채용 설명회 | DEVSISTERS 박주홍
데이터 엔지니어는 무슨 일을 하나요?
J.Park@devsisters.com
2007 KAIST 입학
2013 DEVSISTERS
• Server Engineer
• Data Engineer
• KAIST 데이터 연구, CHI LBW 발표
• Data Science & Infrastructure 팀장
2007 KAIST 입학
2013 DEVSISTERS
• Server Engineer
• Data Engineer
• KAIST 데이터 연구, CHI LBW 발표
• Data Science & Infrastructure 팀장
입학 후에 강산이 한번 바뀌고
2016 KAIST 수리과학과 졸업
01 빅데이터가 뭔가요?
V3
Volume
Variety
Velocity
V4
Volume
Variety
Velocity
Value
V5
Volume
Variety
Velocity
Value
Veracity
VX
Volume
Variety
Velocity
Value
Veracity
V…
V…
V…
V…
V…
VX Plus
Volume
Variety
Velocity
Value
Veracity
V…
V…
V…
V…
V…
+…
그것보다
Real World 에서 느끼는
빅데이터란
Single Server
Single Server
Out of Memory
Single Server
Disk Full
Big Data > Single Server
02 그러면 데이터 엔지니어는 뭘 하나요?
Big Data > Single Server
Single Server → Multi Server
Big Data < Multi Server
Server Cluster
Server Cluster
Cluster Management
Parallel Computing
Load Balancing
데이터 엔지니어는 빅데이터를 처리합니다.
빅데이터를 처리하기 위해 서버 클러스터를 사용합니다.
서버 클러스터로 빅데이터를 처리하면서 발생하는 다양한
Cluster Management
Parallel Computing
Load Balancing
문제를 해결합니다.
03 데브시스터즈에서는 어떻게 문제를 해결하나요?
Server Cluster
Server Cluster
Which
Where
Reference: www.jenunderwood.com
• 분산 처리 클러스터 엔진
• 메모리 기반의 빠른 분석 지원
• SQL, DataFrame 지원
EC2 S3
EC2
• Cloud Server
• 원하는 때 원하는 만큼 서버 생성
• 사용한 만큼 비용 지불
• Cloud Storage
• 병렬 업로드, 병렬 다운로드 지원
• 저장한 만큼 비용 지불
S3
EC2 Cluster
S3
EC2 Cluster
S3
EC2 Cluster
S3
EC2 Cluster
Two More Things
S3
EC2 Cluster
S3
EC2 Cluster
S3
EC2 Cluster
Airflow
New York 에서 진행된
Spark Summit 에 출장가서
Flintrock 개발자와 미팅
DEVSISTSERS 로
Flintrock 개발자를 초청해서
필요한 기능을 공동개발
S3
EC2 Cluster
Airflow
04 DEVSISTERS 는 어떤 데이터 엔지니어를 뽑나요?
1TB 이상 빅데이터를 처리해보신분
Reference: tvN 알바트로스
데이터 엔지니어 신입의 경우
빅데이터를 1TB 이상 구할 수 없거나
빅데이터를 다룰 서버 클러스터가 없기 때문에
사실상 빅데이터를 다룬 경력이 있을 수가 없다.
그래서 빅데이터 기술보다는
전산학 기본기와
데이터 엔지니어에게 필요한 자질을
중점으로 평가합니다.
Python
Linux
Python
Linux
Data Structure
System Engineering
테스트를 확실하게 진행하는 꼼꼼함
실전에서 지속적으로 제품을 개선하는 책임감
Python
Linux
Data Structure
System Engineering
빅데이터 세션은
일어서서 보는 정도가 아니라
강의장 밖에서도 본다.
데이터 엔지니어로 성장하고 싶다면
막강한 권한과 자유로 기회를 제공하는
그렇지만 막중한 책임과 기대에 부응해야 하는
DEVSISTERS 로 오십시오.
빅데이터 전투력 1024TB 을 넘겨보고 싶으신 분
빅데이터 전투력 측정기 폭발시키고 싶으신 분!
환영합니다
J.Park@devsisters.com

[KAIST 채용설명회] 데이터 엔지니어는 무슨 일을 하나요?