SlideShare a Scribd company logo
1 of 24
Download to read offline
데이터 읽는 남자
6번째 순서
김영웅
꿈꾸는 데이터 디자이너 매니저
M.I.S 전공 박사과정
MBA (통신미디어트랙)
컴퓨터공학 전공
Ryan Kim | Convergence Business Designer
Facebook. https://www.facebook.com/keyassist
E-mail. youngwung.kim@gmail.com
Web. http://keyassist.tistory.com
데이터.읽는.남자
Data Centric
<source=http://www.i-scoop.eu/can-survive-age-integration-collaboration>
Categories of Data Scientists
Those strong in statistics: they sometimes develop new statistical theories for big data, that even traditional statisticians are
not aware of. They are expert in statistical modeling, experimental design, sampling, clustering, data reduction, confidence
intervals, testing, modeling, predictive modeling and other related techniques.
Those strong in mathematics: NSA (national security agency) or defense/military people working on big data, astronomers,
and operations research people doing analytic business optimization (inventory management and forecasting, pricing
optimization, supply chain, quality control, yield optimization) as they collect, analyse and extract value out of data.
Those strong in data engineering, Hadoop, database/memory/file systems optimization and architecture, API's, Analytics as
a Service, optimization of data flows, data plumbing.
Those strong in machine learning / computer science (algorithms, computational complexity)
Those strong in business, ROI optimization, decision sciences, involved in some of the tasks traditionally performed by
business analysts in bigger companies (dashboards design, metric mix selection and metric definitions, ROI optimization, high-
level database design)
Those strong in production code development, software engineering (they know a few programming languages)
Those strong in visualization
Those strong in GIS, spatial data, data modeled by graphs, graph databases
Those strong in a few of the above. After 20 years of experience across many industries, big and small companies (and lots of
training), I'm strong both in stats, machine learning, business, mathematics and more than just familiar with visualization and
data engineering. This could happen to you as well over time, as you build experience. I mention this because so many people
still think that it is not possible to develop a strong knowledge base across multiple domains that are traditionally perceived as
separated (the silo mentality). Indeed, that's the very reason why data science was created.
Most of them are familiar or expert in big data.
There are other ways to categorize data scientists, see for instance our article on Taxonomy of data scientists. A different
categorization would be creative versus mundane. The "creative" category has a better future, as mundane can be outsourced
(anything published in textbooks or on the web can be automated or outsourced - job security is based on how much you know
that no one else know or can easily learn). Along the same lines, we have science users (those using science, that is,
practitioners; often they do not have a PhD), innovators (those creating new science, called researchers), and hybrids. Most
data scientists, like geologists helping predict earthquakes, or chemists designing new molecules for big pharma, are scientists,
and they belong to the user category.
Implications for other IT professionals
You (engineer, business analyst) probably do already a bit of data science work, and know already some of the stuff that some
data scientists do. It might be easier than you think to become a data scientist. Check out our book (listed below in "related
articles"), to find out what you already know, what you need to learn, to broaden your career prospects.
Are data scientists a threat to your job/career? Again, check our book (listed below) to find out what data scientists do, if the
risk for you is serious (you = the business analyst, data engineer or statistician; risk = being replaced by
a data scientist who does everything) and find out how to mitigate the risk (learn some of the data scientist skills from our
book, if you perceive data scientists as competitors)
<source=http://a16z.com/2014/01/14/the-four-stages-of-disruption/>
이 책은 데이터 과학에 대해 입문하려는 사람에게 적절한 책입니다. 단순하게 분석사례를 서술
한 기술서가 아니라 분석의 필요성, 의미, 그것을 위한 기반지식까지 상당히 쉽게 안내하고 있습
니다. 빅데이터라는 단어와 함께 필요이상으로 남달되는 '데이터 분석' 분야에 대해 체계적으로
설명하고 있으니, 이 카테고리에 관심이 있으시다면 이 책을 읽고 나서 전체적인 감을 잡으실 수
있습니다. 책 자체가 그리 두꺼운 편이 아니고 내용도 쉽게 기술되어 있기 때문에 전문을 읽는데
그리 오랜 시간이 걸리지는 않습니다.
<source=http://keyassist.tistory.com/150>
데이터 분석의 가장 큰 효과는 

'의사 결정 프로세스의 최적화'

-'데이터 분석을 시작하려는 사람을 위한 책', p.15
복잡한 수리 모델을 구축하는 것도 대규모 데이터를 빠르게 처리하는
것도 아니다. 단순하면서도 운용하기 쉽게, 한정된 경영 자원이나 정책
자원을 효율적으로 사용할 수 있도록 의사 결정을 지원하는 것. 바로 이
것이 데이터 분석의 진정한 가치라고 할 수 있다
-'데이터 분석을 시작하려는 사람을 위한 책', p.15
데이터 분석이 성공하기 위한 다섯 가지 요소
-'데이터 분석을 시작하려는 사람을 위한 책', p.40
1) 분석 대상의 데이터와 분석 기반이 있다

2) 목적과 경영 과제가 명확하다

3) 첨단 기술을 보유하고 있으며 인식 능력이 있는 실행팀

4) 경영층의 지원

5) 열정과 창의력이 있는 인재
-'데이터 분석을 시작하려는 사람을 위한 책', p.46
요컨대 목적에 따라 통계나 분석 수법을 올바르게 실천해 결과를 이끌
어내는 것이 중요하며, 이를 위해 분석 담당자는 단순히 분석 자체에 재
미를 느끼는 것으로 끝내서는 안 된다. 협업 필터링 같은 일부를 제외하
면 통계나 기계 학습 자체에는 의사 결정을 완전 자동화하는 힘이 없다.
어디까지나 의사 결정의 최적화를 지원할 뿐이다. 그런데 이 본질을 이
해하지 못하는 사람이 많은 것이 현실이다.
-'데이터 분석을 시작하려는 사람을 위한 책', p.120
위기의식을 항상 느끼는 데이터 과학자는 데이터의 사전 처리와 분석
수법 선정, 유의성 검정 등 화려하지 않은 작업의 중요성을 잘 알고 있
다. 그러나 경험이 일천한 분석자 중에는 분석 대상에 관심을 보이기보
다 최첨단 분석 수법이나 도구에 정신이 팔려 이런 과정을 생략하고 숫
자와 씨름하는 데만 열중하는 사람도 있다.
-'데이터 분석을 시작하려는 사람을 위한 책', p.136
데이터 분석 프로젝트를 성공시킬 때 중요한 것은 분석 자체가 아니라
분석을 통해 얻은 결과를 현장의 프로세스에 반영하는 것이다. 그러나
분석 결과를 과신하다 현장에 예측 모델을 도입하는 단계에서 큰 실패
를 맛보는 경우가 있다. 올바른 프로세스를 통해 분석한 결과는 높은 정
확도로 현실을 말해 준다. 그러나 단순히 그 결과를 보여주기만 해서는
사람, 즉 조직은 움직이지 않는다.
"Efforts and courage are not enough
without purpose and direction."
노력이나 용기 있는 한 발을 내디뎠다고 해도 

목적이나 착지점에 대한 방향성이 없다면 

그 노력이나 행동의 결과는 

충분하지 못한 것이 될 것이다.

John F. Kennedy
[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자

More Related Content

What's hot

꿈꾸는데이터디자이너 설명회 2부
꿈꾸는데이터디자이너 설명회 2부꿈꾸는데이터디자이너 설명회 2부
꿈꾸는데이터디자이너 설명회 2부Hanyang University
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구Newsjelly
 
꿈꾸는 데이터 디자이너 1기를 끝내며
꿈꾸는 데이터 디자이너 1기를 끝내며꿈꾸는 데이터 디자이너 1기를 끝내며
꿈꾸는 데이터 디자이너 1기를 끝내며neuroassociates
 
꿈꾸는 데이터 디자이너 시즌2 교육설명회
꿈꾸는 데이터 디자이너 시즌2 교육설명회꿈꾸는 데이터 디자이너 시즌2 교육설명회
꿈꾸는 데이터 디자이너 시즌2 교육설명회neuroassociates
 
DLAB company info and big data case studies
DLAB company info and big data case studiesDLAB company info and big data case studies
DLAB company info and big data case studiesDLAB
 
뉴스생태계와 알고리즘의 역할 - CMS를 중심으로
뉴스생태계와 알고리즘의 역할 - CMS를 중심으로뉴스생태계와 알고리즘의 역할 - CMS를 중심으로
뉴스생태계와 알고리즘의 역할 - CMS를 중심으로Sungkyu Lee
 
데이터 분석 프로세스
데이터 분석 프로세스데이터 분석 프로세스
데이터 분석 프로세스Lee Seungeun
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)Myungjin Lee
 
데이터 활용 스타트업을 위한 특화 지원사업 DB-Stars 안내
데이터 활용 스타트업을 위한 특화 지원사업 DB-Stars 안내데이터 활용 스타트업을 위한 특화 지원사업 DB-Stars 안내
데이터 활용 스타트업을 위한 특화 지원사업 DB-Stars 안내Dylan Ko
 

What's hot (9)

꿈꾸는데이터디자이너 설명회 2부
꿈꾸는데이터디자이너 설명회 2부꿈꾸는데이터디자이너 설명회 2부
꿈꾸는데이터디자이너 설명회 2부
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구
 
꿈꾸는 데이터 디자이너 1기를 끝내며
꿈꾸는 데이터 디자이너 1기를 끝내며꿈꾸는 데이터 디자이너 1기를 끝내며
꿈꾸는 데이터 디자이너 1기를 끝내며
 
꿈꾸는 데이터 디자이너 시즌2 교육설명회
꿈꾸는 데이터 디자이너 시즌2 교육설명회꿈꾸는 데이터 디자이너 시즌2 교육설명회
꿈꾸는 데이터 디자이너 시즌2 교육설명회
 
DLAB company info and big data case studies
DLAB company info and big data case studiesDLAB company info and big data case studies
DLAB company info and big data case studies
 
뉴스생태계와 알고리즘의 역할 - CMS를 중심으로
뉴스생태계와 알고리즘의 역할 - CMS를 중심으로뉴스생태계와 알고리즘의 역할 - CMS를 중심으로
뉴스생태계와 알고리즘의 역할 - CMS를 중심으로
 
데이터 분석 프로세스
데이터 분석 프로세스데이터 분석 프로세스
데이터 분석 프로세스
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
 
데이터 활용 스타트업을 위한 특화 지원사업 DB-Stars 안내
데이터 활용 스타트업을 위한 특화 지원사업 DB-Stars 안내데이터 활용 스타트업을 위한 특화 지원사업 DB-Stars 안내
데이터 활용 스타트업을 위한 특화 지원사업 DB-Stars 안내
 

Viewers also liked

[Week3]데이터읽어주는남자
[Week3]데이터읽어주는남자[Week3]데이터읽어주는남자
[Week3]데이터읽어주는남자neuroassociates
 
Doing data science chap11
Doing data science chap11Doing data science chap11
Doing data science chap11Keunhyun Oh
 
데이터 사이언티스트 키노트 Pt 20141008
데이터 사이언티스트 키노트 Pt 20141008데이터 사이언티스트 키노트 Pt 20141008
데이터 사이언티스트 키노트 Pt 20141008Myung-Hoe Huh
 
[Week4]데이터읽어주는남자
[Week4]데이터읽어주는남자[Week4]데이터읽어주는남자
[Week4]데이터읽어주는남자neuroassociates
 
Lean Analytics_cojette
Lean Analytics_cojetteLean Analytics_cojette
Lean Analytics_cojetteJeongMin Kwon
 
데이터 사이언스 소개 - 정준호
데이터 사이언스 소개 -  정준호데이터 사이언스 소개 -  정준호
데이터 사이언스 소개 - 정준호준호 정
 
[패스트캠퍼스] Making Travel Schedule
[패스트캠퍼스] Making Travel Schedule[패스트캠퍼스] Making Travel Schedule
[패스트캠퍼스] Making Travel ScheduleJeong-Ho Lee
 
R & big data analysis 20120531
R & big data analysis 20120531R & big data analysis 20120531
R & big data analysis 20120531JeongMin Kwon
 
[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScienceNAVER D2
 
[2A6]web & health 2.0. 회사에서의 data science란?
[2A6]web & health 2.0. 회사에서의 data science란?[2A6]web & health 2.0. 회사에서의 data science란?
[2A6]web & health 2.0. 회사에서의 data science란?NAVER D2
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루Jaimie Kwon (권재명)
 
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?Yongho Ha
 

Viewers also liked (12)

[Week3]데이터읽어주는남자
[Week3]데이터읽어주는남자[Week3]데이터읽어주는남자
[Week3]데이터읽어주는남자
 
Doing data science chap11
Doing data science chap11Doing data science chap11
Doing data science chap11
 
데이터 사이언티스트 키노트 Pt 20141008
데이터 사이언티스트 키노트 Pt 20141008데이터 사이언티스트 키노트 Pt 20141008
데이터 사이언티스트 키노트 Pt 20141008
 
[Week4]데이터읽어주는남자
[Week4]데이터읽어주는남자[Week4]데이터읽어주는남자
[Week4]데이터읽어주는남자
 
Lean Analytics_cojette
Lean Analytics_cojetteLean Analytics_cojette
Lean Analytics_cojette
 
데이터 사이언스 소개 - 정준호
데이터 사이언스 소개 -  정준호데이터 사이언스 소개 -  정준호
데이터 사이언스 소개 - 정준호
 
[패스트캠퍼스] Making Travel Schedule
[패스트캠퍼스] Making Travel Schedule[패스트캠퍼스] Making Travel Schedule
[패스트캠퍼스] Making Travel Schedule
 
R & big data analysis 20120531
R & big data analysis 20120531R & big data analysis 20120531
R & big data analysis 20120531
 
[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience
 
[2A6]web & health 2.0. 회사에서의 data science란?
[2A6]web & health 2.0. 회사에서의 data science란?[2A6]web & health 2.0. 회사에서의 data science란?
[2A6]web & health 2.0. 회사에서의 data science란?
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루
 
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
 

Similar to [week6] 데이터읽어주는남자

[통계페스티발] 무덤에서 요람까지 통계와 함께
[통계페스티발] 무덤에서 요람까지 통계와 함께[통계페스티발] 무덤에서 요람까지 통계와 함께
[통계페스티발] 무덤에서 요람까지 통계와 함께백승민 Baek Seung Min
 
분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질Sun Young Kim
 
효율적 데이터 과학을 위한 7가지 팁
효율적 데이터 과학을 위한 7가지 팁효율적 데이터 과학을 위한 7가지 팁
효율적 데이터 과학을 위한 7가지 팁Jaimie Kwon (권재명)
 
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인r-kor
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)Han Woo PARK
 
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해pinetreeopenclass
 
건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안메가트렌드랩 megatrendlab
 
Week1 ot
Week1 otWeek1 ot
Week1 otEun Yu
 
빅데이터전문가교육 3학기 1
빅데이터전문가교육 3학기 1빅데이터전문가교육 3학기 1
빅데이터전문가교육 3학기 1Kangwook Lee
 
[IBM Korea 김상훈] Watson Explorer
[IBM Korea 김상훈] Watson Explorer[IBM Korea 김상훈] Watson Explorer
[IBM Korea 김상훈] Watson Explorer(Joe), Sanghun Kim
 
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입Hoon Park
 
[D2 CAMPUS] Tech meet-up `data science` 발표자료
[D2 CAMPUS] Tech meet-up `data science` 발표자료[D2 CAMPUS] Tech meet-up `data science` 발표자료
[D2 CAMPUS] Tech meet-up `data science` 발표자료NAVER D2
 
About cerebro scholar
About cerebro scholarAbout cerebro scholar
About cerebro scholarJungeunKim49
 
How to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyDataya Nolja
 
Audience research와 미디어 스타트업
Audience research와 미디어 스타트업Audience research와 미디어 스타트업
Audience research와 미디어 스타트업Sungkyu Lee
 
1.introduction(epoch#2)
1.introduction(epoch#2)1.introduction(epoch#2)
1.introduction(epoch#2)Haesun Park
 
Things Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in MindThings Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in MindDataya Nolja
 
Peopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayPeopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayYoungchan Jo
 

Similar to [week6] 데이터읽어주는남자 (20)

[통계페스티발] 무덤에서 요람까지 통계와 함께
[통계페스티발] 무덤에서 요람까지 통계와 함께[통계페스티발] 무덤에서 요람까지 통계와 함께
[통계페스티발] 무덤에서 요람까지 통계와 함께
 
분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질
 
효율적 데이터 과학을 위한 7가지 팁
효율적 데이터 과학을 위한 7가지 팁효율적 데이터 과학을 위한 7가지 팁
효율적 데이터 과학을 위한 7가지 팁
 
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인
 
빅데이터
빅데이터빅데이터
빅데이터
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
 
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
 
건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안
 
Week1 ot
Week1 otWeek1 ot
Week1 ot
 
빅데이터전문가교육 3학기 1
빅데이터전문가교육 3학기 1빅데이터전문가교육 3학기 1
빅데이터전문가교육 3학기 1
 
[IBM Korea 김상훈] Watson Explorer
[IBM Korea 김상훈] Watson Explorer[IBM Korea 김상훈] Watson Explorer
[IBM Korea 김상훈] Watson Explorer
 
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
 
[D2 CAMPUS] Tech meet-up `data science` 발표자료
[D2 CAMPUS] Tech meet-up `data science` 발표자료[D2 CAMPUS] Tech meet-up `data science` 발표자료
[D2 CAMPUS] Tech meet-up `data science` 발표자료
 
About cerebro scholar
About cerebro scholarAbout cerebro scholar
About cerebro scholar
 
How to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its Difficulty
 
Audience research와 미디어 스타트업
Audience research와 미디어 스타트업Audience research와 미디어 스타트업
Audience research와 미디어 스타트업
 
1.introduction(epoch#2)
1.introduction(epoch#2)1.introduction(epoch#2)
1.introduction(epoch#2)
 
Things Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in MindThings Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in Mind
 
Peopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayPeopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start today
 
HR과 빅데이터
HR과 빅데이터HR과 빅데이터
HR과 빅데이터
 

More from neuroassociates

[week16] D3.js_Transition
[week16] D3.js_Transition[week16] D3.js_Transition
[week16] D3.js_Transitionneuroassociates
 
[week8] 데이터읽어주는남자
[week8] 데이터읽어주는남자[week8] 데이터읽어주는남자
[week8] 데이터읽어주는남자neuroassociates
 
[Week15] D3.js_Scatter_Chart
[Week15] D3.js_Scatter_Chart[Week15] D3.js_Scatter_Chart
[Week15] D3.js_Scatter_Chartneuroassociates
 
[Week14] D3.js_Scale and Axis (보충자료)
[Week14] D3.js_Scale and Axis (보충자료)[Week14] D3.js_Scale and Axis (보충자료)
[Week14] D3.js_Scale and Axis (보충자료)neuroassociates
 
[Week14] D3.js_Scale and Axis
[Week14] D3.js_Scale and Axis[Week14] D3.js_Scale and Axis
[Week14] D3.js_Scale and Axisneuroassociates
 
[Week13] D3.js_Bar Chart
[Week13] D3.js_Bar Chart[Week13] D3.js_Bar Chart
[Week13] D3.js_Bar Chartneuroassociates
 
[week11] R_ggmap, leaflet
[week11] R_ggmap, leaflet[week11] R_ggmap, leaflet
[week11] R_ggmap, leafletneuroassociates
 
[시즌2, week3] R Basic
[시즌2, week3] R Basic[시즌2, week3] R Basic
[시즌2, week3] R Basicneuroassociates
 
꿈꾸는 데이터 디자이너 시즌2 교육 설명회 2부
꿈꾸는 데이터 디자이너 시즌2 교육 설명회 2부꿈꾸는 데이터 디자이너 시즌2 교육 설명회 2부
꿈꾸는 데이터 디자이너 시즌2 교육 설명회 2부neuroassociates
 
[week16] D3.js (Scale & axis)
[week16] D3.js (Scale & axis)[week16] D3.js (Scale & axis)
[week16] D3.js (Scale & axis)neuroassociates
 

More from neuroassociates (20)

[Week20] D3.js_Mapping
[Week20] D3.js_Mapping[Week20] D3.js_Mapping
[Week20] D3.js_Mapping
 
[week17] D3.js_Tooltip
[week17] D3.js_Tooltip[week17] D3.js_Tooltip
[week17] D3.js_Tooltip
 
[week16] D3.js_Transition
[week16] D3.js_Transition[week16] D3.js_Transition
[week16] D3.js_Transition
 
[week8] 데이터읽어주는남자
[week8] 데이터읽어주는남자[week8] 데이터읽어주는남자
[week8] 데이터읽어주는남자
 
[Week15] D3.js_Scatter_Chart
[Week15] D3.js_Scatter_Chart[Week15] D3.js_Scatter_Chart
[Week15] D3.js_Scatter_Chart
 
[Week14] D3.js_Scale and Axis (보충자료)
[Week14] D3.js_Scale and Axis (보충자료)[Week14] D3.js_Scale and Axis (보충자료)
[Week14] D3.js_Scale and Axis (보충자료)
 
[Week14] D3.js_Scale and Axis
[Week14] D3.js_Scale and Axis[Week14] D3.js_Scale and Axis
[Week14] D3.js_Scale and Axis
 
[Week13] D3.js_Bar Chart
[Week13] D3.js_Bar Chart[Week13] D3.js_Bar Chart
[Week13] D3.js_Bar Chart
 
[Week12] D3.js_Basic2
[Week12] D3.js_Basic2[Week12] D3.js_Basic2
[Week12] D3.js_Basic2
 
[week12] D3.js_Basic
[week12] D3.js_Basic[week12] D3.js_Basic
[week12] D3.js_Basic
 
[week11] R_ggmap, leaflet
[week11] R_ggmap, leaflet[week11] R_ggmap, leaflet
[week11] R_ggmap, leaflet
 
[week9]R_statics
[week9]R_statics[week9]R_statics
[week9]R_statics
 
[Week8]R_ggplot2
[Week8]R_ggplot2[Week8]R_ggplot2
[Week8]R_ggplot2
 
[week7]R_Wrangling(2)
[week7]R_Wrangling(2)[week7]R_Wrangling(2)
[week7]R_Wrangling(2)
 
[week6]R_Wrangling
[week6]R_Wrangling[week6]R_Wrangling
[week6]R_Wrangling
 
[Week5]R_scraping
[Week5]R_scraping[Week5]R_scraping
[Week5]R_scraping
 
[Week4] Google refine
[Week4] Google refine[Week4] Google refine
[Week4] Google refine
 
[시즌2, week3] R Basic
[시즌2, week3] R Basic[시즌2, week3] R Basic
[시즌2, week3] R Basic
 
꿈꾸는 데이터 디자이너 시즌2 교육 설명회 2부
꿈꾸는 데이터 디자이너 시즌2 교육 설명회 2부꿈꾸는 데이터 디자이너 시즌2 교육 설명회 2부
꿈꾸는 데이터 디자이너 시즌2 교육 설명회 2부
 
[week16] D3.js (Scale & axis)
[week16] D3.js (Scale & axis)[week16] D3.js (Scale & axis)
[week16] D3.js (Scale & axis)
 

[week6] 데이터읽어주는남자

  • 2. 김영웅 꿈꾸는 데이터 디자이너 매니저 M.I.S 전공 박사과정 MBA (통신미디어트랙) 컴퓨터공학 전공 Ryan Kim | Convergence Business Designer Facebook. https://www.facebook.com/keyassist E-mail. youngwung.kim@gmail.com Web. http://keyassist.tistory.com 데이터.읽는.남자
  • 3.
  • 4.
  • 7.
  • 8. Categories of Data Scientists
  • 9. Those strong in statistics: they sometimes develop new statistical theories for big data, that even traditional statisticians are not aware of. They are expert in statistical modeling, experimental design, sampling, clustering, data reduction, confidence intervals, testing, modeling, predictive modeling and other related techniques. Those strong in mathematics: NSA (national security agency) or defense/military people working on big data, astronomers, and operations research people doing analytic business optimization (inventory management and forecasting, pricing optimization, supply chain, quality control, yield optimization) as they collect, analyse and extract value out of data. Those strong in data engineering, Hadoop, database/memory/file systems optimization and architecture, API's, Analytics as a Service, optimization of data flows, data plumbing. Those strong in machine learning / computer science (algorithms, computational complexity) Those strong in business, ROI optimization, decision sciences, involved in some of the tasks traditionally performed by business analysts in bigger companies (dashboards design, metric mix selection and metric definitions, ROI optimization, high- level database design) Those strong in production code development, software engineering (they know a few programming languages) Those strong in visualization Those strong in GIS, spatial data, data modeled by graphs, graph databases
  • 10. Those strong in a few of the above. After 20 years of experience across many industries, big and small companies (and lots of training), I'm strong both in stats, machine learning, business, mathematics and more than just familiar with visualization and data engineering. This could happen to you as well over time, as you build experience. I mention this because so many people still think that it is not possible to develop a strong knowledge base across multiple domains that are traditionally perceived as separated (the silo mentality). Indeed, that's the very reason why data science was created. Most of them are familiar or expert in big data. There are other ways to categorize data scientists, see for instance our article on Taxonomy of data scientists. A different categorization would be creative versus mundane. The "creative" category has a better future, as mundane can be outsourced (anything published in textbooks or on the web can be automated or outsourced - job security is based on how much you know that no one else know or can easily learn). Along the same lines, we have science users (those using science, that is, practitioners; often they do not have a PhD), innovators (those creating new science, called researchers), and hybrids. Most data scientists, like geologists helping predict earthquakes, or chemists designing new molecules for big pharma, are scientists, and they belong to the user category. Implications for other IT professionals You (engineer, business analyst) probably do already a bit of data science work, and know already some of the stuff that some data scientists do. It might be easier than you think to become a data scientist. Check out our book (listed below in "related articles"), to find out what you already know, what you need to learn, to broaden your career prospects. Are data scientists a threat to your job/career? Again, check our book (listed below) to find out what data scientists do, if the risk for you is serious (you = the business analyst, data engineer or statistician; risk = being replaced by a data scientist who does everything) and find out how to mitigate the risk (learn some of the data scientist skills from our book, if you perceive data scientists as competitors)
  • 11.
  • 12.
  • 14.
  • 15. 이 책은 데이터 과학에 대해 입문하려는 사람에게 적절한 책입니다. 단순하게 분석사례를 서술 한 기술서가 아니라 분석의 필요성, 의미, 그것을 위한 기반지식까지 상당히 쉽게 안내하고 있습 니다. 빅데이터라는 단어와 함께 필요이상으로 남달되는 '데이터 분석' 분야에 대해 체계적으로 설명하고 있으니, 이 카테고리에 관심이 있으시다면 이 책을 읽고 나서 전체적인 감을 잡으실 수 있습니다. 책 자체가 그리 두꺼운 편이 아니고 내용도 쉽게 기술되어 있기 때문에 전문을 읽는데 그리 오랜 시간이 걸리지는 않습니다. <source=http://keyassist.tistory.com/150>
  • 16. 데이터 분석의 가장 큰 효과는 '의사 결정 프로세스의 최적화' -'데이터 분석을 시작하려는 사람을 위한 책', p.15
  • 17. 복잡한 수리 모델을 구축하는 것도 대규모 데이터를 빠르게 처리하는 것도 아니다. 단순하면서도 운용하기 쉽게, 한정된 경영 자원이나 정책 자원을 효율적으로 사용할 수 있도록 의사 결정을 지원하는 것. 바로 이 것이 데이터 분석의 진정한 가치라고 할 수 있다 -'데이터 분석을 시작하려는 사람을 위한 책', p.15
  • 18. 데이터 분석이 성공하기 위한 다섯 가지 요소 -'데이터 분석을 시작하려는 사람을 위한 책', p.40 1) 분석 대상의 데이터와 분석 기반이 있다 2) 목적과 경영 과제가 명확하다 3) 첨단 기술을 보유하고 있으며 인식 능력이 있는 실행팀 4) 경영층의 지원 5) 열정과 창의력이 있는 인재
  • 19. -'데이터 분석을 시작하려는 사람을 위한 책', p.46 요컨대 목적에 따라 통계나 분석 수법을 올바르게 실천해 결과를 이끌 어내는 것이 중요하며, 이를 위해 분석 담당자는 단순히 분석 자체에 재 미를 느끼는 것으로 끝내서는 안 된다. 협업 필터링 같은 일부를 제외하 면 통계나 기계 학습 자체에는 의사 결정을 완전 자동화하는 힘이 없다. 어디까지나 의사 결정의 최적화를 지원할 뿐이다. 그런데 이 본질을 이 해하지 못하는 사람이 많은 것이 현실이다.
  • 20. -'데이터 분석을 시작하려는 사람을 위한 책', p.120 위기의식을 항상 느끼는 데이터 과학자는 데이터의 사전 처리와 분석 수법 선정, 유의성 검정 등 화려하지 않은 작업의 중요성을 잘 알고 있 다. 그러나 경험이 일천한 분석자 중에는 분석 대상에 관심을 보이기보 다 최첨단 분석 수법이나 도구에 정신이 팔려 이런 과정을 생략하고 숫 자와 씨름하는 데만 열중하는 사람도 있다.
  • 21. -'데이터 분석을 시작하려는 사람을 위한 책', p.136 데이터 분석 프로젝트를 성공시킬 때 중요한 것은 분석 자체가 아니라 분석을 통해 얻은 결과를 현장의 프로세스에 반영하는 것이다. 그러나 분석 결과를 과신하다 현장에 예측 모델을 도입하는 단계에서 큰 실패 를 맛보는 경우가 있다. 올바른 프로세스를 통해 분석한 결과는 높은 정 확도로 현실을 말해 준다. 그러나 단순히 그 결과를 보여주기만 해서는 사람, 즉 조직은 움직이지 않는다.
  • 22. "Efforts and courage are not enough without purpose and direction." 노력이나 용기 있는 한 발을 내디뎠다고 해도 목적이나 착지점에 대한 방향성이 없다면 그 노력이나 행동의 결과는 충분하지 못한 것이 될 것이다. John F. Kennedy