SlideShare a Scribd company logo
1 of 51
Download to read offline
데이터 과학자는 답을 알고 있다
Big Data
April 2015/ ISP/ Yonsei univ.
2010147158 이병은
2012147044 박준성
2012147048 이준영
2012147022 김동욱
2012147043 최재림
2012253081 조동헌
목차
• 빅데이터 개념 소개
• Data science의 흐름 3단계
• 빅데이터 수집 – 컴퓨터 공학
• 빅데이터 분석 – 통계학
• 빅데이터 활용 – 활용 분야 전문성
• 빅데이터의 사례
• 데이터 과학자
• 빅데이터의 한계점
• 결론
Big Data
April 2015/ ISP/ Yonsei univ.
BIG DATA
BigdataBig Data란?
기존에는 대용량 데이터 자체를 의미하였으나, 대용
량 데이터를 이용하여 정보를 수집, 발굴, 분석하는
개념까지 확대되어, 개인화된 비정형 데이터
Bigdata
빅데이터와 클라우드의 만남
➢ 대용량 데이터를 다루는 특성상 한 대의 컴퓨터에 모든 데이터를 저장하는 것은 불가능. 여러 대의 컴퓨터에 저
장하는 분산 환경의 저장 시스템 필요
➢ 데이터 분석 또한 한 대의 컴퓨터로 수행 불가능. 빅데이터 플랫폼은 여러 대의 컴퓨터가 유기적으로 상호 연
결되어 수행되는 분산 컴퓨팅을 기반으로 구성되어어야 함.
➢ 빅데이터는 분산 컴퓨팅의 하드웨어 구성 문제를 클라우드 가상화 기술과 서비스를 통해 해결하고자 함.
• 필요한 만큼만 하드웨어 사용하고 반납
• 클라우드 저장 서비스는 사용 공간 및 시간 선택 가능
Big Data란?
데이터와 클라우드와의 만남을 통해서 이전에는 불가능했던
수십 TB, PB까지의 빅데이터를 저장하고
이를 분석하기 위한 컴퓨터를 원하는 만큼 손쉽게 제공 받을 수 있게 됨
Bigdata
공공 민간의 지식 개방, 공유 확대를 위한 빅데이터 활용 공통 기술 확보
데이터 마트 활성화로 빅데이터 활용성 증대 및 창조적 응용 분야 창출
Big Data란?
빅데이터와 클라우드의 만남
Bigdata
데이터의
무한질주 시대
Big Data란?
Bigdata
스마트환경 정착으로 ‘연결’ 이 보편화
Gartner (2010); Cisco (2011)
Big Data란?
Bigdata
‘연결’의 성장은 데이터의 폭증을 유발
N개의 독립된 존재가 N^2개의 상호 연결로 확장
연결관계를 따라 소통이 이뤄지며 데이터는 급팽창
Big Data란?
BigdataBig Data란?
수익(단위: 10억달러)
빅데이터 시장 규모와 전망
출처: IDC
성장률이 매년 30%를 상회하며 성장 중
Bigdata
빅데이터의 세 가지 특징
2010년 IBM이 최초 정의
전 세계 데이터 중 90%가 최근 3년 이내에 생성
<빅데이터의 3요소> Volume
Large volume of data
terabytes or petabytes
Size, records, transactions, or tables
Variety
Number and type of data sources
Structured
Unstructured
Velocity
Frequency of updates
Real-time or streams
Batch processing
Big Data란?
Bigdata
빅데이터 분류
규모
Volume
다양성
Variety
속도
Velocity
MB,GB
단위 규모
TB,PB,EB
단위
정형데이터 비정형데이터
동영상 음악 메세지
소셜
미디어
위치정보
고객 신상 데이터
매출 데이터
재고 데이터
회계 데이터 등
유통 활용 주기
몇 시간~몇 주
유통활용 주기
분, 초게시물
Big Data란?
Bigdata
새로 등장한 정확성, 제4의 ‘V’
Big Data란?
Bigdata
DATA Science?
BigdataData Science
KDD (Knowledge Discovery in Database) Process
Data
Target	
  data
Preprocessed
data
Transformed	
  data
Pattern/Model
Knowledge
수집된 데이터
목표 데이터 추출
데이터 가공
데이터 분류
데이터 패턴화
지식 창출
데이터 수집
데이터 분석
데이터 활용
BigdataData Science – 데이터 수집
내부데이터
- 기업의 활동으로 업무 과정 중에 생산된 데이터
- 로그 기록
외부데이터
- 인터넷에 연결되어 구할 수 있는 데이터
- 정부, 데이터 회사가 보유
- API를 통해 일부 접근
BigdataData Science – 데이터 수집
70million
BigdataData Science – 데이터 가공
비정형 데이터
BigdataData Science – 데이터 가공
6만년
BigdataData Science – 데이터 가공
80% Unstructed	
  data	
  –	
  IT.com	
  (2020)	
  
빅데이터 의사 결정을 위해 비정형 데이터를 정형데이터로 가공 필요
BigdataData Science – 데이터 가공
정형 데이터 –	
  비정형 데이터를 Database에 데이터 분석가가 활용하도록 정리
BigdataData Science – 데이터 가공
SNS의 글을 분석 –	
  Parsing 문장 자체 분석
특정한 단어 분석
BigdataData Science – 데이터 가공
세상의 사진을 분석 –	
  Image	
  Recognition
비정형 데이터인 이미지를 자동 인식해서 정형 데이터 변환
BigdataData Science – 데이터 가공
Data tool
BigdataData Science – 데이터 분류&패턴화
가공된 데이터를 분류시키고 의미를 발견하는 과정 =>	
  Data	
  Mining
Predictive	
  Methods Descriptive	
  Methods
가설 확인 중심 데이터 분석 패턴 발견 중심 데이터 분석
Classification
-­‐	
  데이터를 미리 지정된 부류나 등급으로 나눔
Clustering
-­‐	
  데이터 수집 후 유사한 데이터끼리 분할
BigdataData Science – 데이터 분류&패턴화
단어 Clustering
BigdataData Science – 데이터 분류&패턴화
INFO	
  graphics
BigdataData Science – 지식창출
데이터 활용
분석 결과를 어떻게 전략적으로 활용할 것인가?
사회학
경제학
공학
법학
경영학
의학
과학
인문학
전문지식
BigdataData Science – 지식 창출
보안 시각화 –	
  공격 판단
BigdataData Science – 지식 창출
스포츠 빅데이터	
  –	
  판단은 감독!
BigdataData Science
BIG 데이터의 수집, 분석, 활용
Bigdata
사례 집중 분석
Bigdata빅데이터 집중 분석 (베노플러스)
베노플러스겔
출시 : 2002년
타겟 : 어린이
Market Message : 멍, 붓기, 벌레 물린데
Bigdata빅데이터 집중 분석 (베노플러스)
‘멍’에 대한 소비자 재분석
•환자가 아닌 아기, 여성 Focus
•여성 잡지에 광고 시작
•성형외과에도 홍보
But! 근본적인 것은 해결되지 않음
시장 타겟 변경
Bigdata
제품으로는
맨소래담과 버츠비가 경쟁자이지만
소비자 인식에서는
계란과 소고기를 이겨야 한다
연고는 치료 뿐만 아니라
가리는 역할도 해야 한다.
빅데이터 집중 분석 (베노플러스)
Bigdata
• 계란은 팔 아프다, 소고기는 비싸다
“멍 빼야 할 땐 – 베노플러스”
• 무릎에 메이크업? 가리지 말고 빼자.
“멍 빼야 할 땐 - 베노플러스"
• “계란은 드세요. 멍은 베노플러스가 뺄게요.”
• ‘멍 빨리 없애는 법’의 키워드는 전년 동기
대비 33% 감소한 반면, ‘베노플러스겔’은
557% 증가함
• ‘멍 빨리 없애는 법’의 검색 감소분이 ‘베노
플러스겔’로 전이됨
• 전년대비 매출 46% 성장!
빅데이터 집중 분석 (베노플러스)
검색량 변화광고 전략
Bigdata빅데이터 집중 분석 (GIS분석사례)
송규봉
GIS United 대표
연세대 생활환경대학원 겸임 교수
2호선 홍대입구역 일일 평균이용객 : 12만 3,800명
홍대입구역에서 홍대 정문으로 이어지는 곳에 많은 유동인구 형성
2호선 합정역 일일 평균이용객 : 5만 1,300명
’홍대정문점' ‘홍대거리점' ‘합정역' 중
가장 매출이 높은 곳은??
답 : 합정역
홍대정문점보다 매출이 3배가 많았다.
사용자의 특징과
지리적 분포 분석!!
Bigdata빅데이터 집중 분석 (GIS분석사례)
홍대전문점 합정역점
주 고객층 20대 (매출의 61%)
40-50대 (매출
의 32%)
평균 카드 사용 금액 3558원 1만 928원
주 매출 시간
9pm-6am동안 매출
의 50%
오전 출근시간에
만 매출의 25%
매출이 높은 이유는 고객특성
- ‘합정역점’에는 경제활동에 참여 중인
40~50대 고객이 두드러짐, 상대적
으로 20대보다 구매력이 높음
- 자택지에서 출발한 고객들이 직장으
로 가기 위한 중간지점에 ’합정역점’
위치 (카드회사 데이터) 퇴근길에도
마찬가지.
BigdataDATA SCIENTIST
“데이터를 얻는 능력, 이해하는 능력, 처리하는 능력,
가치를 뽑아내는 능력, 시각화하는 능력,전달하는 능력이야말로
앞으로 10년간 엄청나게 중요한 능력이 될 것이다.”
- 구글 수석 경제학자 할 베리언(Hal Varian).
BigdataDATA SCIENTIST
Data scientist?
대량의 데이터에 관한 통계학적 분석, 데이터 마이닝, 그
리고 복구 프로세스를 진행하여 트렌드 및 수치 등의 정
보를 확인하는 개인 및 조직, 혹은 애플리케이션
- technopedia
Data scientist의 역할
• 데이터 수집→ 비정형 데이터 처리 기술
• 데이터 분석→ 전략 수립 관점에서 Data선택 및 결합,
통계적 방법, 프로그래밍을 통한 분석
• 데이터 활용→ 각각의 활용 분야에서 전략적 적용
BigdataDATA SCIENTIST
데이터 수집
타격영상
타자의 타율, 주루 플레이
40년간의 수첩 기록(그 날의 상
황, 상대 투수,선수의 자세, 경기 결과)
데이터 분석
모션 캡쳐, ESPN HOT ZONE 분석
마르코브 체인
상황에 따른 상대방의 경향 분석
데이터 활용
약점을 공략하는 결정구
모든 타선 조합의 예상 점수 산출
→ 효율적인 라인업
대비책 제시, 데이터에 따른 전략
구상→ “데이터 야구”
“데이터가 머릿속에 있으니까 직감으로 결정하고 판단할 수 있다. 직감이라
는 것은 운이 아니고 근거가 있어야 한다. 그건 데이터와 경험에서 나온다.”
-김성근 감독
Bigdata2012년 오바마 대선
빅데이터 선거전략
1000 x 200,000,000
결과는 재선 성공!
오바마? NO
데이터 과학자? YES!
BigdataDATA SCIENTIST
• Berkley 대학의 MIDS 과정을 비롯해 Stanford, NYU와 같은 미국 유수 대학에서는
Data Science에 관한 커리큘럼을 갖춰가고 있다.
• 웹 2.0의 선구자로 잘 알려진 팀 오 라일리는 지난 2월 포브스에 ‘가장 영향력 있는
데이터 과학자'로 구글 CEO 래리 페이지를 비롯해 MIT 교수, 메사추세츠 상원의원,
보건 복지부 CTO 등 정・재계와 학계 7명을 소개했다. 오 라일리는 실리콘 밸리에서
가장 뜨고 있는 직업(the hottest job title)으로 데이터 과학자를 꼽았다.
• 미국은 IT 산업계 뿐만 아니라 미국 정부에서도 DJ Patil 박사를 최고데이터과학자
(Chief Data Scientist, CDS)로 임명하는 등 공공 분야에서도 민간 분야의 데이터 과
학자들을 영입하는데 노력을 기울이고 있다.
master of
information
and Data
Science
Bigdata빅데이터 한계점
1. 개인정보 유출
• Netflix - 좋아하는 영화를 통해 개인정보를 역추적 가능
• 미국 ‘target’ , 개인 데이터 남용
• 페이스북, 블로그를 통한 사생활 유출
Bigdata빅데이터 한계점
2. 현업 사용자의 외면(CRM을 기억하자)
• 실무자들이 사용하기 어려운 시스템
• 시스템 사용을 강제하지 않는 기업 문화와 업무 프로세스
• 데이터 ‘분석’이 아닌 집계에 불과했다는 점
Bigdata빅데이터 한계점
3. 목적 없는 분석의 위험
빅데이터 분석시 빅데이터 분석으로 무엇을 얻을 수 있는지 확신과, 무엇을
얻으려 하는지 구체적 목표가 부재하기 때문에 어려움을 겪는 중
결론데이터 과학자는 답을 알고 있다
BigdataReference
http://www.theguardian.com/technology/2015/mar/18/twitter-puts-trillions-tweets-for-sale-data-miners
http://www.slideshare.net/opendori/ss-21769292?
qid=6cbe2dc2-2237-4efaa87e-47da20a80628&v=default&b=&from_search=8
http://www.slideshare.net/womendevel/big-data-analytics-and-data-mining?qid=43051d73-a572-49c0-a336-
d330ed951a1d&v=default&b=&from_search=3
빅데이터 승리의 과학(빅데이터는 당신이 무엇을 선택할지 알고 있다), 고한석 저, 이지스 퍼블리싱

More Related Content

What's hot

빅데이터 시대 새로운 신기술과 활용방향
빅데이터 시대 새로운 신기술과 활용방향빅데이터 시대 새로운 신기술과 활용방향
빅데이터 시대 새로운 신기술과 활용방향Webometrics Class
 
빅데이터 이용 사례 분석
빅데이터 이용 사례 분석빅데이터 이용 사례 분석
빅데이터 이용 사례 분석ko donghwi
 
빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향atelier t*h
 
빅데이터의 활용
빅데이터의 활용빅데이터의 활용
빅데이터의 활용수보 김
 
[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드kosena
 
20120924134035 빅데이터시대,ai의새로운의미와가치
20120924134035 빅데이터시대,ai의새로운의미와가치20120924134035 빅데이터시대,ai의새로운의미와가치
20120924134035 빅데이터시대,ai의새로운의미와가치Webometrics Class
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용Jin wook
 
빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.Byounghee Kim
 
UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015YoungMin Jeon
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해수보 김
 
빅데이터의 개념과 이해 그리고 활용사례 (Introduction to big data and use cases)
빅데이터의 개념과 이해 그리고 활용사례 (Introduction to big data and use cases)빅데이터의 개념과 이해 그리고 활용사례 (Introduction to big data and use cases)
빅데이터의 개념과 이해 그리고 활용사례 (Introduction to big data and use cases)Wonjin Lee
 
빅데이터 분석과 모바일 비즈니스 활용전략
빅데이터 분석과 모바일 비즈니스 활용전략빅데이터 분석과 모바일 비즈니스 활용전략
빅데이터 분석과 모바일 비즈니스 활용전략Seungbyung Chae
 
2015 경영과 정보기술 - 빅데이터(Big Data)
2015 경영과 정보기술 - 빅데이터(Big Data)2015 경영과 정보기술 - 빅데이터(Big Data)
2015 경영과 정보기술 - 빅데이터(Big Data)kyunguk_Kim
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data AnalysisMyunggoon Choi
 
빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델datasciencekorea
 
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2Donghan Kim
 
빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력현주 유
 
지능정보시대를 위한 빅데이터, 이대로 좋은가
지능정보시대를 위한 빅데이터, 이대로 좋은가지능정보시대를 위한 빅데이터, 이대로 좋은가
지능정보시대를 위한 빅데이터, 이대로 좋은가r-kor
 

What's hot (20)

빅데이터 시대 새로운 신기술과 활용방향
빅데이터 시대 새로운 신기술과 활용방향빅데이터 시대 새로운 신기술과 활용방향
빅데이터 시대 새로운 신기술과 활용방향
 
빅데이터 이용 사례 분석
빅데이터 이용 사례 분석빅데이터 이용 사례 분석
빅데이터 이용 사례 분석
 
빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향
 
빅데이터
빅데이터빅데이터
빅데이터
 
빅데이터의 활용
빅데이터의 활용빅데이터의 활용
빅데이터의 활용
 
[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드
 
20120924134035 빅데이터시대,ai의새로운의미와가치
20120924134035 빅데이터시대,ai의새로운의미와가치20120924134035 빅데이터시대,ai의새로운의미와가치
20120924134035 빅데이터시대,ai의새로운의미와가치
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용
 
빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.
 
UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
 
빅데이터의 개념과 이해 그리고 활용사례 (Introduction to big data and use cases)
빅데이터의 개념과 이해 그리고 활용사례 (Introduction to big data and use cases)빅데이터의 개념과 이해 그리고 활용사례 (Introduction to big data and use cases)
빅데이터의 개념과 이해 그리고 활용사례 (Introduction to big data and use cases)
 
빅데이터 분석과 모바일 비즈니스 활용전략
빅데이터 분석과 모바일 비즈니스 활용전략빅데이터 분석과 모바일 비즈니스 활용전략
빅데이터 분석과 모바일 비즈니스 활용전략
 
2015 경영과 정보기술 - 빅데이터(Big Data)
2015 경영과 정보기술 - 빅데이터(Big Data)2015 경영과 정보기술 - 빅데이터(Big Data)
2015 경영과 정보기술 - 빅데이터(Big Data)
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data Analysis
 
빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델
 
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
 
빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력
 
지능정보시대를 위한 빅데이터, 이대로 좋은가
지능정보시대를 위한 빅데이터, 이대로 좋은가지능정보시대를 위한 빅데이터, 이대로 좋은가
지능정보시대를 위한 빅데이터, 이대로 좋은가
 
BigData, Hadoop과 Node.js
BigData, Hadoop과 Node.jsBigData, Hadoop과 Node.js
BigData, Hadoop과 Node.js
 

Viewers also liked

An introduction to hadoop
An introduction to hadoopAn introduction to hadoop
An introduction to hadoopMinJae Kang
 
Apache Spark Overview part2 (20161117)
Apache Spark Overview part2 (20161117)Apache Spark Overview part2 (20161117)
Apache Spark Overview part2 (20161117)Steve Min
 
Cloud Music v1.0
Cloud Music v1.0Cloud Music v1.0
Cloud Music v1.0Steve Min
 
Apache Htrace overview (20160520)
Apache Htrace overview (20160520)Apache Htrace overview (20160520)
Apache Htrace overview (20160520)Steve Min
 
NewSQL Database Overview
NewSQL Database OverviewNewSQL Database Overview
NewSQL Database OverviewSteve Min
 
Cloud Computing v1.0
Cloud Computing v1.0Cloud Computing v1.0
Cloud Computing v1.0Steve Min
 
[SSA] 04.sql on hadoop(2014.02.05)
[SSA] 04.sql on hadoop(2014.02.05)[SSA] 04.sql on hadoop(2014.02.05)
[SSA] 04.sql on hadoop(2014.02.05)Steve Min
 
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)Matthew (정재화)
 
Scala overview
Scala overviewScala overview
Scala overviewSteve Min
 
[SSA] 03.newsql database (2014.02.05)
[SSA] 03.newsql database (2014.02.05)[SSA] 03.newsql database (2014.02.05)
[SSA] 03.newsql database (2014.02.05)Steve Min
 
Apache Spark Overview part1 (20161107)
Apache Spark Overview part1 (20161107)Apache Spark Overview part1 (20161107)
Apache Spark Overview part1 (20161107)Steve Min
 
Expanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with TajoExpanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with TajoMatthew (정재화)
 
[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)Steve Min
 
Gruter TECHDAY 2014 MelOn BigData
Gruter TECHDAY 2014 MelOn BigDataGruter TECHDAY 2014 MelOn BigData
Gruter TECHDAY 2014 MelOn BigDataGruter
 

Viewers also liked (17)

An introduction to hadoop
An introduction to hadoopAn introduction to hadoop
An introduction to hadoop
 
Apache Spark Overview part2 (20161117)
Apache Spark Overview part2 (20161117)Apache Spark Overview part2 (20161117)
Apache Spark Overview part2 (20161117)
 
Cloud Music v1.0
Cloud Music v1.0Cloud Music v1.0
Cloud Music v1.0
 
Html5 video
Html5 videoHtml5 video
Html5 video
 
Apache Htrace overview (20160520)
Apache Htrace overview (20160520)Apache Htrace overview (20160520)
Apache Htrace overview (20160520)
 
NewSQL Database Overview
NewSQL Database OverviewNewSQL Database Overview
NewSQL Database Overview
 
Cloud Computing v1.0
Cloud Computing v1.0Cloud Computing v1.0
Cloud Computing v1.0
 
[SSA] 04.sql on hadoop(2014.02.05)
[SSA] 04.sql on hadoop(2014.02.05)[SSA] 04.sql on hadoop(2014.02.05)
[SSA] 04.sql on hadoop(2014.02.05)
 
vertica_tmp_4.5
vertica_tmp_4.5vertica_tmp_4.5
vertica_tmp_4.5
 
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
 
Scala overview
Scala overviewScala overview
Scala overview
 
[SSA] 03.newsql database (2014.02.05)
[SSA] 03.newsql database (2014.02.05)[SSA] 03.newsql database (2014.02.05)
[SSA] 03.newsql database (2014.02.05)
 
Apache Spark Overview part1 (20161107)
Apache Spark Overview part1 (20161107)Apache Spark Overview part1 (20161107)
Apache Spark Overview part1 (20161107)
 
RESTful API Design, Second Edition
RESTful API Design, Second EditionRESTful API Design, Second Edition
RESTful API Design, Second Edition
 
Expanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with TajoExpanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with Tajo
 
[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)
 
Gruter TECHDAY 2014 MelOn BigData
Gruter TECHDAY 2014 MelOn BigDataGruter TECHDAY 2014 MelOn BigData
Gruter TECHDAY 2014 MelOn BigData
 

Similar to 빅데이터_ISP수업

[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아K data
 
Nia 빅 데이터 세미나 이경일 (1)
Nia 빅 데이터 세미나   이경일 (1)Nia 빅 데이터 세미나   이경일 (1)
Nia 빅 데이터 세미나 이경일 (1)Peter Woo
 
데이터 분석 동향과 비즈스프링이 제공하는 데이터
데이터 분석 동향과 비즈스프링이 제공하는 데이터데이터 분석 동향과 비즈스프링이 제공하는 데이터
데이터 분석 동향과 비즈스프링이 제공하는 데이터BizSpring Inc.
 
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료Seul Koo
 
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선datasciencekorea
 
Big data활용 ss
Big data활용 ssBig data활용 ss
Big data활용 ssJinSoo Park
 
빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117Han Woo PARK
 
의료에서의 인공지능 정리 파일 김치원 V5
의료에서의 인공지능 정리 파일 김치원 V5의료에서의 인공지능 정리 파일 김치원 V5
의료에서의 인공지능 정리 파일 김치원 V5Chiweon Kim
 
데이터바우처 기업소개
데이터바우처 기업소개데이터바우처 기업소개
데이터바우처 기업소개creva_pd
 
170717_rnd Policy Trend in medical ai + bigdata_f
170717_rnd Policy Trend in medical ai + bigdata_f170717_rnd Policy Trend in medical ai + bigdata_f
170717_rnd Policy Trend in medical ai + bigdata_fMnapyoLee
 
[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례
[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례
[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례Core.Today
 
온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석수보 김
 
How to Make Money from Data - Global Cases
How to Make Money from Data - Global CasesHow to Make Money from Data - Global Cases
How to Make Money from Data - Global CasesDataya Nolja
 
JnJ Insight_How_Digital Marketers Use Big Data
JnJ Insight_How_Digital Marketers Use Big DataJnJ Insight_How_Digital Marketers Use Big Data
JnJ Insight_How_Digital Marketers Use Big DataJnJinteractive
 
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...Jungmin Lee
 
2016.07.21. 최신 소프트웨어 기술에 대한 이해
2016.07.21. 최신 소프트웨어 기술에 대한 이해 2016.07.21. 최신 소프트웨어 기술에 대한 이해
2016.07.21. 최신 소프트웨어 기술에 대한 이해 Chanjin Park
 
2016 국가정보화백서(국문 )-빅데이터 part-2016-12
2016 국가정보화백서(국문 )-빅데이터 part-2016-122016 국가정보화백서(국문 )-빅데이터 part-2016-12
2016 국가정보화백서(국문 )-빅데이터 part-2016-12Donghan Kim
 
Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료환태 김
 

Similar to 빅데이터_ISP수업 (20)

[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
 
Nia 빅 데이터 세미나 이경일 (1)
Nia 빅 데이터 세미나   이경일 (1)Nia 빅 데이터 세미나   이경일 (1)
Nia 빅 데이터 세미나 이경일 (1)
 
데이터 분석 동향과 비즈스프링이 제공하는 데이터
데이터 분석 동향과 비즈스프링이 제공하는 데이터데이터 분석 동향과 비즈스프링이 제공하는 데이터
데이터 분석 동향과 비즈스프링이 제공하는 데이터
 
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
 
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
 
Big data활용 ss
Big data활용 ssBig data활용 ss
Big data활용 ss
 
빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117
 
의료에서의 인공지능 정리 파일 김치원 V5
의료에서의 인공지능 정리 파일 김치원 V5의료에서의 인공지능 정리 파일 김치원 V5
의료에서의 인공지능 정리 파일 김치원 V5
 
데이터바우처 기업소개
데이터바우처 기업소개데이터바우처 기업소개
데이터바우처 기업소개
 
Big data
Big dataBig data
Big data
 
170717_rnd Policy Trend in medical ai + bigdata_f
170717_rnd Policy Trend in medical ai + bigdata_f170717_rnd Policy Trend in medical ai + bigdata_f
170717_rnd Policy Trend in medical ai + bigdata_f
 
[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례
[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례
[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례
 
Io e기반 비즈니스 성공조건
Io e기반 비즈니스 성공조건Io e기반 비즈니스 성공조건
Io e기반 비즈니스 성공조건
 
온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석
 
How to Make Money from Data - Global Cases
How to Make Money from Data - Global CasesHow to Make Money from Data - Global Cases
How to Make Money from Data - Global Cases
 
JnJ Insight_How_Digital Marketers Use Big Data
JnJ Insight_How_Digital Marketers Use Big DataJnJ Insight_How_Digital Marketers Use Big Data
JnJ Insight_How_Digital Marketers Use Big Data
 
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
 
2016.07.21. 최신 소프트웨어 기술에 대한 이해
2016.07.21. 최신 소프트웨어 기술에 대한 이해 2016.07.21. 최신 소프트웨어 기술에 대한 이해
2016.07.21. 최신 소프트웨어 기술에 대한 이해
 
2016 국가정보화백서(국문 )-빅데이터 part-2016-12
2016 국가정보화백서(국문 )-빅데이터 part-2016-122016 국가정보화백서(국문 )-빅데이터 part-2016-12
2016 국가정보화백서(국문 )-빅데이터 part-2016-12
 
Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료
 

More from jrim Choi

웨어러블 디바이스 케이스
웨어러블 디바이스 케이스웨어러블 디바이스 케이스
웨어러블 디바이스 케이스jrim Choi
 
퀄컴 2net의 활용방안
퀄컴 2net의 활용방안퀄컴 2net의 활용방안
퀄컴 2net의 활용방안jrim Choi
 
급해요 서비스 소개서
급해요 서비스 소개서급해요 서비스 소개서
급해요 서비스 소개서jrim Choi
 
프로젝션프로젝트 인기척
프로젝션프로젝트   인기척프로젝션프로젝트   인기척
프로젝션프로젝트 인기척jrim Choi
 
급해요 완성
급해요 완성급해요 완성
급해요 완성jrim Choi
 

More from jrim Choi (6)

웨어러블 디바이스 케이스
웨어러블 디바이스 케이스웨어러블 디바이스 케이스
웨어러블 디바이스 케이스
 
퀄컴 2net의 활용방안
퀄컴 2net의 활용방안퀄컴 2net의 활용방안
퀄컴 2net의 활용방안
 
급해요 서비스 소개서
급해요 서비스 소개서급해요 서비스 소개서
급해요 서비스 소개서
 
프로젝션프로젝트 인기척
프로젝션프로젝트   인기척프로젝션프로젝트   인기척
프로젝션프로젝트 인기척
 
급해요 완성
급해요 완성급해요 완성
급해요 완성
 
JnJ
JnJJnJ
JnJ
 

빅데이터_ISP수업

  • 1. 데이터 과학자는 답을 알고 있다 Big Data April 2015/ ISP/ Yonsei univ. 2010147158 이병은 2012147044 박준성 2012147048 이준영 2012147022 김동욱 2012147043 최재림 2012253081 조동헌
  • 2. 목차 • 빅데이터 개념 소개 • Data science의 흐름 3단계 • 빅데이터 수집 – 컴퓨터 공학 • 빅데이터 분석 – 통계학 • 빅데이터 활용 – 활용 분야 전문성 • 빅데이터의 사례 • 데이터 과학자 • 빅데이터의 한계점 • 결론 Big Data April 2015/ ISP/ Yonsei univ.
  • 3.
  • 5. BigdataBig Data란? 기존에는 대용량 데이터 자체를 의미하였으나, 대용 량 데이터를 이용하여 정보를 수집, 발굴, 분석하는 개념까지 확대되어, 개인화된 비정형 데이터
  • 6. Bigdata 빅데이터와 클라우드의 만남 ➢ 대용량 데이터를 다루는 특성상 한 대의 컴퓨터에 모든 데이터를 저장하는 것은 불가능. 여러 대의 컴퓨터에 저 장하는 분산 환경의 저장 시스템 필요 ➢ 데이터 분석 또한 한 대의 컴퓨터로 수행 불가능. 빅데이터 플랫폼은 여러 대의 컴퓨터가 유기적으로 상호 연 결되어 수행되는 분산 컴퓨팅을 기반으로 구성되어어야 함. ➢ 빅데이터는 분산 컴퓨팅의 하드웨어 구성 문제를 클라우드 가상화 기술과 서비스를 통해 해결하고자 함. • 필요한 만큼만 하드웨어 사용하고 반납 • 클라우드 저장 서비스는 사용 공간 및 시간 선택 가능 Big Data란? 데이터와 클라우드와의 만남을 통해서 이전에는 불가능했던 수십 TB, PB까지의 빅데이터를 저장하고 이를 분석하기 위한 컴퓨터를 원하는 만큼 손쉽게 제공 받을 수 있게 됨
  • 7. Bigdata 공공 민간의 지식 개방, 공유 확대를 위한 빅데이터 활용 공통 기술 확보 데이터 마트 활성화로 빅데이터 활용성 증대 및 창조적 응용 분야 창출 Big Data란? 빅데이터와 클라우드의 만남
  • 9. Bigdata 스마트환경 정착으로 ‘연결’ 이 보편화 Gartner (2010); Cisco (2011) Big Data란?
  • 10. Bigdata ‘연결’의 성장은 데이터의 폭증을 유발 N개의 독립된 존재가 N^2개의 상호 연결로 확장 연결관계를 따라 소통이 이뤄지며 데이터는 급팽창 Big Data란?
  • 11. BigdataBig Data란? 수익(단위: 10억달러) 빅데이터 시장 규모와 전망 출처: IDC 성장률이 매년 30%를 상회하며 성장 중
  • 12. Bigdata 빅데이터의 세 가지 특징 2010년 IBM이 최초 정의 전 세계 데이터 중 90%가 최근 3년 이내에 생성 <빅데이터의 3요소> Volume Large volume of data terabytes or petabytes Size, records, transactions, or tables Variety Number and type of data sources Structured Unstructured Velocity Frequency of updates Real-time or streams Batch processing Big Data란?
  • 13. Bigdata 빅데이터 분류 규모 Volume 다양성 Variety 속도 Velocity MB,GB 단위 규모 TB,PB,EB 단위 정형데이터 비정형데이터 동영상 음악 메세지 소셜 미디어 위치정보 고객 신상 데이터 매출 데이터 재고 데이터 회계 데이터 등 유통 활용 주기 몇 시간~몇 주 유통활용 주기 분, 초게시물 Big Data란?
  • 14. Bigdata 새로 등장한 정확성, 제4의 ‘V’ Big Data란?
  • 16.
  • 17. BigdataData Science KDD (Knowledge Discovery in Database) Process Data Target  data Preprocessed data Transformed  data Pattern/Model Knowledge 수집된 데이터 목표 데이터 추출 데이터 가공 데이터 분류 데이터 패턴화 지식 창출 데이터 수집 데이터 분석 데이터 활용
  • 18. BigdataData Science – 데이터 수집 내부데이터 - 기업의 활동으로 업무 과정 중에 생산된 데이터 - 로그 기록 외부데이터 - 인터넷에 연결되어 구할 수 있는 데이터 - 정부, 데이터 회사가 보유 - API를 통해 일부 접근
  • 19. BigdataData Science – 데이터 수집 70million
  • 20. BigdataData Science – 데이터 가공 비정형 데이터
  • 21. BigdataData Science – 데이터 가공 6만년
  • 22. BigdataData Science – 데이터 가공 80% Unstructed  data  –  IT.com  (2020)   빅데이터 의사 결정을 위해 비정형 데이터를 정형데이터로 가공 필요
  • 23. BigdataData Science – 데이터 가공 정형 데이터 –  비정형 데이터를 Database에 데이터 분석가가 활용하도록 정리
  • 24. BigdataData Science – 데이터 가공 SNS의 글을 분석 –  Parsing 문장 자체 분석 특정한 단어 분석
  • 25. BigdataData Science – 데이터 가공 세상의 사진을 분석 –  Image  Recognition 비정형 데이터인 이미지를 자동 인식해서 정형 데이터 변환
  • 26. BigdataData Science – 데이터 가공 Data tool
  • 27. BigdataData Science – 데이터 분류&패턴화 가공된 데이터를 분류시키고 의미를 발견하는 과정 =>  Data  Mining Predictive  Methods Descriptive  Methods 가설 확인 중심 데이터 분석 패턴 발견 중심 데이터 분석 Classification -­‐  데이터를 미리 지정된 부류나 등급으로 나눔 Clustering -­‐  데이터 수집 후 유사한 데이터끼리 분할
  • 28. BigdataData Science – 데이터 분류&패턴화 단어 Clustering
  • 29. BigdataData Science – 데이터 분류&패턴화 INFO  graphics
  • 30. BigdataData Science – 지식창출 데이터 활용 분석 결과를 어떻게 전략적으로 활용할 것인가? 사회학 경제학 공학 법학 경영학 의학 과학 인문학 전문지식
  • 31. BigdataData Science – 지식 창출 보안 시각화 –  공격 판단
  • 32. BigdataData Science – 지식 창출 스포츠 빅데이터  –  판단은 감독!
  • 33. BigdataData Science BIG 데이터의 수집, 분석, 활용
  • 35. Bigdata빅데이터 집중 분석 (베노플러스) 베노플러스겔 출시 : 2002년 타겟 : 어린이 Market Message : 멍, 붓기, 벌레 물린데
  • 36. Bigdata빅데이터 집중 분석 (베노플러스) ‘멍’에 대한 소비자 재분석 •환자가 아닌 아기, 여성 Focus •여성 잡지에 광고 시작 •성형외과에도 홍보 But! 근본적인 것은 해결되지 않음 시장 타겟 변경
  • 37. Bigdata 제품으로는 맨소래담과 버츠비가 경쟁자이지만 소비자 인식에서는 계란과 소고기를 이겨야 한다 연고는 치료 뿐만 아니라 가리는 역할도 해야 한다. 빅데이터 집중 분석 (베노플러스)
  • 38. Bigdata • 계란은 팔 아프다, 소고기는 비싸다 “멍 빼야 할 땐 – 베노플러스” • 무릎에 메이크업? 가리지 말고 빼자. “멍 빼야 할 땐 - 베노플러스" • “계란은 드세요. 멍은 베노플러스가 뺄게요.” • ‘멍 빨리 없애는 법’의 키워드는 전년 동기 대비 33% 감소한 반면, ‘베노플러스겔’은 557% 증가함 • ‘멍 빨리 없애는 법’의 검색 감소분이 ‘베노 플러스겔’로 전이됨 • 전년대비 매출 46% 성장! 빅데이터 집중 분석 (베노플러스) 검색량 변화광고 전략
  • 39. Bigdata빅데이터 집중 분석 (GIS분석사례) 송규봉 GIS United 대표 연세대 생활환경대학원 겸임 교수 2호선 홍대입구역 일일 평균이용객 : 12만 3,800명 홍대입구역에서 홍대 정문으로 이어지는 곳에 많은 유동인구 형성 2호선 합정역 일일 평균이용객 : 5만 1,300명 ’홍대정문점' ‘홍대거리점' ‘합정역' 중 가장 매출이 높은 곳은?? 답 : 합정역 홍대정문점보다 매출이 3배가 많았다. 사용자의 특징과 지리적 분포 분석!!
  • 40. Bigdata빅데이터 집중 분석 (GIS분석사례) 홍대전문점 합정역점 주 고객층 20대 (매출의 61%) 40-50대 (매출 의 32%) 평균 카드 사용 금액 3558원 1만 928원 주 매출 시간 9pm-6am동안 매출 의 50% 오전 출근시간에 만 매출의 25% 매출이 높은 이유는 고객특성 - ‘합정역점’에는 경제활동에 참여 중인 40~50대 고객이 두드러짐, 상대적 으로 20대보다 구매력이 높음 - 자택지에서 출발한 고객들이 직장으 로 가기 위한 중간지점에 ’합정역점’ 위치 (카드회사 데이터) 퇴근길에도 마찬가지.
  • 41.
  • 42. BigdataDATA SCIENTIST “데이터를 얻는 능력, 이해하는 능력, 처리하는 능력, 가치를 뽑아내는 능력, 시각화하는 능력,전달하는 능력이야말로 앞으로 10년간 엄청나게 중요한 능력이 될 것이다.” - 구글 수석 경제학자 할 베리언(Hal Varian).
  • 43. BigdataDATA SCIENTIST Data scientist? 대량의 데이터에 관한 통계학적 분석, 데이터 마이닝, 그 리고 복구 프로세스를 진행하여 트렌드 및 수치 등의 정 보를 확인하는 개인 및 조직, 혹은 애플리케이션 - technopedia Data scientist의 역할 • 데이터 수집→ 비정형 데이터 처리 기술 • 데이터 분석→ 전략 수립 관점에서 Data선택 및 결합, 통계적 방법, 프로그래밍을 통한 분석 • 데이터 활용→ 각각의 활용 분야에서 전략적 적용
  • 44. BigdataDATA SCIENTIST 데이터 수집 타격영상 타자의 타율, 주루 플레이 40년간의 수첩 기록(그 날의 상 황, 상대 투수,선수의 자세, 경기 결과) 데이터 분석 모션 캡쳐, ESPN HOT ZONE 분석 마르코브 체인 상황에 따른 상대방의 경향 분석 데이터 활용 약점을 공략하는 결정구 모든 타선 조합의 예상 점수 산출 → 효율적인 라인업 대비책 제시, 데이터에 따른 전략 구상→ “데이터 야구” “데이터가 머릿속에 있으니까 직감으로 결정하고 판단할 수 있다. 직감이라 는 것은 운이 아니고 근거가 있어야 한다. 그건 데이터와 경험에서 나온다.” -김성근 감독
  • 45. Bigdata2012년 오바마 대선 빅데이터 선거전략 1000 x 200,000,000 결과는 재선 성공! 오바마? NO 데이터 과학자? YES!
  • 46. BigdataDATA SCIENTIST • Berkley 대학의 MIDS 과정을 비롯해 Stanford, NYU와 같은 미국 유수 대학에서는 Data Science에 관한 커리큘럼을 갖춰가고 있다. • 웹 2.0의 선구자로 잘 알려진 팀 오 라일리는 지난 2월 포브스에 ‘가장 영향력 있는 데이터 과학자'로 구글 CEO 래리 페이지를 비롯해 MIT 교수, 메사추세츠 상원의원, 보건 복지부 CTO 등 정・재계와 학계 7명을 소개했다. 오 라일리는 실리콘 밸리에서 가장 뜨고 있는 직업(the hottest job title)으로 데이터 과학자를 꼽았다. • 미국은 IT 산업계 뿐만 아니라 미국 정부에서도 DJ Patil 박사를 최고데이터과학자 (Chief Data Scientist, CDS)로 임명하는 등 공공 분야에서도 민간 분야의 데이터 과 학자들을 영입하는데 노력을 기울이고 있다. master of information and Data Science
  • 47. Bigdata빅데이터 한계점 1. 개인정보 유출 • Netflix - 좋아하는 영화를 통해 개인정보를 역추적 가능 • 미국 ‘target’ , 개인 데이터 남용 • 페이스북, 블로그를 통한 사생활 유출
  • 48. Bigdata빅데이터 한계점 2. 현업 사용자의 외면(CRM을 기억하자) • 실무자들이 사용하기 어려운 시스템 • 시스템 사용을 강제하지 않는 기업 문화와 업무 프로세스 • 데이터 ‘분석’이 아닌 집계에 불과했다는 점
  • 49. Bigdata빅데이터 한계점 3. 목적 없는 분석의 위험 빅데이터 분석시 빅데이터 분석으로 무엇을 얻을 수 있는지 확신과, 무엇을 얻으려 하는지 구체적 목표가 부재하기 때문에 어려움을 겪는 중