SlideShare a Scribd company logo
1 of 22
Choi, Myunggoon 
Data Analyst 
사용자분석팀,UX Lab, Coupang 
E-mail: myunggoonchoi@coupang.com 
E-mail: Myunggoon.choi@gmail.com 
Tel: 02. 6150. 4098 
Mobile: 010. 9692. 3080. 
빅데이터 분석 프로세스
빅데이터 소개 
1 빅데이터의 정의 
정의 
• 디지털 기술 발달로 만들어지는 데이터로 그 규모(Volume)가 방대하고, 생성 속도 
(Velocity)가 빠르며, 형태도 수치 데이터뿐만 아니라 문자와, 영상 데이터를 포함하는 
다양(Variety)한 데이터 
• 3V(Volume과 Velocity, Variety) 
01 
데이터 과학 (Data Science) 
• ‘데이터’ 로부터 의미를 추출해내는 학문 
• 기업의 실무 현장에서 쌓이는 빅데이터를 대상으로 의미를 추출 
• 예를 들면, 인터넷과 휴대전화, 감시용 카메라 등과 같은 정보기술로부터 생성 
되는 숫자와 문자, 영상 정보 등 다양한 유형의 데이터를 의미
빅데이터 소개 
2 빅데이터의 현황 
시대적 상황 
• 인터넷 사용의 급격한 발전과 활용은 인터넷 기업의 등장을 촉진 
• 페이스북의 경우, 이용자가 1억 명에 이르는데 소요 시간은 단, 9개월 
(이용자 5천 만 명에 달하는데 걸린 시간: 라디오 38년, TV 13년, 인터넷 4년, iPod 3 
년) 
• 아날로그에서 디지털로의 정보 흐름의 변화 
• 글로벌 네트워크 및 데이터의 개방과 공유 시대 
01 
<그림1> 인터넷 기업의 등장과 글로벌 디지털 데이터 규모 
출처: 정용찬(2012)
빅데이터 소개 
3 빅데이터의 중요성 증대 
중요성 증대 
• 2010년 미 대통령 과학자문위원회, 모든 연방정부 기관의 빅데이터 전략 필요성 강조 
• 2012년 다보스 포럼, 위기의 자본주의를 구할 사회 기술 모델로의 도구로 빅데이터 제 
시 
• 2011년, 국가정보화전략위원회, 빅데이터를 활용한 공공부분의 혁신 패러다임 형성 
01 
<그림2> ‘Big Data’ 키워드 검색 변화 추이 
120 
100 
80 
60 
40 
20 
0 
2005 2007 2009 2011 2013 
출처: Google Trend, retrieved from 
https://www.google.com/trends/explore#q=big%20data&cmpt=q 
FRQ. 
YEAR
02 빅데이터 방법론 
1 전체 프로세스 
빅데이터 방법론의 핵심적 프로세스(Process) 
• 사회과학을 통한 정확한 현상 설명 및 정의 
• 측정 수준의 정의에 따른 자동적인 데이터 수집 및 분석, 예측 
<Figure 3> Key Process for Big Data Analysis 
1 2 3 
Conceptualization Operationalization 
Concep 
t 
6 7 
Social Science 
4 5 
Algorithm Correlation 
Causation 
Social Scienc and Computer Science, Statistics, Mathematics 
Operationalize 
d 
Definition 
Social 
Phenomena 
Data 
Collection 
Data 
Analysis 
Results 
& 
Implications 
Prediction
02 빅데이터 방법론 
2 빅데이터를 바라보는 사회과학적 관점 
10가지 주요 관점들 
• 인간 감각의 확장 (Extension of Human Senses) 
• 역의제설정이론 (Reversed Agenda-Setting Theory) 
• 공론장 (Public Sphere) 
• SNS (Social Network Services) 
• 집단지성 (Collective Intelligence) 
• 롱테일 가설 (Long-Tail Hypotheses) 
• 관계의 미학 (Aesthetic of Relationship) 
• 소유의 종말 (Age of Access) 
• 비정형 데이터 (Unstructured Data) 
• 융합과 통섭 (Convergence and Consilience) 
사회과학(Social Science) 
사회 
현상 
1
02 빅데이터 방법론 
3 개념을 도출하는 과정 
개념화: 개념을 도출하는 과정 
• 정의: 개념을 발전시키고 명료화하는 과정. 즉, 단어나 예제로써 하나의 개념을 명확히 
하고 정확한 의사전달을 위한 의미에 도달하는 과정. 
• 예시: 
백만 장자, 서울대 교수, 국회의원 
↓ 
부, 명예, 권력 
↓ 
사회적 지위 
사회 
현상 
개념 
1 
2 
사회과학(Social Science) 
개념화 
(Conceptualization)
02 빅데이터 방법론 
4 조작적 정의 
조작화 과정 
• 정의: 정량적 수치를 통해 측정할 수 있는 수준으로 모호한 개념을 이끌어 내는 과정 
• 예시: 
Q. 사회적 지위에 대한 조작적 정의? 
A. 한 개인이 매달에 주기적으로 벌어들이는 수익금의 양!? 
개념 
조작 
적 
정의 
2 
3 
사회과학(Social Science) 
조작화 
(Operationalization)
02 빅데이터 방법론 
5 데이터 수집 
조작적으로 정의된 개념에 대한 데이터 종류 
• 인간 감각의 확장 (Extension of Human Senses) 
- 예: 인체의 심장 박동 센서를 통한 사람의 감정 데이터 등 
• SNS (Social Network Services) 
- 예: 포털이나 SNS(트위터, 페이스북), 온라인 커뮤니티의 텍스트 데이터 
등 
• 집단지성 (Collective Intelligence) 
- 예: 책 한 권에 대한 여러 권의 번역본 텍스트 데이터 등 
• 관계의 미학 (Aesthetic of Relationship) 
- 예: SNS의 친구 관계, 동시 구매를 통해 연결되는 상품 간의 관계 등 
- 관계에는 메타데이터를 포함 
• 비정형 데이터 (Unstructured Data) 
- 정형화되기 이전의 모든 로그 데이터 
- 예: 로그 데이터(어플리케이션을 사용한 사용자의 모든 동선에 관한 데이 
터) 
사회과학(Social Science), 
컴퓨터과학(Computer Science), 
통계학(Statistics), 
수학(Mathematics) 
조작 
적 
정의 
3 
데이 
터수 
집 
4
02 빅데이터 방법론 
5 데이터 수집 
조작적으로 정의된 개념에 대한 데이터 수집 방법 
1) 자체적인 서버 내에서의 데이터 수집 
• 하둡(Hadoop): 빅데이터를 안정되고, 빠르고, 용이하게 분석하게 하는 플랫폼 
• 필요한 기본 소프트웨어: JAVA Hadoop, R, R studio, MySQL, RMR, RmySQL 등 
• 비정형 데이터 
2) API(Application Programming Interface)를 통한 오픈(open) 데이터 수집 
• 프로그래밍 언어를 사용한 데이터 크롤링 소프트웨어 작성을 통한 수집 
- 사용할 수 있는 프로그래밍 언어: Ruby, Python, R, Java 등 
• 공개된 API를 통해 받을 수 있는 데이터: 포털의 블로그나 카페의 텍스트 데이터, 포털 
의 특정 키워드에 대한 검색 빈도 데이터, 트위터의 사용자 및 트윗에 관한 텍스트 데이 
터, 페이스북의 텍스트 데이터, 트위터와 페이스북의 사용자 간 관계 데이터 
3) 쉽게 수집할 수 있는 오픈 소프트웨어를 통한 자료 수집 
• 네이버 트랜드, 구글 트랜드, 구글 ngram을 이용한 검색 데이터 수집 
• 수집 프로그램: NodeXL, Webometric Analyst, WeboNaver, WeboGoogle, 
DiscoverText 
사회과학(Social Science), 
컴퓨터과학(Computer Science), 
통계학(Statistics), 
수학(Mathematics) 
조작 
적 
정의 
3 
데이 
터수 
집 
4
02 빅데이터 방법론 
6 데이터 분석 
텍스트 분석 
1) 텍스트의 감정 분석(Textual Sentimental Analysis) 
① 모델(분석 대상), Dunit(수집 문서), 룰(분석지식) 
② 분석 사전(Daumsoft 의 경우, 약 1,000,000만 단어에 대한 사전 보유): 
문장 분리 → 품사 태깅(Tagging) → 개체명 인식 → 패러프라이징 
(Paraphrasing) → 구문 분석 
③ 지식 매칭 
④ 키팩트(분석 결과): 정제된 키워드 데이터를 통해 감정 분만 아니라 특정 모델 
별, 브랜드별, 사이트별, 시계열 분석 가능 
사회과학(Social Science), 
컴퓨터과학(Computer Science), 
통계학(Statistics), 
수학(Mathematics) 
데이 
터수 
집 
4 
데이 
터분 
석 
5 
브랜드 
쿠팡 
티몬 
11번가 
위메프 
아마존 
감정 
쿠팡 
쿠팡 
쿠팡 
1021 
852 
721 
241 
쿠팡 
느리다 
쿠팡 없다 
친절한 
좋다 
쿠팡 
쿠팡 
1021 
852 
721 
241 
<그림4> 텍스트 감정 분석의 사례
<사진1> 텍스트 분석 사례1 – 직장인의 ‘일하다’와 관련한 키워드 
출처: 
Daumsoft
<사진2> 텍스트 분석 사례2 – 직장인의 ‘회사 회식’과 관련한 키워드 
출처: 
Daumsoft
<사진3> 텍스트 분석 사례3 – 직장인의 요일별 감성 비중 변화 
출처: 
Daumsoft
02 빅데이터 방법론 
6 데이터 분석 
텍스트 분석 
2) 텍스트의 의미망 연결 분석(Textual Semantic Analysis) 
① 모델(분석 대상), Dunit(수집 문서), 룰(분석지식) 
② 분석 사전(Daumsoft 의 경우, 약 1,000,000만 단어에 대한 사전 보유): 
문장 분리 → 품사 태깅(Tagging) → 개체명 인식 → 패러프라이징 
(Paraphrasing) → 구문 분석 
③ 지식 매칭 
④ 두 어휘 간의 연결을 지을 수 있는 범위 설정 및 네트워크 데이터 구성 
⑤ 특정 어휘에 감춰진 의미 파악 및 네트워크 구조 분석을 통한 유사한 그룹 도출 
사회과학(Social Science), 
컴퓨터과학(Computer Science), 
통계학(Statistics), 
수학(Mathematics) 
데이 
터수 
집 
4 
데이 
터분 
석 
5 
빠르다 
<그림5> 텍스트 의미망 연결 분석의 사례 
쿠팡맨 느리다 
쿠팡 
배송 
친절한 
좋다 
상품 
없다 위메프 
브랜드
02 빅데이터 방법론 
6 데이터 분석 
네트워크 분석 
1) 사회 연결망 분석(Social Network Analysis) – 유사성 분석 
① 모델(분석 대상)에서 관계 유형을 발견 
② 일반적으로 사용되는 정형 데이터를 매트릭스 형 관계 데이터로 재구성 
③ 네트워크 구조적 동일성을 지닌 노드들을 자동 알고리즘에 따라 그룹화시켜줌 
④ 관계의 속성에 따라 그룹이 가진 의미를 발견 
사회과학(Social Science), 
컴퓨터과학(Computer Science), 
통계학(Statistics), 
수학(Mathematics) 
데이 
터수 
집 
4 
데이 
터분 
석 
5 
<그림6> 한 사용자가 듣는 가수들 간의 연결을 통한 네트워크 분석의 사례 
출처: Slow News, ‘음악시장과 메타데이터: 아이튠즈의 퇴조 vs. 스 
포티파이의 성장’, retrieved from http://slownews.kr/30565
<그림6> 한 사용자가 듣는 가수들 간의 연결을 통한 네트워크 분석의 사례 
출처: Slow News, ‘음악시장과 메타데이터: 아이튠즈의 퇴조 vs. 스포티파이의 성장’, retrieved from http://slownews.kr/30565
<사진4> 텍스트 분석 사례4 – 애니팡 분석 사례1 
출처: Treum, ‘[트리움의 의미망분석] 요즘 뜨는 애니팡 게임에 ‘숨겨진 코드’, retrieved 
from http://blog.treum.com/72
<사진5> 텍스트 분석 사례5 – 애니팡 분석 사례2 
출처: Treum, ‘[트리움의 의미망분석] 요즘 뜨는 애니팡 게임에 ‘숨겨진 코드’, retrieved 
from http://blog.treum.com/72
02 빅데이터 방법론 
6 데이터 분석 
데이터 시각화(Data Visualization 혹은 Information Visualization) 
• 데이터를 정보로 변환하여 유용하게 사용하게 만드는 한 방법 
• Sensemaking(데이터에 의미와 통찰력을 부여하는 과정) 의 과정 
• Think Visually! 
• 컴퓨터를 사용하여 인지를 넓힐 수 있도록 데이터를 상호작용이 가능한 시각화 하는 것 
• 외부인지보조(External Cognition Aid) 
사회과학(Social Science), 
컴퓨터과학(Computer Science), 
통계학(Statistics), 
수학(Mathematics) 
데이 
터수 
집 
4 
데이 
터분 
석 
5 
<그림7> 런던 지하철 과거(좌)와 현재(우)의 시각화 자료 
출처: Visual Loop, ‘Vintage Infodesign’, 
retrieved from 
http://visualoop.com/11575/vintage-infodesign- 
33 
출처: Cartography Topics and Projects, retrieved 
from 
http://mapmaker.rutgers.edu/355/links.html
02 빅데이터 방법론 
7 데이터 결과 도출 및 해석, 예측 
결론 도출 및 인사이트 발견, 예측 
• 도출된 모든 정보는 연구자의 판단에 의해 맡겨짐 
• 데이터는 좋은 의사결정을 내리는데 보조 도구일 뿐 최종 판단은 사람에 의해 이루어짐 
사회과학(Social Science), 
컴퓨터과학(Computer Science), 
통계학(Statistics), 
수학(Mathematics) 
데이 
터분 
석 
5 
결론 
6 도출 
“사람들은 자기 식대로 사물을 추론한다. 그 사물의 목적을 지워버린다.” 
in <The Tragedy of Julius Caesar>, by 셰익스피어 
7 예측
Choi, Myunggoon 
Data Analyst 
사용자분석팀,UX Lab, Coupang 
E-mail: myunggoonchoi@coupang.com 
E-mail: Myunggoon.choi@gmail.com 
Tel: 02. 6150. 4098 
Mobile: 010. 9692. 3080. 
Thank you

More Related Content

What's hot

[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드kosena
 
Big Data 대충 알아보기
Big Data 대충 알아보기Big Data 대충 알아보기
Big Data 대충 알아보기iron han
 
빅데이터_ISP수업
빅데이터_ISP수업빅데이터_ISP수업
빅데이터_ISP수업jrim Choi
 
빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향atelier t*h
 
[FAST CAMPUS] 1강 data science overview
[FAST CAMPUS] 1강 data science overview [FAST CAMPUS] 1강 data science overview
[FAST CAMPUS] 1강 data science overview chanyoonkim
 
KCSE 2015 Tutorial 빅데이터 분석 기술의 소프트웨어 공학 분야 활용 (...
KCSE 2015 Tutorial 빅데이터 분석 기술의  소프트웨어 공학 분야 활용 (...KCSE 2015 Tutorial 빅데이터 분석 기술의  소프트웨어 공학 분야 활용 (...
KCSE 2015 Tutorial 빅데이터 분석 기술의 소프트웨어 공학 분야 활용 (...Chanjin Park
 
빅데이터의 활용
빅데이터의 활용빅데이터의 활용
빅데이터의 활용수보 김
 
[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.
[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.
[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.kosena
 
20120924134035 빅데이터시대,ai의새로운의미와가치
20120924134035 빅데이터시대,ai의새로운의미와가치20120924134035 빅데이터시대,ai의새로운의미와가치
20120924134035 빅데이터시대,ai의새로운의미와가치Webometrics Class
 
UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015YoungMin Jeon
 
오픈 데이터와 인공지능
오픈 데이터와 인공지능오픈 데이터와 인공지능
오픈 데이터와 인공지능Myungjin Lee
 
집단지성 프로그래밍 01-데이터마이닝 개요
집단지성 프로그래밍 01-데이터마이닝 개요집단지성 프로그래밍 01-데이터마이닝 개요
집단지성 프로그래밍 01-데이터마이닝 개요Kwang Woo NAM
 
빅데이터미래전략세미나 빅데이터 기반 선진국정운영의 비전과 전략 한국정보화진흥원김현곤센터장
빅데이터미래전략세미나 빅데이터 기반 선진국정운영의 비전과 전략 한국정보화진흥원김현곤센터장빅데이터미래전략세미나 빅데이터 기반 선진국정운영의 비전과 전략 한국정보화진흥원김현곤센터장
빅데이터미래전략세미나 빅데이터 기반 선진국정운영의 비전과 전략 한국정보화진흥원김현곤센터장Seungyeob Yang
 
빅데이터란?
빅데이터란?빅데이터란?
빅데이터란?Yoseop Shin
 
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료Seul Koo
 
Nia 빅 데이터 세미나 이경일 (1)
Nia 빅 데이터 세미나   이경일 (1)Nia 빅 데이터 세미나   이경일 (1)
Nia 빅 데이터 세미나 이경일 (1)Peter Woo
 
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안K data
 
빅데이터 이용 사례 분석
빅데이터 이용 사례 분석빅데이터 이용 사례 분석
빅데이터 이용 사례 분석ko donghwi
 

What's hot (20)

[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드
 
Big Data 대충 알아보기
Big Data 대충 알아보기Big Data 대충 알아보기
Big Data 대충 알아보기
 
빅데이터_ISP수업
빅데이터_ISP수업빅데이터_ISP수업
빅데이터_ISP수업
 
Bigdata
BigdataBigdata
Bigdata
 
빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향
 
[FAST CAMPUS] 1강 data science overview
[FAST CAMPUS] 1강 data science overview [FAST CAMPUS] 1강 data science overview
[FAST CAMPUS] 1강 data science overview
 
KCSE 2015 Tutorial 빅데이터 분석 기술의 소프트웨어 공학 분야 활용 (...
KCSE 2015 Tutorial 빅데이터 분석 기술의  소프트웨어 공학 분야 활용 (...KCSE 2015 Tutorial 빅데이터 분석 기술의  소프트웨어 공학 분야 활용 (...
KCSE 2015 Tutorial 빅데이터 분석 기술의 소프트웨어 공학 분야 활용 (...
 
빅데이터의 활용
빅데이터의 활용빅데이터의 활용
빅데이터의 활용
 
Hadoop 기반 빅데이터 이해
Hadoop 기반 빅데이터 이해Hadoop 기반 빅데이터 이해
Hadoop 기반 빅데이터 이해
 
[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.
[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.
[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.
 
20120924134035 빅데이터시대,ai의새로운의미와가치
20120924134035 빅데이터시대,ai의새로운의미와가치20120924134035 빅데이터시대,ai의새로운의미와가치
20120924134035 빅데이터시대,ai의새로운의미와가치
 
UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015
 
오픈 데이터와 인공지능
오픈 데이터와 인공지능오픈 데이터와 인공지능
오픈 데이터와 인공지능
 
집단지성 프로그래밍 01-데이터마이닝 개요
집단지성 프로그래밍 01-데이터마이닝 개요집단지성 프로그래밍 01-데이터마이닝 개요
집단지성 프로그래밍 01-데이터마이닝 개요
 
빅데이터미래전략세미나 빅데이터 기반 선진국정운영의 비전과 전략 한국정보화진흥원김현곤센터장
빅데이터미래전략세미나 빅데이터 기반 선진국정운영의 비전과 전략 한국정보화진흥원김현곤센터장빅데이터미래전략세미나 빅데이터 기반 선진국정운영의 비전과 전략 한국정보화진흥원김현곤센터장
빅데이터미래전략세미나 빅데이터 기반 선진국정운영의 비전과 전략 한국정보화진흥원김현곤센터장
 
빅데이터란?
빅데이터란?빅데이터란?
빅데이터란?
 
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
 
Nia 빅 데이터 세미나 이경일 (1)
Nia 빅 데이터 세미나   이경일 (1)Nia 빅 데이터 세미나   이경일 (1)
Nia 빅 데이터 세미나 이경일 (1)
 
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안
 
빅데이터 이용 사례 분석
빅데이터 이용 사례 분석빅데이터 이용 사례 분석
빅데이터 이용 사례 분석
 

Viewers also liked

신호와 소음 저자 네이트실버가 밝히는 빅데이터(Big data)분석 및 미래예측전략(1)
신호와 소음 저자 네이트실버가 밝히는 빅데이터(Big data)분석 및 미래예측전략(1)신호와 소음 저자 네이트실버가 밝히는 빅데이터(Big data)분석 및 미래예측전략(1)
신호와 소음 저자 네이트실버가 밝히는 빅데이터(Big data)분석 및 미래예측전략(1)희영 임
 
빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)Channy Yun
 
2012 빅데이터 big data 발표자료
2012 빅데이터 big data 발표자료2012 빅데이터 big data 발표자료
2012 빅데이터 big data 발표자료Wooseung Kim
 
비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례
비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례
비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례JeongHeon Lee
 
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스Ji Lee
 
웹보메트릭스01 2
웹보메트릭스01 2웹보메트릭스01 2
웹보메트릭스01 2Inho Cho
 
Tableau Quick start introduction
Tableau Quick start introductionTableau Quick start introduction
Tableau Quick start introductionPlanit-partners
 
Virtual World & Future culture_4_가상과 현실간의 상호대화
Virtual World & Future culture_4_가상과 현실간의 상호대화Virtual World & Future culture_4_가상과 현실간의 상호대화
Virtual World & Future culture_4_가상과 현실간의 상호대화Dongeun Lee
 
Image recognition technology (Medical Presentation)
Image recognition technology (Medical Presentation)Image recognition technology (Medical Presentation)
Image recognition technology (Medical Presentation)saravanan guru
 
Imago OCR: Open-source toolkit for chemical structure image recognition
Imago OCR: Open-source toolkit for chemical structure image recognitionImago OCR: Open-source toolkit for chemical structure image recognition
Imago OCR: Open-source toolkit for chemical structure image recognitionMikhail Rybalkin
 
Golang 으로 vision api 적용하기
Golang 으로 vision api 적용하기Golang 으로 vision api 적용하기
Golang 으로 vision api 적용하기동철 박
 
Building an Image Recognition Service - How to leverage IBM Watson for visual...
Building an Image Recognition Service - How to leverage IBM Watson for visual...Building an Image Recognition Service - How to leverage IBM Watson for visual...
Building an Image Recognition Service - How to leverage IBM Watson for visual...10x Nation
 
Image to text Converter
Image to text ConverterImage to text Converter
Image to text ConverterDhiraj Raj
 
Image Recognition. Technology, Guidelines and Trends
Image Recognition. Technology, Guidelines and TrendsImage Recognition. Technology, Guidelines and Trends
Image Recognition. Technology, Guidelines and TrendsCatchoom
 
[트렌드톡] 중국 온라인 마케팅 전략 (By 카플란마케팅)
[트렌드톡] 중국 온라인 마케팅 전략 (By 카플란마케팅)[트렌드톡] 중국 온라인 마케팅 전략 (By 카플란마케팅)
[트렌드톡] 중국 온라인 마케팅 전략 (By 카플란마케팅)kaplanmkt
 
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현태현 임
 
빅데이터 처리에 있어서 이미지 비디오 데이터의 분석
빅데이터 처리에 있어서 이미지 비디오 데이터의 분석빅데이터 처리에 있어서 이미지 비디오 데이터의 분석
빅데이터 처리에 있어서 이미지 비디오 데이터의 분석JeongHeon Lee
 
이미지(비디오)를 대상으로 한 빅 데이터 시스템 기술 동향 및 고려사항
이미지(비디오)를 대상으로 한 빅 데이터 시스템 기술 동향 및 고려사항이미지(비디오)를 대상으로 한 빅 데이터 시스템 기술 동향 및 고려사항
이미지(비디오)를 대상으로 한 빅 데이터 시스템 기술 동향 및 고려사항JeongHeon Lee
 

Viewers also liked (20)

신호와 소음 저자 네이트실버가 밝히는 빅데이터(Big data)분석 및 미래예측전략(1)
신호와 소음 저자 네이트실버가 밝히는 빅데이터(Big data)분석 및 미래예측전략(1)신호와 소음 저자 네이트실버가 밝히는 빅데이터(Big data)분석 및 미래예측전략(1)
신호와 소음 저자 네이트실버가 밝히는 빅데이터(Big data)분석 및 미래예측전략(1)
 
빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)
 
2012 빅데이터 big data 발표자료
2012 빅데이터 big data 발표자료2012 빅데이터 big data 발표자료
2012 빅데이터 big data 발표자료
 
비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례
비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례
비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례
 
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
 
웹보메트릭스01 2
웹보메트릭스01 2웹보메트릭스01 2
웹보메트릭스01 2
 
Tableau Quick start introduction
Tableau Quick start introductionTableau Quick start introduction
Tableau Quick start introduction
 
Virtual World & Future culture_4_가상과 현실간의 상호대화
Virtual World & Future culture_4_가상과 현실간의 상호대화Virtual World & Future culture_4_가상과 현실간의 상호대화
Virtual World & Future culture_4_가상과 현실간의 상호대화
 
Image recognition technology (Medical Presentation)
Image recognition technology (Medical Presentation)Image recognition technology (Medical Presentation)
Image recognition technology (Medical Presentation)
 
Integrating Text and Image
Integrating Text and ImageIntegrating Text and Image
Integrating Text and Image
 
Imago OCR: Open-source toolkit for chemical structure image recognition
Imago OCR: Open-source toolkit for chemical structure image recognitionImago OCR: Open-source toolkit for chemical structure image recognition
Imago OCR: Open-source toolkit for chemical structure image recognition
 
Golang 으로 vision api 적용하기
Golang 으로 vision api 적용하기Golang 으로 vision api 적용하기
Golang 으로 vision api 적용하기
 
Building an Image Recognition Service - How to leverage IBM Watson for visual...
Building an Image Recognition Service - How to leverage IBM Watson for visual...Building an Image Recognition Service - How to leverage IBM Watson for visual...
Building an Image Recognition Service - How to leverage IBM Watson for visual...
 
Image to text Converter
Image to text ConverterImage to text Converter
Image to text Converter
 
Image Recognition. Technology, Guidelines and Trends
Image Recognition. Technology, Guidelines and TrendsImage Recognition. Technology, Guidelines and Trends
Image Recognition. Technology, Guidelines and Trends
 
[트렌드톡] 중국 온라인 마케팅 전략 (By 카플란마케팅)
[트렌드톡] 중국 온라인 마케팅 전략 (By 카플란마케팅)[트렌드톡] 중국 온라인 마케팅 전략 (By 카플란마케팅)
[트렌드톡] 중국 온라인 마케팅 전략 (By 카플란마케팅)
 
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
 
빅데이터 처리에 있어서 이미지 비디오 데이터의 분석
빅데이터 처리에 있어서 이미지 비디오 데이터의 분석빅데이터 처리에 있어서 이미지 비디오 데이터의 분석
빅데이터 처리에 있어서 이미지 비디오 데이터의 분석
 
Image recognition
Image recognitionImage recognition
Image recognition
 
이미지(비디오)를 대상으로 한 빅 데이터 시스템 기술 동향 및 고려사항
이미지(비디오)를 대상으로 한 빅 데이터 시스템 기술 동향 및 고려사항이미지(비디오)를 대상으로 한 빅 데이터 시스템 기술 동향 및 고려사항
이미지(비디오)를 대상으로 한 빅 데이터 시스템 기술 동향 및 고려사항
 

Similar to Process for Big Data Analysis

학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망Open Cyber University of Korea
 
Social Analytics 소개 (SDEC 오프모임 세미나)
Social Analytics 소개 (SDEC 오프모임 세미나)Social Analytics 소개 (SDEC 오프모임 세미나)
Social Analytics 소개 (SDEC 오프모임 세미나)NAVER D2
 
Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Jiun Bae
 
Week1 ot
Week1 otWeek1 ot
Week1 otEun Yu
 
데이터 사이언스 소개 - 정준호
데이터 사이언스 소개 -  정준호데이터 사이언스 소개 -  정준호
데이터 사이언스 소개 - 정준호준호 정
 
건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안메가트렌드랩 megatrendlab
 
빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력현주 유
 
빅데이터전문가교육 2학기
빅데이터전문가교육 2학기빅데이터전문가교육 2학기
빅데이터전문가교육 2학기Kangwook Lee
 
소프트웨어교육론 전체
소프트웨어교육론 전체소프트웨어교육론 전체
소프트웨어교육론 전체YoungSik Jeong
 
[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScienceNAVER D2
 
Bigdate & R programming
Bigdate & R programmingBigdate & R programming
Bigdate & R programmingSeongWan Son
 
빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)Hong-Seok Kim
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)Han Woo PARK
 
빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0Konkuk University
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터JM code group
 
기계학습 현재와미래 Pdf
기계학습 현재와미래 Pdf기계학습 현재와미래 Pdf
기계학습 현재와미래 Pdf효근 윤
 
Big data활용 ss
Big data활용 ssBig data활용 ss
Big data활용 ssJinSoo Park
 
1.introduction(epoch#2)
1.introduction(epoch#2)1.introduction(epoch#2)
1.introduction(epoch#2)Haesun Park
 

Similar to Process for Big Data Analysis (20)

학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
 
Social Analytics 소개 (SDEC 오프모임 세미나)
Social Analytics 소개 (SDEC 오프모임 세미나)Social Analytics 소개 (SDEC 오프모임 세미나)
Social Analytics 소개 (SDEC 오프모임 세미나)
 
Memento
MementoMemento
Memento
 
Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보
 
Week1 ot
Week1 otWeek1 ot
Week1 ot
 
데이터 사이언스 소개 - 정준호
데이터 사이언스 소개 -  정준호데이터 사이언스 소개 -  정준호
데이터 사이언스 소개 - 정준호
 
건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안
 
빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력
 
빅데이터전문가교육 2학기
빅데이터전문가교육 2학기빅데이터전문가교육 2학기
빅데이터전문가교육 2학기
 
소프트웨어교육론 전체
소프트웨어교육론 전체소프트웨어교육론 전체
소프트웨어교육론 전체
 
[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience
 
공공기관의 빅데이터 구현 전략
공공기관의 빅데이터 구현 전략공공기관의 빅데이터 구현 전략
공공기관의 빅데이터 구현 전략
 
Bigdate & R programming
Bigdate & R programmingBigdate & R programming
Bigdate & R programming
 
빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
 
빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터
 
기계학습 현재와미래 Pdf
기계학습 현재와미래 Pdf기계학습 현재와미래 Pdf
기계학습 현재와미래 Pdf
 
Big data활용 ss
Big data활용 ssBig data활용 ss
Big data활용 ss
 
1.introduction(epoch#2)
1.introduction(epoch#2)1.introduction(epoch#2)
1.introduction(epoch#2)
 

More from Myunggoon Choi

Exploring opinion leadership and homophily in political discussion networks o...
Exploring opinion leadership and homophily in political discussion networks o...Exploring opinion leadership and homophily in political discussion networks o...
Exploring opinion leadership and homophily in political discussion networks o...Myunggoon Choi
 
Influences of strong tie with opinion leaders in an interconnected network of...
Influences of strong tie with opinion leaders in an interconnected network of...Influences of strong tie with opinion leaders in an interconnected network of...
Influences of strong tie with opinion leaders in an interconnected network of...Myunggoon Choi
 
Influences of strong tie with opinion leaders in an interconnected network of...
Influences of strong tie with opinion leaders in an interconnected network of...Influences of strong tie with opinion leaders in an interconnected network of...
Influences of strong tie with opinion leaders in an interconnected network of...Myunggoon Choi
 
Personality homophily in sns messages
Personality homophily in sns messagesPersonality homophily in sns messages
Personality homophily in sns messagesMyunggoon Choi
 
The conditions of journalism using social media(27 sep2011)
The conditions of journalism using social media(27 sep2011)The conditions of journalism using social media(27 sep2011)
The conditions of journalism using social media(27 sep2011)Myunggoon Choi
 
The Next Paradigm Shift in Information and Communication Technology
The Next Paradigm Shift in Information and Communication TechnologyThe Next Paradigm Shift in Information and Communication Technology
The Next Paradigm Shift in Information and Communication TechnologyMyunggoon Choi
 
Appropriate Technology
Appropriate TechnologyAppropriate Technology
Appropriate TechnologyMyunggoon Choi
 
Introduction to webometrics(13 mar2011)
Introduction to webometrics(13 mar2011)Introduction to webometrics(13 mar2011)
Introduction to webometrics(13 mar2011)Myunggoon Choi
 
철의날 사진공모전 3조_기획서(20_mar2011)
철의날 사진공모전 3조_기획서(20_mar2011)철의날 사진공모전 3조_기획서(20_mar2011)
철의날 사진공모전 3조_기획서(20_mar2011)Myunggoon Choi
 
대학생활의설계(01 mar2011)
대학생활의설계(01 mar2011)대학생활의설계(01 mar2011)
대학생활의설계(01 mar2011)Myunggoon Choi
 
TEDx palgong_aboutperu(20jan2011)
TEDx palgong_aboutperu(20jan2011)TEDx palgong_aboutperu(20jan2011)
TEDx palgong_aboutperu(20jan2011)Myunggoon Choi
 
2011대구육상경기대회 스토리텔링아이디어(14 nov2010).pptx [복구됨]
2011대구육상경기대회 스토리텔링아이디어(14 nov2010).pptx [복구됨]2011대구육상경기대회 스토리텔링아이디어(14 nov2010).pptx [복구됨]
2011대구육상경기대회 스토리텔링아이디어(14 nov2010).pptx [복구됨]Myunggoon Choi
 
Hub connector(11 oct2010)
Hub connector(11 oct2010)Hub connector(11 oct2010)
Hub connector(11 oct2010)Myunggoon Choi
 
About google(18nov2010)
About google(18nov2010)About google(18nov2010)
About google(18nov2010)Myunggoon Choi
 

More from Myunggoon Choi (14)

Exploring opinion leadership and homophily in political discussion networks o...
Exploring opinion leadership and homophily in political discussion networks o...Exploring opinion leadership and homophily in political discussion networks o...
Exploring opinion leadership and homophily in political discussion networks o...
 
Influences of strong tie with opinion leaders in an interconnected network of...
Influences of strong tie with opinion leaders in an interconnected network of...Influences of strong tie with opinion leaders in an interconnected network of...
Influences of strong tie with opinion leaders in an interconnected network of...
 
Influences of strong tie with opinion leaders in an interconnected network of...
Influences of strong tie with opinion leaders in an interconnected network of...Influences of strong tie with opinion leaders in an interconnected network of...
Influences of strong tie with opinion leaders in an interconnected network of...
 
Personality homophily in sns messages
Personality homophily in sns messagesPersonality homophily in sns messages
Personality homophily in sns messages
 
The conditions of journalism using social media(27 sep2011)
The conditions of journalism using social media(27 sep2011)The conditions of journalism using social media(27 sep2011)
The conditions of journalism using social media(27 sep2011)
 
The Next Paradigm Shift in Information and Communication Technology
The Next Paradigm Shift in Information and Communication TechnologyThe Next Paradigm Shift in Information and Communication Technology
The Next Paradigm Shift in Information and Communication Technology
 
Appropriate Technology
Appropriate TechnologyAppropriate Technology
Appropriate Technology
 
Introduction to webometrics(13 mar2011)
Introduction to webometrics(13 mar2011)Introduction to webometrics(13 mar2011)
Introduction to webometrics(13 mar2011)
 
철의날 사진공모전 3조_기획서(20_mar2011)
철의날 사진공모전 3조_기획서(20_mar2011)철의날 사진공모전 3조_기획서(20_mar2011)
철의날 사진공모전 3조_기획서(20_mar2011)
 
대학생활의설계(01 mar2011)
대학생활의설계(01 mar2011)대학생활의설계(01 mar2011)
대학생활의설계(01 mar2011)
 
TEDx palgong_aboutperu(20jan2011)
TEDx palgong_aboutperu(20jan2011)TEDx palgong_aboutperu(20jan2011)
TEDx palgong_aboutperu(20jan2011)
 
2011대구육상경기대회 스토리텔링아이디어(14 nov2010).pptx [복구됨]
2011대구육상경기대회 스토리텔링아이디어(14 nov2010).pptx [복구됨]2011대구육상경기대회 스토리텔링아이디어(14 nov2010).pptx [복구됨]
2011대구육상경기대회 스토리텔링아이디어(14 nov2010).pptx [복구됨]
 
Hub connector(11 oct2010)
Hub connector(11 oct2010)Hub connector(11 oct2010)
Hub connector(11 oct2010)
 
About google(18nov2010)
About google(18nov2010)About google(18nov2010)
About google(18nov2010)
 

Process for Big Data Analysis

  • 1. Choi, Myunggoon Data Analyst 사용자분석팀,UX Lab, Coupang E-mail: myunggoonchoi@coupang.com E-mail: Myunggoon.choi@gmail.com Tel: 02. 6150. 4098 Mobile: 010. 9692. 3080. 빅데이터 분석 프로세스
  • 2. 빅데이터 소개 1 빅데이터의 정의 정의 • 디지털 기술 발달로 만들어지는 데이터로 그 규모(Volume)가 방대하고, 생성 속도 (Velocity)가 빠르며, 형태도 수치 데이터뿐만 아니라 문자와, 영상 데이터를 포함하는 다양(Variety)한 데이터 • 3V(Volume과 Velocity, Variety) 01 데이터 과학 (Data Science) • ‘데이터’ 로부터 의미를 추출해내는 학문 • 기업의 실무 현장에서 쌓이는 빅데이터를 대상으로 의미를 추출 • 예를 들면, 인터넷과 휴대전화, 감시용 카메라 등과 같은 정보기술로부터 생성 되는 숫자와 문자, 영상 정보 등 다양한 유형의 데이터를 의미
  • 3. 빅데이터 소개 2 빅데이터의 현황 시대적 상황 • 인터넷 사용의 급격한 발전과 활용은 인터넷 기업의 등장을 촉진 • 페이스북의 경우, 이용자가 1억 명에 이르는데 소요 시간은 단, 9개월 (이용자 5천 만 명에 달하는데 걸린 시간: 라디오 38년, TV 13년, 인터넷 4년, iPod 3 년) • 아날로그에서 디지털로의 정보 흐름의 변화 • 글로벌 네트워크 및 데이터의 개방과 공유 시대 01 <그림1> 인터넷 기업의 등장과 글로벌 디지털 데이터 규모 출처: 정용찬(2012)
  • 4. 빅데이터 소개 3 빅데이터의 중요성 증대 중요성 증대 • 2010년 미 대통령 과학자문위원회, 모든 연방정부 기관의 빅데이터 전략 필요성 강조 • 2012년 다보스 포럼, 위기의 자본주의를 구할 사회 기술 모델로의 도구로 빅데이터 제 시 • 2011년, 국가정보화전략위원회, 빅데이터를 활용한 공공부분의 혁신 패러다임 형성 01 <그림2> ‘Big Data’ 키워드 검색 변화 추이 120 100 80 60 40 20 0 2005 2007 2009 2011 2013 출처: Google Trend, retrieved from https://www.google.com/trends/explore#q=big%20data&cmpt=q FRQ. YEAR
  • 5. 02 빅데이터 방법론 1 전체 프로세스 빅데이터 방법론의 핵심적 프로세스(Process) • 사회과학을 통한 정확한 현상 설명 및 정의 • 측정 수준의 정의에 따른 자동적인 데이터 수집 및 분석, 예측 <Figure 3> Key Process for Big Data Analysis 1 2 3 Conceptualization Operationalization Concep t 6 7 Social Science 4 5 Algorithm Correlation Causation Social Scienc and Computer Science, Statistics, Mathematics Operationalize d Definition Social Phenomena Data Collection Data Analysis Results & Implications Prediction
  • 6. 02 빅데이터 방법론 2 빅데이터를 바라보는 사회과학적 관점 10가지 주요 관점들 • 인간 감각의 확장 (Extension of Human Senses) • 역의제설정이론 (Reversed Agenda-Setting Theory) • 공론장 (Public Sphere) • SNS (Social Network Services) • 집단지성 (Collective Intelligence) • 롱테일 가설 (Long-Tail Hypotheses) • 관계의 미학 (Aesthetic of Relationship) • 소유의 종말 (Age of Access) • 비정형 데이터 (Unstructured Data) • 융합과 통섭 (Convergence and Consilience) 사회과학(Social Science) 사회 현상 1
  • 7. 02 빅데이터 방법론 3 개념을 도출하는 과정 개념화: 개념을 도출하는 과정 • 정의: 개념을 발전시키고 명료화하는 과정. 즉, 단어나 예제로써 하나의 개념을 명확히 하고 정확한 의사전달을 위한 의미에 도달하는 과정. • 예시: 백만 장자, 서울대 교수, 국회의원 ↓ 부, 명예, 권력 ↓ 사회적 지위 사회 현상 개념 1 2 사회과학(Social Science) 개념화 (Conceptualization)
  • 8. 02 빅데이터 방법론 4 조작적 정의 조작화 과정 • 정의: 정량적 수치를 통해 측정할 수 있는 수준으로 모호한 개념을 이끌어 내는 과정 • 예시: Q. 사회적 지위에 대한 조작적 정의? A. 한 개인이 매달에 주기적으로 벌어들이는 수익금의 양!? 개념 조작 적 정의 2 3 사회과학(Social Science) 조작화 (Operationalization)
  • 9. 02 빅데이터 방법론 5 데이터 수집 조작적으로 정의된 개념에 대한 데이터 종류 • 인간 감각의 확장 (Extension of Human Senses) - 예: 인체의 심장 박동 센서를 통한 사람의 감정 데이터 등 • SNS (Social Network Services) - 예: 포털이나 SNS(트위터, 페이스북), 온라인 커뮤니티의 텍스트 데이터 등 • 집단지성 (Collective Intelligence) - 예: 책 한 권에 대한 여러 권의 번역본 텍스트 데이터 등 • 관계의 미학 (Aesthetic of Relationship) - 예: SNS의 친구 관계, 동시 구매를 통해 연결되는 상품 간의 관계 등 - 관계에는 메타데이터를 포함 • 비정형 데이터 (Unstructured Data) - 정형화되기 이전의 모든 로그 데이터 - 예: 로그 데이터(어플리케이션을 사용한 사용자의 모든 동선에 관한 데이 터) 사회과학(Social Science), 컴퓨터과학(Computer Science), 통계학(Statistics), 수학(Mathematics) 조작 적 정의 3 데이 터수 집 4
  • 10. 02 빅데이터 방법론 5 데이터 수집 조작적으로 정의된 개념에 대한 데이터 수집 방법 1) 자체적인 서버 내에서의 데이터 수집 • 하둡(Hadoop): 빅데이터를 안정되고, 빠르고, 용이하게 분석하게 하는 플랫폼 • 필요한 기본 소프트웨어: JAVA Hadoop, R, R studio, MySQL, RMR, RmySQL 등 • 비정형 데이터 2) API(Application Programming Interface)를 통한 오픈(open) 데이터 수집 • 프로그래밍 언어를 사용한 데이터 크롤링 소프트웨어 작성을 통한 수집 - 사용할 수 있는 프로그래밍 언어: Ruby, Python, R, Java 등 • 공개된 API를 통해 받을 수 있는 데이터: 포털의 블로그나 카페의 텍스트 데이터, 포털 의 특정 키워드에 대한 검색 빈도 데이터, 트위터의 사용자 및 트윗에 관한 텍스트 데이 터, 페이스북의 텍스트 데이터, 트위터와 페이스북의 사용자 간 관계 데이터 3) 쉽게 수집할 수 있는 오픈 소프트웨어를 통한 자료 수집 • 네이버 트랜드, 구글 트랜드, 구글 ngram을 이용한 검색 데이터 수집 • 수집 프로그램: NodeXL, Webometric Analyst, WeboNaver, WeboGoogle, DiscoverText 사회과학(Social Science), 컴퓨터과학(Computer Science), 통계학(Statistics), 수학(Mathematics) 조작 적 정의 3 데이 터수 집 4
  • 11. 02 빅데이터 방법론 6 데이터 분석 텍스트 분석 1) 텍스트의 감정 분석(Textual Sentimental Analysis) ① 모델(분석 대상), Dunit(수집 문서), 룰(분석지식) ② 분석 사전(Daumsoft 의 경우, 약 1,000,000만 단어에 대한 사전 보유): 문장 분리 → 품사 태깅(Tagging) → 개체명 인식 → 패러프라이징 (Paraphrasing) → 구문 분석 ③ 지식 매칭 ④ 키팩트(분석 결과): 정제된 키워드 데이터를 통해 감정 분만 아니라 특정 모델 별, 브랜드별, 사이트별, 시계열 분석 가능 사회과학(Social Science), 컴퓨터과학(Computer Science), 통계학(Statistics), 수학(Mathematics) 데이 터수 집 4 데이 터분 석 5 브랜드 쿠팡 티몬 11번가 위메프 아마존 감정 쿠팡 쿠팡 쿠팡 1021 852 721 241 쿠팡 느리다 쿠팡 없다 친절한 좋다 쿠팡 쿠팡 1021 852 721 241 <그림4> 텍스트 감정 분석의 사례
  • 12. <사진1> 텍스트 분석 사례1 – 직장인의 ‘일하다’와 관련한 키워드 출처: Daumsoft
  • 13. <사진2> 텍스트 분석 사례2 – 직장인의 ‘회사 회식’과 관련한 키워드 출처: Daumsoft
  • 14. <사진3> 텍스트 분석 사례3 – 직장인의 요일별 감성 비중 변화 출처: Daumsoft
  • 15. 02 빅데이터 방법론 6 데이터 분석 텍스트 분석 2) 텍스트의 의미망 연결 분석(Textual Semantic Analysis) ① 모델(분석 대상), Dunit(수집 문서), 룰(분석지식) ② 분석 사전(Daumsoft 의 경우, 약 1,000,000만 단어에 대한 사전 보유): 문장 분리 → 품사 태깅(Tagging) → 개체명 인식 → 패러프라이징 (Paraphrasing) → 구문 분석 ③ 지식 매칭 ④ 두 어휘 간의 연결을 지을 수 있는 범위 설정 및 네트워크 데이터 구성 ⑤ 특정 어휘에 감춰진 의미 파악 및 네트워크 구조 분석을 통한 유사한 그룹 도출 사회과학(Social Science), 컴퓨터과학(Computer Science), 통계학(Statistics), 수학(Mathematics) 데이 터수 집 4 데이 터분 석 5 빠르다 <그림5> 텍스트 의미망 연결 분석의 사례 쿠팡맨 느리다 쿠팡 배송 친절한 좋다 상품 없다 위메프 브랜드
  • 16. 02 빅데이터 방법론 6 데이터 분석 네트워크 분석 1) 사회 연결망 분석(Social Network Analysis) – 유사성 분석 ① 모델(분석 대상)에서 관계 유형을 발견 ② 일반적으로 사용되는 정형 데이터를 매트릭스 형 관계 데이터로 재구성 ③ 네트워크 구조적 동일성을 지닌 노드들을 자동 알고리즘에 따라 그룹화시켜줌 ④ 관계의 속성에 따라 그룹이 가진 의미를 발견 사회과학(Social Science), 컴퓨터과학(Computer Science), 통계학(Statistics), 수학(Mathematics) 데이 터수 집 4 데이 터분 석 5 <그림6> 한 사용자가 듣는 가수들 간의 연결을 통한 네트워크 분석의 사례 출처: Slow News, ‘음악시장과 메타데이터: 아이튠즈의 퇴조 vs. 스 포티파이의 성장’, retrieved from http://slownews.kr/30565
  • 17. <그림6> 한 사용자가 듣는 가수들 간의 연결을 통한 네트워크 분석의 사례 출처: Slow News, ‘음악시장과 메타데이터: 아이튠즈의 퇴조 vs. 스포티파이의 성장’, retrieved from http://slownews.kr/30565
  • 18. <사진4> 텍스트 분석 사례4 – 애니팡 분석 사례1 출처: Treum, ‘[트리움의 의미망분석] 요즘 뜨는 애니팡 게임에 ‘숨겨진 코드’, retrieved from http://blog.treum.com/72
  • 19. <사진5> 텍스트 분석 사례5 – 애니팡 분석 사례2 출처: Treum, ‘[트리움의 의미망분석] 요즘 뜨는 애니팡 게임에 ‘숨겨진 코드’, retrieved from http://blog.treum.com/72
  • 20. 02 빅데이터 방법론 6 데이터 분석 데이터 시각화(Data Visualization 혹은 Information Visualization) • 데이터를 정보로 변환하여 유용하게 사용하게 만드는 한 방법 • Sensemaking(데이터에 의미와 통찰력을 부여하는 과정) 의 과정 • Think Visually! • 컴퓨터를 사용하여 인지를 넓힐 수 있도록 데이터를 상호작용이 가능한 시각화 하는 것 • 외부인지보조(External Cognition Aid) 사회과학(Social Science), 컴퓨터과학(Computer Science), 통계학(Statistics), 수학(Mathematics) 데이 터수 집 4 데이 터분 석 5 <그림7> 런던 지하철 과거(좌)와 현재(우)의 시각화 자료 출처: Visual Loop, ‘Vintage Infodesign’, retrieved from http://visualoop.com/11575/vintage-infodesign- 33 출처: Cartography Topics and Projects, retrieved from http://mapmaker.rutgers.edu/355/links.html
  • 21. 02 빅데이터 방법론 7 데이터 결과 도출 및 해석, 예측 결론 도출 및 인사이트 발견, 예측 • 도출된 모든 정보는 연구자의 판단에 의해 맡겨짐 • 데이터는 좋은 의사결정을 내리는데 보조 도구일 뿐 최종 판단은 사람에 의해 이루어짐 사회과학(Social Science), 컴퓨터과학(Computer Science), 통계학(Statistics), 수학(Mathematics) 데이 터분 석 5 결론 6 도출 “사람들은 자기 식대로 사물을 추론한다. 그 사물의 목적을 지워버린다.” in <The Tragedy of Julius Caesar>, by 셰익스피어 7 예측
  • 22. Choi, Myunggoon Data Analyst 사용자분석팀,UX Lab, Coupang E-mail: myunggoonchoi@coupang.com E-mail: Myunggoon.choi@gmail.com Tel: 02. 6150. 4098 Mobile: 010. 9692. 3080. Thank you