SlideShare a Scribd company logo
1 of 44
Download to read offline
2011년 제4회 사내 기술 세미나
- 부제: 빅 데이터 개요 및 동향
2011.12.21
Contents
Big Data! 넌 뭐니?
Big Data 관련 핵심 기술들
Big Data 관련 동향
펜타가 주목해야 할 것들...
마무리
당신의 머리 속을 스치는 생각...
당신의 머리 속을 스치는 생각...
Source: Mike Driscoll, CTO Metamarkets: The Three Sexy Skills of Data Scientists (& Data Driven Startups)
당신의 머리 속을 스치는 생각...
당신의 머리 속을 스치는 생각...
Q. Big Data가 과연 이슈인가요?
여러분의 생각은 어떠신지요?
Big Data? 거대 데이터? 엄청 큰 데이터?
Big Data! 넌 뭐니?
Big Data! 넌 뭐니?
Big Data의 특징
Big Data! 넌 뭐니?
Big Data의 출현 배경
Big Data는 왜 중요한가? → Big Data는 이미 진행 중
Big Data! 넌 뭐니?
Big Data! 넌 뭐니?
Big Data는 왜 중요한가? → 정보 밀집도가 Critical Mass에 도달
Big Data! 넌 뭐니?
Big Data는 왜 중요한가? → Big Data의 Magic
Big Data! 넌 뭐니?
Big Data는 왜 중요한가? → 스마트 혁명의 핵심자원(제4의 경영자원)
Big Data! 넌 뭐니?
데이터 특성에 따른 빅 데이터의 포지셔닝(PwC, 2010.)
Big Data! 넌 뭐니?
Big Data = Complex Data
Big Data! 넌 뭐니?
Gartner(2011.1, ‘Big Data Analytics’)
– 빠른 의사결정이 상대적으로 덜 요구된다.
• 대용량 데이터에 기반한 분석 위주로, 장기적/전략적 접근 필요
– 처리 Processing 복잡도가 높다.
• 다양한 데이터 소스, 복잡한 로직 처리, 대용량 데이터 처리 등으로 인해 처
리 복잡도가 매우 높으며, 이를 해결하기 위해 분산 처리 기술이 필요
– 처리할 데이터양이 방대하다.
• 클릭스트림 데이터를 예로 들면, 고객 정보수집 및 분석을 장기간에 걸쳐 수
행해야 하므로 기존 방법과 비교해 처리해야 할 데이터양 방대
– 비정형 데이터의 비중이 높다.
• 소셜 미디어 데이터, 로그 파일, 클릭스트림 데이터, 콜 센터 로그, 통신
CDR 로그 등 비정형 데이터 파일의 비중이 매우 높음(처리의 복잡성 증대)
– 처리/분석 유연성이 높다
• 잘 정의된 데이터 모델/상관관계/절차 등이 없어, 기존 데이터 처리방법에
비해 처리/분석의 유연성이 높은 편, 새롭고 다양한 처리방법의 수용을 위해,
유연성이 기본적으로 보장돼야 함
– 동시 처리량(Throughput)이 낮다.
• 대용량 및 복잡한 처리 특징, 동시에 처리가 필요한 데이터양은 적음
• (준)실시간 처리가 보장되어야 하는 데이터 분석에는 적합하지 않음
Big Data! 넌 뭐니?
참고) 빅 데이터의 성격
Big Data 관련 핵심 기술들
Big Data 처리 흐름
Big Data 관련 핵심 기술들
Big Data 처리의 어려움
Big Data 관련 핵심 기술들
Big Data 요구사항
Big Data 관련 핵심 기술들
Big Data 필요 기술
Big Data 관련 핵심 기술들
Big Data Architecture(예시 1)
Big Data 관련 핵심 기술들
Big Data Architecture 컴포넌트(예시 1)(1/2)
Big Data 관련 핵심 기술들
Big Data Architecture 컴포넌트(예시 1)(1/2)
Big Data 관련 핵심 기술들
Big Data Architecture(예시 2)
Big Data 관련 핵심 기술들
Big Data 필요 기술(예시 2)
Big Data 관련 핵심 기술들
핵심 기술 1: 클라우드 컴퓨팅(1/3)
Big Data 관련 핵심 기술들
핵심 기술 1: 클라우드 컴퓨팅 (2/3)
Big Data 관련 핵심 기술들
핵심 기술 1: 클라우드 컴퓨팅(3/3)
– 데이터의 상당 부분이 클라우드에서 생산되고 유통
• 2020년 생산되는 데이터 중 클라우드 내에 있는 비율: 5/35 Zettabyte
(14.3%)
• 2020년 생산되는 데이터 중 클라우드로 유통되는 비율: 12/35 Zettabyte
(34.3%)
– 클라우드 컴퓨팅 기술 – Big data
Enabler
• Hadoop과 MapReduce는 거대
데이타를 개별 클러스터에 분산, 저
장하고 보관
• 노드에서 병렬 처리함으로써 고속
처리, 저비용화 달성
Big Data 관련 핵심 기술들
핵심 기술 2: 실시간 분석
Big Data 관련 핵심 기술들
핵심 기술 3: 네트워크 역량 강화
Big Data 관련 동향
Hype Cycle for Emerging Technologies
Big Data 관련 동향
Gartner 선정 Top 10 전략적 기술 영역
Big Data 관련 동향
대용량(Large Scale) 데이터 처리 동향 (Cloud)
Big Data 관련 동향
대용량(Large Scale) 데이터 처리 동향 (DW)
Big Data 관련 동향
참고) NOSQL 기반 DBMS와 RDBMS의 차이점
Big Data 관련 동향
참고) Big-data Analytics Complements DW
Big Data 관련 동향
활용분야
Big Data 관련 동향
Big Data 활용사례
Big Data 관련 동향
Big Data 활용사례: 가치 평가
펜타가 주목해야 할 것들...
Big Data – Segments of Opportunity
Spreadsheets/
Visualization
Connectors/
Integration
Hadoop
Distributions
File Storage
Tools &
Analytics
*Now Hitachi
Analytical
Applications
Analytical
Platform
*Now Teradata *Now HP *Now EMC
펜타가 주목해야 할 것들...
마무리
빅 데이터 확산에 따른 도전과 기회
– 새로운 가치와 수익 창출원으로 기대를 모으고 있으나, ‘빅 브라더’
에 대한 우려와 전문인력 부족 등 해결해야 할 많은 도전과제도 상존
– 데이터 축적량이 양적 거대함을 질적 유용함으로 전환할 시기 임박
– New BM으로서 Big data 서비스 발굴: Big Data와 플랫폼 통합
– BigData는 하나의 솔루션으로 해결할 수 없으며 요구사항, Data의 성
격 등에 따라 다양한 솔루션으로 조합되어야 함
– 오픈소스 중심의 소프트웨어 스택을 구축, 운영이 절실(기술력을 갖추
어야 함)
→ 빅 데이터의 핵심은 데이터의 비즈니스화(막대한 양의 1차 데이
터가 아닌 가공된 2차 데이터가 진정한 의미의 빅 데이터)
To be continued…

More Related Content

Viewers also liked

Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료Seul Koo
 
엘라스틱서치 분석 이해하기 20160623
엘라스틱서치 분석 이해하기 20160623엘라스틱서치 분석 이해하기 20160623
엘라스틱서치 분석 이해하기 20160623Yong Joon Moon
 
2016 software engineering workshop 알려주지 않았지만 알아야 하는 사실들
2016 software engineering workshop 알려주지 않았지만 알아야 하는 사실들2016 software engineering workshop 알려주지 않았지만 알아야 하는 사실들
2016 software engineering workshop 알려주지 않았지만 알아야 하는 사실들Junsu Kim
 
[FOSS4G Korea 2014] Making Base Maps with Open Data
[FOSS4G Korea 2014] Making Base Maps with Open Data[FOSS4G Korea 2014] Making Base Maps with Open Data
[FOSS4G Korea 2014] Making Base Maps with Open DataMinPa Lee
 
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2Donghan Kim
 
빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)Channy Yun
 
2012 빅데이터 big data 발표자료
2012 빅데이터 big data 발표자료2012 빅데이터 big data 발표자료
2012 빅데이터 big data 발표자료Wooseung Kim
 
R & big data analysis 20120531
R & big data analysis 20120531R & big data analysis 20120531
R & big data analysis 20120531JeongMin Kwon
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)Myungjin Lee
 
Becoming a Data Driven Oil and Gas Enterprise with Advanced Analytics and Hadoop
Becoming a Data Driven Oil and Gas Enterprise with Advanced Analytics and HadoopBecoming a Data Driven Oil and Gas Enterprise with Advanced Analytics and Hadoop
Becoming a Data Driven Oil and Gas Enterprise with Advanced Analytics and HadoopDataWorks Summit
 
Oil & Gas Big Data use cases
Oil & Gas Big Data use casesOil & Gas Big Data use cases
Oil & Gas Big Data use caseselephantscale
 
Big Data in Oil and Gas: How to Tap Its Full Potential
Big Data in Oil and Gas: How to Tap Its Full PotentialBig Data in Oil and Gas: How to Tap Its Full Potential
Big Data in Oil and Gas: How to Tap Its Full PotentialHitachi Vantara
 
Big value for big data in oil and gas industry!
Big value for big data in oil and gas industry!Big value for big data in oil and gas industry!
Big value for big data in oil and gas industry!Sai Natkar
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해수보 김
 
A Brief History of Big Data
A Brief History of Big DataA Brief History of Big Data
A Brief History of Big DataBernard Marr
 

Viewers also liked (16)

Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
 
엘라스틱서치 분석 이해하기 20160623
엘라스틱서치 분석 이해하기 20160623엘라스틱서치 분석 이해하기 20160623
엘라스틱서치 분석 이해하기 20160623
 
2016 software engineering workshop 알려주지 않았지만 알아야 하는 사실들
2016 software engineering workshop 알려주지 않았지만 알아야 하는 사실들2016 software engineering workshop 알려주지 않았지만 알아야 하는 사실들
2016 software engineering workshop 알려주지 않았지만 알아야 하는 사실들
 
[FOSS4G Korea 2014] Making Base Maps with Open Data
[FOSS4G Korea 2014] Making Base Maps with Open Data[FOSS4G Korea 2014] Making Base Maps with Open Data
[FOSS4G Korea 2014] Making Base Maps with Open Data
 
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
 
빅데이터
빅데이터빅데이터
빅데이터
 
빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)
 
2012 빅데이터 big data 발표자료
2012 빅데이터 big data 발표자료2012 빅데이터 big data 발표자료
2012 빅데이터 big data 발표자료
 
R & big data analysis 20120531
R & big data analysis 20120531R & big data analysis 20120531
R & big data analysis 20120531
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
 
Becoming a Data Driven Oil and Gas Enterprise with Advanced Analytics and Hadoop
Becoming a Data Driven Oil and Gas Enterprise with Advanced Analytics and HadoopBecoming a Data Driven Oil and Gas Enterprise with Advanced Analytics and Hadoop
Becoming a Data Driven Oil and Gas Enterprise with Advanced Analytics and Hadoop
 
Oil & Gas Big Data use cases
Oil & Gas Big Data use casesOil & Gas Big Data use cases
Oil & Gas Big Data use cases
 
Big Data in Oil and Gas: How to Tap Its Full Potential
Big Data in Oil and Gas: How to Tap Its Full PotentialBig Data in Oil and Gas: How to Tap Its Full Potential
Big Data in Oil and Gas: How to Tap Its Full Potential
 
Big value for big data in oil and gas industry!
Big value for big data in oil and gas industry!Big value for big data in oil and gas industry!
Big value for big data in oil and gas industry!
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
 
A Brief History of Big Data
A Brief History of Big DataA Brief History of Big Data
A Brief History of Big Data
 

More from Donghan Kim

안전한 활용을 위한 개인정보 비식별화 동향-IITP-2052-2022-6.pdf
안전한 활용을 위한 개인정보 비식별화 동향-IITP-2052-2022-6.pdf안전한 활용을 위한 개인정보 비식별화 동향-IITP-2052-2022-6.pdf
안전한 활용을 위한 개인정보 비식별화 동향-IITP-2052-2022-6.pdfDonghan Kim
 
개인정보 비식별화 기술 동향 및 전망
개인정보 비식별화 기술 동향 및 전망 개인정보 비식별화 기술 동향 및 전망
개인정보 비식별화 기술 동향 및 전망 Donghan Kim
 
개인정보 비식별화 이해-김동한(공유)-2017-6-15
개인정보 비식별화 이해-김동한(공유)-2017-6-15개인정보 비식별화 이해-김동한(공유)-2017-6-15
개인정보 비식별화 이해-김동한(공유)-2017-6-15Donghan Kim
 
2016 국가정보화백서(국문 )-빅데이터 part-2016-12
2016 국가정보화백서(국문 )-빅데이터 part-2016-122016 국가정보화백서(국문 )-빅데이터 part-2016-12
2016 국가정보화백서(국문 )-빅데이터 part-2016-12Donghan Kim
 
공공_빅데이터_분석의_확산을_위한_첫걸음-2016-12
공공_빅데이터_분석의_확산을_위한_첫걸음-2016-12공공_빅데이터_분석의_확산을_위한_첫걸음-2016-12
공공_빅데이터_분석의_확산을_위한_첫걸음-2016-12Donghan Kim
 
Ai(인공지능) & ML(머신러닝) 101 Part1
Ai(인공지능) & ML(머신러닝) 101 Part1Ai(인공지능) & ML(머신러닝) 101 Part1
Ai(인공지능) & ML(머신러닝) 101 Part1Donghan Kim
 
기업 클라우드 유연성, 상호운영성 확보를 위한 해답,SDx-2015-11-11
기업 클라우드 유연성, 상호운영성 확보를 위한 해답,SDx-2015-11-11기업 클라우드 유연성, 상호운영성 확보를 위한 해답,SDx-2015-11-11
기업 클라우드 유연성, 상호운영성 확보를 위한 해답,SDx-2015-11-11Donghan Kim
 
ICT기반팩토리-FaaS
ICT기반팩토리-FaaSICT기반팩토리-FaaS
ICT기반팩토리-FaaSDonghan Kim
 
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강Donghan Kim
 
FinTech 알아보기-2015-2-24
FinTech 알아보기-2015-2-24FinTech 알아보기-2015-2-24
FinTech 알아보기-2015-2-24Donghan Kim
 
제5회 사내기술세미나-IT Compliance-김동한-2009-12-4
제5회 사내기술세미나-IT Compliance-김동한-2009-12-4제5회 사내기술세미나-IT Compliance-김동한-2009-12-4
제5회 사내기술세미나-IT Compliance-김동한-2009-12-4Donghan Kim
 
Green IT-2009-4-14
Green IT-2009-4-14Green IT-2009-4-14
Green IT-2009-4-14Donghan Kim
 
Social Commerce 2014-11
Social Commerce 2014-11Social Commerce 2014-11
Social Commerce 2014-11Donghan Kim
 
제3회 사내기술세미나-hadoop(배포용)-dh kim-2014-10-1
제3회 사내기술세미나-hadoop(배포용)-dh kim-2014-10-1제3회 사내기술세미나-hadoop(배포용)-dh kim-2014-10-1
제3회 사내기술세미나-hadoop(배포용)-dh kim-2014-10-1Donghan Kim
 
스마트폰의 모바일 서비스 현황-국회도서관보기고-2010-5
스마트폰의 모바일 서비스 현황-국회도서관보기고-2010-5스마트폰의 모바일 서비스 현황-국회도서관보기고-2010-5
스마트폰의 모바일 서비스 현황-국회도서관보기고-2010-5Donghan Kim
 
제2회 사내기술세미나-no sql(배표용)-d-hankim-2013-4-30
제2회 사내기술세미나-no sql(배표용)-d-hankim-2013-4-30제2회 사내기술세미나-no sql(배표용)-d-hankim-2013-4-30
제2회 사내기술세미나-no sql(배표용)-d-hankim-2013-4-30Donghan Kim
 
3A1P, 통합 계정 관리(IAM:Identity Access Management)-DHan-Kim-2012-11-6
3A1P, 통합 계정 관리(IAM:Identity Access Management)-DHan-Kim-2012-11-63A1P, 통합 계정 관리(IAM:Identity Access Management)-DHan-Kim-2012-11-6
3A1P, 통합 계정 관리(IAM:Identity Access Management)-DHan-Kim-2012-11-6Donghan Kim
 
제2회 i talks-세미나-openstack+openshift-2014-5-28
제2회 i talks-세미나-openstack+openshift-2014-5-28제2회 i talks-세미나-openstack+openshift-2014-5-28
제2회 i talks-세미나-openstack+openshift-2014-5-28Donghan Kim
 
IOT(사물인터넷)-제1회 iTalks 세미나-Dhankim-2014-4-2
IOT(사물인터넷)-제1회 iTalks 세미나-Dhankim-2014-4-2IOT(사물인터넷)-제1회 iTalks 세미나-Dhankim-2014-4-2
IOT(사물인터넷)-제1회 iTalks 세미나-Dhankim-2014-4-2Donghan Kim
 
2014 정보보호 트렌드-Dhan-kim-2014-3-25
2014 정보보호 트렌드-Dhan-kim-2014-3-252014 정보보호 트렌드-Dhan-kim-2014-3-25
2014 정보보호 트렌드-Dhan-kim-2014-3-25Donghan Kim
 

More from Donghan Kim (20)

안전한 활용을 위한 개인정보 비식별화 동향-IITP-2052-2022-6.pdf
안전한 활용을 위한 개인정보 비식별화 동향-IITP-2052-2022-6.pdf안전한 활용을 위한 개인정보 비식별화 동향-IITP-2052-2022-6.pdf
안전한 활용을 위한 개인정보 비식별화 동향-IITP-2052-2022-6.pdf
 
개인정보 비식별화 기술 동향 및 전망
개인정보 비식별화 기술 동향 및 전망 개인정보 비식별화 기술 동향 및 전망
개인정보 비식별화 기술 동향 및 전망
 
개인정보 비식별화 이해-김동한(공유)-2017-6-15
개인정보 비식별화 이해-김동한(공유)-2017-6-15개인정보 비식별화 이해-김동한(공유)-2017-6-15
개인정보 비식별화 이해-김동한(공유)-2017-6-15
 
2016 국가정보화백서(국문 )-빅데이터 part-2016-12
2016 국가정보화백서(국문 )-빅데이터 part-2016-122016 국가정보화백서(국문 )-빅데이터 part-2016-12
2016 국가정보화백서(국문 )-빅데이터 part-2016-12
 
공공_빅데이터_분석의_확산을_위한_첫걸음-2016-12
공공_빅데이터_분석의_확산을_위한_첫걸음-2016-12공공_빅데이터_분석의_확산을_위한_첫걸음-2016-12
공공_빅데이터_분석의_확산을_위한_첫걸음-2016-12
 
Ai(인공지능) & ML(머신러닝) 101 Part1
Ai(인공지능) & ML(머신러닝) 101 Part1Ai(인공지능) & ML(머신러닝) 101 Part1
Ai(인공지능) & ML(머신러닝) 101 Part1
 
기업 클라우드 유연성, 상호운영성 확보를 위한 해답,SDx-2015-11-11
기업 클라우드 유연성, 상호운영성 확보를 위한 해답,SDx-2015-11-11기업 클라우드 유연성, 상호운영성 확보를 위한 해답,SDx-2015-11-11
기업 클라우드 유연성, 상호운영성 확보를 위한 해답,SDx-2015-11-11
 
ICT기반팩토리-FaaS
ICT기반팩토리-FaaSICT기반팩토리-FaaS
ICT기반팩토리-FaaS
 
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강
 
FinTech 알아보기-2015-2-24
FinTech 알아보기-2015-2-24FinTech 알아보기-2015-2-24
FinTech 알아보기-2015-2-24
 
제5회 사내기술세미나-IT Compliance-김동한-2009-12-4
제5회 사내기술세미나-IT Compliance-김동한-2009-12-4제5회 사내기술세미나-IT Compliance-김동한-2009-12-4
제5회 사내기술세미나-IT Compliance-김동한-2009-12-4
 
Green IT-2009-4-14
Green IT-2009-4-14Green IT-2009-4-14
Green IT-2009-4-14
 
Social Commerce 2014-11
Social Commerce 2014-11Social Commerce 2014-11
Social Commerce 2014-11
 
제3회 사내기술세미나-hadoop(배포용)-dh kim-2014-10-1
제3회 사내기술세미나-hadoop(배포용)-dh kim-2014-10-1제3회 사내기술세미나-hadoop(배포용)-dh kim-2014-10-1
제3회 사내기술세미나-hadoop(배포용)-dh kim-2014-10-1
 
스마트폰의 모바일 서비스 현황-국회도서관보기고-2010-5
스마트폰의 모바일 서비스 현황-국회도서관보기고-2010-5스마트폰의 모바일 서비스 현황-국회도서관보기고-2010-5
스마트폰의 모바일 서비스 현황-국회도서관보기고-2010-5
 
제2회 사내기술세미나-no sql(배표용)-d-hankim-2013-4-30
제2회 사내기술세미나-no sql(배표용)-d-hankim-2013-4-30제2회 사내기술세미나-no sql(배표용)-d-hankim-2013-4-30
제2회 사내기술세미나-no sql(배표용)-d-hankim-2013-4-30
 
3A1P, 통합 계정 관리(IAM:Identity Access Management)-DHan-Kim-2012-11-6
3A1P, 통합 계정 관리(IAM:Identity Access Management)-DHan-Kim-2012-11-63A1P, 통합 계정 관리(IAM:Identity Access Management)-DHan-Kim-2012-11-6
3A1P, 통합 계정 관리(IAM:Identity Access Management)-DHan-Kim-2012-11-6
 
제2회 i talks-세미나-openstack+openshift-2014-5-28
제2회 i talks-세미나-openstack+openshift-2014-5-28제2회 i talks-세미나-openstack+openshift-2014-5-28
제2회 i talks-세미나-openstack+openshift-2014-5-28
 
IOT(사물인터넷)-제1회 iTalks 세미나-Dhankim-2014-4-2
IOT(사물인터넷)-제1회 iTalks 세미나-Dhankim-2014-4-2IOT(사물인터넷)-제1회 iTalks 세미나-Dhankim-2014-4-2
IOT(사물인터넷)-제1회 iTalks 세미나-Dhankim-2014-4-2
 
2014 정보보호 트렌드-Dhan-kim-2014-3-25
2014 정보보호 트렌드-Dhan-kim-2014-3-252014 정보보호 트렌드-Dhan-kim-2014-3-25
2014 정보보호 트렌드-Dhan-kim-2014-3-25
 

제4회 사내기술세미나-big data-빅데이터개요및동향-dh kim-2011-12-21

  • 1. 2011년 제4회 사내 기술 세미나 - 부제: 빅 데이터 개요 및 동향 2011.12.21
  • 2. Contents Big Data! 넌 뭐니? Big Data 관련 핵심 기술들 Big Data 관련 동향 펜타가 주목해야 할 것들... 마무리
  • 3. 당신의 머리 속을 스치는 생각...
  • 4. 당신의 머리 속을 스치는 생각...
  • 5. Source: Mike Driscoll, CTO Metamarkets: The Three Sexy Skills of Data Scientists (& Data Driven Startups) 당신의 머리 속을 스치는 생각...
  • 6. 당신의 머리 속을 스치는 생각... Q. Big Data가 과연 이슈인가요? 여러분의 생각은 어떠신지요?
  • 7. Big Data? 거대 데이터? 엄청 큰 데이터? Big Data! 넌 뭐니?
  • 8. Big Data! 넌 뭐니? Big Data의 특징
  • 9. Big Data! 넌 뭐니? Big Data의 출현 배경
  • 10. Big Data는 왜 중요한가? → Big Data는 이미 진행 중 Big Data! 넌 뭐니?
  • 11. Big Data! 넌 뭐니? Big Data는 왜 중요한가? → 정보 밀집도가 Critical Mass에 도달
  • 12. Big Data! 넌 뭐니? Big Data는 왜 중요한가? → Big Data의 Magic
  • 13. Big Data! 넌 뭐니? Big Data는 왜 중요한가? → 스마트 혁명의 핵심자원(제4의 경영자원)
  • 14. Big Data! 넌 뭐니? 데이터 특성에 따른 빅 데이터의 포지셔닝(PwC, 2010.)
  • 15. Big Data! 넌 뭐니? Big Data = Complex Data
  • 16. Big Data! 넌 뭐니? Gartner(2011.1, ‘Big Data Analytics’) – 빠른 의사결정이 상대적으로 덜 요구된다. • 대용량 데이터에 기반한 분석 위주로, 장기적/전략적 접근 필요 – 처리 Processing 복잡도가 높다. • 다양한 데이터 소스, 복잡한 로직 처리, 대용량 데이터 처리 등으로 인해 처 리 복잡도가 매우 높으며, 이를 해결하기 위해 분산 처리 기술이 필요 – 처리할 데이터양이 방대하다. • 클릭스트림 데이터를 예로 들면, 고객 정보수집 및 분석을 장기간에 걸쳐 수 행해야 하므로 기존 방법과 비교해 처리해야 할 데이터양 방대 – 비정형 데이터의 비중이 높다. • 소셜 미디어 데이터, 로그 파일, 클릭스트림 데이터, 콜 센터 로그, 통신 CDR 로그 등 비정형 데이터 파일의 비중이 매우 높음(처리의 복잡성 증대) – 처리/분석 유연성이 높다 • 잘 정의된 데이터 모델/상관관계/절차 등이 없어, 기존 데이터 처리방법에 비해 처리/분석의 유연성이 높은 편, 새롭고 다양한 처리방법의 수용을 위해, 유연성이 기본적으로 보장돼야 함 – 동시 처리량(Throughput)이 낮다. • 대용량 및 복잡한 처리 특징, 동시에 처리가 필요한 데이터양은 적음 • (준)실시간 처리가 보장되어야 하는 데이터 분석에는 적합하지 않음
  • 17. Big Data! 넌 뭐니? 참고) 빅 데이터의 성격
  • 18. Big Data 관련 핵심 기술들 Big Data 처리 흐름
  • 19. Big Data 관련 핵심 기술들 Big Data 처리의 어려움
  • 20. Big Data 관련 핵심 기술들 Big Data 요구사항
  • 21. Big Data 관련 핵심 기술들 Big Data 필요 기술
  • 22. Big Data 관련 핵심 기술들 Big Data Architecture(예시 1)
  • 23. Big Data 관련 핵심 기술들 Big Data Architecture 컴포넌트(예시 1)(1/2)
  • 24. Big Data 관련 핵심 기술들 Big Data Architecture 컴포넌트(예시 1)(1/2)
  • 25. Big Data 관련 핵심 기술들 Big Data Architecture(예시 2)
  • 26. Big Data 관련 핵심 기술들 Big Data 필요 기술(예시 2)
  • 27. Big Data 관련 핵심 기술들 핵심 기술 1: 클라우드 컴퓨팅(1/3)
  • 28. Big Data 관련 핵심 기술들 핵심 기술 1: 클라우드 컴퓨팅 (2/3)
  • 29. Big Data 관련 핵심 기술들 핵심 기술 1: 클라우드 컴퓨팅(3/3) – 데이터의 상당 부분이 클라우드에서 생산되고 유통 • 2020년 생산되는 데이터 중 클라우드 내에 있는 비율: 5/35 Zettabyte (14.3%) • 2020년 생산되는 데이터 중 클라우드로 유통되는 비율: 12/35 Zettabyte (34.3%) – 클라우드 컴퓨팅 기술 – Big data Enabler • Hadoop과 MapReduce는 거대 데이타를 개별 클러스터에 분산, 저 장하고 보관 • 노드에서 병렬 처리함으로써 고속 처리, 저비용화 달성
  • 30. Big Data 관련 핵심 기술들 핵심 기술 2: 실시간 분석
  • 31. Big Data 관련 핵심 기술들 핵심 기술 3: 네트워크 역량 강화
  • 32. Big Data 관련 동향 Hype Cycle for Emerging Technologies
  • 33. Big Data 관련 동향 Gartner 선정 Top 10 전략적 기술 영역
  • 34. Big Data 관련 동향 대용량(Large Scale) 데이터 처리 동향 (Cloud)
  • 35. Big Data 관련 동향 대용량(Large Scale) 데이터 처리 동향 (DW)
  • 36. Big Data 관련 동향 참고) NOSQL 기반 DBMS와 RDBMS의 차이점
  • 37. Big Data 관련 동향 참고) Big-data Analytics Complements DW
  • 38. Big Data 관련 동향 활용분야
  • 39. Big Data 관련 동향 Big Data 활용사례
  • 40. Big Data 관련 동향 Big Data 활용사례: 가치 평가
  • 41. 펜타가 주목해야 할 것들... Big Data – Segments of Opportunity Spreadsheets/ Visualization Connectors/ Integration Hadoop Distributions File Storage Tools & Analytics *Now Hitachi Analytical Applications Analytical Platform *Now Teradata *Now HP *Now EMC
  • 43. 마무리 빅 데이터 확산에 따른 도전과 기회 – 새로운 가치와 수익 창출원으로 기대를 모으고 있으나, ‘빅 브라더’ 에 대한 우려와 전문인력 부족 등 해결해야 할 많은 도전과제도 상존 – 데이터 축적량이 양적 거대함을 질적 유용함으로 전환할 시기 임박 – New BM으로서 Big data 서비스 발굴: Big Data와 플랫폼 통합 – BigData는 하나의 솔루션으로 해결할 수 없으며 요구사항, Data의 성 격 등에 따라 다양한 솔루션으로 조합되어야 함 – 오픈소스 중심의 소프트웨어 스택을 구축, 운영이 절실(기술력을 갖추 어야 함) → 빅 데이터의 핵심은 데이터의 비즈니스화(막대한 양의 1차 데이 터가 아닌 가공된 2차 데이터가 진정한 의미의 빅 데이터)