SlideShare a Scribd company logo
1 of 12
김민섭
과거 아날로그 환경에서 생성되던 데이터에 비하면 그 규모가 방대하고,
생성 주기도 짧고, 형태도 수치 데이터뿐 아니라 문자와 영상 데이터를
포함하는 대규모 데이터를 말한다.
BIG DATA?아날로그 DATA
UCC, SNS, 블로그 ,CCTV, 스포츠 등 일상에서 일어나고 있는 모든 일에
대한 데이터 들이 상상이상으로 급증현상이 일어나고 있다.
-다양하고 방대한 규모의 데이터는 미래 경쟁력의 우위를 좌우하는 중요한 자원으로
활용될 수 있다는 점에서 주목 받고 있다.
공공기관의 입장에서도 빅데이터의 등장은 시민이 요구하는 서비스를 제공할 수 있는
기회로 작용한다. 이는 ‘사회적 비용 감소와 공공 서비스 품질 향상’을 가능하게 만든다.
 Economist 가 전 세계 약 600개 기업을 대상으로
 빅데이터가 기업에 어떠한 영향을 끼치는 가 ?
Big data가 기존의 비즈니스 모델을
완전히 바꾼다. 10%
기업의 의사결정의 중요한 요소로 작용할 것이다. 46%
 기업 내에서 빅데이터를 어떻게 활용하고 있는가 ?
기업 내부에 사용 가능한 데이터는 충분, but 데이터 방치
일부만 활용하고 있다. 53%
25%
부가가치 창출을 위해서는 더 많은 노력이 필요하다!
구글 번역 수억 개의 문서의 패턴을 스스로 분석, 번역하는 시스템 개발.
아마존 고객의 구매 도서 데이터 들을 분석하여 구매 예상 도서 추천 시스템 개발.
yutube 이용자의 선호하는 동영상 채널을 구성할 수 있는 개별 홈페이지를 제공.
축구 선수들의 몸에 센서를 부착시켜
운동량부터 순간속도, 심박수 , 슈팅 동작,방향 등 데이터를 실시간 수집, 분석할 수 있다.
라쿠텐 고객의 정보와 구매내역, 서비스 예약 정보가 통합되어 있다.
라쿠텐은 이를 활용해 그룹 내 전자상거래 사업과 신용결제 서비스, 포털, 여행, 증권 ,프
로스포츠 사업 부문에서 공동 활용한다.
빅데이터를 활용하는 곳은 전세계 여러 분야에서 활용하고 있으며 Hadoop
이라는 오픈소스의 관심도도 같이 높아지고 있는 상황이다.
성능이 좋은 장비?
(Scale up)
많은 수의 장비?
(Scale out)
대량의 정보를 효과적으로 저장하기 위한 분산파일 시스템
(GFS, Google File System)
대용량 데이터의 읽기와 쓰기를 위한 분산 스토리지 시스템
(Bigtable)
구글의 Sawzall 언어의 등장( SQL과 유사 하다. )
Open-source software
빅데이터 처리 언어
Yahoo-2006년 개발 (과거)
Apache- 개발 주도 (현재)
1. 구글 기술인 GFS 공개 이후 본격적으로 개발되었지만 ,
구글의 시스템과 대응되는 체계로 구성.
2. 오픈 소스이므로 무료로 이용할 수 있어 개발 비용 감소.
3. 구글 , 페이스북 , 트위터와 같은 빅데이터가 필수인 기업을 시작으로
최근 다 방면으로 확장해 나가고 있다.
더그 커팅- 하둡 개발자
- 현실 마이닝: 2008년 미래 유망 기술로 MIT에서 발표한 개념.
- [오디오 마이닝] : 컴퓨터 음성파일에서 단어를 추출하여 색인을 만든 후
할 때 이를 사용하는 프로세스
- [비디오 마이닝] : 매장에 비디오 카메라를 설치해 놓고 방문객들의 행태를 분석
구 분 내 용
데이터 마이닝 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아 내는 것이다
텍스트 마이닝 자연어로 구성된 텍스트 데이터에서 패턴 또는 관계를 추출하여 가치와 의미 있는 정보를
찾아내는 마이닝 기법.
사람이 말하는 언어를 이해할 수 있는 자연어처리 기술에 기반한다.
웹 마이닝 인터넷 상에서 수집된 정보를 데이터 마이닝 방법으로 분석 통합하는 기법
웹 마이닝은 콘텐츠 마이닝(웹 검색 수집, 데이터), 구조 마이닝(웹 사이트구조), 활용 마이닝(사용자
이용 형태) 등으로 세분화 한다.
소셜 분석,
소셜 마이닝
소셜 미디어에 올라오는 글과 사용자를 분석해 소비자의 흐름이나 패턴 등을 분석하고 판매나 홍보
에 적용.
마케팅 분야뿐만 아니라 사회의 흐름과 트렌드 , 여론 번화추이를 읽어내는 소셜 미디어 시대의 새
로운 마이닝 기법이다. (18대 대선, 등)
현실 마이닝 사람들의 행동패턴을 예측하기 위해 사회적 행동과 관련된 정보를 기기(휴대폰, GPS 등)을 통해 얻
고 분석하는 기법.
휴대폰 등 모바일 기기들을 통해 현실에서 발생하는 정보를 기반으로 인간관계와 행동 등을 추론.
Big data

More Related Content

Similar to Big data

빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향
atelier t*h
 
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
Peter Woo
 
사물인터넷과 주변 생태계의 변화
사물인터넷과 주변 생태계의 변화사물인터넷과 주변 생태계의 변화
사물인터넷과 주변 생태계의 변화
atelier t*h
 
Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가
Wooseung Kim
 

Similar to Big data (20)

2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
 
DLAB company info and big data case studies
DLAB company info and big data case studiesDLAB company info and big data case studies
DLAB company info and big data case studies
 
건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
 
빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향
 
빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)
 
02 fount ai_ir자료
02 fount ai_ir자료02 fount ai_ir자료
02 fount ai_ir자료
 
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
 
Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료
 
Hitachi Social Innovation Forum 2016 TOKYO 기조 연설
 Hitachi Social Innovation Forum 2016 TOKYO 기조 연설  Hitachi Social Innovation Forum 2016 TOKYO 기조 연설
Hitachi Social Innovation Forum 2016 TOKYO 기조 연설
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터
 
BigData, Hadoop과 Node.js
BigData, Hadoop과 Node.jsBigData, Hadoop과 Node.js
BigData, Hadoop과 Node.js
 
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
 
사물인터넷과 주변 생태계의 변화
사물인터넷과 주변 생태계의 변화사물인터넷과 주변 생태계의 변화
사물인터넷과 주변 생태계의 변화
 
Big Data 대충 알아보기
Big Data 대충 알아보기Big Data 대충 알아보기
Big Data 대충 알아보기
 
How to Make Money from Data - Global Cases
How to Make Money from Data - Global CasesHow to Make Money from Data - Global Cases
How to Make Money from Data - Global Cases
 
[메조미디어] 2024 트렌드 리포트
[메조미디어] 2024 트렌드 리포트[메조미디어] 2024 트렌드 리포트
[메조미디어] 2024 트렌드 리포트
 
국내외 공간빅데이터 정책 및 기술동향
국내외 공간빅데이터 정책 및 기술동향국내외 공간빅데이터 정책 및 기술동향
국내외 공간빅데이터 정책 및 기술동향
 
Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가
 

Big data

  • 2.
  • 3. 과거 아날로그 환경에서 생성되던 데이터에 비하면 그 규모가 방대하고, 생성 주기도 짧고, 형태도 수치 데이터뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말한다. BIG DATA?아날로그 DATA
  • 4. UCC, SNS, 블로그 ,CCTV, 스포츠 등 일상에서 일어나고 있는 모든 일에 대한 데이터 들이 상상이상으로 급증현상이 일어나고 있다.
  • 5. -다양하고 방대한 규모의 데이터는 미래 경쟁력의 우위를 좌우하는 중요한 자원으로 활용될 수 있다는 점에서 주목 받고 있다. 공공기관의 입장에서도 빅데이터의 등장은 시민이 요구하는 서비스를 제공할 수 있는 기회로 작용한다. 이는 ‘사회적 비용 감소와 공공 서비스 품질 향상’을 가능하게 만든다.
  • 6.  Economist 가 전 세계 약 600개 기업을 대상으로  빅데이터가 기업에 어떠한 영향을 끼치는 가 ? Big data가 기존의 비즈니스 모델을 완전히 바꾼다. 10% 기업의 의사결정의 중요한 요소로 작용할 것이다. 46%  기업 내에서 빅데이터를 어떻게 활용하고 있는가 ? 기업 내부에 사용 가능한 데이터는 충분, but 데이터 방치 일부만 활용하고 있다. 53% 25% 부가가치 창출을 위해서는 더 많은 노력이 필요하다!
  • 7. 구글 번역 수억 개의 문서의 패턴을 스스로 분석, 번역하는 시스템 개발. 아마존 고객의 구매 도서 데이터 들을 분석하여 구매 예상 도서 추천 시스템 개발. yutube 이용자의 선호하는 동영상 채널을 구성할 수 있는 개별 홈페이지를 제공. 축구 선수들의 몸에 센서를 부착시켜 운동량부터 순간속도, 심박수 , 슈팅 동작,방향 등 데이터를 실시간 수집, 분석할 수 있다. 라쿠텐 고객의 정보와 구매내역, 서비스 예약 정보가 통합되어 있다. 라쿠텐은 이를 활용해 그룹 내 전자상거래 사업과 신용결제 서비스, 포털, 여행, 증권 ,프 로스포츠 사업 부문에서 공동 활용한다. 빅데이터를 활용하는 곳은 전세계 여러 분야에서 활용하고 있으며 Hadoop 이라는 오픈소스의 관심도도 같이 높아지고 있는 상황이다.
  • 8. 성능이 좋은 장비? (Scale up) 많은 수의 장비? (Scale out) 대량의 정보를 효과적으로 저장하기 위한 분산파일 시스템 (GFS, Google File System) 대용량 데이터의 읽기와 쓰기를 위한 분산 스토리지 시스템 (Bigtable) 구글의 Sawzall 언어의 등장( SQL과 유사 하다. )
  • 9. Open-source software 빅데이터 처리 언어 Yahoo-2006년 개발 (과거) Apache- 개발 주도 (현재) 1. 구글 기술인 GFS 공개 이후 본격적으로 개발되었지만 , 구글의 시스템과 대응되는 체계로 구성. 2. 오픈 소스이므로 무료로 이용할 수 있어 개발 비용 감소. 3. 구글 , 페이스북 , 트위터와 같은 빅데이터가 필수인 기업을 시작으로 최근 다 방면으로 확장해 나가고 있다. 더그 커팅- 하둡 개발자
  • 10. - 현실 마이닝: 2008년 미래 유망 기술로 MIT에서 발표한 개념. - [오디오 마이닝] : 컴퓨터 음성파일에서 단어를 추출하여 색인을 만든 후 할 때 이를 사용하는 프로세스 - [비디오 마이닝] : 매장에 비디오 카메라를 설치해 놓고 방문객들의 행태를 분석
  • 11. 구 분 내 용 데이터 마이닝 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아 내는 것이다 텍스트 마이닝 자연어로 구성된 텍스트 데이터에서 패턴 또는 관계를 추출하여 가치와 의미 있는 정보를 찾아내는 마이닝 기법. 사람이 말하는 언어를 이해할 수 있는 자연어처리 기술에 기반한다. 웹 마이닝 인터넷 상에서 수집된 정보를 데이터 마이닝 방법으로 분석 통합하는 기법 웹 마이닝은 콘텐츠 마이닝(웹 검색 수집, 데이터), 구조 마이닝(웹 사이트구조), 활용 마이닝(사용자 이용 형태) 등으로 세분화 한다. 소셜 분석, 소셜 마이닝 소셜 미디어에 올라오는 글과 사용자를 분석해 소비자의 흐름이나 패턴 등을 분석하고 판매나 홍보 에 적용. 마케팅 분야뿐만 아니라 사회의 흐름과 트렌드 , 여론 번화추이를 읽어내는 소셜 미디어 시대의 새 로운 마이닝 기법이다. (18대 대선, 등) 현실 마이닝 사람들의 행동패턴을 예측하기 위해 사회적 행동과 관련된 정보를 기기(휴대폰, GPS 등)을 통해 얻 고 분석하는 기법. 휴대폰 등 모바일 기기들을 통해 현실에서 발생하는 정보를 기반으로 인간관계와 행동 등을 추론.