SlideShare a Scribd company logo
1 of 20
Download to read offline
Big Data
빅데이터
김원정
INDEX
빅데이터의 등장
빅데이터의 개념
빅데이터의 특징
빅데이터의 기술
01 빅데이터의 등장
1 | 14
• 인터넷이 확산되면서 정형화된 데이터와 비정형화된 데이터가 무수히 발생
하면서 정보 홍수개념이 등장 → 빅데이터 개념으로 이어짐
• 스마트폰과 같은 디지털 기기의 보급과 소셜 네트워크 서비스(SNS)의 부
상으로 엄청난 양의 데이터가 생산됨
• 빅데이터가 차세대 이슈로 떠오르는 이유
1분 동안 인터넷에서 생성되는 데이터의 양
- 정보 통신 기술의 주도권이 데이터로 이동
- 공간·시간·관계·세상 등을 담은 빅데이터
- 빅데이터는 미래 경쟁력과 가치 창출의 원천
02 빅데이터의 개념
2 | 14
• 업무 수행 방식에 초점을 맞춘 정의
[IDC 2010년 4월]
다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고, 데이터의
빠른 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍쳐
• 데이터의 규모에 초점을 맞춘 정의
[맥킨지 2011년 5월]
기존 데이터베이스 관리도구의 데이터 수집, 저장, 관리, 분석하는 역량을 넘어서는
데이터
02 빅데이터의 개념
3 | 14
[빅데이터의 데이터 종류]
• 정형(Structured)
- 고정된 필드에 저장된 데이터(관계형 DB 및 스프레드시트)
• 반정형(Semi-Structured)
- 고정된 필드에 저장되어 있지는 않지만, 메타데이터나 스키마 등을 포함하는
데이터(XML 및 HTML 텍스트)
• 비정형(Unstructured)
- 고정된 필드에 저장되어 있지 않은 데이터(이미지/동영상/음성데이터)
02 빅데이터의 개념
4 | 14
비정형 데이터와 반정형 데이터의 예
03 빅데이터의 특징
5 | 14
빅데이터의 특징 V3
04 빅데이터의 기술
6 | 14
[빅데이터 분석 기술]
• 데이터 마이닝(Data Mining)
• 텍스트 마이닝(Text Mining)
• 오피니언 마이닝(Opinion Mining)
• 소셜 네트워크 분석(Social Network Analytics)
• 클러스터 분석(Cluster Analysis)
04 빅데이터의 기술
7 | 14
[데이터 마이닝(Data Mining)]
• 대용량의 데이터에서 유용한 정보를 추출하는 것
• 다양한 통계적 기법, 수학적 기법과 인공지능을 활용한 패턴인식 기술 등을 이용
하여 데이터 속에서 유의미한 관계, 규칙 패턴 등에 대한 규칙을 발견하는 것
04 빅데이터의 기술
8 | 14
[텍스트 마이닝(Text Mining)]
• 텍스트 데이터에 대하여 자연어 처리 기술을 적용하여 유용한 정보를 추출, 가
공하는 것을 목적으로 하는 기술
• 다른 정보(언어)와의 연결, 개념들의 연결망을 파악하여 카테고리를 찾아내거나
의미를 찾아냄
• 문제점
- 자연어에 영향을 많이 받음
자연어 : 한국어, 일본어, 독일어, 영어 등 사람이 쓰는 말
- 자연어 중 한국어는 어순이 명확하지 않아 아직 분석이 어려움
04 빅데이터의 기술
9 | 14
[오피니언 마이닝(Opinion Mining)]
• 소셜미디어 등의 정형/비정형 텍스트의 긍정, 부정, 중립의 선호도 판별 기술
• 활용 : 특정 서비스 및 상품에 대한 시장규모 예측, 소비자의 반응, 입소문 분석
[소셜 네트워크 분석(Social Network Analytics)]
• 소셜 네트워크 연결구조 및 연결강도 등을 바탕으로 사용자의 명성 및 영향력을
측정하여, 소셜 네트워크 상에서 입소문의 중심이나 허브 역할을 하는 사용자를
찾는 데 주로 활용됨
04 빅데이터의 기술
10 | 14
[클러스터 분석(Cluster Analysis)]
• 데이터 간의 유사도를 정의하고 각 데이터
간의 거리를 구하여 서로의 거리가 가까운
것부터 순서대로 합쳐가는 기술
• 활용 : 군집에 속한 객체들의 유사성과 서로 다른 군집에 속한 객체간의 상이성을
규명하는 통계기법으로 명확한 기준이 존재하지 않거나 밝혀지지 않은 상태에서
다양한 특성을 지닌 대상을 집단으로 분류
04 빅데이터의 기술
11 | 14
[빅데이터 처리 기술]
• Hadoop
• R
• NoSQL(Not-Only/No SQL)
04 빅데이터의 기술
12 | 14
[Hadoop]
• 분산시스템 상에서 대용량 데이터를 분산 처리할 수 있는 자바 기반의 오픈
소스 프레임워크
• 분산 파일 시스템인 HDFS에 데이터를 저장하고, 분산 처리 시스템인 맵리
듀스를 이용해 데이터를 처리
• 현재 정형/비정형 빅 데이터 분석에 가장 선호되는 솔루션
HDFS : Hadoop Distributed File System
04 빅데이터의 기술
13 | 14
[R]
• 통계계산 및 시각화를 위한 언어 및 개발환경 제공
• R 언어와 개발환경을 통해 기본적인 통계기법부터 모델링, 최신 데이터 마이
닝 기법까지 구현/개선이 가능
• 결과는 그래프 등으로 시각화가 가능하며, Java나 C, Python 등의 다른
프로그래밍 언어와 연결도 용이함
04 빅데이터의 기술
[NoSQL(Not-Only/No SQL)]
• 비관계형 데이터베이스
• 테이블 스키마 고정 X / 테이블 간 조인 연산 지원 X
• 분산가능성에 중점을 두어 일관성과 유효성 보장X
• 대규모의 유연한 데이터 처리를 위해서는 NoSQL이 적합하지만, 안정성이
중요한 시스템에서는 관계형 DB를 권장함
• 대표적인 NoSQL : Cassandra, Hbase, MongDB
14 | 14
Q/A
Thank You!:)
00 부록
빅데이터 특징(3V, 4V, 5V)
00 부록
데이터 마이닝과 텍스트 마이닝의 차이점

More Related Content

What's hot

1.고객을 이해하는 빅데이터 (4차산업혁명: 고객과의 소통 신기술의 진화)
1.고객을 이해하는 빅데이터 (4차산업혁명: 고객과의 소통 신기술의 진화)1.고객을 이해하는 빅데이터 (4차산업혁명: 고객과의 소통 신기술의 진화)
1.고객을 이해하는 빅데이터 (4차산업혁명: 고객과의 소통 신기술의 진화)doo rip choi
 
Fingra.ph 빅데이터 시각화
Fingra.ph 빅데이터 시각화Fingra.ph 빅데이터 시각화
Fingra.ph 빅데이터 시각화Fingra.ph
 
건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안메가트렌드랩 megatrendlab
 
Nia 빅 데이터 세미나 이경일 (1)
Nia 빅 데이터 세미나   이경일 (1)Nia 빅 데이터 세미나   이경일 (1)
Nia 빅 데이터 세미나 이경일 (1)Peter Woo
 
Blockchain techonologies and smart city 블록체인기술과 스마트시티
Blockchain techonologies and smart city 블록체인기술과 스마트시티Blockchain techonologies and smart city 블록체인기술과 스마트시티
Blockchain techonologies and smart city 블록체인기술과 스마트시티Byounghee Kim
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구Newsjelly
 
20120924134035 빅데이터시대,ai의새로운의미와가치
20120924134035 빅데이터시대,ai의새로운의미와가치20120924134035 빅데이터시대,ai의새로운의미와가치
20120924134035 빅데이터시대,ai의새로운의미와가치Webometrics Class
 
디지털미디어2017
디지털미디어2017디지털미디어2017
디지털미디어2017naeun jang
 
2013 it trend 전망
2013 it trend 전망2013 it trend 전망
2013 it trend 전망iron han
 
뉴미수정본(Ver3)
뉴미수정본(Ver3)뉴미수정본(Ver3)
뉴미수정본(Ver3)Juyoung An
 
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료Seul Koo
 
빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델datasciencekorea
 
Big data활용 ss
Big data활용 ssBig data활용 ss
Big data활용 ssJinSoo Park
 

What's hot (13)

1.고객을 이해하는 빅데이터 (4차산업혁명: 고객과의 소통 신기술의 진화)
1.고객을 이해하는 빅데이터 (4차산업혁명: 고객과의 소통 신기술의 진화)1.고객을 이해하는 빅데이터 (4차산업혁명: 고객과의 소통 신기술의 진화)
1.고객을 이해하는 빅데이터 (4차산업혁명: 고객과의 소통 신기술의 진화)
 
Fingra.ph 빅데이터 시각화
Fingra.ph 빅데이터 시각화Fingra.ph 빅데이터 시각화
Fingra.ph 빅데이터 시각화
 
건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안
 
Nia 빅 데이터 세미나 이경일 (1)
Nia 빅 데이터 세미나   이경일 (1)Nia 빅 데이터 세미나   이경일 (1)
Nia 빅 데이터 세미나 이경일 (1)
 
Blockchain techonologies and smart city 블록체인기술과 스마트시티
Blockchain techonologies and smart city 블록체인기술과 스마트시티Blockchain techonologies and smart city 블록체인기술과 스마트시티
Blockchain techonologies and smart city 블록체인기술과 스마트시티
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구
 
20120924134035 빅데이터시대,ai의새로운의미와가치
20120924134035 빅데이터시대,ai의새로운의미와가치20120924134035 빅데이터시대,ai의새로운의미와가치
20120924134035 빅데이터시대,ai의새로운의미와가치
 
디지털미디어2017
디지털미디어2017디지털미디어2017
디지털미디어2017
 
2013 it trend 전망
2013 it trend 전망2013 it trend 전망
2013 it trend 전망
 
뉴미수정본(Ver3)
뉴미수정본(Ver3)뉴미수정본(Ver3)
뉴미수정본(Ver3)
 
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
Big Data and Data Visualization(Inforgraphics) 2012년 KISTI(한국정보과학기술연구원) 발표 자료
 
빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델
 
Big data활용 ss
Big data활용 ssBig data활용 ss
Big data활용 ss
 

Similar to 빅데이터

뉴미디어 정보서비스1팀 최종안
뉴미디어 정보서비스1팀 최종안뉴미디어 정보서비스1팀 최종안
뉴미디어 정보서비스1팀 최종안Juyoung An
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망Open Cyber University of Korea
 
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !한국디자인진흥원 공공서비스디자인PD
 
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구 빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구 JM code group
 
Personal 빅데이터 주요 이슈 및 기술적 대응 방안
Personal 빅데이터 주요 이슈 및 기술적 대응 방안Personal 빅데이터 주요 이슈 및 기술적 대응 방안
Personal 빅데이터 주요 이슈 및 기술적 대응 방안메가트렌드랩 megatrendlab
 
DLAB company info and big data case studies
DLAB company info and big data case studiesDLAB company info and big data case studies
DLAB company info and big data case studiesDLAB
 
Social Analytics 소개 (SDEC 오프모임 세미나)
Social Analytics 소개 (SDEC 오프모임 세미나)Social Analytics 소개 (SDEC 오프모임 세미나)
Social Analytics 소개 (SDEC 오프모임 세미나)NAVER D2
 
빅데이터 시대 새로운 신기술과 활용방향
빅데이터 시대 새로운 신기술과 활용방향빅데이터 시대 새로운 신기술과 활용방향
빅데이터 시대 새로운 신기술과 활용방향Webometrics Class
 
2018 제4회 도시빅데이터 세미나: 멜론의 셀프 서비스 분석 환경과 Next
2018 제4회 도시빅데이터 세미나: 멜론의 셀프 서비스 분석 환경과 Next2018 제4회 도시빅데이터 세미나: 멜론의 셀프 서비스 분석 환경과 Next
2018 제4회 도시빅데이터 세미나: 멜론의 셀프 서비스 분석 환경과 NextByunghwa Yoon
 
기업의 Social research 도입의 필요성과 과제 에스코토스
기업의 Social research 도입의 필요성과 과제 에스코토스기업의 Social research 도입의 필요성과 과제 에스코토스
기업의 Social research 도입의 필요성과 과제 에스코토스SCOTOSS
 
소프트웨어교육론 전체
소프트웨어교육론 전체소프트웨어교육론 전체
소프트웨어교육론 전체YoungSik Jeong
 
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big dataK data
 
빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향atelier t*h
 
[week7] 데이터읽어주는남자
[week7] 데이터읽어주는남자[week7] 데이터읽어주는남자
[week7] 데이터읽어주는남자neuroassociates
 
데이터읽는남자(7회)
데이터읽는남자(7회)데이터읽는남자(7회)
데이터읽는남자(7회)Hanyang University
 
최영현 Ia structuring 이론 및 실습
최영현 Ia structuring 이론 및 실습최영현 Ia structuring 이론 및 실습
최영현 Ia structuring 이론 및 실습Young Choi
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data AnalysisMyunggoon Choi
 
2014 비지센터 제 1회 "회원의 날" PT
2014 비지센터 제 1회 "회원의 날" PT2014 비지센터 제 1회 "회원의 날" PT
2014 비지센터 제 1회 "회원의 날" PTNpoITcenter_Kor
 
2014 한국 링크드 데이터 사례집
2014 한국 링크드 데이터 사례집2014 한국 링크드 데이터 사례집
2014 한국 링크드 데이터 사례집Hansung University
 

Similar to 빅데이터 (20)

뉴미디어 정보서비스1팀 최종안
뉴미디어 정보서비스1팀 최종안뉴미디어 정보서비스1팀 최종안
뉴미디어 정보서비스1팀 최종안
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
 
Hadoop 기반 빅데이터 이해
Hadoop 기반 빅데이터 이해Hadoop 기반 빅데이터 이해
Hadoop 기반 빅데이터 이해
 
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !
 
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구 빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
 
Personal 빅데이터 주요 이슈 및 기술적 대응 방안
Personal 빅데이터 주요 이슈 및 기술적 대응 방안Personal 빅데이터 주요 이슈 및 기술적 대응 방안
Personal 빅데이터 주요 이슈 및 기술적 대응 방안
 
DLAB company info and big data case studies
DLAB company info and big data case studiesDLAB company info and big data case studies
DLAB company info and big data case studies
 
Social Analytics 소개 (SDEC 오프모임 세미나)
Social Analytics 소개 (SDEC 오프모임 세미나)Social Analytics 소개 (SDEC 오프모임 세미나)
Social Analytics 소개 (SDEC 오프모임 세미나)
 
빅데이터 시대 새로운 신기술과 활용방향
빅데이터 시대 새로운 신기술과 활용방향빅데이터 시대 새로운 신기술과 활용방향
빅데이터 시대 새로운 신기술과 활용방향
 
2018 제4회 도시빅데이터 세미나: 멜론의 셀프 서비스 분석 환경과 Next
2018 제4회 도시빅데이터 세미나: 멜론의 셀프 서비스 분석 환경과 Next2018 제4회 도시빅데이터 세미나: 멜론의 셀프 서비스 분석 환경과 Next
2018 제4회 도시빅데이터 세미나: 멜론의 셀프 서비스 분석 환경과 Next
 
기업의 Social research 도입의 필요성과 과제 에스코토스
기업의 Social research 도입의 필요성과 과제 에스코토스기업의 Social research 도입의 필요성과 과제 에스코토스
기업의 Social research 도입의 필요성과 과제 에스코토스
 
소프트웨어교육론 전체
소프트웨어교육론 전체소프트웨어교육론 전체
소프트웨어교육론 전체
 
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
 
빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향
 
[week7] 데이터읽어주는남자
[week7] 데이터읽어주는남자[week7] 데이터읽어주는남자
[week7] 데이터읽어주는남자
 
데이터읽는남자(7회)
데이터읽는남자(7회)데이터읽는남자(7회)
데이터읽는남자(7회)
 
최영현 Ia structuring 이론 및 실습
최영현 Ia structuring 이론 및 실습최영현 Ia structuring 이론 및 실습
최영현 Ia structuring 이론 및 실습
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data Analysis
 
2014 비지센터 제 1회 "회원의 날" PT
2014 비지센터 제 1회 "회원의 날" PT2014 비지센터 제 1회 "회원의 날" PT
2014 비지센터 제 1회 "회원의 날" PT
 
2014 한국 링크드 데이터 사례집
2014 한국 링크드 데이터 사례집2014 한국 링크드 데이터 사례집
2014 한국 링크드 데이터 사례집
 

빅데이터

  • 3. 01 빅데이터의 등장 1 | 14 • 인터넷이 확산되면서 정형화된 데이터와 비정형화된 데이터가 무수히 발생 하면서 정보 홍수개념이 등장 → 빅데이터 개념으로 이어짐 • 스마트폰과 같은 디지털 기기의 보급과 소셜 네트워크 서비스(SNS)의 부 상으로 엄청난 양의 데이터가 생산됨 • 빅데이터가 차세대 이슈로 떠오르는 이유 1분 동안 인터넷에서 생성되는 데이터의 양 - 정보 통신 기술의 주도권이 데이터로 이동 - 공간·시간·관계·세상 등을 담은 빅데이터 - 빅데이터는 미래 경쟁력과 가치 창출의 원천
  • 4. 02 빅데이터의 개념 2 | 14 • 업무 수행 방식에 초점을 맞춘 정의 [IDC 2010년 4월] 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고, 데이터의 빠른 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍쳐 • 데이터의 규모에 초점을 맞춘 정의 [맥킨지 2011년 5월] 기존 데이터베이스 관리도구의 데이터 수집, 저장, 관리, 분석하는 역량을 넘어서는 데이터
  • 5. 02 빅데이터의 개념 3 | 14 [빅데이터의 데이터 종류] • 정형(Structured) - 고정된 필드에 저장된 데이터(관계형 DB 및 스프레드시트) • 반정형(Semi-Structured) - 고정된 필드에 저장되어 있지는 않지만, 메타데이터나 스키마 등을 포함하는 데이터(XML 및 HTML 텍스트) • 비정형(Unstructured) - 고정된 필드에 저장되어 있지 않은 데이터(이미지/동영상/음성데이터)
  • 6. 02 빅데이터의 개념 4 | 14 비정형 데이터와 반정형 데이터의 예
  • 7. 03 빅데이터의 특징 5 | 14 빅데이터의 특징 V3
  • 8. 04 빅데이터의 기술 6 | 14 [빅데이터 분석 기술] • 데이터 마이닝(Data Mining) • 텍스트 마이닝(Text Mining) • 오피니언 마이닝(Opinion Mining) • 소셜 네트워크 분석(Social Network Analytics) • 클러스터 분석(Cluster Analysis)
  • 9. 04 빅데이터의 기술 7 | 14 [데이터 마이닝(Data Mining)] • 대용량의 데이터에서 유용한 정보를 추출하는 것 • 다양한 통계적 기법, 수학적 기법과 인공지능을 활용한 패턴인식 기술 등을 이용 하여 데이터 속에서 유의미한 관계, 규칙 패턴 등에 대한 규칙을 발견하는 것
  • 10. 04 빅데이터의 기술 8 | 14 [텍스트 마이닝(Text Mining)] • 텍스트 데이터에 대하여 자연어 처리 기술을 적용하여 유용한 정보를 추출, 가 공하는 것을 목적으로 하는 기술 • 다른 정보(언어)와의 연결, 개념들의 연결망을 파악하여 카테고리를 찾아내거나 의미를 찾아냄 • 문제점 - 자연어에 영향을 많이 받음 자연어 : 한국어, 일본어, 독일어, 영어 등 사람이 쓰는 말 - 자연어 중 한국어는 어순이 명확하지 않아 아직 분석이 어려움
  • 11. 04 빅데이터의 기술 9 | 14 [오피니언 마이닝(Opinion Mining)] • 소셜미디어 등의 정형/비정형 텍스트의 긍정, 부정, 중립의 선호도 판별 기술 • 활용 : 특정 서비스 및 상품에 대한 시장규모 예측, 소비자의 반응, 입소문 분석 [소셜 네트워크 분석(Social Network Analytics)] • 소셜 네트워크 연결구조 및 연결강도 등을 바탕으로 사용자의 명성 및 영향력을 측정하여, 소셜 네트워크 상에서 입소문의 중심이나 허브 역할을 하는 사용자를 찾는 데 주로 활용됨
  • 12. 04 빅데이터의 기술 10 | 14 [클러스터 분석(Cluster Analysis)] • 데이터 간의 유사도를 정의하고 각 데이터 간의 거리를 구하여 서로의 거리가 가까운 것부터 순서대로 합쳐가는 기술 • 활용 : 군집에 속한 객체들의 유사성과 서로 다른 군집에 속한 객체간의 상이성을 규명하는 통계기법으로 명확한 기준이 존재하지 않거나 밝혀지지 않은 상태에서 다양한 특성을 지닌 대상을 집단으로 분류
  • 13. 04 빅데이터의 기술 11 | 14 [빅데이터 처리 기술] • Hadoop • R • NoSQL(Not-Only/No SQL)
  • 14. 04 빅데이터의 기술 12 | 14 [Hadoop] • 분산시스템 상에서 대용량 데이터를 분산 처리할 수 있는 자바 기반의 오픈 소스 프레임워크 • 분산 파일 시스템인 HDFS에 데이터를 저장하고, 분산 처리 시스템인 맵리 듀스를 이용해 데이터를 처리 • 현재 정형/비정형 빅 데이터 분석에 가장 선호되는 솔루션 HDFS : Hadoop Distributed File System
  • 15. 04 빅데이터의 기술 13 | 14 [R] • 통계계산 및 시각화를 위한 언어 및 개발환경 제공 • R 언어와 개발환경을 통해 기본적인 통계기법부터 모델링, 최신 데이터 마이 닝 기법까지 구현/개선이 가능 • 결과는 그래프 등으로 시각화가 가능하며, Java나 C, Python 등의 다른 프로그래밍 언어와 연결도 용이함
  • 16. 04 빅데이터의 기술 [NoSQL(Not-Only/No SQL)] • 비관계형 데이터베이스 • 테이블 스키마 고정 X / 테이블 간 조인 연산 지원 X • 분산가능성에 중점을 두어 일관성과 유효성 보장X • 대규모의 유연한 데이터 처리를 위해서는 NoSQL이 적합하지만, 안정성이 중요한 시스템에서는 관계형 DB를 권장함 • 대표적인 NoSQL : Cassandra, Hbase, MongDB 14 | 14
  • 17. Q/A
  • 20. 00 부록 데이터 마이닝과 텍스트 마이닝의 차이점