SlideShare a Scribd company logo
1 of 29
고려대학교 정보대학 컴퓨터학과
Prof. 강장묵
(kangjm@korea.ac.kr ;
mooknc@gmail.com)
교육정보 서비스 특론
9 주; 2015.4.29. 수
교육정보서비스에서 정형/반정형/비정형 데이터 처리는 어떤 의미를 갖는가?
(교육정보에서 핵심 가중치를 두어야 할 데이터는 무엇인가?
몇 가지 추천하고 그 이유를 논한다.)
키워드 : 교육정보, 교육 데이터 마이닝, 교육 빅데이터
인용: http://analyticstraining.com/wp-content/uploads/2014/09/30-Sept.jpg
교육
정보
+
가중치
금주 소개 사이트
https://www.pinterest.com/
- 이미지 기반의 큐레이션
- 소셜 큐레이션, 관계 큐레이션, 화장품 큐레이션
- 교육 큐레이션?
www.slideshare.net/mooknc
여러분의 보고서, 활동 역시 슬라이드쉐어에 공유
강의 교안
일상의 스토리텔링, 숨겨진 센싱과 문맥 분석
https://www.youtube.com/watch?v=OptqxagZDfM
강의 전 숙의할 질문
- 사물 (만물) 인터넷 환경에서 비정형/반정형/정형 데이터란 무엇
인가?
- 클라우드 컴퓨팅/네트워크 환경에서 비정형/반정형/정형 데이터
의 의미란 무엇인가?
- 웨어러블 중 학생 교복, 배지, 학생 시계, 학생 신발 등에서 정형/
비정형/반정형 데이터란 무엇이고 어떻게 이용할 수 있는가?
- 아니, 반드시 이용해야 하는가? 바른 이용 (교육적 의미 부여는 어
떻게 가능한가?)은 또 무엇인가?
인용: http://news.chosun.com/site/data/html_dir/2015/03/02/2015030202126.html
http://cfile10.uf.tistory.com/image/182A5D50506E440612E7FF
남성분들은 잘 모르시겠지만,
여성분들이 하루에 화장을 몇 번 고칠까요?
소셜 빅 데이터에 올라온 텍스트를 분석해 보면,
그럼,
밤 10시에 화장을 고치는 이유는 무엇일까요?
인용: http://news.chosun.com/site/data/html_dir/2015/03/02/2015030202126.html
[출처] 본 기사는 조선닷컴에서 작성된 기사 입니다
누가 왜 밤중에 화장을 고치느냐고 물어보면
'셀카 찍으려고요'라고 말할 사람은 많지 않을 것입니다.
이런 것은 물어보기도 어렵고 설사 묻는다 해도
잘 대답해주지 않을 것입니다.
그 시간에 화장을 고칠 것이라고는 상상하지 못하기 때
문에 물어볼 생각을 못할 뿐 아니라,
설사 묻는다 해도 민망해서 대답하지 않거나 자신의 행
동을 기억하지 못하기에 대답을 못하기 일쑤입니다.
'밤 10시 셀카' 같은 것들은 부지불식간에 남긴 삶의 흔
적들이 모인 빅 데이터로 그녀들의 삶을 관찰했으니 찾
을 수 있었던 것입니다.
많은 기업은 소비자의 욕구를 파악하기 위해
질문을 활용합니다.
인용: 온라인상 비정형 데이터를 활용한 대안적 디자인 리서치 모델에 관한 연구 -디자인 에쓰노그래피 방법론을 중심으로-, 김은정(EunJungKim),이혜선(HyeSunLee), 디자인
융복합학회, <디자인융복합연구> 12권 5호. 2013 pp.205-223
본 연구에서 활용할 ‘비정형 데이터’는 바로 이 빅 데이터의 개념에서 출발하며,
빅 데이터는 데이터의 정형화 정도에 따라 크게 ‘정형 혹은 구조적(structured)
데이터’, ‘비정형 또는 비구조적(unstructured) 데이터’ 2가지로 나눠진다. ‘정형
데이터’는 고정된 필드에 저장되어지는 구조화된 데이터를 가리키며, 반면에
‘비정형 데이터’는 데이터 하나하나마다 크기와 내용이 달라 통일된 구조로 정
리하기 어려운 데이터를 의미한다. 일상적으로 인터넷에서 실시간으로 업로드
되는 뉴스 게시물이나 블로그, 커뮤니티 게시판의 글, 동영상, 음악, 사진 등처
럼 고정된 서식에 저장되어 있지 않은 데이터들이 바로 이에 속하며 데이터 유
형에 따라 텍스트(text), 이미지(photo), 음성과 영상, 로그 파일 등으로 구성된
다. 이와 같은 온라인상의 비정형 데이터들은 현재 디지털 세상(digital universe)
가운데 약 95%이상을 차지하고 있으며(인용: IDC, The Expanding Digital
Universe, 2007), 앞으로 생성될 전체 데이터 가운데 약 90% 이상을 차지할 것
으로 전망된다.(IDC, The Expanding Digital Universe, 2011; 함유근・채승병, 빅
데이터, 경영을 바꾸다, 서울:삼성경제연구소, 2012. p.32)
특히 SNS 서비스의 인기, 정보를 생산하는 개인용 디지털 기기 사용의 증가와
더불어 이러한 비정형 데이터의 폭발적 생산은 필연적으로 지속될 것이며 해가
지날수록 그 비율 또한 급증할 것이다. 이러한 비정형 데이터들의 특성은 3V(규
모(volume), 다양성(Variety), 속도(Velocity))로 나타난다.
인용: http://www.edureka.co/blog/answering-the-big-question-what-is-big-data/
인용: 맵리듀스와 대응분석을 활용한 비정형 빅 데이터의 정형화와 시각적 해석, 최요셉(JoSephChoi),최용석(YongSeokChoi), 한국통계학회, <응용통계연구> 27권 2호. 2014
pp.169-183
2010년을 기준으로 디지털 공간에 축적된 정보의 규모는 12억
TB(terabyte)에 육박하는 것으로 추정된다 (Gantz와 Reinsel,
2010).
Special Report(2010.02.25)에 의하면, 세계 최대의 소매 체인 월
마트(Wal Mart)에서는 시간당 100만 건 이상의 거래 기록이 저
장되며, 2008년까지 약 2,500TB의 정보가 축적되었다고 한다.
또한, 2011년 1월을 기준으로 트위터에서는 매일 약 1억 1,000
만 개의 트위트가 발신되며 (Chiang, 2011), 2020년, 관리해야할
데이터량이 50배 급증할 것으로 전망된다고 한다(Jeong, 2011).
인용: http://www.edureka.co/blog/answering-the-big-question-what-is-big-data/
비정형 데이터(Unstructured Data): ‘비정형 데이터’란 빅데이터(Big Data)의 유형 중
하나로써, 일정한 규격이나 형태를 지닌 숫자 데이터(numeric data)와 달리 그림이나
영상,문서처럼 형태와 구조가 다른 구조화 되지 않은 데이터를 말한다.
(인용: 정용찬, 빅데이터, 커뮤니케이션북스, 2012. p.14)
본 연구에서의 ‘비정형 데이터’는 책, 잡지, 문서의료 기록등과 같은 전통적인 비정형
데이터가 아닌, 이메일, 트위터, 블로그와 같은 모바일 기기와 온라인상에서 생성 및
축적되는 데이터로 용어의 범위를 제한한다.
인용: 온라인상 비정형 데이터를 활용한 대안적 디자인 리서치 모델에 관한 연구 -디자인 에쓰노그래피 방법론을 중심으로-, 김은정(EunJungKim),이혜선(HyeSunLee), 디자인
융복합학회, <디자인융복합연구> 12권 5호. 2013 pp.205-223
인용: 맵리듀스와 대응분석을 활용한 비정형 빅 데이터의 정형화와 시각적 해석, 최요셉(JoSephChoi),최용석(YongSeokChoi), 한국통계학회, <응용통계연구> 27권 2호. 2014
pp.169-183
최근 구글 자동 번역기와 지역별 검색어 빈도를 통한 독감 유행 정
보, 각종 인터넷 포탈 사이트들의 품질 높은 검색어 기능, 링크 분석
(link analysis)을 통한 키워드간의 연결 분석, 유권자들의 트윗
(tweet)을 분석하여 맞춤형 캠페인을 펼친 미국 오바마 대통령의 선
거 운동 등 비정형 빅 데이터(unstructured big data)에 대한 연구와
활용이 활발해지고 있다.
특히, Kim과 Cho (2013)는 빅데이터 분석과 관련이 있는 통계적 방
법론으로 고차원 회귀분석, 분류분석, 다중비교, 앙상블, 치적화알
고리즘, 차원축소, 네트워크분석, 군집화, 시각화, 온라인분석, 병
렬계산, Rhive인 R 프로그램을 들고 있다.
본 연구에서는 이러한 빅 데이터를 분석하기 위하여, 분산 처리
시스템(distribution processing system)인 맵리듀스(MapReduce)
를 활용하여, 비정형 빅 데이터(unstructured big data)를 정형화
하 고 , 이 를 분 석 하 고 시 각 화 하 기 위 하 여 대 응 분 석
(correspondence analysis)을 활용하려 한다.
인용: 온라인상 비정형 데이터를 활용한 대안적 디자인 리서치 모델에 관한 연구 -디자인 에쓰노그래피 방법론을 중심으로-, 김은정(EunJungKim),이혜선(HyeSunLee), 디자인
융복합학회, <디자인융복합연구> 12권 5호. 2013 pp.205-223
인용: 온라인상 비정형 데이터를 활용한 대안적 디자인 리서치 모델에 관한 연구 -디자인 에쓰노그래피 방법론을 중심으로-, 김은정(EunJungKim),이혜선(HyeSunLee), 디자인
융복합학회, <디자인융복합연구> 12권 5호. 2013 pp.205-223
인용: 온라인상 비정형 데이터를 활용한 대안적 디자인 리서치 모델에 관한 연구 -디자인 에쓰노그래피 방법론을 중심으로-, 김은정(EunJungKim),이혜선(HyeSunLee), 디자인
융복합학회, <디자인융복합연구> 12권 5호. 2013 pp.205-223
일상적 소비․관심 영역 키워드 분석을 통한 트랜드 발굴, 라이프 로그(life log)를 활용한
새로운 라이프스타일 탐색으로 대신 될 수 있다. 먼저 비정형 데이터를 활용한 트랜드
발굴은 소셜미디어 분석을 활용하여 일반적인 사람들의 일상적 소비․관심 영역을 분류,
각 영역에 해당하는 개념, 행위, 제품의 종류 및 품목 관련 주요 어휘들을 포괄하여 키워
드 세트로 구성하여 트랜드 분석을 진행한다. 이 때 연령대, 성별 등의 요소를 기준으로
키워드를 추출한다면 기업이 소구하고자 하는 정확한 해당 타겟 그룹 내의 라이프스타
일 및 삶의 가치, 감성 변화들을 시간의 흐름에 따라 분석할 수 있다.(송길영,여기에 당신의 욕망이
보인다, 빅 데이터가 찾아낸 70억 욕망의 지도, 쌤앤파커스,2012. pp.180-181)
라이프 로그(life log)를 활용한 새로운 라이프스타일 탐색의 경우는 개인의 삶이
온라인상에 흔적을 남기면서 생기는 로그 파일(log file)을 이용하여 타겟 그룹의 대
표적 혹은 새로운 라이프스타일을 발견하는 것이다. 비록 현재 라이프 로그를 활용
한 비정형 데이터 분석 서비스는 제한적이지만, 향후 스마트 기기 내 GPS, 카메라,
NFC 등의 스마트 센서들이 송신하는 라이프 로그 정보셋(위치정보, 소비내역 정보
등)들을 활용한다면 보다 세밀하고 정량화된 라이프스타일 정보를 구축 할 수 있을
것이라 전망된다. 특히 라이프 로그 정보들이 기업 내 CRM과 연결된다면, 해당 기
업의 주 소비자층의 라이프스타일 및 트랜드를 발굴하는데 보다 맞춤화된 정보를
제공 받을 수 있을 것이다.
이와 같은 비정형 데이터를 활용한 분석 기법을 이용하여 도출된 사회문화적 맥락
및 소비자 트랜드, 소비자 가치와 관련된 큰 흐름은 기존 시장에 존재하지 않았던
시장 창출 및 제품 개발을 위한 현 디자인 트랜드 및 새로운 라이프 스타일, 감성 인
지를 통해 전반적 디자인 컨셉 도출 목표로 연결되어진다.
인용: http://www.edureka.co/blog/answering-the-big-question-what-is-big-data/
https://i-msdn.sec.s-msft.com/dynimg/IC197174.gif
A distributed file system (DFS) is a file system that has
data stored in a server. The data can be accessed and
processed as if it is stored on the local machine. The
DFS makes it really convenient to share information in
a controlled manner.
인용: http://www.edureka.co/blog/answering-the-big-question-what-is-big-data/
A DFS allows efficient and well-managed data and
storage sharing options on a network compared to
any other. The DFS allows faster processing of huge
amounts of data by processing data at various
locations and then combining them to give the
desired output. In Big Data technologies like Hadoop,
it is possible to scale a Hadoop cluster to hundreds or
even thousands of nodes. In this way, the MapReduce
functions can be executed on smaller subsets of
larger data sets, and thereby providing the scalability
that is needed for Big Data processing.
인용: http://docs.oracle.com/cd/B19306_01/appdev.102/b14259/xdb02rep.htm
인용: http://docs.oracle.com/cd/B19306_01/appdev.102/b14259/xdb02rep.htm
This diagram shows four boxes: a, b, c, and d.
Box a includes the words Data Structure? inside
it. Box b includes, from top to bottom, the word
Access?, a box labeled Repository Path Access,
and a box labeled SQL Query Access. Box c
includes, from top to bottom, the word
Language?, and the bullet points Java, JDBC,
PL/SQL, and C or C++. Box d includes, from top
to bottom, the words Processing and Data
Manipulation?, and the bullet points DOM, SQL
inserts/updates, XSLT, Queriability, and
Updatability.
인용: http://docs.oracle.com/cd/B19306_01/appdev.102/b14259/xdb02rep.htm
인용: http://docs.oracle.com/cd/B19306_01/appdev.102/b14259/xdb02rep.htm
This diagram shows the data storage model. The words How Structured is
Your Data? appear at the top of the diagram. Three lines connect below to
three separate boxes named, from left to right, Structured Data, Semi-
structured Pseudo-structured Data, and Unstructured Data.
The box labeled Structured Data has two lines that connect below to the
words XML Schema Based? and the words Non-Schema Based?. XML
Schema Based? connects below to the words Use either: CLOB or Structured
Storage. Non-Schema Based? connects below to the words Store as:, which
list three bullet points: CLOB in XMLType Table, File in Repository Folder
Views, and Access through Resource APIs.
The box labeled Semi-structured Pseudo-structured Data has two lines that
connect below to the words XML Schema Based? and Non-Schema Based?.
The words XML Schema Based? connect below to the words Use either:,
which have three bullet points listed below: CLOB, Structured, and Hybrid
Storage (semi-structured storage). The words Non-Schema Based? connect
below to the words Store as:, which have three bullet points listed below:
CLOB in XMLType Table, File in Repository Folder Views, and Access through
Resource APIs. The box labeled Unstructured Data connects to the words
Store as:, which have three bullet points listed below: CLOB in XMLType
Table, File in Repository Folder Views, and Access through Resource APIs.
인용: http://docs.oracle.com/cd/B19306_01/appdev.102/b14259/xdb02rep.htm
인용: http://docs.oracle.com/cd/B19306_01/appdev.102/b14259/xdb02rep.htm
The figure shows a tree structure with two
branches. The top node is labeled Oracle XML DB
Data Access Options. The children of Oracle XML
DB Data Access Options are Query-Based Access
and Path-Based Access. The Query-Based Access
node expands to Use SQL, which expands to
Available Language and XMLType APIs (one
node), which has three branches: JDBC, PL/SQL,
and C (OCI). The Path-Based Access node
expands to Use Repository, which expands to
Available Languages and APIs (one node), which
has three branches: SQL
(RESOURCE_/PATH_VIEW), FTP, and HTTP/WebDav.
인용: http://docs.oracle.com/cd/B19306_01/appdev.102/b14259/img/adxdb006.gif
인용: 맵리듀스와 대응분석을 활용한 비정형 빅 데이터의 정형화와 시각적 해석, 최요셉(JoSephChoi),최용석(YongSeokChoi), 한국통계학회, <응용통계연구> 27권 2호. 2014
pp.169-183
다음주 (10주) 10주:
왜 교육정보에서 메타태그가 필요한가?
교육정보 검색 서비스란 무엇인가?
녹화 11주 이후부터는 질의 응답으로 여러분이 생각하는
교육적 가치, 교육 매타값, 가중치 등에 대해 심화 학습하
겠습니다.
중간고사 보고서 확인
- 9주 차 화요일 자정(메일 도착시간)까지 www.slideshare.net 에 자료 공유
- PPT, PDF 등을 kangjm@korea.ac.kr로 보낼 것
The followings were made to supplement
my shabby presentation.
When you need anything,
please e-mail me at this address at any time.
mooknc@gmail.com
ThanKQkangjm@korea.ac.kr

More Related Content

What's hot

도서관과 링크드데이터[TQK]
도서관과 링크드데이터[TQK]도서관과 링크드데이터[TQK]
도서관과 링크드데이터[TQK]ymchu88
 
도서관 Linked Open Data의 필요성
도서관 Linked Open Data의 필요성도서관 Linked Open Data의 필요성
도서관 Linked Open Data의 필요성Hansung University
 
농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형datasciencekorea
 
LOD를 말하다: Europeana, BBC, LinkedUp
LOD를 말하다: Europeana, BBC, LinkedUpLOD를 말하다: Europeana, BBC, LinkedUp
LOD를 말하다: Europeana, BBC, LinkedUpHansung University
 
Linked Data 이야기
Linked Data 이야기Linked Data 이야기
Linked Data 이야기Haklae Kim
 
공공데이터, 현재 우리는?
공공데이터, 현재 우리는?공공데이터, 현재 우리는?
공공데이터, 현재 우리는?Myungjin Lee
 
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원datasciencekorea
 
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410Peter Woo
 
데이터 거래와 유통에 대하여 (논문)
데이터 거래와 유통에 대하여 (논문)데이터 거래와 유통에 대하여 (논문)
데이터 거래와 유통에 대하여 (논문)Konkuk University
 
공공데이터와 Linked open data
공공데이터와 Linked open data공공데이터와 Linked open data
공공데이터와 Linked open dataMyungjin Lee
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data AnalysisMyunggoon Choi
 
2014 한국 링크드 데이터 사례집
2014 한국 링크드 데이터 사례집2014 한국 링크드 데이터 사례집
2014 한국 링크드 데이터 사례집Hansung University
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해수보 김
 
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁datasciencekorea
 
[오원석 Kswc2010]데이터의 가치를 높이는 linked data
[오원석 Kswc2010]데이터의 가치를 높이는 linked data[오원석 Kswc2010]데이터의 가치를 높이는 linked data
[오원석 Kswc2010]데이터의 가치를 높이는 linked dataLiST Inc
 
Statistics and linked data
Statistics and linked dataStatistics and linked data
Statistics and linked dataymchu88
 
문화유산 정보와 시맨틱웹 응용
문화유산 정보와 시맨틱웹 응용문화유산 정보와 시맨틱웹 응용
문화유산 정보와 시맨틱웹 응용LiST Inc
 
BigData, Hadoop과 Node.js, R2
BigData, Hadoop과 Node.js, R2BigData, Hadoop과 Node.js, R2
BigData, Hadoop과 Node.js, R2고포릿 default
 

What's hot (20)

도서관과 링크드데이터[TQK]
도서관과 링크드데이터[TQK]도서관과 링크드데이터[TQK]
도서관과 링크드데이터[TQK]
 
도서관 Linked Open Data의 필요성
도서관 Linked Open Data의 필요성도서관 Linked Open Data의 필요성
도서관 Linked Open Data의 필요성
 
농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형
 
LOD를 말하다: Europeana, BBC, LinkedUp
LOD를 말하다: Europeana, BBC, LinkedUpLOD를 말하다: Europeana, BBC, LinkedUp
LOD를 말하다: Europeana, BBC, LinkedUp
 
Linked Data 이야기
Linked Data 이야기Linked Data 이야기
Linked Data 이야기
 
공공데이터, 현재 우리는?
공공데이터, 현재 우리는?공공데이터, 현재 우리는?
공공데이터, 현재 우리는?
 
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
 
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
 
1.sos2010 tony
1.sos2010 tony1.sos2010 tony
1.sos2010 tony
 
데이터 거래와 유통에 대하여 (논문)
데이터 거래와 유통에 대하여 (논문)데이터 거래와 유통에 대하여 (논문)
데이터 거래와 유통에 대하여 (논문)
 
공공데이터와 Linked open data
공공데이터와 Linked open data공공데이터와 Linked open data
공공데이터와 Linked open data
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data Analysis
 
2014 한국 링크드 데이터 사례집
2014 한국 링크드 데이터 사례집2014 한국 링크드 데이터 사례집
2014 한국 링크드 데이터 사례집
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
 
BigData, Hadoop과 Node.js
BigData, Hadoop과 Node.jsBigData, Hadoop과 Node.js
BigData, Hadoop과 Node.js
 
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
 
[오원석 Kswc2010]데이터의 가치를 높이는 linked data
[오원석 Kswc2010]데이터의 가치를 높이는 linked data[오원석 Kswc2010]데이터의 가치를 높이는 linked data
[오원석 Kswc2010]데이터의 가치를 높이는 linked data
 
Statistics and linked data
Statistics and linked dataStatistics and linked data
Statistics and linked data
 
문화유산 정보와 시맨틱웹 응용
문화유산 정보와 시맨틱웹 응용문화유산 정보와 시맨틱웹 응용
문화유산 정보와 시맨틱웹 응용
 
BigData, Hadoop과 Node.js, R2
BigData, Hadoop과 Node.js, R2BigData, Hadoop과 Node.js, R2
BigData, Hadoop과 Node.js, R2
 

Viewers also liked

[2014년 3월 25일] mining minds 빅 데이터, 욕망을 읽다
[2014년 3월 25일] mining minds   빅 데이터, 욕망을 읽다[2014년 3월 25일] mining minds   빅 데이터, 욕망을 읽다
[2014년 3월 25일] mining minds 빅 데이터, 욕망을 읽다gilforum
 
데이터마이닝의 개요
데이터마이닝의 개요데이터마이닝의 개요
데이터마이닝의 개요Chris Kim
 
4 voc비정형분석 문종영
4 voc비정형분석 문종영4 voc비정형분석 문종영
4 voc비정형분석 문종영Saltlux Inc.
 
Dm ml study_roadmap
Dm ml study_roadmapDm ml study_roadmap
Dm ml study_roadmapKang Pilsung
 
마인즈랩 통합 VOC 관리 솔루션 소개_20151030
마인즈랩 통합 VOC 관리 솔루션 소개_20151030마인즈랩 통합 VOC 관리 솔루션 소개_20151030
마인즈랩 통합 VOC 관리 솔루션 소개_20151030Taejoon Yoo
 
집단지성 프로그래밍 01-데이터마이닝 개요
집단지성 프로그래밍 01-데이터마이닝 개요집단지성 프로그래밍 01-데이터마이닝 개요
집단지성 프로그래밍 01-데이터마이닝 개요Kwang Woo NAM
 
i-VOC (Voice of the Customer Big Data Analytics Solution) 고객의소리 분석
i-VOC (Voice of the Customer Big Data Analytics Solution) 고객의소리 분석i-VOC (Voice of the Customer Big Data Analytics Solution) 고객의소리 분석
i-VOC (Voice of the Customer Big Data Analytics Solution) 고객의소리 분석Taejoon Yoo
 
비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례
비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례
비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례JeongHeon Lee
 

Viewers also liked (9)

[2014년 3월 25일] mining minds 빅 데이터, 욕망을 읽다
[2014년 3월 25일] mining minds   빅 데이터, 욕망을 읽다[2014년 3월 25일] mining minds   빅 데이터, 욕망을 읽다
[2014년 3월 25일] mining minds 빅 데이터, 욕망을 읽다
 
데이터마이닝의 개요
데이터마이닝의 개요데이터마이닝의 개요
데이터마이닝의 개요
 
Bigdata
BigdataBigdata
Bigdata
 
4 voc비정형분석 문종영
4 voc비정형분석 문종영4 voc비정형분석 문종영
4 voc비정형분석 문종영
 
Dm ml study_roadmap
Dm ml study_roadmapDm ml study_roadmap
Dm ml study_roadmap
 
마인즈랩 통합 VOC 관리 솔루션 소개_20151030
마인즈랩 통합 VOC 관리 솔루션 소개_20151030마인즈랩 통합 VOC 관리 솔루션 소개_20151030
마인즈랩 통합 VOC 관리 솔루션 소개_20151030
 
집단지성 프로그래밍 01-데이터마이닝 개요
집단지성 프로그래밍 01-데이터마이닝 개요집단지성 프로그래밍 01-데이터마이닝 개요
집단지성 프로그래밍 01-데이터마이닝 개요
 
i-VOC (Voice of the Customer Big Data Analytics Solution) 고객의소리 분석
i-VOC (Voice of the Customer Big Data Analytics Solution) 고객의소리 분석i-VOC (Voice of the Customer Big Data Analytics Solution) 고객의소리 분석
i-VOC (Voice of the Customer Big Data Analytics Solution) 고객의소리 분석
 
비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례
비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례
비정형 데이터를 기반으로 한 빅데이터 필요기술 및 적용사례
 

Similar to 고대8 9주 빅데이터

[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)Steve Min
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망Open Cyber University of Korea
 
고려대 교육정보서비스 시스템 4-5주
고려대 교육정보서비스 시스템 4-5주 고려대 교육정보서비스 시스템 4-5주
고려대 교육정보서비스 시스템 4-5주 JM code group
 
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa영진 박
 
[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScienceNAVER D2
 
빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)Hong-Seok Kim
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용Jin wook
 
건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안메가트렌드랩 megatrendlab
 
빅데이터를 활용한 소셜 큐레이션과 로컬 서비스 플랫폼 에트리_특강_자문
빅데이터를 활용한 소셜 큐레이션과 로컬 서비스 플랫폼 에트리_특강_자문빅데이터를 활용한 소셜 큐레이션과 로컬 서비스 플랫폼 에트리_특강_자문
빅데이터를 활용한 소셜 큐레이션과 로컬 서비스 플랫폼 에트리_특강_자문JM code group
 
빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0Konkuk University
 
도서관 이해관계자의 보다 나은 의사결정을 위한 비즈니스 인텔리전스 구축 및 활용
도서관 이해관계자의 보다 나은 의사결정을 위한 비즈니스 인텔리전스 구축 및 활용도서관 이해관계자의 보다 나은 의사결정을 위한 비즈니스 인텔리전스 구축 및 활용
도서관 이해관계자의 보다 나은 의사결정을 위한 비즈니스 인텔리전스 구축 및 활용구중억 (한국기초과학지원연구원)
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)Han Woo PARK
 
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구 빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구 JM code group
 
DLAB company info and big data case studies
DLAB company info and big data case studiesDLAB company info and big data case studies
DLAB company info and big data case studiesDLAB
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루Jaimie Kwon (권재명)
 
Week1 ot
Week1 otWeek1 ot
Week1 otEun Yu
 
유비쿼터스환경과교육11주차141119
유비쿼터스환경과교육11주차141119유비쿼터스환경과교육11주차141119
유비쿼터스환경과교육11주차141119JM code group
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구Newsjelly
 
XML, NoSQL, 빅데이터, 클라우드로 옮겨가는 시장 상황 속, 데이터모델링 여전히 중요한가
XML, NoSQL, 빅데이터, 클라우드로 옮겨가는 시장 상황 속, 데이터모델링 여전히 중요한가XML, NoSQL, 빅데이터, 클라우드로 옮겨가는 시장 상황 속, 데이터모델링 여전히 중요한가
XML, NoSQL, 빅데이터, 클라우드로 옮겨가는 시장 상황 속, 데이터모델링 여전히 중요한가Devgear
 

Similar to 고대8 9주 빅데이터 (20)

[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
 
고려대 교육정보서비스 시스템 4-5주
고려대 교육정보서비스 시스템 4-5주 고려대 교육정보서비스 시스템 4-5주
고려대 교육정보서비스 시스템 4-5주
 
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
 
[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience
 
빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용
 
Big data
Big dataBig data
Big data
 
건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안
 
빅데이터를 활용한 소셜 큐레이션과 로컬 서비스 플랫폼 에트리_특강_자문
빅데이터를 활용한 소셜 큐레이션과 로컬 서비스 플랫폼 에트리_특강_자문빅데이터를 활용한 소셜 큐레이션과 로컬 서비스 플랫폼 에트리_특강_자문
빅데이터를 활용한 소셜 큐레이션과 로컬 서비스 플랫폼 에트리_특강_자문
 
빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0
 
도서관 이해관계자의 보다 나은 의사결정을 위한 비즈니스 인텔리전스 구축 및 활용
도서관 이해관계자의 보다 나은 의사결정을 위한 비즈니스 인텔리전스 구축 및 활용도서관 이해관계자의 보다 나은 의사결정을 위한 비즈니스 인텔리전스 구축 및 활용
도서관 이해관계자의 보다 나은 의사결정을 위한 비즈니스 인텔리전스 구축 및 활용
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
 
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구 빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
 
DLAB company info and big data case studies
DLAB company info and big data case studiesDLAB company info and big data case studies
DLAB company info and big data case studies
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루
 
Week1 ot
Week1 otWeek1 ot
Week1 ot
 
유비쿼터스환경과교육11주차141119
유비쿼터스환경과교육11주차141119유비쿼터스환경과교육11주차141119
유비쿼터스환경과교육11주차141119
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구
 
XML, NoSQL, 빅데이터, 클라우드로 옮겨가는 시장 상황 속, 데이터모델링 여전히 중요한가
XML, NoSQL, 빅데이터, 클라우드로 옮겨가는 시장 상황 속, 데이터모델링 여전히 중요한가XML, NoSQL, 빅데이터, 클라우드로 옮겨가는 시장 상황 속, 데이터모델링 여전히 중요한가
XML, NoSQL, 빅데이터, 클라우드로 옮겨가는 시장 상황 속, 데이터모델링 여전히 중요한가
 

More from JM code group

빅데이터와 인문융합 비즈니스 모델
빅데이터와 인문융합 비즈니스 모델빅데이터와 인문융합 비즈니스 모델
빅데이터와 인문융합 비즈니스 모델JM code group
 
2015 isaca conference_io_t_case_150904
2015 isaca conference_io_t_case_1509042015 isaca conference_io_t_case_150904
2015 isaca conference_io_t_case_150904JM code group
 
핀테크 정보교육시스템 특론 마지막 강의
핀테크 정보교육시스템 특론 마지막 강의핀테크 정보교육시스템 특론 마지막 강의
핀테크 정보교육시스템 특론 마지막 강의JM code group
 
빅데이터 힐링 맵 개발
빅데이터 힐링 맵 개발 빅데이터 힐링 맵 개발
빅데이터 힐링 맵 개발 JM code group
 
기술과 인문융합 (교육정보시스템특론) 12주
기술과 인문융합 (교육정보시스템특론) 12주기술과 인문융합 (교육정보시스템특론) 12주
기술과 인문융합 (교육정보시스템특론) 12주JM code group
 
빅데이터와공공정보 - 최고위과정 특강
빅데이터와공공정보 - 최고위과정 특강빅데이터와공공정보 - 최고위과정 특강
빅데이터와공공정보 - 최고위과정 특강JM code group
 
고려대 교육정보 서비스 특론 7주
고려대 교육정보 서비스 특론 7주고려대 교육정보 서비스 특론 7주
고려대 교육정보 서비스 특론 7주JM code group
 
교육정보서비스 사물인터넷 강의 6주
교육정보서비스 사물인터넷 강의 6주교육정보서비스 사물인터넷 강의 6주
교육정보서비스 사물인터넷 강의 6주JM code group
 
교육정보서비스 특론 3주
교육정보서비스 특론 3주교육정보서비스 특론 3주
교육정보서비스 특론 3주JM code group
 
고대 대학원 교육정보서비스특론 2주
고대 대학원 교육정보서비스특론 2주고대 대학원 교육정보서비스특론 2주
고대 대학원 교육정보서비스특론 2주JM code group
 
고려대 워크샵 141206 강장묵
고려대 워크샵 141206 강장묵고려대 워크샵 141206 강장묵
고려대 워크샵 141206 강장묵JM code group
 
모바일 미디어론 14주 모바일 공론장
모바일 미디어론 14주 모바일 공론장모바일 미디어론 14주 모바일 공론장
모바일 미디어론 14주 모바일 공론장JM code group
 
유비쿼터스환경과교육13주차141203
유비쿼터스환경과교육13주차141203유비쿼터스환경과교육13주차141203
유비쿼터스환경과교육13주차141203JM code group
 
모바일 미디어론 소셜미디어와 저널리즘
모바일 미디어론 소셜미디어와 저널리즘모바일 미디어론 소셜미디어와 저널리즘
모바일 미디어론 소셜미디어와 저널리즘JM code group
 
모바일 미디어론 12주 141120
모바일 미디어론 12주 141120모바일 미디어론 12주 141120
모바일 미디어론 12주 141120JM code group
 
유비쿼터스환경과교육
유비쿼터스환경과교육유비쿼터스환경과교육
유비쿼터스환경과교육JM code group
 
데이터 저널리즘
데이터 저널리즘데이터 저널리즘
데이터 저널리즘JM code group
 
2014 스마트교육∙디지털교과서 담당 교육전문직 워크숍
2014 스마트교육∙디지털교과서 담당 교육전문직 워크숍2014 스마트교육∙디지털교과서 담당 교육전문직 워크숍
2014 스마트교육∙디지털교과서 담당 교육전문직 워크숍JM code group
 
모바일미디이론 뉴미디어 아이디어의 발견 공유 설계
모바일미디이론 뉴미디어 아이디어의 발견 공유 설계모바일미디이론 뉴미디어 아이디어의 발견 공유 설계
모바일미디이론 뉴미디어 아이디어의 발견 공유 설계JM code group
 

More from JM code group (20)

빅데이터와 인문융합 비즈니스 모델
빅데이터와 인문융합 비즈니스 모델빅데이터와 인문융합 비즈니스 모델
빅데이터와 인문융합 비즈니스 모델
 
2015 isaca conference_io_t_case_150904
2015 isaca conference_io_t_case_1509042015 isaca conference_io_t_case_150904
2015 isaca conference_io_t_case_150904
 
핀테크 정보교육시스템 특론 마지막 강의
핀테크 정보교육시스템 특론 마지막 강의핀테크 정보교육시스템 특론 마지막 강의
핀테크 정보교육시스템 특론 마지막 강의
 
로봇과 교육
로봇과 교육로봇과 교육
로봇과 교육
 
빅데이터 힐링 맵 개발
빅데이터 힐링 맵 개발 빅데이터 힐링 맵 개발
빅데이터 힐링 맵 개발
 
기술과 인문융합 (교육정보시스템특론) 12주
기술과 인문융합 (교육정보시스템특론) 12주기술과 인문융합 (교육정보시스템특론) 12주
기술과 인문융합 (교육정보시스템특론) 12주
 
빅데이터와공공정보 - 최고위과정 특강
빅데이터와공공정보 - 최고위과정 특강빅데이터와공공정보 - 최고위과정 특강
빅데이터와공공정보 - 최고위과정 특강
 
고려대 교육정보 서비스 특론 7주
고려대 교육정보 서비스 특론 7주고려대 교육정보 서비스 특론 7주
고려대 교육정보 서비스 특론 7주
 
교육정보서비스 사물인터넷 강의 6주
교육정보서비스 사물인터넷 강의 6주교육정보서비스 사물인터넷 강의 6주
교육정보서비스 사물인터넷 강의 6주
 
교육정보서비스 특론 3주
교육정보서비스 특론 3주교육정보서비스 특론 3주
교육정보서비스 특론 3주
 
고대 대학원 교육정보서비스특론 2주
고대 대학원 교육정보서비스특론 2주고대 대학원 교육정보서비스특론 2주
고대 대학원 교육정보서비스특론 2주
 
고려대 워크샵 141206 강장묵
고려대 워크샵 141206 강장묵고려대 워크샵 141206 강장묵
고려대 워크샵 141206 강장묵
 
모바일 미디어론 14주 모바일 공론장
모바일 미디어론 14주 모바일 공론장모바일 미디어론 14주 모바일 공론장
모바일 미디어론 14주 모바일 공론장
 
유비쿼터스환경과교육13주차141203
유비쿼터스환경과교육13주차141203유비쿼터스환경과교육13주차141203
유비쿼터스환경과교육13주차141203
 
모바일 미디어론 소셜미디어와 저널리즘
모바일 미디어론 소셜미디어와 저널리즘모바일 미디어론 소셜미디어와 저널리즘
모바일 미디어론 소셜미디어와 저널리즘
 
모바일 미디어론 12주 141120
모바일 미디어론 12주 141120모바일 미디어론 12주 141120
모바일 미디어론 12주 141120
 
유비쿼터스환경과교육
유비쿼터스환경과교육유비쿼터스환경과교육
유비쿼터스환경과교육
 
데이터 저널리즘
데이터 저널리즘데이터 저널리즘
데이터 저널리즘
 
2014 스마트교육∙디지털교과서 담당 교육전문직 워크숍
2014 스마트교육∙디지털교과서 담당 교육전문직 워크숍2014 스마트교육∙디지털교과서 담당 교육전문직 워크숍
2014 스마트교육∙디지털교과서 담당 교육전문직 워크숍
 
모바일미디이론 뉴미디어 아이디어의 발견 공유 설계
모바일미디이론 뉴미디어 아이디어의 발견 공유 설계모바일미디이론 뉴미디어 아이디어의 발견 공유 설계
모바일미디이론 뉴미디어 아이디어의 발견 공유 설계
 

고대8 9주 빅데이터

  • 1. 고려대학교 정보대학 컴퓨터학과 Prof. 강장묵 (kangjm@korea.ac.kr ; mooknc@gmail.com) 교육정보 서비스 특론 9 주; 2015.4.29. 수 교육정보서비스에서 정형/반정형/비정형 데이터 처리는 어떤 의미를 갖는가? (교육정보에서 핵심 가중치를 두어야 할 데이터는 무엇인가? 몇 가지 추천하고 그 이유를 논한다.) 키워드 : 교육정보, 교육 데이터 마이닝, 교육 빅데이터 인용: http://analyticstraining.com/wp-content/uploads/2014/09/30-Sept.jpg 교육 정보 + 가중치
  • 2. 금주 소개 사이트 https://www.pinterest.com/ - 이미지 기반의 큐레이션 - 소셜 큐레이션, 관계 큐레이션, 화장품 큐레이션 - 교육 큐레이션?
  • 3. www.slideshare.net/mooknc 여러분의 보고서, 활동 역시 슬라이드쉐어에 공유 강의 교안
  • 4. 일상의 스토리텔링, 숨겨진 센싱과 문맥 분석 https://www.youtube.com/watch?v=OptqxagZDfM
  • 5. 강의 전 숙의할 질문 - 사물 (만물) 인터넷 환경에서 비정형/반정형/정형 데이터란 무엇 인가? - 클라우드 컴퓨팅/네트워크 환경에서 비정형/반정형/정형 데이터 의 의미란 무엇인가? - 웨어러블 중 학생 교복, 배지, 학생 시계, 학생 신발 등에서 정형/ 비정형/반정형 데이터란 무엇이고 어떻게 이용할 수 있는가? - 아니, 반드시 이용해야 하는가? 바른 이용 (교육적 의미 부여는 어 떻게 가능한가?)은 또 무엇인가?
  • 6. 인용: http://news.chosun.com/site/data/html_dir/2015/03/02/2015030202126.html http://cfile10.uf.tistory.com/image/182A5D50506E440612E7FF 남성분들은 잘 모르시겠지만, 여성분들이 하루에 화장을 몇 번 고칠까요? 소셜 빅 데이터에 올라온 텍스트를 분석해 보면,
  • 7. 그럼, 밤 10시에 화장을 고치는 이유는 무엇일까요?
  • 8. 인용: http://news.chosun.com/site/data/html_dir/2015/03/02/2015030202126.html [출처] 본 기사는 조선닷컴에서 작성된 기사 입니다 누가 왜 밤중에 화장을 고치느냐고 물어보면 '셀카 찍으려고요'라고 말할 사람은 많지 않을 것입니다. 이런 것은 물어보기도 어렵고 설사 묻는다 해도 잘 대답해주지 않을 것입니다. 그 시간에 화장을 고칠 것이라고는 상상하지 못하기 때 문에 물어볼 생각을 못할 뿐 아니라, 설사 묻는다 해도 민망해서 대답하지 않거나 자신의 행 동을 기억하지 못하기에 대답을 못하기 일쑤입니다. '밤 10시 셀카' 같은 것들은 부지불식간에 남긴 삶의 흔 적들이 모인 빅 데이터로 그녀들의 삶을 관찰했으니 찾 을 수 있었던 것입니다. 많은 기업은 소비자의 욕구를 파악하기 위해 질문을 활용합니다.
  • 9. 인용: 온라인상 비정형 데이터를 활용한 대안적 디자인 리서치 모델에 관한 연구 -디자인 에쓰노그래피 방법론을 중심으로-, 김은정(EunJungKim),이혜선(HyeSunLee), 디자인 융복합학회, <디자인융복합연구> 12권 5호. 2013 pp.205-223 본 연구에서 활용할 ‘비정형 데이터’는 바로 이 빅 데이터의 개념에서 출발하며, 빅 데이터는 데이터의 정형화 정도에 따라 크게 ‘정형 혹은 구조적(structured) 데이터’, ‘비정형 또는 비구조적(unstructured) 데이터’ 2가지로 나눠진다. ‘정형 데이터’는 고정된 필드에 저장되어지는 구조화된 데이터를 가리키며, 반면에 ‘비정형 데이터’는 데이터 하나하나마다 크기와 내용이 달라 통일된 구조로 정 리하기 어려운 데이터를 의미한다. 일상적으로 인터넷에서 실시간으로 업로드 되는 뉴스 게시물이나 블로그, 커뮤니티 게시판의 글, 동영상, 음악, 사진 등처 럼 고정된 서식에 저장되어 있지 않은 데이터들이 바로 이에 속하며 데이터 유 형에 따라 텍스트(text), 이미지(photo), 음성과 영상, 로그 파일 등으로 구성된 다. 이와 같은 온라인상의 비정형 데이터들은 현재 디지털 세상(digital universe) 가운데 약 95%이상을 차지하고 있으며(인용: IDC, The Expanding Digital Universe, 2007), 앞으로 생성될 전체 데이터 가운데 약 90% 이상을 차지할 것 으로 전망된다.(IDC, The Expanding Digital Universe, 2011; 함유근・채승병, 빅 데이터, 경영을 바꾸다, 서울:삼성경제연구소, 2012. p.32) 특히 SNS 서비스의 인기, 정보를 생산하는 개인용 디지털 기기 사용의 증가와 더불어 이러한 비정형 데이터의 폭발적 생산은 필연적으로 지속될 것이며 해가 지날수록 그 비율 또한 급증할 것이다. 이러한 비정형 데이터들의 특성은 3V(규 모(volume), 다양성(Variety), 속도(Velocity))로 나타난다.
  • 11. 인용: 맵리듀스와 대응분석을 활용한 비정형 빅 데이터의 정형화와 시각적 해석, 최요셉(JoSephChoi),최용석(YongSeokChoi), 한국통계학회, <응용통계연구> 27권 2호. 2014 pp.169-183 2010년을 기준으로 디지털 공간에 축적된 정보의 규모는 12억 TB(terabyte)에 육박하는 것으로 추정된다 (Gantz와 Reinsel, 2010). Special Report(2010.02.25)에 의하면, 세계 최대의 소매 체인 월 마트(Wal Mart)에서는 시간당 100만 건 이상의 거래 기록이 저 장되며, 2008년까지 약 2,500TB의 정보가 축적되었다고 한다. 또한, 2011년 1월을 기준으로 트위터에서는 매일 약 1억 1,000 만 개의 트위트가 발신되며 (Chiang, 2011), 2020년, 관리해야할 데이터량이 50배 급증할 것으로 전망된다고 한다(Jeong, 2011).
  • 13. 비정형 데이터(Unstructured Data): ‘비정형 데이터’란 빅데이터(Big Data)의 유형 중 하나로써, 일정한 규격이나 형태를 지닌 숫자 데이터(numeric data)와 달리 그림이나 영상,문서처럼 형태와 구조가 다른 구조화 되지 않은 데이터를 말한다. (인용: 정용찬, 빅데이터, 커뮤니케이션북스, 2012. p.14) 본 연구에서의 ‘비정형 데이터’는 책, 잡지, 문서의료 기록등과 같은 전통적인 비정형 데이터가 아닌, 이메일, 트위터, 블로그와 같은 모바일 기기와 온라인상에서 생성 및 축적되는 데이터로 용어의 범위를 제한한다. 인용: 온라인상 비정형 데이터를 활용한 대안적 디자인 리서치 모델에 관한 연구 -디자인 에쓰노그래피 방법론을 중심으로-, 김은정(EunJungKim),이혜선(HyeSunLee), 디자인 융복합학회, <디자인융복합연구> 12권 5호. 2013 pp.205-223
  • 14. 인용: 맵리듀스와 대응분석을 활용한 비정형 빅 데이터의 정형화와 시각적 해석, 최요셉(JoSephChoi),최용석(YongSeokChoi), 한국통계학회, <응용통계연구> 27권 2호. 2014 pp.169-183 최근 구글 자동 번역기와 지역별 검색어 빈도를 통한 독감 유행 정 보, 각종 인터넷 포탈 사이트들의 품질 높은 검색어 기능, 링크 분석 (link analysis)을 통한 키워드간의 연결 분석, 유권자들의 트윗 (tweet)을 분석하여 맞춤형 캠페인을 펼친 미국 오바마 대통령의 선 거 운동 등 비정형 빅 데이터(unstructured big data)에 대한 연구와 활용이 활발해지고 있다. 특히, Kim과 Cho (2013)는 빅데이터 분석과 관련이 있는 통계적 방 법론으로 고차원 회귀분석, 분류분석, 다중비교, 앙상블, 치적화알 고리즘, 차원축소, 네트워크분석, 군집화, 시각화, 온라인분석, 병 렬계산, Rhive인 R 프로그램을 들고 있다. 본 연구에서는 이러한 빅 데이터를 분석하기 위하여, 분산 처리 시스템(distribution processing system)인 맵리듀스(MapReduce) 를 활용하여, 비정형 빅 데이터(unstructured big data)를 정형화 하 고 , 이 를 분 석 하 고 시 각 화 하 기 위 하 여 대 응 분 석 (correspondence analysis)을 활용하려 한다.
  • 15. 인용: 온라인상 비정형 데이터를 활용한 대안적 디자인 리서치 모델에 관한 연구 -디자인 에쓰노그래피 방법론을 중심으로-, 김은정(EunJungKim),이혜선(HyeSunLee), 디자인 융복합학회, <디자인융복합연구> 12권 5호. 2013 pp.205-223
  • 16. 인용: 온라인상 비정형 데이터를 활용한 대안적 디자인 리서치 모델에 관한 연구 -디자인 에쓰노그래피 방법론을 중심으로-, 김은정(EunJungKim),이혜선(HyeSunLee), 디자인 융복합학회, <디자인융복합연구> 12권 5호. 2013 pp.205-223
  • 17. 인용: 온라인상 비정형 데이터를 활용한 대안적 디자인 리서치 모델에 관한 연구 -디자인 에쓰노그래피 방법론을 중심으로-, 김은정(EunJungKim),이혜선(HyeSunLee), 디자인 융복합학회, <디자인융복합연구> 12권 5호. 2013 pp.205-223 일상적 소비․관심 영역 키워드 분석을 통한 트랜드 발굴, 라이프 로그(life log)를 활용한 새로운 라이프스타일 탐색으로 대신 될 수 있다. 먼저 비정형 데이터를 활용한 트랜드 발굴은 소셜미디어 분석을 활용하여 일반적인 사람들의 일상적 소비․관심 영역을 분류, 각 영역에 해당하는 개념, 행위, 제품의 종류 및 품목 관련 주요 어휘들을 포괄하여 키워 드 세트로 구성하여 트랜드 분석을 진행한다. 이 때 연령대, 성별 등의 요소를 기준으로 키워드를 추출한다면 기업이 소구하고자 하는 정확한 해당 타겟 그룹 내의 라이프스타 일 및 삶의 가치, 감성 변화들을 시간의 흐름에 따라 분석할 수 있다.(송길영,여기에 당신의 욕망이 보인다, 빅 데이터가 찾아낸 70억 욕망의 지도, 쌤앤파커스,2012. pp.180-181) 라이프 로그(life log)를 활용한 새로운 라이프스타일 탐색의 경우는 개인의 삶이 온라인상에 흔적을 남기면서 생기는 로그 파일(log file)을 이용하여 타겟 그룹의 대 표적 혹은 새로운 라이프스타일을 발견하는 것이다. 비록 현재 라이프 로그를 활용 한 비정형 데이터 분석 서비스는 제한적이지만, 향후 스마트 기기 내 GPS, 카메라, NFC 등의 스마트 센서들이 송신하는 라이프 로그 정보셋(위치정보, 소비내역 정보 등)들을 활용한다면 보다 세밀하고 정량화된 라이프스타일 정보를 구축 할 수 있을 것이라 전망된다. 특히 라이프 로그 정보들이 기업 내 CRM과 연결된다면, 해당 기 업의 주 소비자층의 라이프스타일 및 트랜드를 발굴하는데 보다 맞춤화된 정보를 제공 받을 수 있을 것이다. 이와 같은 비정형 데이터를 활용한 분석 기법을 이용하여 도출된 사회문화적 맥락 및 소비자 트랜드, 소비자 가치와 관련된 큰 흐름은 기존 시장에 존재하지 않았던 시장 창출 및 제품 개발을 위한 현 디자인 트랜드 및 새로운 라이프 스타일, 감성 인 지를 통해 전반적 디자인 컨셉 도출 목표로 연결되어진다.
  • 18. 인용: http://www.edureka.co/blog/answering-the-big-question-what-is-big-data/ https://i-msdn.sec.s-msft.com/dynimg/IC197174.gif A distributed file system (DFS) is a file system that has data stored in a server. The data can be accessed and processed as if it is stored on the local machine. The DFS makes it really convenient to share information in a controlled manner.
  • 19. 인용: http://www.edureka.co/blog/answering-the-big-question-what-is-big-data/ A DFS allows efficient and well-managed data and storage sharing options on a network compared to any other. The DFS allows faster processing of huge amounts of data by processing data at various locations and then combining them to give the desired output. In Big Data technologies like Hadoop, it is possible to scale a Hadoop cluster to hundreds or even thousands of nodes. In this way, the MapReduce functions can be executed on smaller subsets of larger data sets, and thereby providing the scalability that is needed for Big Data processing.
  • 21. 인용: http://docs.oracle.com/cd/B19306_01/appdev.102/b14259/xdb02rep.htm This diagram shows four boxes: a, b, c, and d. Box a includes the words Data Structure? inside it. Box b includes, from top to bottom, the word Access?, a box labeled Repository Path Access, and a box labeled SQL Query Access. Box c includes, from top to bottom, the word Language?, and the bullet points Java, JDBC, PL/SQL, and C or C++. Box d includes, from top to bottom, the words Processing and Data Manipulation?, and the bullet points DOM, SQL inserts/updates, XSLT, Queriability, and Updatability.
  • 23. 인용: http://docs.oracle.com/cd/B19306_01/appdev.102/b14259/xdb02rep.htm This diagram shows the data storage model. The words How Structured is Your Data? appear at the top of the diagram. Three lines connect below to three separate boxes named, from left to right, Structured Data, Semi- structured Pseudo-structured Data, and Unstructured Data. The box labeled Structured Data has two lines that connect below to the words XML Schema Based? and the words Non-Schema Based?. XML Schema Based? connects below to the words Use either: CLOB or Structured Storage. Non-Schema Based? connects below to the words Store as:, which list three bullet points: CLOB in XMLType Table, File in Repository Folder Views, and Access through Resource APIs. The box labeled Semi-structured Pseudo-structured Data has two lines that connect below to the words XML Schema Based? and Non-Schema Based?. The words XML Schema Based? connect below to the words Use either:, which have three bullet points listed below: CLOB, Structured, and Hybrid Storage (semi-structured storage). The words Non-Schema Based? connect below to the words Store as:, which have three bullet points listed below: CLOB in XMLType Table, File in Repository Folder Views, and Access through Resource APIs. The box labeled Unstructured Data connects to the words Store as:, which have three bullet points listed below: CLOB in XMLType Table, File in Repository Folder Views, and Access through Resource APIs.
  • 25. 인용: http://docs.oracle.com/cd/B19306_01/appdev.102/b14259/xdb02rep.htm The figure shows a tree structure with two branches. The top node is labeled Oracle XML DB Data Access Options. The children of Oracle XML DB Data Access Options are Query-Based Access and Path-Based Access. The Query-Based Access node expands to Use SQL, which expands to Available Language and XMLType APIs (one node), which has three branches: JDBC, PL/SQL, and C (OCI). The Path-Based Access node expands to Use Repository, which expands to Available Languages and APIs (one node), which has three branches: SQL (RESOURCE_/PATH_VIEW), FTP, and HTTP/WebDav.
  • 27. 인용: 맵리듀스와 대응분석을 활용한 비정형 빅 데이터의 정형화와 시각적 해석, 최요셉(JoSephChoi),최용석(YongSeokChoi), 한국통계학회, <응용통계연구> 27권 2호. 2014 pp.169-183
  • 28. 다음주 (10주) 10주: 왜 교육정보에서 메타태그가 필요한가? 교육정보 검색 서비스란 무엇인가? 녹화 11주 이후부터는 질의 응답으로 여러분이 생각하는 교육적 가치, 교육 매타값, 가중치 등에 대해 심화 학습하 겠습니다. 중간고사 보고서 확인 - 9주 차 화요일 자정(메일 도착시간)까지 www.slideshare.net 에 자료 공유 - PPT, PDF 등을 kangjm@korea.ac.kr로 보낼 것
  • 29. The followings were made to supplement my shabby presentation. When you need anything, please e-mail me at this address at any time. mooknc@gmail.com ThanKQkangjm@korea.ac.kr