SlideShare a Scribd company logo
1 of 32
웹의 진화와 지식 구조화



      Youngwhan Lee, Ph. D.
       전화: 010-7997-0345
   이메일: nicklee@konkuk.ac.kr
  Facebook: Youngwhan Nick Lee
        Twitter: nicklee002




              1
Internet Today
2010:
• Estimated 1011 Web pages in the World
2012:
•   Social Media: Facebook (1 Billion Monthly Active Users)
•   문자 발명후 2003년까지 5 엑사 바이트  2012년 현재 매일 7 엑사바이트 데이터 생성 중
•   Is “big data” a big pile of garbage?




                                                        1-2
목차
1. 웹의 진화
     – 지식/정보 추출 기술
2.   롱테일 현상과 산업
3.   데이터의 웹: Linked Open Data (LOD)
4.   큐레이션
5.   소셜미디어 분석
     – 예: 강남스타일과 시사점
웹의 진화
빅데이터 처리와 정보/지식 추출 기술
Aggregation




                                    지식구조화                LOD

                                           RIF                                     큐레이션
                                        SPARQ
                                           L
                                            OWL
                                       RDF

            NoSQL                               데이터 마이닝
           MapReduce
        Cloud Computing                           XML

          R-DBMS

                                                                                                            Understanding




                   Modified, based on Gene Bellinger, Durval Castro, Anthony Mills http://www.systems-thinking.org/dikw/dikw.htm , http://yjhyjh.egloos.com/39721
Linked Open Data (LOD) 프로젝트
What are the Problems with the Web?
• Not easy to find information
   – “Data Mining” gives an answer of 30 Million Pages
• No way to find the information that I want
   – How can you find the pianist name of a song that is
     being played in the radio?
• Search results cannot be connected
   – Companies that got venture capital investment more
     than $1 Billions that is related Pyramidal Neurons
   – Landlocked countries the population more than 10
     Millions
• Vocabulary sensitive
   – River that flows into Atlantic ocean?
• Data, information or knowledge that I am interested
  does not find me real-time
Linked Open Data (LOD) Principles
    Linking Open Data (LOD) is to connect and to open data to public
    A little history of LOD Project
         Tim Berners-Lee proposed LOD(Linking Open Data) project (2006)
         Since the proposal, numerous countries and organizations participated, caused LOD to
          explode in terms of the number of data
               Wikipedia  DBpedia (www.dbpedia.org)
               Bio2RDF project opened in 27 fields of Biology, Genetics, Medical-related, of which the
                data sets are about 2.3 billions (Bio2RDF.org) (2008.10)
               BBC announced to participate LOD project (www.bbc.org), now one of the institutes
                actively utilizing the data
               US Data.gov released 5 billion data triples
               US Library of Congress announced to join LOD project.
                (http://id.loc.gov/authorities/sh85042531#concept)
               NY Times ( data.nytimes.com) release their data of 150 years of publication (2009.10)
               US Whitehouse release a plan to open data in RDF (2009.11)


                          1.    Use URIs as names for things
     4 Principles         2.    Use HTTP URIs
       of LOD             3.    When someone looks up a URI, provide useful information
                          4.    Include links to other URIs
Linked Open Data (LOD) Principles
Change of Web Structure



                    유저 인터페이스

인간을 위한
웹 페이지 연결            웹페이지 연결 버스




                    유저 인터페이스

 인간을 위한
               웹페이지 연결 버스
 웹 페이지 연결

                          매쉬업
              매쉬업

 컴퓨터를 위한
                      웹데이터 연결 버스
 웹 데이터 연결


                     11
Mar., 2008
May, 2007                    Sep., 2008




                July, 2009
SPARQL Example: To Query Wikipedia




          DBPedia SPARQL Endpoint
SPARQL Example: To Query Neuro Commons
Web 3.0: Merging the two
                    Perspectives
              WWW Propoal             Semantic
                (1989)                  Web      LOD Proposal (2006)   “GGG” Proposal (2007)

Technology                                 Knowledge-based
Innovation                                  Semantics Web
Perspective

                Next Generation Web

                                           Data-based
                                           Semantic Web

                                                                  Web 3.0
  Market
 Behavior
Perspective                 WEB 1.0                 WEB 2.0                 “WEB2” Proposal (2009)



                                                                       Technical Proposal Phase
                                                                       Practical Use Phase
큐레이션
Curation Services
Social Data Curation




        Sead-data.net
Video Curation




    VideoCooki.com
빅데이터 분석
Gloor’s Coolhunting
Gloor’s Coolhunting




소셜네트워크 분석을 통하여 트렌드 분석(Coolhunting)뿐만이
    아니고 트렌드 창출(Coolfarming)도 가능하다
전희주: 텔레콤 이탈고객 분석

■   양방향 해지자 네트워크 분석




                            • Color: 해지일자 별 표현
                                     (빨간색->보라색: 해지일자 선->
                            후)
                            • Shape: 십자가 모양 (이탈유발자)
                             - Connector 및 Broker 역할 점수가 평
                               균점수보다 모두 높은 고객
                            • Size: 연령 (20대 ~ 50대 분포)
                            • Label: 해지일자




    <그림 1> 102명 해지자들 간의 네트워 해지유발자를 찾아낼 수 있다
       소셜 네트워크 분석을 통하여
                                                             24
    크
                                  출처: 2012 하계 통계학회 2012-11
예: 강남스타일과 시사점
오빤 강남 스타일
• 8억 클릭 육박 중.
    •2012년 7월 15일 뮤직비디오 공개

    • 2012년 8월 24일, 40(+40)일 경과: 5000만 뷰

    • 2012년 9월 4일, 52 (+11)일 경과: 1억 뷰

    • 2012년 9월 12일, 60 (+8)일 경과: 1.5억 뷰

    • 2012년 9월 18일, 66(+6)일 경과: 2억 뷰

    • 2012년 9월 26일, 74일 경과: 3억 뷰

    • 2012년 10월 20일, 98일 경과: 5억 284만 뷰

    • 2012년 11월 20일, 128일 경과: 7억 704만 뷰

•       참고) 역대 유투브 조회수

    –   1위: 저스틴 비버의 ‘Baby’ 7억 9105만 건

    –   2위: 제니퍼 로페즈의 ‘On the floor’ 6억 1072만 건
SM Town 트위팅 3/3 ~ 3/9
트위터 id           Betweenness
allkpop               0.14915
icontaec              0.05684
mama_risaa            0.04227
yeolbong              0.03491
mikcat39              0.03056
ponponn91             0.01750
bigbangupdates        0.02072
dunia_kpopers         0.01920
ariearien             0.01875
2ne1global            0.01850
instiz_ichart         0.01446
taeccool              0.01137
soompi_bigbang        0.01060
yuuuukaap             0.00903
su_sunshine           0.00947
soompi                0.00948
koreanchingu          0.01063
lovelytaec            0.01034
younggirls97          0.00753
소녀시대 트위팅 3/3 ~ 3/9
                     트위터 id     Betweenness
               smtown_snsd           0.18733
               soshified             0.08696
               soal_kpop             0.08263
               yurui912              0.06552
               dunia_kpopers         0.03794
               ggkwonyuri_           0.03667
               we_lovekorea          0.03364
               ccpacilli             0.02858
               oniontaker            0.02562
               allkpop               0.02676
               abckpop_              0.02306
               egghead0              0.02190
               diiahottest           0.01963
               youtube               0.01661
               mikifujisaki          0.01597
               processic             0.01546
               kpopers_family        0.01478
               snsd_news             0.01222
               niakanyaa             0.01280
강남스타일 트위팅 11/3 ~ 11/5
트위터 id            Betweenness
psy                    0.40147
ellemca                0.15645
only5guysonly1d        0.10259
duckbelieber97         0.08064
davtinmodel            0.06590
laura_stubbsx          0.06070
laraheleno             0.05797
fernandoponcejr        0.04981
delylachen_ii          0.04234
kayliesimmons          0.03671
geekstoremx            0.03172
timeswagbiebs          0.02865
itsmaylinsofia_        0.02664
youtube                0.02585
ultrakpop              0.02335
justinbieber           0.02329
conqueruniverse        0.02321
taylorswift13          0.02292
staystronghope         0.02130
“강남 스타일” Twitters
기술 수용 주기와 캐즘 이론
  VISIONARIES      PRAGMATISTS
  “Follow their    “Stay with the
  own dictates”        herd”
소녀시대 / SM Town
                  강남 스타일 Twitters
   Twitters
향후 연구

• 소셜네트워크 분석과 LOD의 접목
 – 사용 단어 분석에 온톨로지를 사용하여 분석의
   정밀성 제고
 – Foaf 등을 이용한 소셜 네트워크 관계성 정밀 분
   석
• 강남스타일 및 한류스타 트윗 정밀 분석
 – 트윗 패턴 및 트위터 성향 분석



         감사합니다

More Related Content

Similar to 웹의 진화와 지식 구조화 Ver 1 1

빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0Konkuk University
 
e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원
e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원
e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원Center for Teaching and Learning
 
01.소셜 큐레이션 서비스가 각광받는 이유
01.소셜 큐레이션 서비스가 각광받는 이유01.소셜 큐레이션 서비스가 각광받는 이유
01.소셜 큐레이션 서비스가 각광받는 이유Industrial Bank of Korea
 
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012Daum DNA
 
DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료Hyun Namgoong
 
Social big data - Collaboration & Collective Intelligence
Social big data - Collaboration & Collective IntelligenceSocial big data - Collaboration & Collective Intelligence
Social big data - Collaboration & Collective Intelligencekang Anthony
 
제5회인터넷리더십프로그램_openness trend_신종섭
제5회인터넷리더십프로그램_openness trend_신종섭제5회인터넷리더십프로그램_openness trend_신종섭
제5회인터넷리더십프로그램_openness trend_신종섭daumfoundation
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용Jin wook
 
BigData, Hadoop과 Node.js, R2
BigData, Hadoop과 Node.js, R2BigData, Hadoop과 Node.js, R2
BigData, Hadoop과 Node.js, R2고포릿 default
 
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big dataK data
 
데이터시장의 트렌드와 예측 - 이영환
데이터시장의 트렌드와 예측 - 이영환 데이터시장의 트렌드와 예측 - 이영환
데이터시장의 트렌드와 예측 - 이영환 datasciencekorea
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터JM code group
 
소셜 관점에서 본 2011년 웹동향 및 2012
소셜 관점에서 본 2011년 웹동향 및 2012소셜 관점에서 본 2011년 웹동향 및 2012
소셜 관점에서 본 2011년 웹동향 및 2012YOOJIN KIM
 
Digital curation
Digital curationDigital curation
Digital curationiron han
 
데이터읽는남자 2
데이터읽는남자 2데이터읽는남자 2
데이터읽는남자 2Hanyang University
 
DIY 공공데이터
DIY 공공데이터DIY 공공데이터
DIY 공공데이터So Won Young
 
웹의 분화 현상
웹의 분화 현상웹의 분화 현상
웹의 분화 현상Hye-Jin Park
 

Similar to 웹의 진화와 지식 구조화 Ver 1 1 (20)

빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0
 
e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원
e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원
e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원
 
01.소셜 큐레이션 서비스가 각광받는 이유
01.소셜 큐레이션 서비스가 각광받는 이유01.소셜 큐레이션 서비스가 각광받는 이유
01.소셜 큐레이션 서비스가 각광받는 이유
 
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
 
DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료
 
Social big data - Collaboration & Collective Intelligence
Social big data - Collaboration & Collective IntelligenceSocial big data - Collaboration & Collective Intelligence
Social big data - Collaboration & Collective Intelligence
 
제5회인터넷리더십프로그램_openness trend_신종섭
제5회인터넷리더십프로그램_openness trend_신종섭제5회인터넷리더십프로그램_openness trend_신종섭
제5회인터넷리더십프로그램_openness trend_신종섭
 
공공기관의 빅데이터 구현 전략
공공기관의 빅데이터 구현 전략공공기관의 빅데이터 구현 전략
공공기관의 빅데이터 구현 전략
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용
 
BigData, Hadoop과 Node.js, R2
BigData, Hadoop과 Node.js, R2BigData, Hadoop과 Node.js, R2
BigData, Hadoop과 Node.js, R2
 
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
 
데이터시장의 트렌드와 예측 - 이영환
데이터시장의 트렌드와 예측 - 이영환 데이터시장의 트렌드와 예측 - 이영환
데이터시장의 트렌드와 예측 - 이영환
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터
 
소셜 관점에서 본 2011년 웹동향 및 2012
소셜 관점에서 본 2011년 웹동향 및 2012소셜 관점에서 본 2011년 웹동향 및 2012
소셜 관점에서 본 2011년 웹동향 및 2012
 
BigData, Hadoop과 Node.js
BigData, Hadoop과 Node.jsBigData, Hadoop과 Node.js
BigData, Hadoop과 Node.js
 
Digital curation
Digital curationDigital curation
Digital curation
 
데이터읽는남자 2
데이터읽는남자 2데이터읽는남자 2
데이터읽는남자 2
 
DIY 공공데이터
DIY 공공데이터DIY 공공데이터
DIY 공공데이터
 
웹의 분화 현상
웹의 분화 현상웹의 분화 현상
웹의 분화 현상
 
웹의 분화 현상
웹의 분화 현상웹의 분화 현상
웹의 분화 현상
 

More from Konkuk University

비대면인증의 성공적 정착을 위한 제언
비대면인증의 성공적 정착을 위한 제언비대면인증의 성공적 정착을 위한 제언
비대면인증의 성공적 정착을 위한 제언Konkuk University
 
데이터 거래와 유통에 대하여 (논문)
데이터 거래와 유통에 대하여 (논문)데이터 거래와 유통에 대하여 (논문)
데이터 거래와 유통에 대하여 (논문)Konkuk University
 
핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508
핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508
핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508Konkuk University
 
금융 보안사고 트렌드와 정부 금융사들의 과제
금융 보안사고 트렌드와 정부 금융사들의 과제금융 보안사고 트렌드와 정부 금융사들의 과제
금융 보안사고 트렌드와 정부 금융사들의 과제Konkuk University
 
Lessons Learned from Lod Failure and Big Data : The Future Trend
Lessons Learned from Lod Failure and Big Data : The Future Trend Lessons Learned from Lod Failure and Big Data : The Future Trend
Lessons Learned from Lod Failure and Big Data : The Future Trend Konkuk University
 
집단지성에서 시민행동의 플랫폼으로
집단지성에서 시민행동의 플랫폼으로집단지성에서 시민행동의 플랫폼으로
집단지성에서 시민행동의 플랫폼으로Konkuk University
 
소셜미디어 사용 해외사례 Ver 1 1
소셜미디어 사용 해외사례 Ver 1 1소셜미디어 사용 해외사례 Ver 1 1
소셜미디어 사용 해외사례 Ver 1 1Konkuk University
 
Smart gov 3 소통과 공유의 원칙 (최종)
Smart gov 3 소통과 공유의 원칙 (최종)Smart gov 3 소통과 공유의 원칙 (최종)
Smart gov 3 소통과 공유의 원칙 (최종)Konkuk University
 
Smart gov 3 소통과 공유의 원칙 최종
Smart gov 3 소통과 공유의 원칙 최종Smart gov 3 소통과 공유의 원칙 최종
Smart gov 3 소통과 공유의 원칙 최종Konkuk University
 
공공정보의 개방활용의 필요성과 역할
공공정보의 개방활용의 필요성과 역할공공정보의 개방활용의 필요성과 역할
공공정보의 개방활용의 필요성과 역할Konkuk University
 
웹 3.0 세상을 바꾸고 있다 요약
웹 3.0 세상을 바꾸고 있다 요약웹 3.0 세상을 바꾸고 있다 요약
웹 3.0 세상을 바꾸고 있다 요약Konkuk University
 

More from Konkuk University (11)

비대면인증의 성공적 정착을 위한 제언
비대면인증의 성공적 정착을 위한 제언비대면인증의 성공적 정착을 위한 제언
비대면인증의 성공적 정착을 위한 제언
 
데이터 거래와 유통에 대하여 (논문)
데이터 거래와 유통에 대하여 (논문)데이터 거래와 유통에 대하여 (논문)
데이터 거래와 유통에 대하여 (논문)
 
핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508
핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508
핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508
 
금융 보안사고 트렌드와 정부 금융사들의 과제
금융 보안사고 트렌드와 정부 금융사들의 과제금융 보안사고 트렌드와 정부 금융사들의 과제
금융 보안사고 트렌드와 정부 금융사들의 과제
 
Lessons Learned from Lod Failure and Big Data : The Future Trend
Lessons Learned from Lod Failure and Big Data : The Future Trend Lessons Learned from Lod Failure and Big Data : The Future Trend
Lessons Learned from Lod Failure and Big Data : The Future Trend
 
집단지성에서 시민행동의 플랫폼으로
집단지성에서 시민행동의 플랫폼으로집단지성에서 시민행동의 플랫폼으로
집단지성에서 시민행동의 플랫폼으로
 
소셜미디어 사용 해외사례 Ver 1 1
소셜미디어 사용 해외사례 Ver 1 1소셜미디어 사용 해외사례 Ver 1 1
소셜미디어 사용 해외사례 Ver 1 1
 
Smart gov 3 소통과 공유의 원칙 (최종)
Smart gov 3 소통과 공유의 원칙 (최종)Smart gov 3 소통과 공유의 원칙 (최종)
Smart gov 3 소통과 공유의 원칙 (최종)
 
Smart gov 3 소통과 공유의 원칙 최종
Smart gov 3 소통과 공유의 원칙 최종Smart gov 3 소통과 공유의 원칙 최종
Smart gov 3 소통과 공유의 원칙 최종
 
공공정보의 개방활용의 필요성과 역할
공공정보의 개방활용의 필요성과 역할공공정보의 개방활용의 필요성과 역할
공공정보의 개방활용의 필요성과 역할
 
웹 3.0 세상을 바꾸고 있다 요약
웹 3.0 세상을 바꾸고 있다 요약웹 3.0 세상을 바꾸고 있다 요약
웹 3.0 세상을 바꾸고 있다 요약
 

웹의 진화와 지식 구조화 Ver 1 1

  • 1. 웹의 진화와 지식 구조화 Youngwhan Lee, Ph. D. 전화: 010-7997-0345 이메일: nicklee@konkuk.ac.kr Facebook: Youngwhan Nick Lee Twitter: nicklee002 1
  • 2. Internet Today 2010: • Estimated 1011 Web pages in the World 2012: • Social Media: Facebook (1 Billion Monthly Active Users) • 문자 발명후 2003년까지 5 엑사 바이트  2012년 현재 매일 7 엑사바이트 데이터 생성 중 • Is “big data” a big pile of garbage? 1-2
  • 3.
  • 4. 목차 1. 웹의 진화 – 지식/정보 추출 기술 2. 롱테일 현상과 산업 3. 데이터의 웹: Linked Open Data (LOD) 4. 큐레이션 5. 소셜미디어 분석 – 예: 강남스타일과 시사점
  • 6. 빅데이터 처리와 정보/지식 추출 기술 Aggregation 지식구조화 LOD RIF 큐레이션 SPARQ L OWL RDF NoSQL 데이터 마이닝 MapReduce Cloud Computing XML R-DBMS Understanding Modified, based on Gene Bellinger, Durval Castro, Anthony Mills http://www.systems-thinking.org/dikw/dikw.htm , http://yjhyjh.egloos.com/39721
  • 7. Linked Open Data (LOD) 프로젝트
  • 8. What are the Problems with the Web? • Not easy to find information – “Data Mining” gives an answer of 30 Million Pages • No way to find the information that I want – How can you find the pianist name of a song that is being played in the radio? • Search results cannot be connected – Companies that got venture capital investment more than $1 Billions that is related Pyramidal Neurons – Landlocked countries the population more than 10 Millions • Vocabulary sensitive – River that flows into Atlantic ocean? • Data, information or knowledge that I am interested does not find me real-time
  • 9. Linked Open Data (LOD) Principles Linking Open Data (LOD) is to connect and to open data to public  A little history of LOD Project  Tim Berners-Lee proposed LOD(Linking Open Data) project (2006)  Since the proposal, numerous countries and organizations participated, caused LOD to explode in terms of the number of data  Wikipedia  DBpedia (www.dbpedia.org)  Bio2RDF project opened in 27 fields of Biology, Genetics, Medical-related, of which the data sets are about 2.3 billions (Bio2RDF.org) (2008.10)  BBC announced to participate LOD project (www.bbc.org), now one of the institutes actively utilizing the data  US Data.gov released 5 billion data triples  US Library of Congress announced to join LOD project. (http://id.loc.gov/authorities/sh85042531#concept)  NY Times ( data.nytimes.com) release their data of 150 years of publication (2009.10)  US Whitehouse release a plan to open data in RDF (2009.11) 1. Use URIs as names for things 4 Principles 2. Use HTTP URIs of LOD 3. When someone looks up a URI, provide useful information 4. Include links to other URIs
  • 10. Linked Open Data (LOD) Principles
  • 11. Change of Web Structure 유저 인터페이스 인간을 위한 웹 페이지 연결 웹페이지 연결 버스 유저 인터페이스 인간을 위한 웹페이지 연결 버스 웹 페이지 연결 매쉬업 매쉬업 컴퓨터를 위한 웹데이터 연결 버스 웹 데이터 연결 11
  • 12. Mar., 2008 May, 2007 Sep., 2008 July, 2009
  • 13.
  • 14. SPARQL Example: To Query Wikipedia DBPedia SPARQL Endpoint
  • 15. SPARQL Example: To Query Neuro Commons
  • 16. Web 3.0: Merging the two Perspectives WWW Propoal Semantic (1989) Web LOD Proposal (2006) “GGG” Proposal (2007) Technology Knowledge-based Innovation Semantics Web Perspective Next Generation Web Data-based Semantic Web Web 3.0 Market Behavior Perspective WEB 1.0 WEB 2.0 “WEB2” Proposal (2009) Technical Proposal Phase Practical Use Phase
  • 19. Social Data Curation Sead-data.net
  • 20. Video Curation VideoCooki.com
  • 23. Gloor’s Coolhunting 소셜네트워크 분석을 통하여 트렌드 분석(Coolhunting)뿐만이 아니고 트렌드 창출(Coolfarming)도 가능하다
  • 24. 전희주: 텔레콤 이탈고객 분석 ■ 양방향 해지자 네트워크 분석 • Color: 해지일자 별 표현 (빨간색->보라색: 해지일자 선-> 후) • Shape: 십자가 모양 (이탈유발자) - Connector 및 Broker 역할 점수가 평 균점수보다 모두 높은 고객 • Size: 연령 (20대 ~ 50대 분포) • Label: 해지일자 <그림 1> 102명 해지자들 간의 네트워 해지유발자를 찾아낼 수 있다 소셜 네트워크 분석을 통하여 24 크 출처: 2012 하계 통계학회 2012-11
  • 26. 오빤 강남 스타일 • 8억 클릭 육박 중. •2012년 7월 15일 뮤직비디오 공개 • 2012년 8월 24일, 40(+40)일 경과: 5000만 뷰 • 2012년 9월 4일, 52 (+11)일 경과: 1억 뷰 • 2012년 9월 12일, 60 (+8)일 경과: 1.5억 뷰 • 2012년 9월 18일, 66(+6)일 경과: 2억 뷰 • 2012년 9월 26일, 74일 경과: 3억 뷰 • 2012년 10월 20일, 98일 경과: 5억 284만 뷰 • 2012년 11월 20일, 128일 경과: 7억 704만 뷰 • 참고) 역대 유투브 조회수 – 1위: 저스틴 비버의 ‘Baby’ 7억 9105만 건 – 2위: 제니퍼 로페즈의 ‘On the floor’ 6억 1072만 건
  • 27. SM Town 트위팅 3/3 ~ 3/9 트위터 id Betweenness allkpop 0.14915 icontaec 0.05684 mama_risaa 0.04227 yeolbong 0.03491 mikcat39 0.03056 ponponn91 0.01750 bigbangupdates 0.02072 dunia_kpopers 0.01920 ariearien 0.01875 2ne1global 0.01850 instiz_ichart 0.01446 taeccool 0.01137 soompi_bigbang 0.01060 yuuuukaap 0.00903 su_sunshine 0.00947 soompi 0.00948 koreanchingu 0.01063 lovelytaec 0.01034 younggirls97 0.00753
  • 28. 소녀시대 트위팅 3/3 ~ 3/9 트위터 id Betweenness smtown_snsd 0.18733 soshified 0.08696 soal_kpop 0.08263 yurui912 0.06552 dunia_kpopers 0.03794 ggkwonyuri_ 0.03667 we_lovekorea 0.03364 ccpacilli 0.02858 oniontaker 0.02562 allkpop 0.02676 abckpop_ 0.02306 egghead0 0.02190 diiahottest 0.01963 youtube 0.01661 mikifujisaki 0.01597 processic 0.01546 kpopers_family 0.01478 snsd_news 0.01222 niakanyaa 0.01280
  • 29. 강남스타일 트위팅 11/3 ~ 11/5 트위터 id Betweenness psy 0.40147 ellemca 0.15645 only5guysonly1d 0.10259 duckbelieber97 0.08064 davtinmodel 0.06590 laura_stubbsx 0.06070 laraheleno 0.05797 fernandoponcejr 0.04981 delylachen_ii 0.04234 kayliesimmons 0.03671 geekstoremx 0.03172 timeswagbiebs 0.02865 itsmaylinsofia_ 0.02664 youtube 0.02585 ultrakpop 0.02335 justinbieber 0.02329 conqueruniverse 0.02321 taylorswift13 0.02292 staystronghope 0.02130
  • 31. 기술 수용 주기와 캐즘 이론 VISIONARIES PRAGMATISTS “Follow their “Stay with the own dictates” herd” 소녀시대 / SM Town 강남 스타일 Twitters Twitters
  • 32. 향후 연구 • 소셜네트워크 분석과 LOD의 접목 – 사용 단어 분석에 온톨로지를 사용하여 분석의 정밀성 제고 – Foaf 등을 이용한 소셜 네트워크 관계성 정밀 분 석 • 강남스타일 및 한류스타 트윗 정밀 분석 – 트윗 패턴 및 트위터 성향 분석 감사합니다

Editor's Notes

  1. To run for real: http://dbpedia.org/sparqlPREFIX type: &lt;http://dbpedia.org/class/yago/&gt;PREFIX prop: &lt;http://dbpedia.org/property/&gt;SELECT ?country_name ?populationWHERE { ?country a type:LandlockedCountries ;rdfs:label ?country_name ;prop:populationEstimate ?population . FILTER (?population &gt; 15000000 &amp;&amp; langMatches(lang(?country_name), &quot;EN&quot;)) .} ORDER BY DESC(?population)