• Save
[오원석 Kswc2010]데이터의 가치를 높이는 linked data
Upcoming SlideShare
Loading in...5
×
 

[오원석 Kswc2010]데이터의 가치를 높이는 linked data

on

  • 1,653 views

데이터의 가치를 높이는 linked data

데이터의 가치를 높이는 linked data

Statistics

Views

Total Views
1,653
Slideshare-icon Views on SlideShare
1,653
Embed Views
0

Actions

Likes
3
Downloads
0
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    [오원석 Kswc2010]데이터의 가치를 높이는 linked data [오원석 Kswc2010]데이터의 가치를 높이는 linked data Presentation Transcript

    • Composing the Semantic Web
      데이터의 가치를 높이는 Linked Data
      (주)탑쿼드란트코리아 오 원 석
    • 지구보다 큰 생각 : 화성시
      2
    • The Web : The World’s Largest Information System
      3
    • Search
      색인
      검색
      참조
      4
    • The Web : The World’s Largest Information System
      5
    • Semantic Web & Linked Data
      질의
      6
    • Linked Data 원칙
      http://bibleontology.com/page/Bilhah
      http://bibleontology.com/page/Bilhah
      http://bibleontology.com/page/Bilhah
      http://bibleontology.com/page/Bilhah
      http:// http://bibleontology.com/page/Bilhah
      1. Use URIs as names for things
      2. Use HTTP URIs so that people can look up those names
      3. When someone looks up a URI, provide useful RDF Information
      4. Include RDF statements that link to other URIs so that they can discover related things
      3. When someone looks up a URI, provide useful RDF Information
      4. Include RDF statements that link to other URIs so that they can discover related things
      1. Use URIs as names for things
      http://bibleontology.com/page/Bilhah
      1. Use URIs as names for things
      http://bibleontology.com/page/Bilhah
      2. Use HTTP URIs so that people can look up those names
      http://bibleontology.com/page/Bilhah
      Tim Berners-Lee 2007 http://www.w3.org/DesignIssues/LinkedData.html
      HTTP
      URI
      RDF
      7
    • Linked Data 예시
      [residences]
      Seoul
      HongGilDong
      http://dbpedia.org/
      resource/Seoul
      [researches]
      SemanticWeb
      [age]
      [name]
      [sameAs]
      Hong, Gil Dong
      35
      http://dbpedia.org/
      resource/Semantic_Web
      http://sws.geonames.org/1835848/
      [hasPhotoCollection]
      [nearbyFeatures]
      http://www4.wiwiss.fu-berlin.de/flickrwrappr/
      photos/Semantic_Web
      http://sws.geonames.org/1835848/nearby.rdf
      8
    • Linked Data – 기본 원칙
      • 웹에 데이터를 넣어서 데이터베이스에 질의하듯, 질의하고 싶어요
      URI
      로 식별하고, Linking 하고,
      RDF
      로 표현하고,
      SQL
      SPARQL
      로 질의하고,
      HTTP
      로 유통하고,
      SPARQL
      9
    • Linked Data Cloud
      10
    • Linked Data – SPARQL
      11
    • Linked Data에 대해 조금만 더…
      12
    • 지겹지만 : Current Web – Document Web
      인간이 이해할 수 있는(human-readable) 웹
      Beijing
      ?
      ?
      ?
      ?
      참고 : Chris Bizer / The Emerging Web of Linked Data
      13
    • 지겹지만 : Semantic Web – Data Web - Linked Data
      기계가 이해하고 처리할 수 있는 (machine-readable) 웹
      참고 : Chris Bizer / The Emerging Web of Linked Data
      14
    • Current Web – Document Web
      Search Engines
      Web Browsers
      Silo
      Silo
      Silo
      참고 : Chris Bizer / The Emerging Web of Linked Data
      15
    • OpenAPI - Mashup
      Open
      API
      Open
      API
      Open
      API
      X
      X
      X
      X
      Silo
      Silo
      Silo
      16
    • Linked Datause Semantic Web technologies …
      Use Semantic Web technologies to
      publish structured data on the Web,
      set links between data from one data source to data within other data sources.
      RDF
      RDF
      RDF
      RDF
      RDF
      RDF
      RDF
      RDF
      RDF
      RDF
      RDFlink
      RDFlinks
      RDFlinks
      RDFlinks
      A
      E
      C
      D
      B
      참고 : Chris Bizer / The Emerging Web of Linked Data
      17
    • Linked Data – 기본에충실하자
      웹상에서 데이터를 좀 더 효율적으로
      교환(유통) 하고자 하는 것
      SPARQL
      HTTP
      URI
      RDF
      18
    • Triple
      • 주어(Subject) , 술어(Predicate), 목적어(Object)의 형태로 데이터를 표현하고 기술 하는 방법
      • SPO 패턴으로 표현되기 때문에 트리플 구조라 부르며, 하나의 조합된 셋을 Statements라 함
      • RDF, RDFS, OWL은 모두 XML 표현 형식의 RDF 구조를 기반으로 하며 RDF 트리플 형식으로 데이터를 표현함,
      O
      S
      S
      P
      P
      P
      O
      O
      S
      19
    • Semantic Web & SPARQL
      • Triple Pattern으로 질의
      • RDF Model 구조를 모르더라도
      • 질의하고 싶은 URI 개체 또는
      • 질의하고 싶은 속성(property)을통해
      select ?p ?o where
      { <http://dbpedia.org/resource/Seoul>?p ?o}
      select ?s ?o where
      { ?s <http://dbpedia.org/property/xxx>?o}
      20
    • SPARQL Endpoint
      웹 브라우저
      어플리케이션
      HTML, RDF, XML,CSV, ..
      SPARQL
      HTML, RDF, XML, CSV, ..
      SPARQL
      HTTP
      RDF Triple
      SPARQL Endpoint
      Web Server / Servlet Container (java)
      트리플(Linked Data) 저장소
      21
    • SPARQL Endpoint – Content Negotiation
      Application
      Browser
      RDF Triple
      SPARQL Endpoint
      22
    • 시맨틱한 서비스 vs시맨틱웹 서비스
      통계
      언어처리
      마이닝
      추론
      검색

      링킹
      아이디어 발굴
      탐색
      어플 적용
      검색

      23
    • 시맨틱한 서비스 vs시맨틱웹 서비스
      시맨틱한 서비스
      통계
      언어처리
      마이닝
      추론
      검색
      논문1
      논문2

      논문3
      논문4
      24
    • 시맨틱한 서비스 vs시맨틱웹 서비스
      시맨틱웹 서비스
      정보과학회
      정보처리학회
      지도학회
      연구재단
      인용하다
      동일저자이다
      같은논문이다
      25
    • 시맨틱한 서비스 vs시맨틱웹 서비스
      링킹
      아이디어 발굴
      정보과학회
      정보처리학회
      지도학회
      연구재단
      탐색
      인용하다
      어플 적용
      검색

      동일저자이다
      링킹
      탐색
      검색
      같은논문이다
      정보를 더욱 풍부하게…
      연결된 정보간의 탐색
      자원간의 연결을 기반으로 검색
      아이디어발굴
      어플 적용

      다양한 분석 및 서비스에의 활용..
      다양한 미디어에서의 서비스 적용…

      26
    • 시맨틱한 서비스 vs시맨틱웹 서비스
      시맨틱한 서비스가 필요하지 않거나, 잘못 되었다는 것은 절대 아닙니다.
      시맨틱웹, 적어도 Linked Data에 대한 오해는 하지 말아야 할 것입니다.
      27
    • 연결
      • 웹상에서 데이터를 좀 더 효율적으로 교환(유통)하고자 하는 것
      시맨틱웹은 웹 상에서의 데이터 연결이 가장 우선시 되어야 합니다.
      그것이 RDF와 SPARQL이 필요한 이유입니다.
      추론
      지식 가공
      온톨로지
      의미 검색
      텍스트 마이닝
      SNA
      시맨틱 검색
      자연어 처리
      28
    • 공공데이터의 개방 ??
      • 지금도 공공데이터는 개방되어 있다.
      HTML
      29
    • 공공데이터의 개방 ??
      • 지금도 공공데이터는 개방되어 있다.
      30
    • 데이터를 갖고 있는 곳들
      31
    • Linked Data로 연결하면??
      회사를 창업하고 싶은데…. 관련된 정보는???
      내게 혜택이 있는 복지 정책은???
      아이를 출산했는데.. 무엇을..??
      data.go.kr
      32
    • 다른 나라는 ? 미국의 data.gov
      □ data.gov의 목적
      • 미국 연방정부의 고부가가치 기계가독형데이터셋을 대국민을 위해 개방
      • 국민 스스로 창조적으로 이용하도록 함.
      □ data.gov를 활용하여 국민들은
      • RAW DATA를 보거나 다운로드
      • 위젯이나 다른 툴을 이용하여 특정 데이터를 가공, 융합한 챠트나 지도, 스냅샷을 만들 수도 있음
       
      □ data.gov의 Linked Data화
      • 구축된 data.gov 의 일부를 시맨틱 웹 표준 포맷인 RDF(Resource Description Framework)로 변환하여 Linked Data로 공개
      • Tim Berners-Lee와 함께 시맨틱 웹의 창시자인 Jim Hendler교수가 프로젝트 수행
      33
    • 미국의 data.gov
      34
    • 미국의 data.gov – Data Sets
      35
    • 미국의 data.gov – SPARQL Endpoint
      36
    • 또 다른 나라는 ? 영국의 data.gov.uk
      □ data.gov.uk의 목적
      o 정부의 투명성을 높이기 위해
      o 국민의 권리 향상(Citizen empowerment)
      o 데이터의 공개를 통한 경제적 사회적 가치 증대
      o 영국이 차세대 웹(web of data, 즉, Semantic Web)에서 세계적으로 앞서나가기 위해
      □ 비전
      o 정부가 수집한 데이터의 원스톱샵(one-stop-shop for data collected by the government)
      □ 시맨틱 웹 기술을 이용하여 링크를 통해 데이터를 융합하고 검색을 확장하도록 제공
      o data.gov.uk의 이용자들은 이용가능한 정보를 이용해 자신만의 매쉬업을 만들 수 있을 것으로 기대
      37
    • 영국의 data.gov.uk
      38
    • 영국의 data.gov.uk – SPARQL Endpoint
      <?xml version="1.0"?>
      <sparqlxmlns="http://www.w3.org/2005/sparql-results#">
      <head>
      <variable name="type"/>
      </head>
      <results>
      <result>
      <binding name="type">
      <uri>http://www.w3.org/2006/vcard/ns#VCard</uri>
      </binding>
      </result>
      <result>
      <binding name="type">
      <uri>http://www.w3.org/2006/vcard/ns#Address</uri>
      </binding>
      </result>
      <result>
      <binding name="type">
      <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_Other_Independent_School</uri>
      </binding>
      </result>
      <result>
      <binding name="type">
      <uri>http://education.data.gov.uk/def/school/School</uri>
      </binding>
      </result>
      <result>
      <binding name="type">
      <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_Voluntary_Aided_School</uri>
      </binding>
      </result>
      <result>
      <binding name="type">
      <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_Community_School</uri>
      </binding>
      </result>
      <result>
      <binding name="type">
      <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_Community_Special_School</uri>
      </binding>
      </result>
      <result>
      <binding name="type">
      <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_Foundation_School</uri>
      </binding>
      </result>
      <result>
      <binding name="type">
      <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_Voluntary_Controlled_School</uri>
      </binding>
      </result>
      <result>
      <binding name="type">
      <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_LA_Nursery_School</uri>
      </binding>
      </result>
      </results>
      </sparql>
      Analytics
      Education
      Environment
      Finance
      Transport
      Statutory Notices
      XML
      JSON
      39
    • 공공정보의 활용
      정보의
      효율적 활용
      • 다양한 디지털 환경에서, 다양한 서비스에 양질의 공공정보가 활용
      부처간 협력
      • 유관 부처와의 정보 연계에 따른 협력 체제 강화
      정보의
      재활용
      • 정보의 생산, 관리 비용 절감
      창의적인
      아이디어 발굴
      • 국민 스스로의 창의적인 아이디어 발굴 기회 부여
      40
    • 공공정보의 활용
      분석
      정보제공
      연계
      융복합
      다양한
      서비스
      민간

      공공
      다양한
      채널
      인터넷TV
      스마트폰
      인터넷
      협력체제
      강화및
      응용
      응용

      활용
      Linked Data
      민간
      포털및 대국민
      유관기관
      국해부, 행안부 등
      공개형 공공정보
      발행 및 제공
      Linkd Data Center
      서비스 기획 및 개발
      41
    • 공공정보를 개방하는 방법
      42
    • 공공정보에 Linked Data를 활용하면…
      단절된 국가 공공정보
      연결된 국가 공공정보
      부동산정보
      환경정보
      부동산정보
      환경정보
      문화재정보
      문화재정보
      교통정보
      XXX 정보
      교통정보
      XXX 정보
      공간정보
      공간정보
      일자리정보
      일자리정보
      여행정보
      토지정보
      여행정보
      토지정보
      문헌정보
      문헌정보
      상품정보
      상품정보
      민간 정보
      해외 정보
      포털 및 언론
      대학
      기타
      DBPedia
      BBC
      etc
      국가 공공정보
      XXX정보
      여행정보
      공간정보
      문헌정보
      환경정보
      43
    • 공공정보에 Linked Data가 필요한 이유
      • 공동 활용 및 자발적 참여를 통해 데이터가 선순환 될 수 있는 구조로
      • 정부가 공개한 공공정보를 활용해 누구나 창의적인 정보를 재생산, 재배포 할 수 있고, 관련 응용서비스를 발굴, 개발하여 서비스할 수 있게 지원할 수 있도록…
       다양한 환경(웹, 스마트폰, IPTV 등)에서의 다양한 서비스(정보제공, 분석, 통계, 추천, SNS 등) 발굴
      • 스마트폰이나 인터넷 TV, 차세대 웹환경의 전환에서 보듯, 양방향 정보 생산과 소비로 정보 유통 패러다임이 급속히 전환되는 추세
       OpenAPI는 단방향이며, 주도적인 제공
      • 국민 모두가 참여하여 데이터의 가치를 향상시키고, 창의적인 응용서비스를 발굴할 수 있도록 지원하는 데이터 유통 생태계
       HTTP, URI, RDF, SPARQL  dereferenceable URI , Linking
      • 구글이나 애플이 보유한 플랫폼이라는 것에 대해 배울점은??
       Linked Data는 데이터 유통 생태계를 조성하는 장을 위한 좋은 방법
      44
    • 공공정보에 Linked Data가 필요한 이유
      • 공공이나 민간에서 공개된 공공정보를 활용하여 창의적인 새로운 서비스를 발굴하여 활용할 수 있도록
      • 유관 부처 및 공공에서는 관련 정보를 활용하여 부처간 협력 체제 강화 및 업무 효율성 증진에 활용할 수 있음
      • 민간에서는 관련 정보를 응용하여 혁신적이며, 창의적인 서비스에 활용할 수 있음
      • 잠재적 정보 활용 대상의 서비스 요구 다양성에 즉각적으로 대응할 수 있는 생태계 조성이 필요
      45
    • Linked Data에 유용한 자원 발굴
      • 공공정보를 분석하여 Linked Data에 유용한 자원 도출
      • 대상 정보의 품질 및 업데이트 주기, 예측되는 응용서비스에서의 활용도 등을 체크
      • Linked Data로의 확보가 용이하며, Linked Data로 구축 시 활용도가 높은 대상을 도출
      • 정보 보유 기관과의 저작권 또는 공개 허용 범위 및 방법에 대한 협의
      • 모든 국민이 Linked Data 정책을 통해 공개된 데이터를 자유롭게 활용하는 것에 대한 저작권 및 정보 보유 기관의 정책에 대한 협의
      • 공개 정도에 대한 범위 확정 및 Linked Data 대상 자원으로써의 필요성 및 유용성 파악
      • Linked Data 유용성 및 기대되는 응용서비스, 기대효과 등의 도출
      • Linked Data를 확보하고 서비스함에 따라 예측 가능한 응용서비스 및 기대효과 도출
      • 예측 가능 정도에 따른 단계별 Linked Data 구축 방안 및 시스템 개발 방안 도출
      46
    • Linked Data를담을 그릇이 필요
      분석 및 설계
      설계 도구
      47
    • Linked Data 확보
      변환 규칙
      수집 규칙
      변환
      트리플(Linked Data) 변환
      (인스턴스 생성)
      트리플 저장소에 저장
      48
    • Linked Data 통합 운영

      스마트폰
      스마트TV
      공공시설
      Linked Data
      시각화 서비스
      탐색/브라우징 서비스
      Linked Data
      제공 서비스
      Linked Data
      운영/관리
      Linked Data
      제공 모듈
      (SPARQL Endpoint)
      외부 정보
      연계 모듈
      Linked Data
      연계 관리
      Linked Data
      변환기
      Linked Data
      저장소
      추론기
      모델 설계
      변환규칙 설계
      49
    • 앞에서 봤던 SPARQL Endpoint
      웹 브라우저
      어플리케이션
      HTML, RDF, XML,CSV, ..
      SPARQL
      HTML, RDF, XML, CSV, ..
      SPARQL
      RDF Triple
      SPARQL Endpoint
      Web Server / Servlet Container (java)
      트리플(Linked Data) 저장소
      50
    • SPARQL Endpoint 예시
      51
    • SPARQL Endpoint 결과 예시
      52
    • 외부 정보와의 연결 – Linking & Mashup
      Legacy Data
      OpenAPI(Data)
      OpenAPI(Service)
      Mashup
      Mashup
      Mashup
      Linking &
      Mashup
      RDF Triple
      외부정보 연계 모듈
      트리플(Linked Data) 저장소
      53
    • 시각화 서비스
      54
    • 탐색/브라우징 서비스
      55
    • 탐색/브라우징 서비스
      http://dbpedia.org/page/Namdaemun
      56
    • 결론
      플랫폼을 보유하면 승리한다. – 구글, 애플
      플랫폼은 생태계를 조성한다.
      플랫폼에서는 콘텐트와 서비스가 자발적으로 창조되고, 활용되고, 도태된다.
      Linked Data는 웹기반 데이터 유통 생태계를 조성하는 초석이다
      Linked Data를 통해 데이터는 활용되고, 풍부해지고, 유용해 진다.
      Linked Data, Linking을 통해 데이터들이 질적으로 풍부해지게 된다.
      57
    • 데이터 유통 생태계

      스마트폰
      스마트TV
      공공시설
      연구자
      개발자
      서비스(컨텐트) 기획자
      정책입안(결정)자
      CEO
      기관
      .
      .
      .
      .
      데이터를 자유롭게 활용할 수 있는 장(場)
      .
      .
      .
      .
      58
    • 데이터 유통 생태계
      + 재생산된 정보
      + 민간 정보, 해외 정보
      Linked Data 기반의 공공정보
      + 개별 공공정보
      Linked Data 기반의
      공공정보
      59
    • 데이터 유통 생태계
      포털
      포털
      SPARQL

      스마트폰
      스마트TV
      공공시설
      공간정보
      여행정보
      공개된 공공정보
      행안부
      복지부
      주소정보
      복지정보
      국해부
      환경부
      공간정보
      환경정보
      60
    • 끝…
      Gov2.0, 공공정보의 개방은
      사람이 브라우저를 통해 읽을 수 있는 수준이 아닌
      기계간, 기계와 사람간 협업을 위한 수준의 개방이었으면 좋겠습니다.
      Semantic Web (Linked Data)을 위한 Killer Application이 필요한 것이 아닙니다.
      Semantic Web (Linked Data)은 데이터 유통 생태계를 좀 더 SMART하게 하자는 것입니다.
      61
    • 감사합니다
      Q & A
      capsuleboy@topquadrant.co.kr
      linkeddata@linkeddata.kr
      @linked_data
      62