LOD (linked open data) part 2 lod 구축과 현황

19,059 views

Published on

LOD , Linked Open Data 에 대해 구축 절차 및 도구, 사례에 대한 자료 입니다. LOD는 공공 데이터를 제공, 공유, 재활용하기 위한 또 하나의 방법이며 오픈 데이터(Open Data) 를 위한 하나의 방법으로 웹을 기반으로 데이터를 공유하여 재활용하고자 방법이며 기술이고 데이터입니다.

Published in: Technology

LOD (linked open data) part 2 lod 구축과 현황

  1. 1. LOD 구축과 현황 주식회사 리스트 대표이사 오원석 LOD(Linked Open Data) Part 2
  2. 2. 1 목차 1. LOD 구축 2. Linked Data 4 Principles & 5 Star 3. 관련도구 4. LOD 사례
  3. 3. 2 1. LOD 구축 1. LOD 구축 2. Linked Data 4 Principles & 5 Star 3. 관련도구 4. LOD 사례
  4. 4. 3 General Architecture Member Paper Patent 2. 온톨로지(트리플) 변홖 매핑 설계 1. 온톨로지 설계 온톨로지 변홖 규칙 개념 모델 (온톨로지) 3. 온톨로지(트리플) 변홖 4. 온톨로지(트리플) 저장 6. Linked Data 서비스 구현 Mashup Browsing Search … 관리 5. 추롞 …
  5. 5. 4 How to LOD Publish : Modeling DB (ERD) Modeling Ontology Model
  6. 6. 5 How to LOD Publish : DB2RDF : Triple Converting DB2RDF 변홖 규칙 수집 규칙 트리플(Linked Data) 변홖 (인스턴스 생성) 트리플 저장소에 저장
  7. 7. 6 LOD Service & Publishing Architecture Converting Layer (OntoTrans2.0) DB Collecter RDB to RDF Mapper Triple Generater RDF Layer Triple Store DB W3C Semantic Web Standards & SKOS, FOAF, FRBR, … Servlet Container (Tomcat) Pubby A Linked Data Frontend for SPARQL Endpoints Client API for Triple Store Application Layer (Linked Data Service) HTML Browsing RDF Browsing SPARQL Endpoint Visualization REST API Searching HTTP
  8. 8. 7 SPARQL Endpoint SPARQL Endpoint RDF Triple 트리플(Linked Data) 저장소 어플리케이션 웹 브라우저 HTML, RDF, XML, CSV, .. SPARQL HTML, RDF, XML,CSV, .. Web Server / Servlet Container SPARQL
  9. 9. 8 SPARQL Endpoint for Human & for Machine html rdf json 4월에 꽃이 피는 식물은?
  10. 10. 9 SPARQL Endpoint for Human & for Machine html rdf json 사이트 이용자 개발자
  11. 11. 10 Publishing
  12. 12. 11 OpenAPI의 활용 질의 구성 SPARQL Endpoint OpenAPI 생성
  13. 13. 12 Content Negotiation http://wildlife.linkeddata.kr/resource/Aegypius_monachus http://wildlife.linkeddata.kr/page/Aegypius_monachus http://wildlife.linkeddata.kr/data/Aegypius_monachus
  14. 14. 13 LOD Architecture RDF Store (Triple Store) RDF Converting (DB2RDF) RAW DATA (원시 메타데이터) LOD Publishing Environment Search Engine HTML Browser Linked Data Clients ADM Model Triple Interlinking Triple HTML RDF Managing Indexing Collecting Converting
  15. 15. 14 2. Linked Data 4 Principles & 5 Star 1. LOD 구축 2. Linked Data 4 Principles & 5 Star 3. 관련도구 4. LOD 사례
  16. 16. 15 Linked Data 5 Star http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/
  17. 17. 16 Linked Data 4 Principles 1. Use URIs as names for things 2. Use HTTP URIs so that people can look up those names 3. When someone looks up a URI, provide useful RDF Information 4. Include RDF statements that link to other URIs so that they can discover related things HTTP URI RDF Tim Berners-Lee 2007 http://www.w3.org/DesignIssues/LinkedData.html
  18. 18. 17 Linked Data 4 Principles : Example
  19. 19. 18 Linked Data 4 Principles : 1 1. Use URIs as names for things http://lod.nl.go.kr/resource/KMO200937463 http://lod.nl.go.kr/resource/KMO200937463 http://lod.nl.go.kr/resource/KMO200937463
  20. 20. 19 Linked Data 4 Principles : 2 2. Use HTTP URIs so that people can look up those names http://lod.nl.go.kr/resource/KMO200937463 http://lod.nl.go.kr/resource/KMO200937463
  21. 21. 20 Linked Data 4 Principles : 3 3. When someone looks up a URI, provide useful RDF Information http://lod.nl.go.kr/resource/KMO200937463
  22. 22. 21 Linked Data 4 Principles : 4 4. Include RDF statements that link to other URIs so that they can discover related things http://lod.nl.go.kr/resource/KMO200937463
  23. 23. 22 URI, RDF, SPARQL, HTTP 로 식별하고, Linking 하고, 로 표현하고, 로 질의하고, 로 유통하고,
  24. 24. 23 Example HongGilDong Hong, Gil Dong 35 Seoul SemanticWeb [hasPhotoCollection] http://dbpedia.org/ resource/Semantic_Web http://www4.wiwiss.fu-berlin.de/flickrwrappr/ photos/Semantic_Web [sameAs] http://dbpedia.org/ resource/Seoul http://sws.geonames.org/1835848/ http://sws.geonames.org/1835848/nearby.rdf [nearbyFeatures] [residences] [researches] [name] [age] [sameAs] [sameAs]
  25. 25. 24 3. 관련 도구 1. LOD 구축 2. Linked Data 4 Principles & 5 Star 3. 관련도구 4. LOD 사례
  26. 26. 25 온톨로지 설계 도구
  27. 27. 26 Total Solution • 기존의 온톨로지 레파지토리 시스템 중심의 OpenLink 통합 솔루션 • 다양핚 RDBMS, ODBMS, File Server의 데이터 뿐만 아니 라 텍스트, XML, HTML 데이터를 하나로 통합하는 미들웨 어 • DBPedia, MusicBrainz, Bio2RDF 등의 Linked Data 프로 젝트에 홗용 • 현재 세계에서 가장 주목 받고 있는 Linked Data 솔루션 중 의 하나 • 영국 Talis사의 통합 솔루션 • 영국의 data.gov.uk, ordnancesurvey와 BBC Music 서비 스 구축에 도입 • 구조적, 비구조적 데이터의 RDF 변홖 기능 제공 • SPARQL Endpoint 등의 Cloud 기반 Linked Data 호스팅 서비스 기능 제공 • 영국의 data.gov.uk 등과 함께 현재 세계에서 가장 주목 받 고 있는 Linked Data 솔루션 중의 하나
  28. 28. 27 Total Solution • 독일 Ontotext사의 LDSR(Linked Data Semantic Repository) • LOD 데이터 셋 중 생명공학 분야데이터 셋 40억개의 Linked Data 서비스를 제공하는 linkedlifedata 서비스 구 축에 도입 • 오픈소스 Sesame 구조 위에 SAIL 추롞 계층 등을 두어 솔루 션 제공 • 추롞 지원정도나 대용량 지원 정도에 따라 OWLIM-Lite, OWLIM-SE, OWLIM-Enterprise로 구분 • D2R Server는 베를린 대학의 오픈소스 프로젝트로 주로 Linked Data의 허브 역핛을 하는 것으로 다양핚 원천 데이 터로 부터 트리플을 생성, 변홖해주는 기능 제공 – DBPedia, BBC Worldcup 등에서 홗용 • AllegroGraph는 미국 Franz사의 Linked Data 구축을 지 원하는 대용량 트리플 스토어 • OntoBase2.0은 주식회사 리스트의 Linked Data 서비스 구 축에 최적화된 대용량 트리플 스토어
  29. 29. 28 Vocabulary : SKOS •시소러스, 택사노미, 분류체계와 주제명 같은 지식어휘체계를 웹에 표현하기 위핚 RDF 용어집(vocabulary) •Enterprise 홖경의 표준 용어 관리나, Linked Data 서비스에서 개체들을 표현하기 위핚 용어들간의 관계 표현에 주로 홗용 •미국 의회도서관의 LCSH 등과 함께 Linked Data를 위핚 거의 모든 RDF에서 홗용되고 있음 •W3C는 Linked Data 데이터 셋에서 용어간의 관계 표현과 함께 기존의 택사노미, 시소러스, 분류체계 등을 Linked Data로 발행하고자 핛 경우 SKOS를 사용핛 것을 권고하고 있음 SKOS로 표현된 World Wide Web DBpedia에서의 SKOS 홗용 예시
  30. 30. 29 Vocabulary : FOAF •사람간의 관계 기술을 위핚 RDF 기반의 명세 용어집(vocabulary) •RDF 구문을 기반으로 하고 있으며, 그룹(group)에 소속되어 있는 개인(person), 조직(organization)에 의해 생성된 문서 (document), 핚 개인과 연결된 다른 개인의 연결 등의 처리에 홗용 •FOAF-a-matic 과 같은 간단핚 어플리케이션을 통해 누구라도 손쉽게 자싞의 FOAF를 만들 수 있음 FOAF를 이용핚 Social Network의 통합 (Sheila Kinsella, Applications of Social Network Analysis 2007)
  31. 31. 30 Vocabulary : Dublin Core •기본적인 메타데이터의 속성을 표현하기 위핚 용어집 •동영상, 소리, 이미지, 텍스트, 웹 페이지 등의 디지털 매체들을 기술하는 데 널리 사용되며, XML과 RDF를 사용하여 구현되 어 있음 •데이터의 형식과 구조를 단순화하여 원문의 저자나 발행자가 메타데이터를 직접 작성하고, 이를 바탕으로 특정분야에서 요구 되는 수준으로 확장하여 사용핛 수 있도록 하는 것이 Dublin Core의 목적 Drupal에서의 Dublin Core 예시 Dublin Core 메타데이터 요소
  32. 32. 31 4. LOD 사례 1. LOD 구축 2. Linked Data 4 Principles & 5 Star 3. 관련도구 4. LOD 사례
  33. 33. 32 LOD Cloud Media User Generated Content Publications Government Geographic Cross-Domain Life Sciences http://www.slideshare.net/lysander07/13-semantic-web-technologies-linked-data-semantic-search
  34. 34. 33 LOD 통계 Domain Number of datasets Triples % (Out-)Links % Media 25 1,841,852,061 5.82 % 50,440,705 10.01 % Geographic 31 6,145,532,484 19.43 % 35,812,328 7.11 % Government 49 13,315,009,400 42.09 % 19,343,519 3.84 % Publications 87 2,950,720,693 9.33 % 139,925,218 27.76 % Cross-domain 41 4,184,635,715 13.23 % 63,183,065 12.54 % Life sciences 41 3,036,336,004 9.60 % 191,844,090 38.06 % User-generated content 20 134,127,413 0.42 % 3,449,143 0.68 % 295 31,634,213,770 503,998,829 http://lod-cloud.net/state/
  35. 35. 34 http://data.gov.uk/linked-data Using SPARQL Endpoints provided by TSO
  36. 36. 35 http://data.gov.uk/linked-data
  37. 37. 36 http://data.gov.uk/linked-data $stop <http://transport.data.gov.uk/id/stop-point/2800S40063G>
  38. 38. 37 http://data.gov.uk/linked-data http://transport.data.gov.uk/id/stop-point/2800S40063G
  39. 39. 38 http://data.gov.uk/linked-data http://transport.data.gov.uk/id/stop-point/2800S40063G
  40. 40. 39 MusicBrainz  LinkedBrainz
  41. 41. 40 iMDB  LinkedMovie http://moviedata.kr 구조 모델 설계 (온톨로지)
  42. 42. 41 BBC Music
  43. 43. 42 BBC Music
  44. 44. 43 BBC Music Artist profile - data from MusicBrainz Artist profile - biography extract from Wikipedia Artist profile - content from the BBC Artist profile - bbc.co.uk/music/artists/:guid
  45. 45. 44 BBC Programmes
  46. 46. 45 WorldCat
  47. 47. 46 WorldCat
  48. 48. 47 VIAF • 목적 – 젂거 데이터의 공유 증짂 – 목록 비용 젃감 – 국제적인 젂거 통제 • 주요 기관 – OCLC – host – Library of Congress(LC) – Deutsche Nationalbibliothek (DNB) – Bibliothèque nationale de France (BnF)
  49. 49. 48 VIAF : 이외수 http://viaf.org/viaf/28620430/
  50. 50. 49 VIAF : 이외수 http://viaf.org/viaf/28620430/viaf.xml
  51. 51. 50 DBpedia • a project aiming to extract structured content from the information created as part of the Wikipedia project • as of September 2011, more than 3.64 million things, more than 6.5 million interlinks, and over 1 billion pieces of information (RDF triples)
  52. 52. 51 Freebase • a large collaborative knowledge base consisting of metadata composed mainly by its community members • as of May 2012, approximately 22 million topics
  53. 53. 52 GeoNames • a geographical database available and accessible through various web services, under a Creative Commons attribution license • over 10,000,000 geographical names corresponding to over 7,500,000 unique features
  54. 54. 53 Life Science : LinkedLifeData • Linked Life Data Platform • 다양핚 이형의 데이터셋을 통합하기 위핚 데이터 통합 플랫폼 • 의학, 생명공학 분야의 데이터베이스를 RDF화 • 다양핚 데이터셋 간의 의미적 연계(semantically linking) • HTTP 프로토콜을 통해 데이터를 접근핛 수 있도록 공개 • 목적 - 서로 다른 이형의 데이터의 정보들을 서로 연결(interlinking)함으로써 시맨틱 웹 기술의 잠재적 능력을 보여주고 - 연구하고자 하는 과학적 문제를 해결하기 위핚 젂체적인 view를 제공
  55. 55. 54 Life Science : Bio2RDF • Biological knowledge discovery를 위핚 데이터 통합 플랫폼 • silos핚 Biological 데이터를 linked data로 구축하여 서비스
  56. 56. 55 IBM Watson : Deep QA YAGO knowledge back-ends question classification & decomposition D. Ferrucci et al.: Building Watson: An Overview of the DeepQA Project. AI Magazine, Fall 2010.
  57. 57. 56 Google – Knowledge Graph
  58. 58. 57 국내 : 생물정보 LOD http://wildlife.linkeddata.kr/  http://lod.nature.go.kr 로 변경 중
  59. 59. 58 국내 : 한국사 LOD http://lod.koreahistory.or.kr
  60. 60. 59 국내 : 국가 서지 LOD http://lod.nl.go.kr
  61. 61. 60 국내 : 국가 서지 LOD
  62. 62. 61 국내 : 국가 서지 LOD
  63. 63. 62 국내 : KDATA (공공데이터를 활용한 LOD) http://kdata.kr
  64. 64. 63 주소데이터 : http://jusodata.kr http://jusodata.kr 안전행정부의 도로명 새주소를 LOD 형식으로 제공하는 서비스 새주소, 구주소(지번) 변환 제공 좌표 정보 제공 Linked Open Data 형식의 발행 및 서비스
  65. 65. 감사합니다. 주식회사 리스트 대표이사 : http://li-st.com 대한민국 대표 LOD KDATA Founder : http://kdata.kr 새주소 기반 Linked Open Data-주소데이터 Founder : http://jusodata.kr codalida@gmail.com , ceo@li-st.com

×