문화유산 정보와 시맨틱웹 응용

1,357 views

Published on

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,357
On SlideShare
0
From Embeds
0
Number of Embeds
7
Actions
Shares
0
Downloads
46
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

문화유산 정보와 시맨틱웹 응용

  1. 1. 오원석
  2. 2. 1 Linked Data 소개 2
  3. 3. The Web : The World’s Largest Information System 3
  4. 4. The Web : The World’s Largest Information System 4
  5. 5. Semantic Web & Linked Data 질의 5
  6. 6. Current Web – Document Web 인간이 이해할 수 있는(human-readable) 웹 • 문서(Document)로 이루어진 글로벌 네트워크 • HTML 문서가 기본 단위 • 인간 가독형 (human-readable) – Presentation • 문서간 단순 링크 (untyped links) YES ???단순 링크로, 연결은 되어 있지만 서로가어떤 내용을 포함하고 있는지는 모름 참고 : Chris Bizer / The Emerging Web of Linked Data 6
  7. 7. Data Web 기계가 이해하고 처리 할 수 있는(machine-readable) 웹• 데이터(Data)로 이루어진 글로벌 네트워크• RDF 데이터가 기본 단위• 기계 가독형 (machine-readable)• 데이터간 의미있는 링크 (typed links) YES YES개체(thing)들 간의 연결로 서로가 개체에대한 참조 속성으로 연결됨 참고 : Chris Bizer / The Emerging Web of Linked Data 7
  8. 8. Data Web  Semantic Web : Linked Data 미래의 웹  데이터 웹  Linked Data  Global Database 질의, 탐색, 활용  8
  9. 9. Linked Data 예시 [residences] Seoul HongGilDong http://dbpedia.org/ resource/Seoul [researches] [age] SemanticWeb[name] [sameAs]Hong, Gil 35 Dong http://dbpedia.org/ resource/Semantic_Web http://sws.geonames.org/1835848/ [hasPhotoCollection] [nearbyFeatures] http://www4.wiwiss.fu-berlin.de/flickrwrappr/ photos/Semantic_Web http://sws.geonames.org/1835848/nearby.rdf시맨틱웹은 단지 데이터를 웹으로 제공하는 것이 아니라, 데이터 간의 링크를 만듦으로써, 인간이나 기계 모두 데이터의 웹을 탐험할 수 있도록 해준다. Linked Data를 통해 유용한 데이터를 얻게 되면, 그 데이터에 관계된 데이터로 계속되는 항해가 가능하다. - Tim Berners-Lee, Linked Data, 2006, http://www.w3.org/DesignIssues/LinkedData.html 9
  10. 10. Linked Data 4 원칙1. Use URIs as names for things.2. Use HTTP URIs so that people can look up those names.3. When someone looks up a URI, provide useful information, using the standards. (RDF*, SPARQL)4. Include links to other URIs. so that they can discover more things. 10
  11. 11. Linked Data 4 원칙 – 제 1 원칙1. Use URIs as names for things. URI 11
  12. 12. Linked Data 4 원칙 – 제 2 원칙2. Use HTTP URIs so that people can look up those names. HTTP 12
  13. 13. Linked Data 4 원칙 – 제 3 원칙3. When someone looks up a URI, provide useful information, using the standards. (RDF*, SPARQL) RDF 13
  14. 14. Linked Data 4 원칙 – 제 3 원칙 (계속)3. When someone looks up a URI, provide useful information, using the standards. (RDF*, SPARQL) SPARQL 14
  15. 15. Linked Data 4 원칙 – 제 4 원칙4. Include links to other URIs. so that they can discover more things. interlinking 15
  16. 16. Linked Data 5 Starhttp://lab.linkeddata.deri.ie/2010/star-scheme-by-example/ 16
  17. 17. 현재의 웹• 지금도 많은 데이터들이 웹에 있습니다. HTML 17
  18. 18. 현재의 웹• 지금도 많은 데이터들이 웹에 있습니다. 18
  19. 19. 데이터를 갖고 있는 곳들 19
  20. 20. Linked Data로 연결하면?? data.go.kr 20
  21. 21. 데이터를 보는 관점 이 데이터는 이렇게 보면 이렇게 쓸 수도 있겠군.. 흑 ㅠㅠ 그런데 사용할 수가 없네?? 관점 관점 데이터 이 데이터는 주인 이렇게 쓸려고 관점 만들었어 이 2개의 데이터를 섞으 면 내가 원하는 결과를 관점 얻을 수 있는데… 우잉 !! 관점 관점 관점 데이터 이 데이터는 관점 주인 이렇게 쓸려고 만들었어 저 데이터가 있어야 내가 기획한 서비스가 동작하 는데.. 아쉽다..!!! 21
  22. 22. 데이터를 보는 관점 내 데이터랑 개방된 웹상의 저 데이터를 융합하면 좋은것 이 나오겠군…!! 내 데이터도 꺼내 놓으라고?? 그건 안돼 !! 왜냐고?? 음 !!! 품질도 안 좋고…데이터 비밀스러운 데이터이고… 주인 누가 볼까 걱정되고.. 우리 서버 느려질테고… 등등 이유는 백만가지도 넘어.. 난 그냥 누가 꺼내 놓으면 그걸 가져다가만 쓸꺼야…!!!
  23. 23. 데이터를 보는 관점 데이터 좀 쓰기 좋게 오픈해 주심 안돼요? 안됩니다. 비밀 데이터입니다. 홈페이지에 다 있던데요?? 그런데 HTML 포맷이라 쓰기가 불편해요.. 헉..그래요?? 음…그건 오픈하면 안되는거라 막아야 합니다..조치하겠습니다. 앗..우잉…그럼 그거라도 그냥 쓸께요…막지는 마세요..ㅠㅠ 데이터 주인
  24. 24. 2 Linked Data 현황 24
  25. 25. Vocabulary - SKOS• 시소러스, 택사노미, 분류체계와 주제명표목 같은 지식어휘체계를 웹에 표현하기 위한 RDF 용어집(vocabulary)• Enterprise 환경의 표준 용어 관리나, Linked Data 서비스에서 개체들을 표현하기 위한 용어들간의 관계 표현에 주로 활용• 미국 의회도서관의 LCSH 등과 함께 Linked Data를 위한 거의 모든 RDF에서 활용되고 있음• W3C는 Linked Data 데이터 셋에서 용어간의 관계 표현과 함께 기존의 택사노미, 시소러스, 분류체계 등을 Linked Data로 발행하고자 할 경우 SKOS를 사용할 것을 권고하고 있음 DBpedia에서의 SKOS 활용 예시 SKOS로 표현된 World Wide Web 25
  26. 26. Vocabulary - FOAF• 사람간의 관계 기술을 위한 RDF 기반의 명세 용어집(vocabulary)• RDF 구문을 기반으로 하고 있으며, 그룹(group)에 소속되어 있는 개인(person), 조직(organization)에 의해 생성된 문서 (document), 한 개인과 연결된 다른 개인의 연결 등의 처리에 활용• FOAF-a-matic 과 같은 간단한 어플리케이션을 통해 누구라도 손쉽게 자신의 FOAF를 만들 수 있음 FOAF를 이용한 Social Network의 통합 (Sheila Kinsella, Applications of Social Network Analysis 2007) 26
  27. 27. Vocabulary - SIOC• 시맨틱웹 기술을 이용하여 SNS 등의 커뮤니티를 연결하고자 하는 목적의 RDF 기반 용어집(vocabulary)• 2004년 DERI를 중심으로 시작된 온라인 커뮤니티를 의미적으로 연결하기 위한 시도 중 하나로, 커뮤니티 사이의 관계 를 표현하기 위해 RDF/RDFS를 이용하는 SIOC 온톨로지를 사용하며 FOAF, RSS 등을 이용해 확장 가능하도록 하고 있음 SIOC의 주요 클래스와 속성 27
  28. 28. Vocabulary - Dublin Core• 기본적인 메타데이터의 속성을 표현하기 위한 용어집• 동영상, 소리, 이미지, 텍스트, 웹 페이지 등의 디지털 매체들을 기술하는 데 널리 사용되며, XML과 RDF를 사용하여 구 현되어 있음• 데이터의 형식과 구조를 단순화하여 원문의 저자나 발행자가 메타데이터를 직접 작성하고, 이를 바탕으로 특정분야에 서 요구되는 수준으로 확장하여 사용할 수 있도록 하는 것이 Dublin Core의 목적 Drupal에서의 Dublin Core 예시 Dublin Core 메타데이터 요소 28
  29. 29. LOD Cloud 2011.09 2007.05 2008.09 2009.03 29
  30. 30. 미국 의회 도서관• 도서관 자료의 주제목록(subject cataloging)을 위한 Subject Headings를 Linked Data로 발행• MARC21(MARCXML)포맷으로 되어 있는 전거 데이터(authority record)를 RDF 포맷의 SKOS를 이용하여 RDF화• 전거 레코드의 각 항목(entry)을 skos:Concept의 인스턴스로 대응하고 LCCN(Library Congress Control Number)을 이 용하여 URI 부여 http://lcsubjects.org/subjects/sh95000541 LCSH에서 MARC와 SKOS의 매핑 관계 World Wide Web을 표현한 Linked Data 30
  31. 31. VIAF VIAF(Virtual International Authority File)• 목적 - 전거 데이터의 공유 증진 - 목록 비용 절감 - 국제적인 전거 통제• Linked Data의 활용 - 항목마다 URI를 부여하여 linked data로 이용 가능 - UNIMARC과 MARC21, RDF 지원 VIAF에서의 Steve Jobs http://viaf.org/viaf/84237107/#Jobs,_Steve,_1955-2011 VIAF에서 지원하는 동일 개체의 표현 방법 31
  32. 32. LIBRIS• 스웨덴 국립도서관으로 도서관 전체 데이터를 Linked Data로 구축한 최초의 종합목록(2008년)• 대학도서관 및 연구도서관, 박물관, 아카이브, 공공도서관 등 170여개 도서관 기관이 이용하는 종합목록시스템.• RDF파일 포맷을 제공하여 Linked Data를 구현.• ―아래는 Linked data : evolving the web into a global data space / Tom Heath, Christian Bizer‖ 예시 http://libris.kb.se/bib/12130810 http://libris.kb.se/data/bib/12130810 32
  33. 33. data.gov.uk• 영국 정부는 정책의 투명성을 높이고, 국민의 알 권리를 향상시키며, 공공정보의 재사용성 증진을 통해 경제적 사회적 가치 증대를 유발시키고자 공공 정보 개방• 차세대 웹(web of data, 즉, Semantic Web)기술에서 자국의 인지도를 상승시키고, 데이터를 보다 윤택하게 제공하기 위해 Linked Data 기술 적용 33
  34. 34. LinkedBrainz 34
  35. 35. BBC • BBC의 대표적 Linked Data 서비스인 BBC Music과 BBC Worldcup BBC Music BBC Worldcup 35
  36. 36. Linked Data 기술 : 기술 개념도 Mashup Browsing Search … 6. Linked Data 서비스 구현 1. 온톨로지 설계 4. 온톨로지(트리플) 관리 5. 추론 저장 온톨로지 개념 모델 변환 규칙 (온톨로지) 3. 온톨로지(트리플) 변환 ERP DW CRM … 2. 온톨로지(트리플) 변환 매핑 설계 36
  37. 37. Linked Data 솔루션 • 기존의 온톨로지 레파지토리 시스템 중심의 OpenLink 통합 솔루션 • 다양한 RDBMS, ODBMS, File Server의 데이터 뿐만 아니라 텍스트, XML, HTML 데이터를 하나 로 통합하는 미들웨어 • DBPedia, MusicBrainz, Bio2RDF 등의 Linked Data 프로젝트에 활용 • 현재 세계에서 가장 주목 받고 있는 Linked Data 솔루션 중의 하나 • 영국 Talis사의 통합 솔루션 • 영국의 data.gov.uk, ordnancesurvey와 BBC Music 서비스 구축에 도입 • 구조적, 비구조적 데이터의 RDF 변환 기능 제공 • SPARQL Endpoint 등의 Cloud 기반 Linked Data 호스팅 서비스 기능 제공 • 영국의 data.gov.uk 등과 함께 현재 세계에서 가 장 주목 받고 있는 Linked Data 솔루션 중의 하나 37
  38. 38. Linked Data 솔루션 • 독일 Ontotext사의 LDSR(Linked Data Semantic Repository) • LOD 데이터 셋 중 생명공학 분야데이터 셋 40억 개의 Linked Data 서비스를 제공하는 linkedlifedata 서비스 구축에 도입 • 오픈소스 Sesame 구조 위에 SAIL 추론 계층 등 을 두어 솔루션 제공 • 추론 지원정도나 대용량 지원 정도에 따라 OWLIM-Lite, OWLIM-SE, OWLIM-Enterprise로 구분 • D2R Server는 베를린 대학의 오픈소스 프로젝트 로 주로 Linked Data의 허브 역할을 하는 것으로 다양한 원천 데이터로 부터 트리플을 생성, 변환 해주는 기능 제공 – DBPedia, BBC Worldcup 등 에서 활용 • AllegroGraph는 미국 Franz사의 Linked Data 구 축을 지원하는 대용량 트리플 스토어 • OntoBase2.0은 한국 탑쿼드란트코리아의 Linked Data 서비스 구축에 최적화된 대용량 트 리플 스토어 38
  39. 39. 3 Linked Data for Cultural Heritage 39
  40. 40. thedatahub The Comprehensive Knowledge Archive Network 40
  41. 41. Why semantic web for Cultural Heritage• Many C.H. institutions have a data integration problem, since data about the same artifacts is scattered in separate silos: – cataloging data – acquisition data – conservation data – scientific data, … 41
  42. 42. Why semantic web for Cultural Heritage• Global 환경의 데이터 활용 – Giant Global Graph 42
  43. 43. Cultural Heritage Data Standards• Dublin Core (DC) – Simple resource descriptions: author, date created, etc – ISO 15836• Conceptual Reference Model (CRM) – 국제박물관협의회(ICOM-International Council of Museums)의 국제문서화위원회(CIDOC- International Committee on Documentation)가 이질적인 문화유산 정보의 통합, 교환, 연결 하 기 위해 만든 온톨로지 – ISO 21127 (2006) "Information and documentation — A reference ontology for the interchange of cultural heritage information"• Functional Requirements for Bibliographic Records (FRBR) – by International Federation of Library Associations and Institutions(IFLA) - 국제도서관협회연 맹 – Conceptual entity-relationship model• Europeana Data Model (EDM) – Structuring the data that Europeana is ingesting, managing and publishing – Refined until the end of 2010, will be implemented during 2011 – Open, cross-domain framework, adheres to Semantic Web modeling principles 43
  44. 44. MOLTO• Requirements: - the ability to handle generic knowledge, such as people, institutions, and locations - the ability to handle specific subject domains, such as the cultural heritage and museums• Ontology & Interlinking - DBpedia - the RDF-ized version of Wikipedia, describing more than 3.5 million things and covers 97 languages. - Geonames - a geographic database that covers 6 million of the most significant geographical features on Earth. - PROTON - an light weight upper-level ontology, 542 entity classes and 183 properties. PROTON is encoded in OWL Lite - CIDOC-CRM - Painting Ontology (Time Ontology, Mid-Level-Ontology SUMO) - Linkages to DBpedia• http://www.molto-project.eu 44
  45. 45. MOLTO – Museum Data Models “value” “value” “value” “value” “value” “value” mao:value mao:value mao:value mao:value mao:value mao:value mao:Quantity mao:Length mao:Bredth mao:Height mao:Diam mao:Weight (Antal) (Langd) (Bredd) (Hojd) (Diam) (Vikt) mao:hasLength mao:hasBredth mao:hasHeight mao:hasDiam mao:hasWeight (Langd) (Bredd) (Hojd) (Diam) (Vikt) mao:hasQuantity (Antal) crm:E54_Dimension crm:P91_has_unit crm:E58_Measurement_Unit mao:itemMeasurement MuseumObject - Foremalsnumber rdfs:label pext:author URI:http://molto.ontotext.com/GSM_Nr ptop:Person ptop:TimeInterval“firstname lastname” URI:http://molto.ontotext.com/GIM_Nr mao:fromPeriod crm:E21_Person crm:E52_Time-Span rdfs:label mao:relatedCategory “time” mao:fromCollection ptop:locatedIn rdf:type mao:hasMaterial ptop:Object “kontor” - “office” crm:E22_Man_Made-Object “livsmedelsindustri” - “food” ptop:Location “grafisk industri” - “graphics industry” crm:E53_Place rdfs:label crm:E57_Material “GSM”/”GIM” rdfs:label pext:hasAddress “painting” “portret” “material” “sculpture” pext:Address rdfs:label “address”출처 : A Framework for Improved Access to Museum Databases in the Semantic Web 45
  46. 46. MOLTO – Gothenburg City Museum Data• 8,900 museum objects in two museum collections - GSM(Gothenburg Stads Museum) and GIM(Gothenburg Industry Museum)• 39 properties describe each museum object MAO – Finland http://www.seco.tkk.fi/projects/finnonto/ 46
  47. 47. MOLTO• http://museum.ontotext.com 47
  48. 48. MOLTO 48
  49. 49. MOLTO 49
  50. 50. FactForge 50
  51. 51. FactForge PREFIX fb: <http://rdf.freebase.com/ns/> PREFIX ff: <http://factforge.net/> PREFIX dbpedia: <http://dbpedia.org/resource/> PREFIX umbel: <http://umbel.org/umbel#> PREFIX dbp-prop: <http://dbpedia.org/property/> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX umbel-sc: <http://umbel.org/umbel/sc/> PREFIX dbp-ont: <http://dbpedia.org/ontology/> SELECT DISTINCT ?painting_l ?owner_l ?city_fb_con ?city_db_loc ?city_db_cit WHERE { ?p fb:visual_art.artwork.artist dbpedia:Amedeo_Modigliani ; fb:visual_art.artwork.owners [ fb:visual_art.artwork_owner_relationship.owner ?ow ] ; ff:preferredLabel ?painting_l. ?ow ff:preferredLabel ?owner_l . OPTIONAL { ?ow fb:location.location.containedby [ ff:preferredLabel ?city_fb_con ] } . OPTIONAL { ?ow dbp-prop:location ?loc. ?loc rdf:type umbel-sc:City ; ff:preferredLabel ?city_db_loc } OPTIONAL { ?ow dbp-ont:city [ ff:preferredLabel ?city_db_cit ] } } 51
  52. 52. FactForge 52
  53. 53. Europeana• http://europeana.eu• Pan-European Digital Museum• People can explore the digital resources of Europes museums, libraries, archives, audio-visual collections • And be inspired by the rich diversity of Europes cultural and scientific heritage• Promotes discovery and networking opportunities in a multilingual space• Around 1500 institutions contributed – Includes over 15 M items 53
  54. 54. Europeana and Semantic Web• Europeana adopts semantic web for all future development – EDM is based on semweb, which makes it easily extensible – Current holdings will be converted to semweb format• Europeanas first White Paper Knowledge = Information in Context looks at the key role LOD will play in Europeanas development – "Linked data gives machines the ability to make associations and put search terms into context. Without linked data, Europeana could be seen as a simple collection of digital objects. With linked data, the potential is far greater"• LOD Experiment in Europeana Thought Lab: – Data and metadata from the Amsterdam Museum (AM) • 70k cultural heritage objects related to the city – Retrieved from an XML API of the museums collection (database by AdLib UK) – Converted to LOD compliant with EDM by Vrije Universiteit (VU): 5M facts • Conversion software is available as open source – Linked to existing datasets • Dutch Art and Architecture Thesaurus (AATNed) • Gettys Union List of Artists Names (ULAN) • DBpedia (data version of Wikipedia) • GeoNames (structured geographical data) – Published to the Comprehensive Knowledge Archives Network (CKAN) – Prime example the type of LOD that Europeana will be producing 54
  55. 55. Europeana – Technical Architecture The Europeana Semantic elements The Europeana Data Models 55
  56. 56. Europeana – Linked Data 56
  57. 57. Europeana – Linked Datahttp://data.europeana.eu/item/92056/BD9D5C6C6B02248F187238E9D7CC09EAF17BEA59 57
  58. 58. Amsterdam Museum object 1 2 3• http://semanticweb.cs.vu.nl/europeana/browse/list_resource?r=http://purl.org/collections/nl/am/proxy-23182 58
  59. 59. Amsterdam Museum object 13 2 59
  60. 60. Linked Heritage• Coordination of Standards and Technologies for the enrichment of Europeana - www.linkedheritage.org - Linked Heritage is a 30 month EU project, started on 1st April 2011• 38 partners from 24 countries and 4 external contributors• Contribution of content Europeana: 3 millions objects• 5 key areas of development and innovation: - Linked Data - Persistent identifiers - Metadata and standards - Cooperation with the private sector - Multilingual and cross-domain combination of terminologies 60

×