SIG-SWO 鯖江 2012年10月5日Linked Dataにおける識別子とスキー              マ           武田英明       国立情報学研究所        takeda@nii.ac.jp          ...
どのようにしてコンピュータにデータを入れる?• データをどのように記述するか? – 個別のデータの記述の仕方  • スキーマ/クラス/概念 (Schema/Class/Concept) – データ記述間の関係  • オントロジー/タキソノミー/...
Architecture for the Semantic Web   クラスの世界(Ontologies)   インスタンスの世界    (Linked Data)        Tim Berners-Lee http://www.w3...
Layers of Semantic Web• Ontology   – クラスの記述   – RDFS, OWL   – ontology buildingの課題       • Ontology buildingはそもそも難しい      ...
Layers of Semantic Web• Linked Data   – 個物の記述   – RDF + (RDFS, OWL)   – いい点       • 書きやすい(事実の記述)       • リンクしやすい (事実間の関係) ...
エンティティの識別子の重要性• 全てのモノは識別可能でないといけない• 人間は曖昧な識別子あるいは文脈があれ  ば識別子なしでも識別可能• Webにおけては、文脈はないか使えない。• なので、全てのモノに識別子を与えない  といけない     ...
識別子のシステム• 能力は人間の情報処理の基本能力 – 名付け:  • 人の名前、ペットの名前、いろいろなものの名前  • 数が多くなければOK – システマティックな識別子の必要  • 大量のモノがあるとき    – 電話番号、郵便番号、パス...
Webにおける識別子システム• これまでの識別子システムの大きな差はない• 違い – システムを超えた利用 – 真に電子化• Webにおける識別子システムへの要求仕様 – 識別子は安定していて持続可能 (モノがなくなっ   ても) – システム...
LODにおける解決法• Webにおける識別子システムへの要求仕様 – 識別子は安定していて持続可能  • 個別の発行者に依存 – システムを超えて唯一性の保証  • URI – 識別子に関する記述が手に入ること  • 参照解決可能なURI – ...
いつかの例ISBN(International Standard Book Number) • 概要   – 商用の書籍への唯一性のある番号付与   – 13 数字      • Prefix: 978 or 979 (EAN codeとの互換...
いくつかの例       DOI (Digital Object Identifier)• 概要  – 科学に関わるデジタルオブジェクトへの識別子(多くは論文)  – An unfixed string: “prefix/suffix”    ...
いくつかの例          Dbpedia (識別子として)• 概要  – A wikipedia page  – wikipedia pageの名前が識別子      • 手動で管理           – Disambiguation ...
識別子間の関係• 複数の識別子システムの共存    – カバー範囲の違い    – 観点の違い   一つのモノが複数の識別子をもちうる   異なる識別子システムの識別子間のマッピングが必    要   方法:特殊なプロパティ      ...
LOD Cloud(Linking Open Data)         Hideaki Takeda / National Institute of Informatics
識別子のまとめ• 識別子はLODのコア – データの手に入りやすさ Data availability – データの一貫性 Data inconsistency – データの相互運用性 Data interoperability• よい識別子シ...
情報を構造化する• 多様な情報構造化のレベル – キーワード、タグ Keywords, tags    • 特徴を示すような自由に選んだ語、語句 – 統制語彙 Controlled vocabulary    • 語、規定された語句の集合   ...
図書館学での例• 図書館コミュニティは先駆者• 分類 Classification – Universal Decimal Classification (UDC)• 統制語彙         Controlled Vocabulary – 人...
Hideaki Takeda / National Institute of Informatics
Hideaki Takeda / National Institute of Informatics
UDC ELEMENT              DEFINITION                                      UDC as Linked Data                               ...
http://id.loc.gov/authorities/names/n79084664.html   <http://id.loc.gov/authorities/names/n79084664>                      ...
http://id.loc.gov/authorities/subjects/sh85008180.html                                                         Hideaki Tak...
http://data.bnf.fr/11932084/intelligence_artificielle/                                            Hideaki Takeda / Nationa...
例:生物種とタクソン• 概要 – 生物種とタクソンの名前 (kingdom, divison, class, order, family, tribe,   genus) – 文字列     • 種は二名法     • 領域毎の学界がタクソン名...
植物            藻類              菌類             動物             分類群 Taxon                                Plants         Algae ...
情報構造化まとめ• Keywords, tags/Controlled vocabulary  /Classification/Taxonomy /Thesaurus/Ontology  – 差異は明確でないし、また重要でない  – より構造化...
LODのためのスキーマ・語彙• クラス/概念の記述 – オントロジーにおける概念定義 – 関係データベースのテーブルのスキーマ – オブジェクト指向プログラミングにおけるオブジェ   クト定義• セマンティックWebでのクラス定義 – RDFS...
LODのためのスキーマ・語彙• スキーマ共有の重要性 – 相互運用性 – 汎用アプリケーション• よく使われるスキーマ – Dublin Core – FOAF (Friend-Of-A-Friend) – SKOS (Simple Knowl...
Usage of Common Vocabularies        Prefix                      Namespace                                    Used bydc    ...
(Simple) Dublin Core• 図書館コミュニティから                             • 15 elements• DCMI (Dublin Core Metadata                   ...
dc terms    • Qualified Dublin Core             – 定義域と値域             – より精緻な語彙                • simple dcの拡張Properties    ...
Dcterms           subPropertyOf                 Domain            Range                      Dcterms               subProp...
The Friend of a Friend (FOAF)    • 人と人の関係のメタデータ    • 自主的なプロジェクトClasses: | Agent | Document | Group | Image | LabelProperty...
SKOS (Simple Knowledge Organization              System)• タキソノミーに関するメタデータ  – 概念の階層的構造    • 件名標目のようなタキソノミーにために設計    • 上位下位関...
SKOS (Simple Knowledge Organization              System)• SKOS Core (hierarchical concept structure)  – skos:semanticRelat...
SKOS (Simple Knowledge Organization              System)• SKOS Mapping  – skos:mappingRelation  – skos:closeMatch         ...
Linked Open Vocabulary (LOV)• 語彙流通のためのプラットフォーム  – スキーマの登録  – スキーマの検索• http://labs.mondeca.com/dataset/lov/• MetaBridge (日本...
XHideaki Takeda / National Institute of Informatics
More Info.• http://www.w3.org/2005/Incubator/lld/wiki/V  ocabulary_and_Dataset                       Hideaki Takeda / Nati...
スキーマ・語彙のまとめ• いくつかの有名なスキーマ – DC, DC terms, FOAF, SKOS …• もっと多い専門的スキーマ – CIDOC CRM – PRISM –…• 再利用を強く推奨 – LOV               ...
まとめ• 3つの層 – オントロジー/シソーラス/タキソノミー   (Ontology/Thesaurus/Taxonomy) – スキーマ (Schema) – 識別子 (Identification)• トップダウンではない、むしろ今はボト...
Upcoming SlideShare
Loading in...5
×

識別子とスキーマ

1,837
-1

Published on

SIG-SWO (セマンティックWebとオントロジー研究会) 2012年10月5日発表

Published in: Technology
0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,837
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
12
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide

識別子とスキーマ

  1. 1. SIG-SWO 鯖江 2012年10月5日Linked Dataにおける識別子とスキー マ 武田英明 国立情報学研究所 takeda@nii.ac.jp Hideaki Takeda / National Institute of Informatics
  2. 2. どのようにしてコンピュータにデータを入れる?• データをどのように記述するか? – 個別のデータの記述の仕方 • スキーマ/クラス/概念 (Schema/Class/Concept) – データ記述間の関係 • オントロジー/タキソノミー/シソーラス (Ontology/Taxonomy/Thesaurus)• 個々のデータをどう参照するか? – 個別データの識別の仕方 • 識別子(Identifier) – 識別子同士の関係 Hideaki Takeda / National Institute of Informatics
  3. 3. Architecture for the Semantic Web クラスの世界(Ontologies) インスタンスの世界 (Linked Data) Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/ Hideaki Takeda / National Institute of Informatics
  4. 4. Layers of Semantic Web• Ontology – クラスの記述 – RDFS, OWL – ontology buildingの課題 • Ontology buildingはそもそも難しい – 整合性、一貫性、論理性 • オントロジー間の関係はもっと難しい Descriptions on classes Ontology インスタンスに関する記述 Linked Data Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/ Hideaki Takeda / National Institute of Informatics
  5. 5. Layers of Semantic Web• Linked Data – 個物の記述 – RDF + (RDFS, OWL) – いい点 • 書きやすい(事実の記述) • リンクしやすい (事実間の関係) – よくない点 • 複雑な構造は書きづらい • それでもクラス記述は必要 (-> ontology) Descriptions on classes Ontology Description on instances Linked Data Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/ Hideaki Takeda / National Institute of Informatics
  6. 6. エンティティの識別子の重要性• 全てのモノは識別可能でないといけない• 人間は曖昧な識別子あるいは文脈があれ ば識別子なしでも識別可能• Webにおけては、文脈はないか使えない。• なので、全てのモノに識別子を与えない といけない Hideaki Takeda / National Institute of Informatics
  7. 7. 識別子のシステム• 能力は人間の情報処理の基本能力 – 名付け: • 人の名前、ペットの名前、いろいろなものの名前 • 数が多くなければOK – システマティックな識別子の必要 • 大量のモノがあるとき – 電話番号、郵便番号、パスポート番号、製造番号、ISBN• システマティックな識別子への要求仕様 – 識別子は安定していて持続可能 – 唯一性の保証 – 識別子発行者が信頼でき持続可能 Hideaki Takeda / National Institute of Informatics
  8. 8. Webにおける識別子システム• これまでの識別子システムの大きな差はない• 違い – システムを超えた利用 – 真に電子化• Webにおける識別子システムへの要求仕様 – 識別子は安定していて持続可能 (モノがなくなっ ても) – システムを超えて唯一性の保証 – 識別子に関する記述が手に入ること • モノ経由では手に入らない! – 識別子発行者が信頼でき持続可能 Hideaki Takeda / National Institute of Informatics
  9. 9. LODにおける解決法• Webにおける識別子システムへの要求仕様 – 識別子は安定していて持続可能 • 個別の発行者に依存 – システムを超えて唯一性の保証 • URI – 識別子に関する記述が手に入ること • 参照解決可能なURI – 識別子発行者が信頼でき持続可能 • Webがある限り Hideaki Takeda / National Institute of Informatics
  10. 10. いつかの例ISBN(International Standard Book Number) • 概要 – 商用の書籍への唯一性のある番号付与 – 13 数字 • Prefix: 978 or 979 (EAN codeとの互換性のため) • Group(言語・国別グループ): 1から5文字 • Publisher code: • Item number: • Check num: 1文字 – 管理方法: 2層構造 • National ISBN Agency – Publisher • 要求仕様との整合性 – 1. (安定したID) たぶん – 2. (唯一ID) あり、しかしURIではない – 3. (参照解決可能) ない(amazonが代わり?) – 4. (信頼できる発行者) あり Hideaki Takeda / National Institute of Informatics
  11. 11. いくつかの例 DOI (Digital Object Identifier)• 概要 – 科学に関わるデジタルオブジェクトへの識別子(多くは論文) – An unfixed string: “prefix/suffix” • Prefix: 出版社に割り当て • Suffix: デジタルオブジェクトに割り当て – 管理: 3層構造 • IDF (International DOI Foundation) – Registration Agency – 出版社• 要求仕様との整合性 – 1. (安定したID) OK – 2. (唯一ID) あり、URI – 3. (参照解決可能) オブジェクトページへの誘導(しかしメタデータではな い) – 4. (信頼できる発行者)OK Hideaki Takeda / National Institute of Informatics
  12. 12. いくつかの例 Dbpedia (識別子として)• 概要 – A wikipedia page – wikipedia pageの名前が識別子 • 手動で管理 – Disambiguation page – Redirect page• 要求仕様との整合性 – 1. (安定したID) たぶん(でも消滅、名前変更、内容変更もあり) – 2. (唯一ID) あり、URI – 3. (参照解決可能) メタデータ(RDF) – 4. (信頼できる発行者)たぶん Hideaki Takeda / National Institute of Informatics
  13. 13. 識別子間の関係• 複数の識別子システムの共存 – カバー範囲の違い – 観点の違い 一つのモノが複数の識別子をもちうる 異なる識別子システムの識別子間のマッピングが必 要 方法:特殊なプロパティ  owl:sameAs, (rdfs:seeAlso, skos:exactMatch)  http://sameas.org 問題  どうやって関係を発見するか  owl:sameAsによる論理的不整合  メンテナンス Hideaki Takeda / National Institute of Informatics
  14. 14. LOD Cloud(Linking Open Data) Hideaki Takeda / National Institute of Informatics
  15. 15. 識別子のまとめ• 識別子はLODのコア – データの手に入りやすさ Data availability – データの一貫性 Data inconsistency – データの相互運用性 Data interoperability• よい識別子システムを構築することは信 頼でき持続可能なLODをつくることにつな がる Hideaki Takeda / National Institute of Informatics
  16. 16. 情報を構造化する• 多様な情報構造化のレベル – キーワード、タグ Keywords, tags • 特徴を示すような自由に選んだ語、語句 – 統制語彙 Controlled vocabulary • 語、規定された語句の集合 • 例:国名リスト、名称典拠 – 分類 Classification • エンティティを分類するシステム。多くは階層的。分類は意味を持たない ことも – タキソノミー Taxonomy • 分類のための階層的用語の体系。上位下位は通常は一般特殊関係 • 例:議会図書館件名標目 – シソーラスThesaurus • 意味の体系。タキソノミーより多くの関係: (hypersym, hyposym), synonym, antonym, homonym, holonym, meronym – オントロジー Ontology • 概念の体系。語句ではなくて概念が要素。もっと多くの関係。概念の定義 Hideaki Takeda / National Institute of Informatics
  17. 17. 図書館学での例• 図書館コミュニティは先駆者• 分類 Classification – Universal Decimal Classification (UDC)• 統制語彙 Controlled Vocabulary – 人名、組織、場所に関する典拠authority • Library of Congress : 8百万, MADS &SKOS • British Library: 2.6 百万, foaf & BIO (A vocabulary for biographical information) • 国立国会図書館: 1百万, foaf • Deutsche Nationalbibliothek (DNB, Germany): 1.8 & 1.3百万 (人名 & 組織), • Virtual International Authority File (VIAF): 4百万• タキソノミー Taxonomy – 件名標目 Subject Heading: LC, NDL, • Library of Congress: MADS &SKOS • British Library: • National Diet Library (Japan): 0.1 百万, SKOS • Deutsche Nationalbibliothek (DNB, Germany): 0.16 百万 Hideaki Takeda / National Institute of Informatics
  18. 18. Hideaki Takeda / National Institute of Informatics
  19. 19. Hideaki Takeda / National Institute of Informatics
  20. 20. UDC ELEMENT DEFINITION UDC as Linked Data SKOS TERM UDC SUBPROPERTYUDC number (notation) UDC notation is combination of symbols (numerals, signs and letters) that represent a class, its skos:notation --- position in the hierarchy and its relation to other classes. Notation is a language-independent indexing term that enables mechanical sorting and filing of subjects. Also called UDC number and UDC classmarkclass identifier (URI) A unique identifier assigned to each UDC class. It identifies the relationship between a class skos:Concept --- meaning and its notational representationbroader class (URI) Superordinate class: the class hierarchically above the class in question skos:broader ---caption Verbal description of the class content skos:prefLabel ---including note Extension of the caption containing verbal examples of the class content (usually a selection of skos:note udc:includingN important terms that do not appear in the subdivision) oteapplication note Instructions for number building, further extension and specification of the class skos:note udc:application Notescope note Note explaining the extent and the meaning of a UDC class. Used to resolve disambiguation or skos:scopeNot --- to distinguish this class from other similar classes eexamples Examples of combination are used to illustrate UDC class building i.e. complex subject skos:example --- statementssee also reference Indication of conceptual relationship between UDC classes from different hierarchies skos:related --- <skos:Concept rdf:about="http://udcdata.info/025553"> 69,000 records <skos:inScheme rdf:resource="http://udcdata.info/udc-schema"/> 40 Languages <skos:broader rdf:resource="http://udcdata.info/025461"/> <skos:notation rdf:datatype="http://udcdata.info/UDCnotation">510.6</skos:notation> <skos:prefLabel xml:lang="en">Mathematical logic</skos:prefLabel> <skos:prefLabel xml:lang="ja">記号論理学</skos:prefLabel> <skos:related rdf:resource="http://udcdata.info/000016"/>http://udcdata.info/ </skos:Concept> Hideaki Takeda / National Institute of Informatics
  21. 21. http://id.loc.gov/authorities/names/n79084664.html <http://id.loc.gov/authorities/names/n79084664> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://www.loc.gov/mads/rdf/v1#PersonalName> . <http://id.loc.gov/authorities/names/n79084664> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://www.loc.gov/mads/rdf/v1#Authority> . <http://id.loc.gov/authorities/names/n79084664> <http://www.loc.gov/mads/rdf/v1#authoritativeLabel> "Natsume, Sōseki, 1867-1916"@en . <http://id.loc.gov/authorities/names/n79084664> <http://www.loc.gov/mads/rdf/v1#elementList> _:bnode7authoritiesnamesn79084664 . _:bnode7authoritiesnamesn79084664 <http://www.w3.org/1999/02/22-rdf-syntax-ns#first> _:bnode8authoritiesnamesn79084664 . _:bnode7authoritiesnamesn79084664 <http://www.w3.org/1999/02/22-rdf-syntax-ns#rest> _:bnode010 . _:bnode8authoritiesnamesn79084664 <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://www.loc.gov/mads/rdf/v1#FullNameElement> . _:bnode8authoritiesnamesn79084664 <http://www.loc.gov/mads/rdf/v1#elementValue> "Natsume, Sōseki,"@en . _:bnode010 <http://www.w3.org/1999/02/22-rdf-syntax-ns#first> _:bnode11authoritiesnamesn79084664 . _:bnode010 <http://www.w3.org/1999/02/22-rdf-syntax-ns#rest> <http://www.w3.org/1999/02/22-rdf-syntax-ns#nil> . _:bnode11authoritiesnamesn79084664 <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://www.loc.gov/mads/rdf/v1#DateNameElement> . Hideaki Takeda / National Institute of Informatics
  22. 22. http://id.loc.gov/authorities/subjects/sh85008180.html Hideaki Takeda / National Institute of Informatics
  23. 23. http://data.bnf.fr/11932084/intelligence_artificielle/ Hideaki Takeda / National Institute of Informatics
  24. 24. 例:生物種とタクソン• 概要 – 生物種とタクソンの名前 (kingdom, divison, class, order, family, tribe, genus) – 文字列 • 種は二名法 • 領域毎の学界がタクソン名を管理 – E.g., Papilo xuthus (Asian Swallowtail, ナミアゲハ,호랑나비)• (IDとしてみたときの)要求仕様との整合性 – 1. (安定したID) たぶん(でも消滅、名前変更、内容変更もあり) – 2. (唯一ID) 概ねあるが、実はそれほどない – 3. (参照解決可能) ない。 – 4. (信頼できる発行者)たぶん Hideaki Takeda / National Institute of Informatics
  25. 25. 植物 藻類 菌類 動物 分類群 Taxon Plants Algae Fungi Animalsドメイン Domain 界 Kingdom 門 Division/Phylum -phyta -phyta -mycota 亜門 Subdivision/Subphylum -phytina -phytina -mycotina 綱 Class -opsida -phyceae -mycetes 亜綱 Subclass -idae -phycidae -mycetidae 目 Order -ales -ales -ales 亜目 Suborder -ineae -ineae -ineae 上科 Superfamily -acea -acea -acea -oidea 科 Family -aceae -aceae -aceae -idae 亜科 Subfamily -oideae -oideae -oideae -inae 族/連 Tribe -eae -eae -eae -ini亜族/亜連 Subtribe -inae -inae -inae -ina 属 Genus 亜属 Subgenus 種 Species 亜種 Subspecies Hideaki Takeda / National Institute of Informatics
  26. 26. 情報構造化まとめ• Keywords, tags/Controlled vocabulary /Classification/Taxonomy /Thesaurus/Ontology – 差異は明確でないし、また重要でない – より構造化の方向へ – 要求仕様は識別子システムと同じ • 安定していて持続可能 • システムを超えて唯一性の保証 • 記述が手に入ること • 発行者が信頼でき持続可能 Hideaki Takeda / National Institute of Informatics
  27. 27. LODのためのスキーマ・語彙• クラス/概念の記述 – オントロジーにおける概念定義 – 関係データベースのテーブルのスキーマ – オブジェクト指向プログラミングにおけるオブジェ クト定義• セマンティックWebでのクラス定義 – RDFS/OWLによるクラス記述 • RDFS: 簡単なクラス定義 • OWL: 記述論理に基づく• Linked Dataにおけるクラス定義 – 主にRDFSに基づく (例外: owl:sameAs) – 簡単な構造 (主にプロパティー値の組) Hideaki Takeda / National Institute of Informatics
  28. 28. LODのためのスキーマ・語彙• スキーマ共有の重要性 – 相互運用性 – 汎用アプリケーション• よく使われるスキーマ – Dublin Core – FOAF (Friend-Of-A-Friend) – SKOS (Simple Knowledge Organization System) Hideaki Takeda / National Institute of Informatics
  29. 29. Usage of Common Vocabularies Prefix Namespace Used bydc http://purl.org/dc/elements/1.1/ 66 (31.88 %)foaf http://xmlns.com/foaf/0.1/ 55 (26.57 %)dcterms http://purl.org/dc/terms/ 38 (18.36 %)skos http://www.w3.org/2004/02/skos/core# 29 (14.01 %)akt http://www.aktors.org/ontology/portal# 17 (8.21 %)geo http://www.w3.org/2003/01/geo/wgs84_pos# 14 (6.76 %)mo http://purl.org/ontology/mo/ 13 (6.28 %)bibo http://purl.org/ontology/bibo/ 8 (3.86 %)vcard http://www.w3.org/2006/vcard/ns# 6 (2.90 %)frbr http://purl.org/vocab/frbr/core# 5 (2.42 %)sioc http://rdfs.org/sioc/ns# 4 (1.93 %) LDOW2011 Presentation, Christian Bizer (Freie Universität Berlin), 2011 Hideaki Takeda / National Institute of Informatics
  30. 30. (Simple) Dublin Core• 図書館コミュニティから • 15 elements• DCMI (Dublin Core Metadata – Title Initiative)による管理 – Creator• (Simple) Dublin Core – Subject – たった15要素 – Description – Simple is best – Publisher – 値域制約はない – Contributor – http://purl.org/dc/elements/1.1/ – Date – Type – Format – Identifier – Source – Language – Relation – Coverage – Rights Hideaki Takeda / National Institute of Informatics
  31. 31. dc terms • Qualified Dublin Core – 定義域と値域 – より精緻な語彙 • simple dcの拡張Properties abstract , accessRights , accrualMethod , accrualPeriodicity , accrualPolicy , alternative , audience , available , bibliograp hicCitation ,conformsTo , contributor , coverage , created , creator , date , dateAccepted , dateCopyrighted , dateSubmit ted , description ,educationLevel , extent , format , hasFormat , hasPart , hasVersion , identifier , instructionalMethod , i sFormatOf , isPartOf , isReferencedBy ,isReplacedBy , isRequiredBy , issued , isVersionOf , language , license , mediator , medium , modified , provenance , publisher , references ,relation , replaces , requires , rights , rightsHolder , source , sp atial , subject , tableOfContents , temporal , title , type , validProperties in the contributor , coverage , creator , date , description , format , identifier , language , publisher , relation , rights , source , s/elements/1.1/namespace ubject , title , typeVocabulary Encoding Schemes DCMIType , DDC , IMT , LCC , LCSH , MESH , NLM , TGN , UDCSyntax Encoding Schemes Box , ISO3166 , ISO639-2 , ISO639-3 , Period , Point , RFC1766 , RFC3066 , RFC4646 , RFC5646 , URI , W3CDTFClasses Agent , AgentClass , BibliographicResource , FileFormat , Frequency , Jurisdiction , LicenseDocument , LinguisticSystem , Location ,LocationPeriodOrJurisdiction , MediaType , MediaTypeOrExtent , MethodOfAccrual , MethodOfInstruction , Pe riodOfTime , PhysicalMedium ,PhysicalResource , Policy , ProvenanceStatement , RightsStatement , SizeOrDuration , Sta ndardDCMI Type Vocabulary Collection , Dataset , Event , Image , InteractiveResource , MovingImage , PhysicalObject , Service , Software , Sound , Sti llImage , TextTerms related to the DCMI memberOf , VocabularyEncodingSchemeAbstract Model Hideaki Takeda / National Institute of Informatics
  32. 32. Dcterms subPropertyOf Domain Range Dcterms subPropertyOf Domain Rangecontributor dc:contributor rdfs:Resource dcterms:Agent conformsTo dc:relation, dcterms:relation rdfs:Resource dcterms:Standard hasFormat dc:relation, dcterms:relation rdfs:Resource rdfs:Resource dc:creator,creator rdfs:Resource dcterms:Agent dcterms:contributor hasPart dc:relation, dcterms:relation rdfs:Resource rdfs:Resource dcterms:LocationPeriodOrcoverage dc:coverage rdfs:Resource hasVersion dc:relation, dcterms:relation rdfs:Resource rdfs:Resource Jurisdiction dc:coverage, isFormatOf dc:relation, dcterms:relation rdfs:Resource rdfs:Resourcespatial rdfs:Resource dcterms:Location dcterms:coverage isPartOf dc:relation, dcterms:relation rdfs:Resource rdfs:Resource dc:coverage,Temporal rdfs:Resource dcterms:PeriodOfTime dcterms:coverage isReferencedBy dc:relation, dcterms:relation rdfs:Resource rdfs:ResourceDate dc:date rdfs:Resource rdfs:Literal isReplacedBy dc:relation, dcterms:relation rdfs:Resource rdfs:ResourceAvailable dc:date, dcterms:date rdfs:Resource rdfs:LiteralCreated dc:date, dcterms:date rdfs:Resource rdfs:Literal isRequiredBy dc:relation, dcterms:relation rdfs:Resource rdfs:ResourcedateAccepted dc:date, dcterms:date rdfs:Resource rdfs:Literal isVersionOf dc:relation, dcterms:relation rdfs:Resource rdfs:ResourcedateCopyrighted dc:date, dcterms:date rdfs:Resource rdfs:Literal References dc:relation, dcterms:relation rdfs:Resource rdfs:ResourcedateSubmitted dc:date, dcterms:date rdfs:Resource rdfs:Literal Replaces dc:relation, dcterms:relation rdfs:Resource rdfs:ResourceIssued dc:date, dcterms:date rdfs:Resource rdfs:Literal Requires dc:relation, dcterms:relation rdfs:Resource rdfs:ResourceModified dc:date, dcterms:date rdfs:Resource rdfs:Literal Rights dc:rights rdfs:Resource dcterms:RightsStatement accessRights dc:rights, dcterms:rights rdfs:Resource dcterms:RightsStatementValid dc:date, dcterms:date rdfs:Resource rdfs:Literal License dc:rights, dcterms:rights rdfs:Resource dcterms:LicenseDocumentdescription dc:description rdfs:Resource rdfs:Resource Subject dc:subject rdfs:Resource rdfs:Resource dc:description, title dc:title rdfs:Resource rdfs:Resourcerdfs:LiteralAbstract rdfs:Resource rdfs:Resource dcterms:description alternative dc:title, dcterms:title rdfs:Resource rdfs:Resourcerdfs:Literal dc:description, type dc:type rdfs:Resource rdfs:ClasstableOfContents rdfs:Resource rdfs:Resource dcterms:description audience rdfs:Resource dcterms:AgentClass dcterms:MediaTypeOrExte educationLevel dcterms:audience rdfs:Resource dcterms:AgentClassformat dc:format rdfs:Resource mediator dcterms:audience rdfs:Resource dcterms:AgentClass nt dcmitype:Collecextent dc:format, dcterms:format rdfs:Resource dcterms:SizeOrDuration accrualMethod dcterms:MethodOfAccrual tion dcterms:PhysicalR dcmitype:CollecMedium dc:format, dcterms:format dcterms:PhysicalMedium accrualPeriodicity dcterms:Frequency esource tionIdentifier dc:identifier rdfs:Resource rdfs:Literal dcmitype:Collec accrualPolicy dcterms:PolicybibliographicCitat dc:identifier, dcterms:Bibliograp tion rdfs:Literalion dcterms:identifier hicResource instructionalMethod rdfs:Resource dcterms:MethodOfInstructio provenance rdfs:Resource dcterms:ProvenanceStatemLanguage dc:language rdfs:Resource dcterms:LinguisticSystem rightsHolder rdfs:Resource dcterms:AgentPublisher dc:publisher rdfs:Resource dcterms:AgentRelation dc:relation rdfs:Resource rdfs:Resource http://dublincore.org/documents/dcmi-terms/source dc:source, dcterms:relation rdfs:Resource rdfs:Resource Hideaki Takeda / National Institute of Informatics http://www.kanzaki.com/docs/sw/dc-domain-range.html
  33. 33. The Friend of a Friend (FOAF) • 人と人の関係のメタデータ • 自主的なプロジェクトClasses: | Agent | Document | Group | Image | LabelProperty |OnlineAccount | OnlineChatAccount |OnlineEcommerceAccount | OnlineGamingAccount |Organization | Person | PersonalProfileDocument | Project | @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .Properties: @prefix foaf: <http://xmlns.com/foaf/0.1/> . | account | accountName | accountServiceHomepage | age | @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .aimChatID | based_near | birthday | currentProject | <#JW>depiction | depicts | dnaChecksum | familyName | a foaf:Person ;family_name | firstName | focus | fundedBy | geekcode | foaf:name "Jimmy Wales" ; foaf:mbox <mailto:jwales@bomis.com> ;gender | givenName | givenname | holdsAccount | foaf:homepage <http://www.jimmywales.com/> ;homepage | icqChatID | img | interest | isPrimaryTopicOf | foaf:nick "Jimbo" ; foaf:depictionjabberID | knows | lastName | logo | made | maker | mbox | <http://www.jimmywales.com/aus_img_small.jpg> ;mbox_sha1sum | member | membershipClass | msnChatID foaf:interest <http://www.wikimedia.org> ; foaf:knows [| myersBriggs | name | nick | openid | page | pastProject | a foaf:Person ;phone | plan | primaryTopic | publications | foaf:name "Angela Beesley" ].schoolHomepage | sha1 | skypeID | status | surname | theme| thumbnail | tipjar | title | topic | topic_interest | weblog | <http://www.wikimedia.org>workInfoHomepage | workplaceHomepage | yahooChatID | Takeda /"Wikipedia" . Institute of Informatics Hideaki rdfs:label National
  34. 34. SKOS (Simple Knowledge Organization System)• タキソノミーに関するメタデータ – 概念の階層的構造 • 件名標目のようなタキソノミーにために設計 • 上位下位関係はクラス・サブクラス関係とは一致 しない• W3C Recommendation 18 August 2009 Hideaki Takeda / National Institute of Informatics
  35. 35. SKOS (Simple Knowledge Organization System)• SKOS Core (hierarchical concept structure) – skos:semanticRelation – skos:broaderTransitive subPropertyOf – skos:narrowerTransitive – skos:broader – skos:narrower – skos:related – skos:preflabel – skos:altlabel – skos:hiddenlabel Hideaki Takeda / National Institute of Informatics
  36. 36. SKOS (Simple Knowledge Organization System)• SKOS Mapping – skos:mappingRelation – skos:closeMatch subPropertyOf – skos:exactMatch – skos:broadMatch – skos:narrowMatch – skos:relatedMatch Hideaki Takeda / National Institute of Informatics
  37. 37. Linked Open Vocabulary (LOV)• 語彙流通のためのプラットフォーム – スキーマの登録 – スキーマの検索• http://labs.mondeca.com/dataset/lov/• MetaBridge (日本) – http://www.metabridge.jp/ Hideaki Takeda / National Institute of Informatics
  38. 38. XHideaki Takeda / National Institute of Informatics
  39. 39. More Info.• http://www.w3.org/2005/Incubator/lld/wiki/V ocabulary_and_Dataset Hideaki Takeda / National Institute of Informatics
  40. 40. スキーマ・語彙のまとめ• いくつかの有名なスキーマ – DC, DC terms, FOAF, SKOS …• もっと多い専門的スキーマ – CIDOC CRM – PRISM –…• 再利用を強く推奨 – LOV Hideaki Takeda / National Institute of Informatics
  41. 41. まとめ• 3つの層 – オントロジー/シソーラス/タキソノミー (Ontology/Thesaurus/Taxonomy) – スキーマ (Schema) – 識別子 (Identification)• トップダウンではない、むしろ今はボトム アップ• それぞれの層は役割が違う• しかし、その層の価値だけを追求するのでは なくて、よいつながりを考慮すべき Hideaki Takeda / National Institute of Informatics
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×