Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

1,157 views

Published on

第2回 Linked Open Data(LOD)とオントロジー勉強会にて発表したLinked Data: Webをグローバルなデータ空間にする仕組みの 「第4章 つながるデータをデザインしよう」の内容。

Published in: Technology
  • Be the first to comment

Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

  1. 1. Linked Data Webをグローバルなデータ空間にする仕組み 総合地球環境学研究所 南 佳孝 『第4章 つながるデータをデザインし よう』 2013/8/5 第2回 Linked Open Data(LOD)とオントロジー勉強会
  2. 2. おさらい ① 事物の名前としてURIを使うこと ② 事物の名前を調べられるようにHTTP URIを使うこと ③ URIが参照されたとき、有用な情報を供給できるようにすること ④ データの中に他のURIへのリンクをいれること Linked Data 4原則 303URI と ハッシュURI RDFとその形式 他の事物へのリンク
  3. 3. URIで名前をつける 人物 建物 飼い犬 科学的な概念
  4. 4. どうやってURIを決めるの? + 名前空間 ※自分がコントロールできること
  5. 5. 自分が管理する名前空間 新たなURIを発行 http://oreno.site 新たなURIを発行 http://omaeno.site 自分が管理できない名前空間 ○ ×
  6. 6. Linked Dataを生成する最大の理由 内部・外部へリンクして、付加価値を生み出す! http://oreno.site http://omaeno.site じゃあ リンクを貼ってもらうには?
  7. 7. • コントロール可能 • 実装に非依存 • Natural Key 一貫したルール 永続的・安定的
  8. 8. コントロール可能な名前空間 http://omaeno.site http://omaeno.site/person/aho/ http://oreno.site http://omaeno.site/person/aho/#comedian http://oreno.site/ahosisho/ 同一のデータ ※ http://omaeno.site/がLinked Dataでなければ Dbpediaなどをリンク先として考えるべき
  9. 9. 実装に非依存 http://oreno.site http://oreno.site/comedian.php?id=ahosisho&format=rdf http://oreno.site:8080/comedian.php?id=ahosisho&format=rdf http://oreno.site/comedian/ahosisho.rdf ぴ、PHP? ぽ、ポート番号? ○ × ×
  10. 10. ユニーク性を保証する Natural Key(自然なキー) http://oreno.site/comedian/ahosisho http://oreno.site/comedian/geinin00001 ポイント 一般的な規則: 可能な限り、データセットを持つドメインで意味があるキー を使う ※どちらを使うかについては未だに議論される ところ
  11. 11. 3種類のURI • 現実世界の事物そのものを表現するURI • 現実世界の事物の記述をHTMLによって表現した関連情 報リソースのURI • 現実世界の事物の記述をRDF/XMLファイルによって表現 した関連情報リソースを示すURI 視覚的に区別しづらく、 間違ったURIを使ってしまう可能性がある 拡張子(.html .rdf)を使って 区別する方法が通常よく使われる
  12. 12. URIが参照されたら
  13. 13. ① 事物の名前としてURIを使うこと ② 事物の名前を調べられるようにHTTP URIを使うこと ③ URIが参照されたとき、有用な情報を供給できるようにすること ④ データの中に他のURIへのリンクをいれること Linked Data 4原則 どんな情報を載せればいい の? 1. リテラル(文字列)のトリプル 2. 他のリソース(作者やタイプなど)にリンクするト リプル 3. 他のリソースからリンクされるトリプル 4. 関係するリソース(リソースの名前や作者の所属な ど)のトリプル 5. データの由来など、記述自体を記述するトリプル 6. リソース全体に関するトリプル 例えば、LODAC Species:http://lod.ac/species/Papilio_xuthus
  14. 14. データセットの記述 • 何を記述する? – 製作者・更新状況・ライセンス・データの由 来など • メカニズム – Semantic Sitemaps – voiD(the Vocabulary of Interlinked Datasets)
  15. 15. データを記述するための語彙 • 概念階層を表現するための語彙 – SKOS(Simple Knowledge Organization System) • 概念モデルを記述するための語彙 – RDFS(RDF Vocabulary Description Language、 RDF Shema) – OWL(Web Ontology Language)
  16. 16. rdfs:Class RDFクラスであるリソースのクラス rdf:Property すべてのRDFプロパティのクラス RDFSの基本 • クラスとプロパティの型定義から構成 • 2つの名前空間 – http://www.w3.org/2000/01/rdf-schema# • プレフィックスは「rdfs:」 – http://www.w3.org/1999/02/22-rdf-syntax-ns# • プレフィックスは「rdf:」 基本クラス
  17. 17. RDFSの基本 • アノテーション – rdfs:label – rdfs:comment • クラスとプロパティの関係 – rdfs:subClassOf – rdfs:subPropertyOf – rdfs:domain – rdfs:range
  18. 18. 【推奨】語彙 • ダブリンコア・メタデータ・イニシアティブ(Dublin Core Metadata Initiative (DCMI) ) – http://dublincore.org/documents/dcmi-terms/ • フレンド・オブ・ア・フレンド(Friend-of-a-Friend (FOAF) ) – http://xmlns.com/foaf/spec/ • 意味論的相互リンク・オンライン・コミュニティ(Semantically-Interlinked Online Communities (SIOC) ) – http://rdfs.org/sioc/spec/ • プロジェクト記述(Description of a Project (DOAP) ) – http://trac.usefulinc.com/doap • 音楽オントロジー(Music Ontology) – http://musicontology.com/ • プログラム・オントロジー(Programmes Ontology) – http://www.bbc.co.uk/ontologies/programmes/2009-09-07.shtml • グッド・リレーション・オントロジー(Good Relations Ontology) – http://purl.org/goodrelations/ • クリエイティブ・コモンズ(Creative Commons (CC) ) – http://creativecommons.org/ns# • 書誌オントロジー(Bibliographic Ontology (BIBO) ) – http://bibliontology.com/ • OAIオブジェクト再利用・交換(OAI Object Reuse and Exchange) – http://www.openarchives.org/ore/ • レビュー語彙(Review Vocabulary) – http://purl.org/stuff/rev# • ベーシック・ジオ(Basic Geo (WGS84) ) – http://www.w3.org/2003/01/geo/
  19. 19. 語彙の選び方 • 利用と理解 – 広く用いられている – 既存のアプリからアクセスできるようになる • 維持管理 – 管理方針が明瞭である – 維持活動が活発である – 更新される基準がある • カバー範囲 – データセットを十分にカバーしている • 表現力 – 過不足ではなく適切な表現である
  20. 20. 用語の定義 • 既存語彙を補充するため • 管理できる名前空間内で • RDFS、OWLを用いて既存語彙と関連させ る • Linked Data原則に則る • 人間がわかりやすいラベルとコメント • 必要最低限だけ LODAC Speciesでは:http://lod.ac/ns/species#
  21. 21. リンクする
  22. 22. http://oreno.site 外からのリンクを得るには 1.データセットの価値 2.リンクすることで新たな事がで きる 3.リンクの生成・維持が容易 外へのリンク先を選ぶ データセットを包括的に維持する CKAN http://data.linkedopendata.jp/
  23. 23. http://oreno.site http://omaeno.site .html 自動化! (参考)Silk:http://www.slideshare.net/YoshitakaMinami/silk-13745740 プロパティの選び方 1.どのくらい他で使われているか 2.参照してデータを得ることができ るか
  24. 24. ① 事物の名前としてURIを使うこと ② 事物の名前を調べられるようにHTTP URIを使うこと ③ URIが参照されたとき、有用な情報を供給できるようにすること ④ データの中に他のURIへのリンクをいれること Linked Data 4原則 まとめ

×