Linked Data - Webをグローバルなデータ空間にする仕組み 第4章
Upcoming SlideShare
Loading in...5
×
 

Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

on

  • 831 views

第2回 Linked Open Data(LOD)とオントロジー勉強会にて発表したLinked Data: Webをグローバルなデータ空間にする仕組みの ...

第2回 Linked Open Data(LOD)とオントロジー勉強会にて発表したLinked Data: Webをグローバルなデータ空間にする仕組みの 「第4章 つながるデータをデザインしよう」の内容。

Statistics

Views

Total Views
831
Views on SlideShare
831
Embed Views
0

Actions

Likes
1
Downloads
4
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Linked Data - Webをグローバルなデータ空間にする仕組み 第4章 Linked Data - Webをグローバルなデータ空間にする仕組み 第4章 Presentation Transcript

  • Linked Data Webをグローバルなデータ空間にする仕組み 総合地球環境学研究所 南 佳孝 『第4章 つながるデータをデザインし よう』 2013/8/5 第2回 Linked Open Data(LOD)とオントロジー勉強会
  • おさらい ① 事物の名前としてURIを使うこと ② 事物の名前を調べられるようにHTTP URIを使うこと ③ URIが参照されたとき、有用な情報を供給できるようにすること ④ データの中に他のURIへのリンクをいれること Linked Data 4原則 303URI と ハッシュURI RDFとその形式 他の事物へのリンク
  • URIで名前をつける 人物 建物 飼い犬 科学的な概念
  • どうやってURIを決めるの? + 名前空間 ※自分がコントロールできること
  • 自分が管理する名前空間 新たなURIを発行 http://oreno.site 新たなURIを発行 http://omaeno.site 自分が管理できない名前空間 ○ ×
  • Linked Dataを生成する最大の理由 内部・外部へリンクして、付加価値を生み出す! http://oreno.site http://omaeno.site じゃあ リンクを貼ってもらうには?
  • • コントロール可能 • 実装に非依存 • Natural Key 一貫したルール 永続的・安定的
  • コントロール可能な名前空間 http://omaeno.site http://omaeno.site/person/aho/ http://oreno.site http://omaeno.site/person/aho/#comedian http://oreno.site/ahosisho/ 同一のデータ ※ http://omaeno.site/がLinked Dataでなければ Dbpediaなどをリンク先として考えるべき
  • 実装に非依存 http://oreno.site http://oreno.site/comedian.php?id=ahosisho&format=rdf http://oreno.site:8080/comedian.php?id=ahosisho&format=rdf http://oreno.site/comedian/ahosisho.rdf ぴ、PHP? ぽ、ポート番号? ○ × ×
  • ユニーク性を保証する Natural Key(自然なキー) http://oreno.site/comedian/ahosisho http://oreno.site/comedian/geinin00001 ポイント 一般的な規則: 可能な限り、データセットを持つドメインで意味があるキー を使う ※どちらを使うかについては未だに議論される ところ
  • 3種類のURI • 現実世界の事物そのものを表現するURI • 現実世界の事物の記述をHTMLによって表現した関連情 報リソースのURI • 現実世界の事物の記述をRDF/XMLファイルによって表現 した関連情報リソースを示すURI 視覚的に区別しづらく、 間違ったURIを使ってしまう可能性がある 拡張子(.html .rdf)を使って 区別する方法が通常よく使われる
  • URIが参照されたら
  • ① 事物の名前としてURIを使うこと ② 事物の名前を調べられるようにHTTP URIを使うこと ③ URIが参照されたとき、有用な情報を供給できるようにすること ④ データの中に他のURIへのリンクをいれること Linked Data 4原則 どんな情報を載せればいい の? 1. リテラル(文字列)のトリプル 2. 他のリソース(作者やタイプなど)にリンクするト リプル 3. 他のリソースからリンクされるトリプル 4. 関係するリソース(リソースの名前や作者の所属な ど)のトリプル 5. データの由来など、記述自体を記述するトリプル 6. リソース全体に関するトリプル 例えば、LODAC Species:http://lod.ac/species/Papilio_xuthus
  • データセットの記述 • 何を記述する? – 製作者・更新状況・ライセンス・データの由 来など • メカニズム – Semantic Sitemaps – voiD(the Vocabulary of Interlinked Datasets)
  • データを記述するための語彙 • 概念階層を表現するための語彙 – SKOS(Simple Knowledge Organization System) • 概念モデルを記述するための語彙 – RDFS(RDF Vocabulary Description Language、 RDF Shema) – OWL(Web Ontology Language)
  • rdfs:Class RDFクラスであるリソースのクラス rdf:Property すべてのRDFプロパティのクラス RDFSの基本 • クラスとプロパティの型定義から構成 • 2つの名前空間 – http://www.w3.org/2000/01/rdf-schema# • プレフィックスは「rdfs:」 – http://www.w3.org/1999/02/22-rdf-syntax-ns# • プレフィックスは「rdf:」 基本クラス
  • RDFSの基本 • アノテーション – rdfs:label – rdfs:comment • クラスとプロパティの関係 – rdfs:subClassOf – rdfs:subPropertyOf – rdfs:domain – rdfs:range
  • 【推奨】語彙 • ダブリンコア・メタデータ・イニシアティブ(Dublin Core Metadata Initiative (DCMI) ) – http://dublincore.org/documents/dcmi-terms/ • フレンド・オブ・ア・フレンド(Friend-of-a-Friend (FOAF) ) – http://xmlns.com/foaf/spec/ • 意味論的相互リンク・オンライン・コミュニティ(Semantically-Interlinked Online Communities (SIOC) ) – http://rdfs.org/sioc/spec/ • プロジェクト記述(Description of a Project (DOAP) ) – http://trac.usefulinc.com/doap • 音楽オントロジー(Music Ontology) – http://musicontology.com/ • プログラム・オントロジー(Programmes Ontology) – http://www.bbc.co.uk/ontologies/programmes/2009-09-07.shtml • グッド・リレーション・オントロジー(Good Relations Ontology) – http://purl.org/goodrelations/ • クリエイティブ・コモンズ(Creative Commons (CC) ) – http://creativecommons.org/ns# • 書誌オントロジー(Bibliographic Ontology (BIBO) ) – http://bibliontology.com/ • OAIオブジェクト再利用・交換(OAI Object Reuse and Exchange) – http://www.openarchives.org/ore/ • レビュー語彙(Review Vocabulary) – http://purl.org/stuff/rev# • ベーシック・ジオ(Basic Geo (WGS84) ) – http://www.w3.org/2003/01/geo/
  • 語彙の選び方 • 利用と理解 – 広く用いられている – 既存のアプリからアクセスできるようになる • 維持管理 – 管理方針が明瞭である – 維持活動が活発である – 更新される基準がある • カバー範囲 – データセットを十分にカバーしている • 表現力 – 過不足ではなく適切な表現である
  • 用語の定義 • 既存語彙を補充するため • 管理できる名前空間内で • RDFS、OWLを用いて既存語彙と関連させ る • Linked Data原則に則る • 人間がわかりやすいラベルとコメント • 必要最低限だけ LODAC Speciesでは:http://lod.ac/ns/species#
  • リンクする
  • http://oreno.site 外からのリンクを得るには 1.データセットの価値 2.リンクすることで新たな事がで きる 3.リンクの生成・維持が容易 外へのリンク先を選ぶ データセットを包括的に維持する CKAN http://data.linkedopendata.jp/
  • http://oreno.site http://omaeno.site .html 自動化! (参考)Silk:http://www.slideshare.net/YoshitakaMinami/silk-13745740 プロパティの選び方 1.どのくらい他で使われているか 2.参照してデータを得ることができ るか
  • ① 事物の名前としてURIを使うこと ② 事物の名前を調べられるようにHTTP URIを使うこと ③ URIが参照されたとき、有用な情報を供給できるようにすること ④ データの中に他のURIへのリンクをいれること Linked Data 4原則 まとめ