1st LODandOntology studysession aboutRDF

767 views
758 views

Published on

1st LOD and Ontology study session @Osaka University Nakanoshima Center

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
767
On SlideShare
0
From Embeds
0
Number of Embeds
158
Actions
Shares
0
Downloads
15
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

1st LODandOntology studysession aboutRDF

  1. 1. RDF(Resource Description Framework)~Web上に構造化データを公開するための方法~2013/04/25第1回 LINKED OPEN DATAとオントロジー勉強会大阪大学産業科学研究所増田 壮志
  2. 2. Linked Data の4つの基本原則1. あらゆる事物にURIを付与すること2. 誰でも事物の内容が確認できるように,URIはHTTP経由で参照できること3. Webで構造化データを公開するときは,RDFを用いること4. あらゆる事物にハイパーリンクを利用すること(RDFリンク)
  3. 3. RDFとは?• RDF:Resource Description Framework• 直訳すると“リソースを記述するための枠組み”• 様々な異なるアプリケーションをweb上で処理するための標準形式.• 情報をノードで表し,ノードとノード間をアークと呼ばれるラベルを付けた線で結ぶグラフとして表現する.ノード1 ノード2アーク情報1 情報2
  4. 4. RDFトリプル• RDFはデータを記述する際に,主語・述語・目的語の3つ組構造で記述するというデータモデルのこと.• この3つ組構造をトリプルと呼ぶ.• 主語は,URIで記述してリソースを同定する.• 目的語は,単純なリテラル値として記述されるか,URIが記述される.• 述語は,主語と目的語を接続し,それぞれの関係を記述する.また,述語もURIとして記述される.主語 目的語述語リソース リソースプロパティRDFトリプル
  5. 5. RDFトリプルの例ガンダム RX-78-2ex:numberガンダムの型式はRX-78-2です目的語がリテラル値(単純な文字列や数字)ガンダムは,アムロ・レイが搭乗者です地球連邦軍ex:belongアムロ・レイは地球連邦軍に所属していex:have目的語がURIの場合は,他のトリプルの主語になる.主語が目的語になったり目的語が主語になったりする.地球連邦軍はガンダムを所有しているアムロ・レイex:hasPilothttp://example.org/person/amuro rayhttp://example.org/force/Earth Federation Space Force目的語がURIになっているhttp://example.org/mobilesuit/gundam主語主語目的語主語目的語目的語目的語
  6. 6. Linked DataとRDF• RDFトリプルの集合は,主語と目的語をノード,述語を有向枝としてみると,一つのグラフとして見ることができる.• Linked DataのURIはグローバルにユニークなので,参照解決することで,RDFトリプル集合に結び付けられる.→世界中のすべてのLinked Dataは1つの巨大なグラフになりえる.アプリケーションは,URIを次々と参照していきグラフの部分を引き出していくものである.
  7. 7. RDFのシリアル化形式• RDFは,リソースを主語,目的語,述語の形式で記述するデータモデルである.→RDFは,データ形式ではない• RDFの形式に沿ってトリプルを特定の文法に従ってファイルに書き出す(シリアル化する)必要がある.• シリアル化形式として• RDF/XML• RDFa• Turtle• N-Triples• RDF/JSONなどがある.今日は,RDF/XMLを中心に紹介します
  8. 8. RDF/XMLでの表現(1/3)<?xml version="1.0" encording="UTF-8"?><rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmls:ex=“http://www.example.org/terms"><rdf:Description rdf:about="http://www.example.org/mobilesuit/gundam"><ex:hasPilot><rdf:Description rdf:about="http://www.example. org/person/amuro ray"></rdf:Description></ex:hasPilot></rdf:Description></rdf:RDF>ガンダム アムロ・レイhttp://example.org/mobilesuit/gundam http://example.org/person/amuro ray宣言• Xml使うよ• RDF書いてるよ• 略語を使うよ本体ノードプロパティ(述語)ノードノード要素とプロパティ要素を入れ子にして表現するのでノードとプロパティが交互に現れるex:hasPilot
  9. 9. RDF/XMLでの表現(2/3)<rdf:Description rdf:about="http://www.example.org/mobilesuit/gundam"><ex:number> RX-78-2</ex:number><ex:hasPilot><rdf:Description rdf:about="http://www.example.org/person/amuro ray"></ex:hasPilot></rdf:Description>• 主語から複数の目的語に枝分かれしている場合リテラル値はrdf:Descriptionによるノード要素を用いずに直接記述ガンダム RX-78-2アムロ・レイhttp://example.org/mobilesuit/gundamhttp://example.org/person/amuro ray複数のプロパティは兄弟要素として列挙ex:numberex:hasPilot
  10. 10. RDF/XMLでの表現(3/3)ガンダム アムロ・レイ 地球連邦軍http://example.org/mobilesuit/gundamhttp://example.org/person/amuro rayhttp://example.org/force/Earth Federation Space Force• 複数のトリプルから構成されている場合<rdf:Description rdf:about="http://www.example.org/mobilesuit/gundam"><ex:hasPilot><rdf:Description rdf:about="http://www.example.org/person/amuro ray"><ex:belong><rdf:Description rdf:about="http://www.example.org/force/EarthFederationSpaceForce"></rdf:Description></ex:belong></rdf:Description></ex:hasPilot></rdf:Description>ノードプロパティ(述語)ノードノードプロパティ(述語)目的語が,次の目的語の主語となり,次々に入れ子構造になっていく.ex:hasPilot ex:belong
  11. 11. Linked Data の4つの基本原則1. あらゆる事物にURIを付与すること2. 誰でも事物の内容が確認できるように,URIはHTTP経由で参照できること3. Webで構造化データを公開するときは,RDFを用いること4. あらゆる事物にハイパーリンクを利用すること(RDFリンク)
  12. 12. RDFを外とリンクさせる• RDFをデータの孤島としないために,他のデータ源へとRDFリンクさせる• RDFリンクの3つの重要なタイプ1. 関係リンク• 他の人々や場所,遺伝子と言った他のデータ源で関連する事物を指す.2. 同一性リンク• 現実世界の同じ事物や同じ抽象概念を結びつけるために,他のデータ源によって使用される別名のURI同士を同じものであるというリンクで結ぶ.3. 語彙リンク• データの表現に使われる用語の定義とそれらの定義から他の語彙の関連語の定義する.
  13. 13. 関係リンクfoaf:based_nearfoaf:based_nearfoaf:interest増田壮志兵庫県(Geonamesのデータ)http://example.org/person/masudatakeshihttp://sws.geonames.org/1862047/Linked Datahttp://www.w3.org/standards/semanticweb/data兵庫県(Wikipediaのデータ)http://en.wikipedia.org/wiki/Hyogo_Prefecture名前空間の異なるノードをRDFリンクで結ぶことで,アプリケーションは,潜在的に無限のデータのネットワークを参照可能になるそれぞれ名前空間が異なっている
  14. 14. 同一性リンク• 現実世界の同じ事物が,複数のURIで記述されている時に“同一である(sameAs)”リンクで結ぶ.• URIの記述は様々な人によって行われるため,同じ事物でも異なる多数のURIが存在する.• これらのURIのことをURI別名(URI aliases)と呼ぶ.• URI別名が存在することのメリット• 1つのリソースに関して異なるデータ公開者によって異なる視点や意見が表現されることを許す• Linked Data利用者が個々の事物に関してそれぞれの公開者が用意したURIを参照できるので,それぞれがその事物について何を述べているかを知ることができる.• URIを割り当てるための中央集約的な権限が不要.
  15. 15. 同一性リンク(例)Aさんが飼っている柴犬うちのポチAさんのURIAさん家のポチAさんの知り合いのBさんのURI柴犬Aさんを知らないCさんのURIsameAssameAsURI別名
  16. 16. 語彙リンク(1/2)• データの表現に使われる用語の定義とその定義から他の語彙の関連語の定義をする.• 方法1:広く利用されている語彙を用いる• 方法2:可能な限り自己記述できるデータを作る• 異なる語彙間により多くのリンクが用意されればされるほど,Webアプリケーションは異なる語彙を使って表現されたデータをうまく統合出来るようになる.
  17. 17. 語彙リンク(2/2)• 自己記述性とは• Linked dataアプリケーションが未知の語彙を用いて表現されたデータを発見したときに,その語彙を理解して処理できる表現に変換するのに必要なメタ情報を獲得できること.• 自己記述可能にするためには1. アプリケーションがRDFやOWLで書かれた用語の定義を参照できるようにリンクさせる.2. RDFリンクで異なる語彙用語間をマッピングして,公開する.
  18. 18. まとめ(RDFとは)• Web上にデータを公開するときにRDFという決まりにそってデータを公開する.• RDFの書き方には,RDF/XML,RDFa,Turtleなどがある.• Linked dataは,リソース同士がリンクしていなければ始まらないので,リンクさせる(RDFリンク).• RDFリンクには,関係リンク,同一性リンク,語彙リンクがありそれらのリンクを参照解決することで,Webアプリケーションは,あらゆるデータを取得できる.
  19. 19. まとめ(Linked Dataとは)• Linked Dataは• RDFという統一データモデルを持ちグローバルなデータ共有に適している.• HTTPプロトコルを使用することで汎用のデータブラウザでデータ源にアクセスしたり,データ領域全体が検索エンジンによってクロール可能である.• URIを用いることで,異なるデータ源にある事物間にハイパーリンクを作ることができる.また,アプリケーションが実行時で新しいデータ源を発見することを可能にしている.• 定義が検索可能な語彙を共有し,語彙間のリンクを貼ることが可能なので,異なるデータ源からのデータ統合が容易である.を提供する.
  20. 20. 語彙リンク例

×