Linked Open Dataとは


LODチャレンジ実行委員会
Linking Open Data運動
• 多くの人々がオープンにしたデータ(Open
  Data)を,皆でつなげて(Linkして),大きな価値
  を生み出していく
• Webを発明したTim Berners-Lee氏が提唱し,
  世界で広まっている
• データの「囲い込み」から「共有」へ
Linked Open Data(LOD)とは
• Web技術を利用して,オープンなデータ(Open Data)
  を公開し,つなげる(Linkする)仕組み
• Web空間を巨大なデータベースとして,問い合わせ
  や利用が可能
        公開             問い合わせ
  データ


  データ


  データ
              Web空間    利用
LODクラウド
         LODとして利用可能なデータセット間のリンク関係を図示




              2007/5/1
                                           2007/11/7   2008/3/31




                         2009/3/27                     2010/9/22
http://richard.cyganiak.de/2007/10/lod/
LODクラウド
                                             ユーザ生成コンテンツ

                                          メディア

    政府・自治体                                                 図書館・出版




                                          クロスドメイン


                     地理情報                           ライフサイエンス
2010/9/22
http://richard.cyganiak.de/2007/10/lod/
従来のWeb
• 文書のWeb:文書ファイル(HTML)+リンク
• 各文書の所在をURIで表す
• 人間が読むことを想定
• 文書群に対してキーワード検索し,必要な情報を取
  得する
             リンク
                   HTML
      HTML
                                HTML
                          リンク
               HTML
従来のWeb
                                ・各Webサイトが持っている
                                データベースどうしはつな
                                がっていない
                                ・同じ書籍に関するデータで
                                あるかどうかを計算機に判
                                定させるには,ひと手間必要




          HTML   HTML    HTML       HTML


 出版社       書店            図書館               クチコミ



データベース   データベース         データベース        データベース
LODによるデータのWeb
•   データのWeb:データ(RDF)+リンク
•   各データの所在をURIで表す
•   計算機が読むことを想定
•   データ群に対してSQLライクな条件式で検索し,必要
    な情報を得る


             RDFデータ

    RDFデータ

                       RDFデータ
Linked Open Data
                                                          Web空間
                                      price
                                                2,940円
                    セマンティックWeb入門

                author             publisher         オーム社
                          author                      データ自体をWeb上
               斎藤 信男           萩野達也
                                                      に公開し,共有する.
                                                      個々のデータがIDを
                                                      持っていて一意に識
                                               RDF    別できる

         RDF             RDF            RDF


 出版社               書店                 図書館                 クチコミ



データベース         データベース              データベース                データベース
LODの基本的な仕組み
• モノにURIで名前を付ける
  – URIはグローバル
  – 同じURIは同じモノを表現
• リンクもURI
  – 関係性を表す語彙をURIで区別
• 省略表記
  – 名前空間の接頭辞を利用
  – http://dbpedia.org/resource/Japan ⇒ depedia:Japan

                    dbpedia-owl:capital
         dbpedia:Japan               dbpedia:Tokyo
LODの基本的な仕組み
           dbpedia-owl:capital
dbpedia:Japan             dbpedia:Tokyo

           dbpedia-owl:leaderName
dbpedia:Tokyo             dbpedia:Shintarō_Ishihara

                     URIが同じノードで2つのグラフを結合

           dbpedia-owl:capital
dbpedia:Japan             dbpedia:Tokyo
                                  dbpedia-owl:leaderName
                          dbpedia:Shintarō_Ishihara
LODの基本的な仕組み
• どのような語彙を選ぶかはデータ作成者の自由
• 共通で使用できる語彙の整備が進みつつある
• 分野,ドメインを越えてノードどうしをリンクすること
  で, データがLODクラウドとつながっていく
               dbpedia-owl:capital
       dbpedia:Japan          dbpedia:Tokyo

                                       dbpedia-owl:leaderName
 owl:sameAs
                               dbpedia:Shintarō_Ishihara

        http://data.nytimes.com/59436095099277148161
LODの利用と公開

                      LODクラウド
                          (Web空間)
                                          LOD利用
  LOD公開                                   アプリケーション
   SPARQL
 エンドボイント
             RDFダンプ
                                         検索エンジン
    LOD公開ツール

                                                        ユーザインタフェース
                                          RDF             などへの出力
                                RDFストア   ファイル
RDFストア      既存データ
            (RDB,CSVなど)                   C. Bizer, et. al(著), 萩野(訳), Linked Data
                                          の仕組み, 情報処理,vol.52,no.3, 2011
LODとしてのデータ公開
• LODをWeb上で公開する
 – 既存データ・新規データをRDF形式で作成する
 – SPARQLエンドポイントまたはRDFダンプを公開する
• LODを閲覧・検索する
 – ノードのURIに関してHTTPで問い合わせする
 – SPARQLエンドポイントを利用してデータを検索する
• 他のLODへRDFでリンクする
 – LODクラウドとつながって,たどることが可能に
 – sameAsにより同一のモノを指すURIを結びつける
• 公開情報をリポジトリサイトに登録する
 – CKANに登録すると,LODクラウドにデータ公開者ノードが
   作成される
LODの到達度                      “Raw data now!”
                                                             by Tim Berners-Lee


      形式に関係なく,オープンライセンスで公開する
             ★
      例:表データの画像
   ★★ コンピュータで処理可能な構造化データで公開する
      例:Excelデータ
  ★★★ オープンなデータ形式で公開する
      例:CSVデータ
 ★★★★ URIを利用してモノに名前を付ける
      例:RDFデータ
★★★★★ 他のデータへリンクする


http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/
LODの特徴
•   だれでもWeb上でデータを公開できる
•   語彙を自由に選んでデータを表現できる
•   だれでもデータに情報を付加できる
•   データの選択や加工の自由度が高い
• お互いにデータを公開し,共有することで,こ
  れらの利便性が高まる
参考文献
• TED2009 Tim Berners-Lee on the next Web
  http://www.ted.com/talks/lang/jpn/tim_bern
  ers_lee_on_the_next_web.html
• TED2010 Tim Berners-Lee:The year open data
  went worldwide
  http://www.ted.com/talks/lang/jpn/tim_bern
  ers_lee_the_year_open_data_went_worldwid
  e.html
参考文献
• Linked Data: Evolving the Web into a Global Data
  Space, Chrisitian Bizer and Tom Heath, 2011
  http://linkeddatabook.com/editions/1.0/
• リンクするデータ(Linked Data)~広がり始めた
  データのクラウド~,情報処理学会誌,vol.52,
  no.3,2011年.
  http://www.bookpark.ne.jp/cm/ipsj/mokuji.asp?
  category1=Magazine&vol=52&no=3
• セマンティックHTML/XHTML,神崎正英,毎日コ
  ミュニケーションズ,2009年.

Linked Open Dataとは

  • 1.
  • 2.
    Linking Open Data運動 •多くの人々がオープンにしたデータ(Open Data)を,皆でつなげて(Linkして),大きな価値 を生み出していく • Webを発明したTim Berners-Lee氏が提唱し, 世界で広まっている • データの「囲い込み」から「共有」へ
  • 3.
    Linked Open Data(LOD)とは •Web技術を利用して,オープンなデータ(Open Data) を公開し,つなげる(Linkする)仕組み • Web空間を巨大なデータベースとして,問い合わせ や利用が可能 公開 問い合わせ データ データ データ Web空間 利用
  • 4.
    LODクラウド LODとして利用可能なデータセット間のリンク関係を図示 2007/5/1 2007/11/7 2008/3/31 2009/3/27 2010/9/22 http://richard.cyganiak.de/2007/10/lod/
  • 5.
    LODクラウド ユーザ生成コンテンツ メディア 政府・自治体 図書館・出版 クロスドメイン 地理情報 ライフサイエンス 2010/9/22 http://richard.cyganiak.de/2007/10/lod/
  • 6.
    従来のWeb • 文書のWeb:文書ファイル(HTML)+リンク • 各文書の所在をURIで表す •人間が読むことを想定 • 文書群に対してキーワード検索し,必要な情報を取 得する リンク HTML HTML HTML リンク HTML
  • 7.
    従来のWeb ・各Webサイトが持っている データベースどうしはつな がっていない ・同じ書籍に関するデータで あるかどうかを計算機に判 定させるには,ひと手間必要 HTML HTML HTML HTML 出版社 書店 図書館 クチコミ データベース データベース データベース データベース
  • 8.
    LODによるデータのWeb • データのWeb:データ(RDF)+リンク • 各データの所在をURIで表す • 計算機が読むことを想定 • データ群に対してSQLライクな条件式で検索し,必要 な情報を得る RDFデータ RDFデータ RDFデータ
  • 9.
    Linked Open Data Web空間 price 2,940円 セマンティックWeb入門 author publisher オーム社 author データ自体をWeb上 斎藤 信男 萩野達也 に公開し,共有する. 個々のデータがIDを 持っていて一意に識 RDF 別できる RDF RDF RDF 出版社 書店 図書館 クチコミ データベース データベース データベース データベース
  • 10.
    LODの基本的な仕組み • モノにURIで名前を付ける – URIはグローバル – 同じURIは同じモノを表現 • リンクもURI – 関係性を表す語彙をURIで区別 • 省略表記 – 名前空間の接頭辞を利用 – http://dbpedia.org/resource/Japan ⇒ depedia:Japan dbpedia-owl:capital dbpedia:Japan dbpedia:Tokyo
  • 11.
    LODの基本的な仕組み dbpedia-owl:capital dbpedia:Japan dbpedia:Tokyo dbpedia-owl:leaderName dbpedia:Tokyo dbpedia:Shintarō_Ishihara URIが同じノードで2つのグラフを結合 dbpedia-owl:capital dbpedia:Japan dbpedia:Tokyo dbpedia-owl:leaderName dbpedia:Shintarō_Ishihara
  • 12.
    LODの基本的な仕組み • どのような語彙を選ぶかはデータ作成者の自由 • 共通で使用できる語彙の整備が進みつつある •分野,ドメインを越えてノードどうしをリンクすること で, データがLODクラウドとつながっていく dbpedia-owl:capital dbpedia:Japan dbpedia:Tokyo dbpedia-owl:leaderName owl:sameAs dbpedia:Shintarō_Ishihara http://data.nytimes.com/59436095099277148161
  • 13.
    LODの利用と公開 LODクラウド (Web空間) LOD利用 LOD公開 アプリケーション SPARQL エンドボイント RDFダンプ 検索エンジン LOD公開ツール ユーザインタフェース RDF などへの出力 RDFストア ファイル RDFストア 既存データ (RDB,CSVなど) C. Bizer, et. al(著), 萩野(訳), Linked Data の仕組み, 情報処理,vol.52,no.3, 2011
  • 14.
    LODとしてのデータ公開 • LODをWeb上で公開する –既存データ・新規データをRDF形式で作成する – SPARQLエンドポイントまたはRDFダンプを公開する • LODを閲覧・検索する – ノードのURIに関してHTTPで問い合わせする – SPARQLエンドポイントを利用してデータを検索する • 他のLODへRDFでリンクする – LODクラウドとつながって,たどることが可能に – sameAsにより同一のモノを指すURIを結びつける • 公開情報をリポジトリサイトに登録する – CKANに登録すると,LODクラウドにデータ公開者ノードが 作成される
  • 15.
    LODの到達度 “Raw data now!” by Tim Berners-Lee 形式に関係なく,オープンライセンスで公開する ★ 例:表データの画像 ★★ コンピュータで処理可能な構造化データで公開する 例:Excelデータ ★★★ オープンなデータ形式で公開する 例:CSVデータ ★★★★ URIを利用してモノに名前を付ける 例:RDFデータ ★★★★★ 他のデータへリンクする http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/
  • 16.
    LODの特徴 • だれでもWeb上でデータを公開できる • 語彙を自由に選んでデータを表現できる • だれでもデータに情報を付加できる • データの選択や加工の自由度が高い • お互いにデータを公開し,共有することで,こ れらの利便性が高まる
  • 17.
    参考文献 • TED2009 TimBerners-Lee on the next Web http://www.ted.com/talks/lang/jpn/tim_bern ers_lee_on_the_next_web.html • TED2010 Tim Berners-Lee:The year open data went worldwide http://www.ted.com/talks/lang/jpn/tim_bern ers_lee_the_year_open_data_went_worldwid e.html
  • 18.
    参考文献 • Linked Data:Evolving the Web into a Global Data Space, Chrisitian Bizer and Tom Heath, 2011 http://linkeddatabook.com/editions/1.0/ • リンクするデータ(Linked Data)~広がり始めた データのクラウド~,情報処理学会誌,vol.52, no.3,2011年. http://www.bookpark.ne.jp/cm/ipsj/mokuji.asp? category1=Magazine&vol=52&no=3 • セマンティックHTML/XHTML,神崎正英,毎日コ ミュニケーションズ,2009年.