レビュー

『Linked Data: Webをグローバ
ルなデータ空間にする仕組み』

小村 愛美(神戸大学)
• 自己紹介
  神戸大学附属図書館 所属
• 業務経験:サービス担当
      リポジトリ・デジタルアーカイブ担当
・目録経験:なし
・コーディング?プログラミング??
・LODの理解: ・ ・ ・
技術的な解説はできない
・勉強中。LOD...
本日のお話
1. 勉強会紹介
2. 『Linked Data: Webをグローバルな
データ空間にする仕組み』 紹介
    休憩
3. Linked Dataに関する + α
4. 質疑・ディスカッション
勉強会『Linked Data』輪読
• 2013年7月∼ 月1回ペース(全6回)
• 2∼3ページずつ輪読
• 開催記録:
情報組織化研究グループ勉強会記録(2013年度)
http://josoken.digick.jp/study/
20...
『Linked Data』 紹介
『Linked Data: Webをグローバルなデータ空間にす
る仕組み』 近代科学社,2013.1
!

原書:
『Linked Data: Evolving the Web into a Global Da...
『Linked Data』 紹介
• 1章 はじめに
• 2章 Linked Dataの基本原則
• 3章 データのWeb
• 4章 つながるデータをデザインしよう
• 5章 Linked Data公開のレシピ
• 6章 Linked Data...
1章 はじめに
➢ データの氾濫:Web企業 マスメディア 
         公的機関 研究団体etc. の
         データ公開・共有
                

 データの大洪水

    第三者のビジネス   データへの...
1章 はじめに
➢よりよいデータモデル:
 RDF(Resource Description Framework)
 ・異なるデータ源にあるデータ同士を
リンク可能
 ・データとデータの関係性を記述できる
2章 Linked Dataの基本原則
1. あらゆる事物にURIを付与すること。
2. 誰でも事物の内容が確認できるように、URIは
HTTP経由で参照できること。
3. URIを参照した時は、標準の技術(RDFやSPARQL等)
を使用して...
2章 Linked Dataの基本原則
➢Webの仕組みを構成する標準
  URI・HTTP・HTML・ハイパーリンク
➢Linked Dataは、Webの構成をデータ共有に
 適用したもの。
 Webと異なるもの/Webに存在しなかった
 も...
2章 Linked Dataの基本原則
原則1. あらゆる事物にURIを付与すること。
➢  記述するデータ・事物・概念などをURIで
同定
!
原則2. 誰でも事物の内容が確認できるように、  

   URIはHTTP経由で参照できること。...
2章 Linked Dataの基本原則
原則3. URIを参照した時は、標準の技術(RDF
やSPARQL等)を使用して関係する有用
な情報を利用できるようにすること。
!

➢構造化データの公開:RDFの使用を推奨
2章 Linked Dataの基本原則
原則3.
➢RDFのシリアル化形式:
・RDF/XML
・RDFa
・Turtle
・N-Triples
・RDF/JSON
cf. DBpediaリソース“Raw Data”(各形式のサンプル)
2章 Linked Dataの基本原則
原則4. より多くの事物を発見できるように他の
URIへのリンクを含めること。
➢他のデータ源へのリンクを含める
  =データ源同士をつなぐ
➢リンクの種類
 1. 関係リンク
 2. 同一性リンク
 3...
2章 Linked Dataの基本原則
➢ Linked Data 公開の段階

☆4+
他のデータ源とリンク

汎用的な形式
機械可読の構造化形
式
オープンライセンス
(データ形式不問)

☆3+
RDFを使用
3章 データのWeb
➢データのWeb   文書のWeb(従来のWeb)
➢「何十億ものRDF文から成る巨大でグローバルな
グラフ」
➢データのトピック:
地理情報・人物・企業・出版物・画像・音楽・
映像・化学物質・薬物・統計・コミュニティ・・...
3章 データのWeb

The Linking Open Data cloud diagram(http://lod-cloud.net/) 2011年9月時点
4章 つながるデータをデザインしよう
➢URIを発行
➢URIの例
・事物を表現する=3つのURIが必要(2.3.1項)
1. 事物そのものを表現するURI
2. 事物をHTMLによって記述した文書のURI
3. 事物をRDF/XMLによって記...
4章 つながるデータをデザインしよう
➢DBpediaの例
1.http://dbpedia.org/resource/Wildlife_photography

2.http://dbpedia.org/page/Wildlife_photo...
DBpedia:Wikipediaの情報をLiked Dataへ変換

DBpedia Japanese
Wikipedia → DBpedia
infobox
DBpedia Japanese
DBpedia Japanese(RDF/XML)
4章 つながるデータをデザインしよう
➢データセットの記述
 製作者・更新状況・適用ライセンス
 ・データの利用者にとって重要
➢ライセンス・権利放棄の重要性
 ・ライセンスが明示されていない
  = データの再利用を妨げる
 ・Web上の一般...
4章 つながるデータをデザインしよう
• データ記述の語彙
RDFS:基本。RDFSだけで十分なことも多い
OWL: sameAs 重要。2つのURIが同じ事物
を指していることを記述する時に使用。
cf. 2.5.2節(p.24)

"25
4章 つながるデータをデザインしよう
• 既存用語・語彙の再利用
• 既存用語を使う=データが使われやすくな
る
• 推奨語彙:
DCMI:Dublin Core Metadata Initiative
Metadata Terms Vocab...
5章 Linked Data公開のレシピ
➢公開パターン
・リレーショナルデータベースから
ラッパを用いてRDF変換
代表的なラッパ:D2R Server
・静的な構造化データから
CSV, Excel, XML etc.
RDF化ツール 参照...
ConverterToRdf
RDFizers
5章 Linked Data公開のレシピ
• Linked Data公開時のチェック事項
• 他のデータセットにリンクしているか?
• 一次情報源データと由来のメタデータを提
供しているか?
• 普及している既存の語彙から用語を採って
いるか?...
6章 Linked Dataを利用する
➢既存のアプリケーション
•汎用的アプリケーション
• Linked Dataブラウザ
Disco Hyperdata Browser, Tabulator,
Marbles
• Linked Data検...
6章 Linked Dataを利用する
➢既存のアプリケーション
•分野に特化したアプリケーション
•政府データ関連のアプリケーションリスト
:data.gov, data.gov.uk 

 

サイト上にリスト
• DBpedia Mobi...
data.gov

"33
data.gov.uk

"34
➢読み終えて…
•Linked Dataの概念はわかった
「データをより使いやすい形で公開・共
有する方法論」
•技術に関する部分はまだ難しい
•実際にデータを触りながら読んだ方が理解
が進む図書では
➢勉強会:今後どう進める?
RDA、FRBR関連の文献輪読
BIBFRAME関係の文献輪読
文献リストのLOD化
などのアイデア
*会場・作業環境が課題?
➢図書館のデータ:高度に構造化(3.2.5)
Linked Dataと親和性は高い
•VIAF (Virtual International Authority File)
•RDA (Resource Description and Acce...
VIAF

"38
Web NDL Authorities

"39
Linked Dataに関する + α
➢第2回 Linked Open Data(LOD)とオントロジー勉強会
  2013.8.5 (http://kokucheese.com/event/index/
101729/)
➢情報組織化研究グ...
Linked Dataに関する + α
• Linked Dataを使い始めるにあたって
公開ずみのデータを眺める
ex.) DBpedia Japanese, 日本語Wikipediaオントロ
ジー研究ページ,CKAN日本語
• Linked...
DBpedia Japanese(RDF/XML)
"45
"46
"47
"48
"49
"50
"51
Linked Dataに関する + α
• 関連の研究会・イベントは増えている
ex.)LODチャレンジ
 インターナショナルオープンデータデイ
• 公的機関情報のオープンデータ化の加速
cf.) G8オープンデータ憲章 (2013.6)
  ...
"53
"54
Linked Dataに関する + α
• 研究会参加で感じること
間口を広げ、より普及させよう
ex.) 公開・活用支援サイト
• 初期の関係者から、一般へと拡大
素人でも入っていきやすくなっている

"55
ご清聴ありがとうございました

"56
Upcoming SlideShare
Loading in …5
×

140201josoken linkeddata

2,004 views

Published on

Published in: Technology

140201josoken linkeddata

  1. 1. レビュー
 『Linked Data: Webをグローバ ルなデータ空間にする仕組み』 小村 愛美(神戸大学)
  2. 2. • 自己紹介   神戸大学附属図書館 所属 • 業務経験:サービス担当       リポジトリ・デジタルアーカイブ担当 ・目録経験:なし ・コーディング?プログラミング?? ・LODの理解: ・ ・ ・ 技術的な解説はできない ・勉強中。LOD関連の情報紹介、疑問の共有など できれば ・会場からも補足などいただきたい
  3. 3. 本日のお話 1. 勉強会紹介 2. 『Linked Data: Webをグローバルな データ空間にする仕組み』 紹介     休憩 3. Linked Dataに関する + α 4. 質疑・ディスカッション
  4. 4. 勉強会『Linked Data』輪読 • 2013年7月∼ 月1回ペース(全6回) • 2∼3ページずつ輪読 • 開催記録: 情報組織化研究グループ勉強会記録(2013年度) http://josoken.digick.jp/study/ 2013/2013.html#06
  5. 5. 『Linked Data』 紹介 『Linked Data: Webをグローバルなデータ空間にす る仕組み』 近代科学社,2013.1 ! 原書: 『Linked Data: Evolving the Web into a Global Data Space』 2011.1 著者: Tom Heath (Head of Research / The Open Data Institute / UK) Christian Bizer (Freie Universität Berlin/ Germany)
  6. 6. 『Linked Data』 紹介 • 1章 はじめに • 2章 Linked Dataの基本原則 • 3章 データのWeb • 4章 つながるデータをデザインしよう • 5章 Linked Data公開のレシピ • 6章 Linked Dataを利用する • 7章 まとめと展望 ! ➢架空企業“BIG LYNX社”をシナリオにRDF記述例 ➢実際の公開データセットetc.紹介 ➢図書館のデータへの言及も(p.38 3.2.5)
  7. 7. 1章 はじめに ➢ データの氾濫:Web企業 マスメディア           公的機関 研究団体etc. の          データ公開・共有                   データの大洪水     第三者のビジネス   データへの需要 ➢ Linked Dataの原理    構造化データ:      定型的な構造=簡単に再利用 公開方法(既存):      microformats, Web API(XML, JSON)        それぞれに制約
  8. 8. 1章 はじめに ➢よりよいデータモデル:  RDF(Resource Description Framework)  ・異なるデータ源にあるデータ同士を リンク可能  ・データとデータの関係性を記述できる
  9. 9. 2章 Linked Dataの基本原則 1. あらゆる事物にURIを付与すること。 2. 誰でも事物の内容が確認できるように、URIは HTTP経由で参照できること。 3. URIを参照した時は、標準の技術(RDFやSPARQL等) を使用して関係する有用な情報を利用できるよう にすること。 4. より多くの事物を発見できるように他のURIへのリ ンクを含めること。
  10. 10. 2章 Linked Dataの基本原則 ➢Webの仕組みを構成する標準   URI・HTTP・HTML・ハイパーリンク ➢Linked Dataは、Webの構成をデータ共有に  適用したもの。  Webと異なるもの/Webに存在しなかった  ものを新たに追加するものではない。
  11. 11. 2章 Linked Dataの基本原則 原則1. あらゆる事物にURIを付与すること。 ➢  記述するデータ・事物・概念などをURIで 同定 ! 原則2. 誰でも事物の内容が確認できるように、      URIはHTTP経由で参照できること。 ➢ HTTP:WebでHTML文書の同定に使用。   Linked Dataでは記述する対象の同定に使用。   
  12. 12. 2章 Linked Dataの基本原則 原則3. URIを参照した時は、標準の技術(RDF やSPARQL等)を使用して関係する有用 な情報を利用できるようにすること。 ! ➢構造化データの公開:RDFの使用を推奨
  13. 13. 2章 Linked Dataの基本原則 原則3. ➢RDFのシリアル化形式: ・RDF/XML ・RDFa ・Turtle ・N-Triples ・RDF/JSON cf. DBpediaリソース“Raw Data”(各形式のサンプル)
  14. 14. 2章 Linked Dataの基本原則 原則4. より多くの事物を発見できるように他の URIへのリンクを含めること。 ➢他のデータ源へのリンクを含める   =データ源同士をつなぐ ➢リンクの種類  1. 関係リンク  2. 同一性リンク  3. 語彙リンク
  15. 15. 2章 Linked Dataの基本原則 ➢ Linked Data 公開の段階 ☆4+ 他のデータ源とリンク 汎用的な形式 機械可読の構造化形 式 オープンライセンス (データ形式不問) ☆3+ RDFを使用
  16. 16. 3章 データのWeb ➢データのWeb   文書のWeb(従来のWeb) ➢「何十億ものRDF文から成る巨大でグローバルな グラフ」 ➢データのトピック: 地理情報・人物・企業・出版物・画像・音楽・ 映像・化学物質・薬物・統計・コミュニティ・・・ → あらゆる分野
  17. 17. 3章 データのWeb The Linking Open Data cloud diagram(http://lod-cloud.net/) 2011年9月時点
  18. 18. 4章 つながるデータをデザインしよう ➢URIを発行 ➢URIの例 ・事物を表現する=3つのURIが必要(2.3.1項) 1. 事物そのものを表現するURI 2. 事物をHTMLによって記述した文書のURI 3. 事物をRDF/XMLによって記述したデータの URI
  19. 19. 4章 つながるデータをデザインしよう ➢DBpediaの例 1.http://dbpedia.org/resource/Wildlife_photography 2.http://dbpedia.org/page/Wildlife_photography 3.http://dbpedia.org/data/Wildlife_photography   ※RDF形式とHTML形式の区別がつきにくい ➢拡張子を付与するパターン(一般的) 1. http://biglinx.co.uk/people/dave-smith 2. http://biglinx.co.uk/people/dave-smith.html 3. http://biglinx.co.uk/people/dave-smith.rdf
  20. 20. DBpedia:Wikipediaの情報をLiked Dataへ変換 DBpedia Japanese
  21. 21. Wikipedia → DBpedia infobox
  22. 22. DBpedia Japanese
  23. 23. DBpedia Japanese(RDF/XML)
  24. 24. 4章 つながるデータをデザインしよう ➢データセットの記述  製作者・更新状況・適用ライセンス  ・データの利用者にとって重要 ➢ライセンス・権利放棄の重要性  ・ライセンスが明示されていない   = データの再利用を妨げる  ・Web上の一般的なライセンス   = クリエイティブ・コモンズ・ライセンス
  25. 25. 4章 つながるデータをデザインしよう • データ記述の語彙 RDFS:基本。RDFSだけで十分なことも多い OWL: sameAs 重要。2つのURIが同じ事物 を指していることを記述する時に使用。 cf. 2.5.2節(p.24) "25
  26. 26. 4章 つながるデータをデザインしよう • 既存用語・語彙の再利用 • 既存用語を使う=データが使われやすくな る • 推奨語彙: DCMI:Dublin Core Metadata Initiative Metadata Terms Vocabulary FOAF:Friend-of-a-friend Vocabulary etc. "26
  27. 27. 5章 Linked Data公開のレシピ ➢公開パターン ・リレーショナルデータベースから ラッパを用いてRDF変換 代表的なラッパ:D2R Server ・静的な構造化データから CSV, Excel, XML etc. RDF化ツール 参照ページ: ConverterToRdf, RDFizers
  28. 28. ConverterToRdf
  29. 29. RDFizers
  30. 30. 5章 Linked Data公開のレシピ • Linked Data公開時のチェック事項 • 他のデータセットにリンクしているか? • 一次情報源データと由来のメタデータを提 供しているか? • 普及している既存の語彙から用語を採って いるか? • データセットのメタデータを提供している か? "30
  31. 31. 6章 Linked Dataを利用する ➢既存のアプリケーション •汎用的アプリケーション • Linked Dataブラウザ Disco Hyperdata Browser, Tabulator, Marbles • Linked Data検索エンジン Sig.ma, Falcons, SWSE etc. Google, Yahoo! etc. – リッチスニペット
  32. 32. 6章 Linked Dataを利用する ➢既存のアプリケーション •分野に特化したアプリケーション •政府データ関連のアプリケーションリスト :data.gov, data.gov.uk    サイト上にリスト • DBpedia Mobile:スマートフォンのGPS情 報 × DBpediaの近隣情報
  33. 33. data.gov "33
  34. 34. data.gov.uk "34
  35. 35. ➢読み終えて… •Linked Dataの概念はわかった 「データをより使いやすい形で公開・共 有する方法論」 •技術に関する部分はまだ難しい •実際にデータを触りながら読んだ方が理解 が進む図書では
  36. 36. ➢勉強会:今後どう進める? RDA、FRBR関連の文献輪読 BIBFRAME関係の文献輪読 文献リストのLOD化 などのアイデア *会場・作業環境が課題?
  37. 37. ➢図書館のデータ:高度に構造化(3.2.5) Linked Dataと親和性は高い •VIAF (Virtual International Authority File) •RDA (Resource Description and Access) •国立国会図書館:Web NDL Authorities •大学図書館:「NII 総合目録データベースの データ公開に関するパブリックコメント募集」 http://www.nii.ac.jp/CAT-ILL/about/project/ od2013/
  38. 38. VIAF "38
  39. 39. Web NDL Authorities "39
  40. 40. Linked Dataに関する + α ➢第2回 Linked Open Data(LOD)とオントロジー勉強会   2013.8.5 (http://kokucheese.com/event/index/ 101729/) ➢情報組織化研究グループ月例研究会   「Linked Open Dataの基礎とこれからの情報活用」 2013.9.21 (http://josoken.digick.jp/meeting/ 2013/201309.html) ➢第2回Linked Open Dataハッカソン関西 in 大阪   2013.12.6 (http://peatix.com/event/23486)
  41. 41. Linked Dataに関する + α • Linked Dataを使い始めるにあたって 公開ずみのデータを眺める ex.) DBpedia Japanese, 日本語Wikipediaオントロ ジー研究ページ,CKAN日本語 • Linked Data公開・活用支援 • LinkData.org:データをアップ→オープンデータ化    アプリケーションの作成も "43 • OPEN Refine:数万件規模のデータをLinked Data化
  42. 42. DBpedia Japanese(RDF/XML)
  43. 43. "45
  44. 44. "46
  45. 45. "47
  46. 46. "48
  47. 47. "49
  48. 48. "50
  49. 49. "51
  50. 50. Linked Dataに関する + α • 関連の研究会・イベントは増えている ex.)LODチャレンジ  インターナショナルオープンデータデイ • 公的機関情報のオープンデータ化の加速 cf.) G8オープンデータ憲章 (2013.6)   data.go.jp • 図書館データのオープン化:大きくはこれら の流れとつながる "52
  51. 51. "53
  52. 52. "54
  53. 53. Linked Dataに関する + α • 研究会参加で感じること 間口を広げ、より普及させよう ex.) 公開・活用支援サイト • 初期の関係者から、一般へと拡大 素人でも入っていきやすくなっている "55
  54. 54. ご清聴ありがとうございました "56

×