Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

140201josoken linkeddata

2,047 views

Published on

Published in: Technology

140201josoken linkeddata

  1. 1. レビュー
 『Linked Data: Webをグローバ ルなデータ空間にする仕組み』 小村 愛美(神戸大学)
  2. 2. • 自己紹介   神戸大学附属図書館 所属 • 業務経験:サービス担当       リポジトリ・デジタルアーカイブ担当 ・目録経験:なし ・コーディング?プログラミング?? ・LODの理解: ・ ・ ・ 技術的な解説はできない ・勉強中。LOD関連の情報紹介、疑問の共有など できれば ・会場からも補足などいただきたい
  3. 3. 本日のお話 1. 勉強会紹介 2. 『Linked Data: Webをグローバルな データ空間にする仕組み』 紹介     休憩 3. Linked Dataに関する + α 4. 質疑・ディスカッション
  4. 4. 勉強会『Linked Data』輪読 • 2013年7月∼ 月1回ペース(全6回) • 2∼3ページずつ輪読 • 開催記録: 情報組織化研究グループ勉強会記録(2013年度) http://josoken.digick.jp/study/ 2013/2013.html#06
  5. 5. 『Linked Data』 紹介 『Linked Data: Webをグローバルなデータ空間にす る仕組み』 近代科学社,2013.1 ! 原書: 『Linked Data: Evolving the Web into a Global Data Space』 2011.1 著者: Tom Heath (Head of Research / The Open Data Institute / UK) Christian Bizer (Freie Universität Berlin/ Germany)
  6. 6. 『Linked Data』 紹介 • 1章 はじめに • 2章 Linked Dataの基本原則 • 3章 データのWeb • 4章 つながるデータをデザインしよう • 5章 Linked Data公開のレシピ • 6章 Linked Dataを利用する • 7章 まとめと展望 ! ➢架空企業“BIG LYNX社”をシナリオにRDF記述例 ➢実際の公開データセットetc.紹介 ➢図書館のデータへの言及も(p.38 3.2.5)
  7. 7. 1章 はじめに ➢ データの氾濫:Web企業 マスメディア           公的機関 研究団体etc. の          データ公開・共有                   データの大洪水     第三者のビジネス   データへの需要 ➢ Linked Dataの原理    構造化データ:      定型的な構造=簡単に再利用 公開方法(既存):      microformats, Web API(XML, JSON)        それぞれに制約
  8. 8. 1章 はじめに ➢よりよいデータモデル:  RDF(Resource Description Framework)  ・異なるデータ源にあるデータ同士を リンク可能  ・データとデータの関係性を記述できる
  9. 9. 2章 Linked Dataの基本原則 1. あらゆる事物にURIを付与すること。 2. 誰でも事物の内容が確認できるように、URIは HTTP経由で参照できること。 3. URIを参照した時は、標準の技術(RDFやSPARQL等) を使用して関係する有用な情報を利用できるよう にすること。 4. より多くの事物を発見できるように他のURIへのリ ンクを含めること。
  10. 10. 2章 Linked Dataの基本原則 ➢Webの仕組みを構成する標準   URI・HTTP・HTML・ハイパーリンク ➢Linked Dataは、Webの構成をデータ共有に  適用したもの。  Webと異なるもの/Webに存在しなかった  ものを新たに追加するものではない。
  11. 11. 2章 Linked Dataの基本原則 原則1. あらゆる事物にURIを付与すること。 ➢  記述するデータ・事物・概念などをURIで 同定 ! 原則2. 誰でも事物の内容が確認できるように、      URIはHTTP経由で参照できること。 ➢ HTTP:WebでHTML文書の同定に使用。   Linked Dataでは記述する対象の同定に使用。   
  12. 12. 2章 Linked Dataの基本原則 原則3. URIを参照した時は、標準の技術(RDF やSPARQL等)を使用して関係する有用 な情報を利用できるようにすること。 ! ➢構造化データの公開:RDFの使用を推奨
  13. 13. 2章 Linked Dataの基本原則 原則3. ➢RDFのシリアル化形式: ・RDF/XML ・RDFa ・Turtle ・N-Triples ・RDF/JSON cf. DBpediaリソース“Raw Data”(各形式のサンプル)
  14. 14. 2章 Linked Dataの基本原則 原則4. より多くの事物を発見できるように他の URIへのリンクを含めること。 ➢他のデータ源へのリンクを含める   =データ源同士をつなぐ ➢リンクの種類  1. 関係リンク  2. 同一性リンク  3. 語彙リンク
  15. 15. 2章 Linked Dataの基本原則 ➢ Linked Data 公開の段階 ☆4+ 他のデータ源とリンク 汎用的な形式 機械可読の構造化形 式 オープンライセンス (データ形式不問) ☆3+ RDFを使用
  16. 16. 3章 データのWeb ➢データのWeb   文書のWeb(従来のWeb) ➢「何十億ものRDF文から成る巨大でグローバルな グラフ」 ➢データのトピック: 地理情報・人物・企業・出版物・画像・音楽・ 映像・化学物質・薬物・統計・コミュニティ・・・ → あらゆる分野
  17. 17. 3章 データのWeb The Linking Open Data cloud diagram(http://lod-cloud.net/) 2011年9月時点
  18. 18. 4章 つながるデータをデザインしよう ➢URIを発行 ➢URIの例 ・事物を表現する=3つのURIが必要(2.3.1項) 1. 事物そのものを表現するURI 2. 事物をHTMLによって記述した文書のURI 3. 事物をRDF/XMLによって記述したデータの URI
  19. 19. 4章 つながるデータをデザインしよう ➢DBpediaの例 1.http://dbpedia.org/resource/Wildlife_photography 2.http://dbpedia.org/page/Wildlife_photography 3.http://dbpedia.org/data/Wildlife_photography   ※RDF形式とHTML形式の区別がつきにくい ➢拡張子を付与するパターン(一般的) 1. http://biglinx.co.uk/people/dave-smith 2. http://biglinx.co.uk/people/dave-smith.html 3. http://biglinx.co.uk/people/dave-smith.rdf
  20. 20. DBpedia:Wikipediaの情報をLiked Dataへ変換 DBpedia Japanese
  21. 21. Wikipedia → DBpedia infobox
  22. 22. DBpedia Japanese
  23. 23. DBpedia Japanese(RDF/XML)
  24. 24. 4章 つながるデータをデザインしよう ➢データセットの記述  製作者・更新状況・適用ライセンス  ・データの利用者にとって重要 ➢ライセンス・権利放棄の重要性  ・ライセンスが明示されていない   = データの再利用を妨げる  ・Web上の一般的なライセンス   = クリエイティブ・コモンズ・ライセンス
  25. 25. 4章 つながるデータをデザインしよう • データ記述の語彙 RDFS:基本。RDFSだけで十分なことも多い OWL: sameAs 重要。2つのURIが同じ事物 を指していることを記述する時に使用。 cf. 2.5.2節(p.24) "25
  26. 26. 4章 つながるデータをデザインしよう • 既存用語・語彙の再利用 • 既存用語を使う=データが使われやすくな る • 推奨語彙: DCMI:Dublin Core Metadata Initiative Metadata Terms Vocabulary FOAF:Friend-of-a-friend Vocabulary etc. "26
  27. 27. 5章 Linked Data公開のレシピ ➢公開パターン ・リレーショナルデータベースから ラッパを用いてRDF変換 代表的なラッパ:D2R Server ・静的な構造化データから CSV, Excel, XML etc. RDF化ツール 参照ページ: ConverterToRdf, RDFizers
  28. 28. ConverterToRdf
  29. 29. RDFizers
  30. 30. 5章 Linked Data公開のレシピ • Linked Data公開時のチェック事項 • 他のデータセットにリンクしているか? • 一次情報源データと由来のメタデータを提 供しているか? • 普及している既存の語彙から用語を採って いるか? • データセットのメタデータを提供している か? "30
  31. 31. 6章 Linked Dataを利用する ➢既存のアプリケーション •汎用的アプリケーション • Linked Dataブラウザ Disco Hyperdata Browser, Tabulator, Marbles • Linked Data検索エンジン Sig.ma, Falcons, SWSE etc. Google, Yahoo! etc. – リッチスニペット
  32. 32. 6章 Linked Dataを利用する ➢既存のアプリケーション •分野に特化したアプリケーション •政府データ関連のアプリケーションリスト :data.gov, data.gov.uk    サイト上にリスト • DBpedia Mobile:スマートフォンのGPS情 報 × DBpediaの近隣情報
  33. 33. data.gov "33
  34. 34. data.gov.uk "34
  35. 35. ➢読み終えて… •Linked Dataの概念はわかった 「データをより使いやすい形で公開・共 有する方法論」 •技術に関する部分はまだ難しい •実際にデータを触りながら読んだ方が理解 が進む図書では
  36. 36. ➢勉強会:今後どう進める? RDA、FRBR関連の文献輪読 BIBFRAME関係の文献輪読 文献リストのLOD化 などのアイデア *会場・作業環境が課題?
  37. 37. ➢図書館のデータ:高度に構造化(3.2.5) Linked Dataと親和性は高い •VIAF (Virtual International Authority File) •RDA (Resource Description and Access) •国立国会図書館:Web NDL Authorities •大学図書館:「NII 総合目録データベースの データ公開に関するパブリックコメント募集」 http://www.nii.ac.jp/CAT-ILL/about/project/ od2013/
  38. 38. VIAF "38
  39. 39. Web NDL Authorities "39
  40. 40. Linked Dataに関する + α ➢第2回 Linked Open Data(LOD)とオントロジー勉強会   2013.8.5 (http://kokucheese.com/event/index/ 101729/) ➢情報組織化研究グループ月例研究会   「Linked Open Dataの基礎とこれからの情報活用」 2013.9.21 (http://josoken.digick.jp/meeting/ 2013/201309.html) ➢第2回Linked Open Dataハッカソン関西 in 大阪   2013.12.6 (http://peatix.com/event/23486)
  41. 41. Linked Dataに関する + α • Linked Dataを使い始めるにあたって 公開ずみのデータを眺める ex.) DBpedia Japanese, 日本語Wikipediaオントロ ジー研究ページ,CKAN日本語 • Linked Data公開・活用支援 • LinkData.org:データをアップ→オープンデータ化    アプリケーションの作成も "43 • OPEN Refine:数万件規模のデータをLinked Data化
  42. 42. DBpedia Japanese(RDF/XML)
  43. 43. "45
  44. 44. "46
  45. 45. "47
  46. 46. "48
  47. 47. "49
  48. 48. "50
  49. 49. "51
  50. 50. Linked Dataに関する + α • 関連の研究会・イベントは増えている ex.)LODチャレンジ  インターナショナルオープンデータデイ • 公的機関情報のオープンデータ化の加速 cf.) G8オープンデータ憲章 (2013.6)   data.go.jp • 図書館データのオープン化:大きくはこれら の流れとつながる "52
  51. 51. "53
  52. 52. "54
  53. 53. Linked Dataに関する + α • 研究会参加で感じること 間口を広げ、より普及させよう ex.) 公開・活用支援サイト • 初期の関係者から、一般へと拡大 素人でも入っていきやすくなっている "55
  54. 54. ご清聴ありがとうございました "56

×