Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Linked Open Dataの基礎と これからの情報活用

6,820 views

Published on

2013年9月21日
主催:日本図書館研究会 情報組織化グループ研究会
共催:情報知識学会関西部会、「書誌コントロール研究会」
(科学研究費基盤研究(C) 課題番号25330391 研究代表者:和中幹雄)

Published in: Education
  • Be the first to comment

Linked Open Dataの基礎と これからの情報活用

  1. 1. Linked Open Dataの基礎と これからの情報活用 嘉村哲郎 (東京藝術大学 芸術情報センター/総合芸術アーカイブセンター) 2013年9月21日 主催:日本図書館研究会 情報組織化グループ研究会 共催:情報知識学会関西部会、「書誌コントロール研究会」 (科学研究費基盤研究(C) 課題番号25330391 研究代表者:和中幹雄)
  2. 2. 1. Open Data概説 • オープンデータとは • オープンデータと行政 • オープンデータ政策と文化・芸術(EUを例に) • オープンデータの公開・共有 2. Linked Open Data • Linked Dataの基本原則 • RDFの特徴 • SPARQL EndpointとSPARQL クエリ 3. Linked Open Dataの利用事例
  3. 3. 1.Open Data 「オープンデータとは」
  4. 4. ウェブの発明者,ティム・バーナーズ=リー氏による呼びかけ 2009年,TEDにおけるプレゼンテーション 政府のデータ,科学研究のデータ,コミュニティのデータ・・・ 生のデータ(Raw Data)を今すぐWebに公開しよう!! 日本語字幕付き動画: http://goo.gl/xNQkp Raw Data Now A year of Open Data
  5. 5. オープン の解釈
  6. 6. オープンの定義 The Open Definition - http://opendefinition.org/ インターネット上のコンテンツやデータのオープンとは, それらを誰もが自由に利用,再配布,再利用できること “A piece of data or content is open if anyone is free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and/or share-alike.”
  7. 7. オープンの定義 The Open Definition - http://opendefinition.org/ インターネット上のコンテンツやデータのオープンとは, それらを誰もが自由に利用,再配布,再利用できること
  8. 8. オープンの定義 The Open Definition - http://opendefinition.org/ インターネット上のコンテンツやデータのオープンとは, それらを誰もが自由に利用,再配布,再利用できること 文化情報学術情報公共情報
  9. 9. Open Data オープンライセンスを適用したデータ オープンデータとは
  10. 10. 「オープンデータと行政」 Open Data & Open Government
  11. 11. Open Government • 政府・自治体等公的機関が保有するデータを公開する • 公開したデータを活用したサービスの提供,データを元 にした政策提言の創出 • 公的な機能をより多くの主体で分担して担い, コストの削減と経済の活性化を目指す
  12. 12. G8 - 2013によるオープンデータ憲章の合意 外務省オープンデータ憲章 http://www.mofa.go.jp/mofaj/gaiko/page23_000044.html 原則1:原則としてのオープンデータ • データによっては,公表出来ないという合理的な理由があることを認識しつつ,この憲章で示 されているように,政府のデータすべてが,原則として公表されるという期待を醸成する。 原則3:すべての者が利用できる • 幅広い用途のために,誰もが入手可能なオープンな形式でデータを公表する。 • 可能な限り多くのデータを公表する。 原則5:イノベーションのためのデータの公表 • オープンデータ・リテラシ−を高め,オープンデータに携わる人々を育成する。 • 将来世代のデータイノベーターの能力を強化する。
  13. 13. 原則2:質と量 • しっかりした一貫性のあるメタデータ(データに関する属性情報を説明するデータ)の使用。 • 最新の主要なメタデータの解説の最新化の公表及び更新。 • 十分に具体化されたデータの確保。 • データ使用者からの意見の聴取。 原則5:イノベーションのためのデータの公表 • 著作権を尊重しつつオープン・ライセンスを使用したデータの発出を支持する。 • データをまとめて機械判読できることを確保する。 • アプリケーション・プログラミング・インターフェースを使用してデータを公表する。 • データの革新的な使用方法を促進する。 オープンデータ憲章(技術的な別添より)
  14. 14. 各国政府のオープンガバメントポータル
  15. 15. ■カテゴリ数 50種類 教育,観光,ビジネス,経済,健康等 ■データセット数 97,536データセット ■データ形式:49種 ■モバイルアプリ: 137個 ■市民作成アプリ: 349個 「家庭の医学」のようなアプリ 米国の公営バスアプリ 米国の例 ナショナルギャラリー・ワシントン 議会図書館バーチャルツアー※数値情報は2013.9.9時点
  16. 16. Open Dataの特徴 政府・自治体・企業・コミュニティなど組織または個人が保有するデ ータを公開し,第三者が自由に利用できるようにすること •情報を公開 情報の存在を世の中に伝える •CSVやXMLなど再利用可能かつ機械処理できる形式の公開が望ましい •公開するデータはできるかぎりオープンライセンスを適用する
  17. 17. Open Government Dataの取組み(2013.4)
  18. 18. Open Government Dataの取組み(2013.9)
  19. 19. 経済産業省 2013.03
  20. 20. 福井県鯖江市 「公共施設情報「ご当地情報Q&A」
  21. 21. 「オープンデータ政策と文化・芸術」 EUを例に
  22. 22. 2003年に「公共セクターの情報の利活用に関する指令」制定(EU PSI指令2003/98/EC) “加盟国は、公的機関が保有する情報の再利用が可能な場合には、商業・非商業 の目的を問わずこれらの情報が再利用可能であることを確保しなければならない” 国際大学GLOCOM 公開シンポジウム「オープンデータが拓く未来」2012/5/31,「欧州におけるオープンデータ政策の現状」より引用. 1.「公開を基本」とすること 2.「再利用を可能」とすること,その場合は「商業・非商業の目的を問わない」こと 3. 但し、"国家機密保持等の観点から機微性の高い情報の他、「公共放送局や研究教育機" "MLA」の保有する情報は当面の間対象外" 欧州のオープンデータ政策 PSI(Public Sector Information)
  23. 23. 公的な「美術館・博物館・図書館・アーカイブズ施設」を含む 欧州のオープンデータ政策 2013年6月:「PSI指令」大規模改正(2013/37/EU) オープンデータ義務の対象を追加 •データ提供対価の原則無償化義務(限界費用) •データのマシンリーダビリティ確保義務 実質的に情報のOpen Data/Linked Open Dataでの公開 Europeana支援の措置 参考資料: 生貝直人 "EUにおけるオープンデータ政策とクリエイティブ・コモンズ・ライセンス "より作成
  24. 24. 関連の指令(2012年EU孤児作品指令) 「Orhan Works DirecGve、2012/28/EU」 対象:EU加盟国の公的な文化施設   (図書館・美術館・博物館・アーカイブズ・研究教育機関等) 内容: 1. 権利者不明の(写真作品を除く)孤児作品のデジタル化・Web公開ができる 2. 孤児作品と認定後、権利者が名乗り出るまでEU全域で同様に扱われる ただし、権利者不明であるという調査した記録を当局に提出する 加盟国は2014年10月までに国内法化義務 参考資料: 生貝直人 "EUにおけるオープンデータ政策とクリエイティブ・コモンズ・ライセンス "より作成
  25. 25. 「オープンデータの公開・共有」
  26. 26. データカタログサイト「CKAN」 •データを公開,存在をアピールしたいとき •誰でもデータを登録・利用(ダウンロード)できる •自前で公開している公開データベースのAPIもオープンデータの情報として登録可能 •データの形式やライセンスのタイプ,公開主体からデータを検索することができる
  27. 27. WikiPedia 編集ワークショップ • 内容 チームごとに地域の史跡や歴史的建造物等について現地調査および 文献調査し、実際にウィキペディア記事を書く • 目的 • 地域の観光資源に関する記事を充実 (オープンデータを自ら作る) • リテラシーの向上 • 特徴 文献調査等は図書館で実施。  → 図書館等文化施設との連携
  28. 28. オープンデータ街歩きワークショップ横浜 • 内容 歴史データや観光スポットデータを使用した 地図アプリやARアプリを用いてグループに別れて 街歩きを行った。 • 目的 身近なフィールドでオープンデータに触れる機会を提供し、その有用性を感じてもら う。そして、オープンデータの新たな応用例を発想してもらう。 • 特徴 歴史資料を携えながらの街歩きは 学びや気づきが多く得られる
  29. 29. データ共有5つのステップ どんな形式でもよいのでデータをオープンライセンスで公開 例:PDF, jpg 構造化された形式で公開 例:画像化された表よりも,エクセル表等 機械処理できる汎用的な形式で公開 例:csv, tsv, json http://5stardata.info/ja/ ★3までは誰もが 容易にできます
  30. 30. 情報を使う 情報を探す 情報を集める 情報を整える 使う側にとって効率的なデータ環境を提供する ★ ★ ★ ★ ★ 負担を減らすために… ★4 ★5でデータ公開をめざす意義
  31. 31. 2.Linked Open Data
  32. 32. Open Data オープンライセンスのデータ Linked Data 標準化されたデータのWeb Linked Open Data オープンライセンスを適用した 標準化されたデータ
  33. 33. Linked Data 標準化されたデータのWeb
  34. 34. Webの標準化規格・技術を使用して データを公開・共有するための方法論
  35. 35. Webの原則 1.IRIをHTML文書の識別子に使う  http://josoken.digick.jp/index.html ※IRI(国際化資源(リソース)識別子):Internationalized Resource Identifier)
  36. 36. Webの原則 1.IRIをHTML文書の識別子に使う  http://josoken.digick.jp/index.html 2.IRIの利用にはHTTPの技術を用いる ↑ ※IRI(国際化資源(リソース)識別子):Internationalized Resource Identifier)
  37. 37. Webの原則 1.IRIをHTML文書の識別子に使う  http://josoken.digick.jp/index.html 2.IRIの利用にはHTTPの技術を用いる ↑ 3.IRIにアクセスするとHTML文書が見られる(Webブラウザを使用した場合) ※IRI(国際化資源(リソース)識別子):Internationalized Resource Identifier)
  38. 38. Webの原則 1.IRIをHTML文書の識別子に使う  http://josoken.digick.jp/index.html 2.IRIの利用にはHTTPの技術を用いる ↑ 3.IRIにアクセスするとHTML文書が見られる(Webブラウザを使用した場合) 4.HTML文書には他の文書へのIRIのリンクがある http://josoken.digick.jp/meeting/news.html#201309 ※IRI(国際化資源(リソース)識別子):Internationalized Resource Identifier)
  39. 39. Linked Dataの基本原則 1.IRIをあらゆる事物の識別子に使う (リソース)
  40. 40. Linked Dataの基本原則 http://example.jp/001 藤田(という事物)に関する識別子 1.IRIをあらゆる事物の識別子に使う (リソース)
  41. 41. Linked Dataの基本原則 2.IRIの利用にはHTTPの技術を用いる http://example.jp/001 藤田(という事物)に関する識別子 1.IRIをあらゆる事物の識別子に使う (リソース)
  42. 42. Linked Dataの基本原則 2.IRIの利用にはHTTPの技術を用いる http://example.jp/001 藤田(という事物)に関する識別子 XML等の構造化データ 1.IRIをあらゆる事物の識別子に使う (リソース) 3.IRIにアクセスすると事物に関する 構造化データが得られる (リソース)
  43. 43. Linked Dataの基本原則 2.IRIの利用にはHTTPの技術を用いる http://example.jp/001 藤田(という事物)に関する識別子 http://example.jp/002 書籍(という事物)に関する識別子 4.データには他のIRIへのリンクを含む XML等の構造化データ 1.IRIをあらゆる事物の識別子に使う (リソース) 3.IRIにアクセスすると事物に関する 構造化データが得られる (リソース)
  44. 44. Dereference(参照解決) 人物、藤田に関するHTMLページ 人がみる情報 XML等の構造化データ コンピュータがみるデータ HTML RDF リソース http://example.jp/001 アクセス方法によって HTTPサーバが自動判別 ・・・・ ・・・・ ・・・・
  45. 45. Dereference(参照解決) 人物、藤田に関するHTMLページ 人がみる情報 XML等の構造化データ コンピュータがみるデータ HTML RDF リソース http://example.jp/001 アクセス方法によって HTTPサーバが自動判別 ・・・・ ・・・・ ・・・・
  46. 46. Dereference(参照解決) 人物、藤田に関するHTMLページ 人がみる情報 XML等の構造化データ コンピュータがみるデータ HTML RDF リソース http://example.jp/001 アクセス方法によって HTTPサーバが自動判別 ・・・・ ・・・・ ・・・・
  47. 47. Dereference(参照解決) 人物、藤田に関するHTMLページ 人がみる情報 XML等の構造化データ コンピュータがみるデータ HTML RDF リソース http://example.jp/001 アクセス方法によって HTTPサーバが自動判別 ・・・・ ・・・・ ・・・・ HTTPの技術コンテントネゴシエーションを利用
  48. 48. ①NDLが定義した人物「夏目漱石」という人物名称を同定する識別子 Cool IRI 実体と表現を区別する方法論 http://id.ndl.go.jp/auth/entity/00054222 303 See Other 303 See Other 国立国会図書館の個人名 典拠データのRDFは 「名称実体」と「典拠情報」の区別に303転送型IRI(COOL IRI)を利用 http://id.ndl.go.jp/auth/ndla/00054222 http://id.ndl.go.jp/auth/ndla/00054222.rdf 2-3. 名称実体URI http://iss.ndl.go.jp/ndla/function/#2
  49. 49. ①NDLが定義した人物「夏目漱石」という人物名称を同定する識別子 Cool IRI 実体と表現を区別する方法論 http://id.ndl.go.jp/auth/entity/00054222 303 See Other 303 See Other 国立国会図書館の個人名 典拠データのRDFは 「名称実体」と「典拠情報」の区別に303転送型IRI(COOL IRI)を利用 http://id.ndl.go.jp/auth/ndla/00054222 http://id.ndl.go.jp/auth/ndla/00054222.rdf ① 実体として参照するアドレス 2-3. 名称実体URI http://iss.ndl.go.jp/ndla/function/#2
  50. 50. ①NDLが定義した人物「夏目漱石」という人物名称を同定する識別子 Cool IRI 実体と表現を区別する方法論 http://id.ndl.go.jp/auth/entity/00054222 303 See Other 303 See Other 国立国会図書館の個人名 典拠データのRDFは 「名称実体」と「典拠情報」の区別に303転送型IRI(COOL IRI)を利用 http://id.ndl.go.jp/auth/ndla/00054222 http://id.ndl.go.jp/auth/ndla/00054222.rdf ① 実体として参照するアドレス ②ブラウザで①にアクセスすると 自動的に人がみる典拠情報を 表示(表現)するページへ転送 2-3. 名称実体URI http://iss.ndl.go.jp/ndla/function/#2
  51. 51. ①NDLが定義した人物「夏目漱石」という人物名称を同定する識別子 Cool IRI 実体と表現を区別する方法論 http://id.ndl.go.jp/auth/entity/00054222 303 See Other 303 See Other 国立国会図書館の個人名 典拠データのRDFは 「名称実体」と「典拠情報」の区別に303転送型IRI(COOL IRI)を利用 http://id.ndl.go.jp/auth/ndla/00054222 http://id.ndl.go.jp/auth/ndla/00054222.rdf ① 実体として参照するアドレス ②ブラウザで①にアクセスすると 自動的に人がみる典拠情報を 表示(表現)するページへ転送 ③Linked Dataプログラムが①にアク セスすると自動的にデータへ転送 2-3. 名称実体URI http://iss.ndl.go.jp/ndla/function/#2
  52. 52. 構造化データ RDF(Resource Description Frame Work) RDFの特徴 •W3CというWebに関する技術の標準化を進める団体により標準化されたデータ形式 •1つの情報を主語,述語,目的語の3つ組(Triple)であらわす 画家「藤田」と作品「カフェ」を3つ組であらわすと
  53. 53. 構造化データ RDF(Resource Description Frame Work) RDFの特徴 •W3CというWebに関する技術の標準化を進める団体により標準化されたデータ形式 •1つの情報を主語,述語,目的語の3つ組(Triple)であらわす 主語 画家「藤田」と作品「カフェ」を3つ組であらわすと 藤田嗣治
  54. 54. 構造化データ RDF(Resource Description Frame Work) RDFの特徴 •W3CというWebに関する技術の標準化を進める団体により標準化されたデータ形式 •1つの情報を主語,述語,目的語の3つ組(Triple)であらわす 主語 作品は 述語 画家「藤田」と作品「カフェ」を3つ組であらわすと 藤田嗣治
  55. 55. 構造化データ RDF(Resource Description Frame Work) RDFの特徴 •W3CというWebに関する技術の標準化を進める団体により標準化されたデータ形式 •1つの情報を主語,述語,目的語の3つ組(Triple)であらわす 主語 作品は 述語 目的語 画家「藤田」と作品「カフェ」を3つ組であらわすと 藤田嗣治 「カフェ」
  56. 56. 構造化データ RDF(Resource Description Frame Work) RDFの特徴 •W3CというWebに関する技術の標準化を進める団体により標準化されたデータ形式 •1つの情報を主語,述語,目的語の3つ組(Triple)であらわす 画家「藤田」と作品「カフェ」を3つ組であらわすと 藤田嗣治 「カフェ」
  57. 57. 構造化データ RDF(Resource Description Frame Work) RDFの特徴 •W3CというWebに関する技術の標準化を進める団体により標準化されたデータ形式 •1つの情報を主語,述語,目的語の3つ組(Triple)であらわす 画家「藤田」と作品「カフェ」を3つ組であらわすと 藤田嗣治 「カフェ」 主語
  58. 58. 構造化データ RDF(Resource Description Frame Work) RDFの特徴 •W3CというWebに関する技術の標準化を進める団体により標準化されたデータ形式 •1つの情報を主語,述語,目的語の3つ組(Triple)であらわす 画家「藤田」と作品「カフェ」を3つ組であらわすと 藤田嗣治 「カフェ」 作者は 主語述語
  59. 59. 構造化データ RDF(Resource Description Frame Work) RDFの特徴 •W3CというWebに関する技術の標準化を進める団体により標準化されたデータ形式 •1つの情報を主語,述語,目的語の3つ組(Triple)であらわす 画家「藤田」と作品「カフェ」を3つ組であらわすと 藤田嗣治 「カフェ」 作者は 主語述語目的語
  60. 60. コンピュータが内容を理解するための情報 「メタデータ」 メタデータ(属性) データ(値) 名前 藤田嗣治 生年 1886 没年 1968 メタデータ(属性) データ(値) タイトル カフェ 制作年 1949 材質・技法 油彩/キャンバス
  61. 61. メタデータは再利用性を考慮し,なるべく広く使われているものの利用が望ましい 「dc」は接頭子と呼ばれ,メタデータの典拠元を表す 行頭のdc: はhttp://purl.org/dc/terms/ 定義されている事を記述する 例: RDFデータの冒頭に定義されるプレフィクス @prefix dc:<http://purl.org/dc/terms/> メタデータ(属性) データ(値) dc:title カフェ dc:created 1949 dc:medium 油彩/キャンバス コンピュータが内容を理解するための記述
  62. 62. dc:title が何を表すのか,知りたい場合は,http://purl.org/dc/terms/title にアクセスすることで,その用途・適用範囲などの説明が見られる. dc:title Dublin Core (団体組織) 主題や名前を意 味する識別子 lodac:Address bmx:exhibition British Museumが定義した「展覧会」を 意味する識別子 LODACグループが定義した「住所」を意 味する識別子
  63. 63. @prefix dc: <http://purl.org/dc/terms/> . @prefix ex: <http://example.jp/>. ex:001 a ex:artwork; dc:title "カフェ"@ja; dc:created "1949"; dc:medium "油彩/キャンバス"@ja; . メタデータ 値 RDFデータ(Turtle) ネットワーク上でコンピュータが処理できるデータ RDFデータをネットワーク上で使えるようにするため,識別子(アドレス)をつける http://example.jp/001 RDFデータの中身はテキストベース
  64. 64. @prefix dc: <http://purl.org/dc/terms/> . @prefix ex: <http://example.jp/>. ex:001 a ex:artwork; dc:title "カフェ"@ja; dc:created "1949"; dc:medium "油彩/キャンバス"@ja; . メタデータ 値 RDFデータ(Turtle) ネットワーク上でコンピュータが処理できるデータ 主語 述語 目的語 RDFデータをネットワーク上で使えるようにするため,識別子(アドレス)をつける http://example.jp/001 RDFデータの中身はテキストベース
  65. 65. @prefix dc: <http://purl.org/dc/terms/> . @prefix ex: <http://example.jp/>. ex:001 a ex:artwork; dc:title "カフェ"@ja; dc:created "1949"; dc:medium "油彩/キャンバス"@ja; . このデータ内容を要約すると・・・ http://example.jp/001はインターネット経由でデータを参照でき、 データはexample.jpのartworkに分類される、 「カフェ」というタイトルがつくデータである ネットワーク経由で参照できるデータ
  66. 66. @prefix dc: <http://purl.org/dc/terms/> . @prefix ex: <http://example.jp/>. ex:001 a ex:artwork; dc:title "カフェ"@ja; dc:created "1949"; dc:medium "油彩/キャンバス"@ja; . exはprefixで http://example.jp/と定義。 この部分は,http://example.jp/001の情報が記述してあるデータと宣言している このデータ内容を要約すると・・・ http://example.jp/001はインターネット経由でデータを参照でき、 データはexample.jpのartworkに分類される、 「カフェ」というタイトルがつくデータである ネットワーク経由で参照できるデータ
  67. 67. LinkするData Linked Data
  68. 68. メタデータ(属性) データ(値) 名前 藤田嗣治 生年 1886 没年 1968 メタデータ(属性) データ(値) タイトル カフェ 制作年 1949 材質・技法 油彩/キャンバス ■リレーショナルデータベースの場合 作者テーブル 作品テーブル 作者ID 名前 生年 没年 001 藤田嗣治 1886 1968 作品ID タイトル 制作年 材質・技法 作者ID 2381 カフェ 1949 油彩/キャンバス 001 作者IDでテーブルを結合 作品情報 作品ID タイトル 制作年 材質・技法 作者ID 2381 カフェ 1949 油彩/キャンバス 001 名前 生年 没年 藤田嗣治 1886 1968 複数のデータを結合して使う
  69. 69. 作者 作品 IRI 名前 生年 没年 http://example.jp/001 藤田嗣治 1886 1968 IRI タイトル 制作年 材質・技法 作者 http://example.jp/2381 カフェ 1949 油彩/キャンバス http://example.jp/001 IDをHTTPで参照可能なIRIにすると インターネット経由でデータを参照できる 作品 IRI タイトル 所蔵館 材質・技法 作者 http://example.jp/4552 自画像 http://data.geidai.ac.jp/150 油彩/キャンバス http://example.jp/001 所蔵館 IRI タイトル 住所 所蔵作品 http://data.geidai.ac.jp/150 東京藝術大学大学美術館 東京都台東区上野公園.... http://example.jp/4552
  70. 70. 所蔵館 crm:P55_has_current_location http://example.jp/4552 http://data.geidai.ac.jp/150 作者・作品・所蔵館の関係 自画像 http://example.jp/2381 http://example.jp/001 作者 dc:creator 作者 dc:creator タイトル dc:title 油彩/キャンバス 素材・技法 dc:medium 油彩/キャンバス 素材・技法 dc:medium カフェ タイトル dc:title タイトル dc:title 東京藝術大学 大学美術館 住所 lodac:Address 東京都台東区 上野公園... 藤田嗣治 1886 1968 名前 foaf:name 生年 rda2:dateOfBirth 没年 rda2:dateOfDeath リソース リソース リソース リソース
  71. 71. RDFデータを使う時は メタデータ(属性) データ(値) dc:title カフェ dc:created 1949 dc:medium 油彩/キャンバス dc:creator http://example.jp/001 データの場所 http://example.jp/2381 RDF検索システムやプログラムでは次のような命令を実行する データのアドレス「http://example.jp/2381」の 1. メタデータ「dc:title」 に格納されている値を表示しなさい   → カフェ 2. メタデータ「dc:creator」のリソース「foaf:name」の値を表示しなさい   → 藤田嗣治
  72. 72. RDFのシリアライズ形式 @prefix dc: <http://purl.org/dc/terms/> . @prefix ex: <http://example.jp/> . @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . <http://example.jp/001> a ex:artwork ; dc:created "1949" ; dc:medium "油彩/キャンバス"@ja ; dc:title "カフェ"@ja . Turtle (Nation3またはN3) { "@id": "http://example.jp/001", "@type": "http://example.jp/artwork", "http://purl.org/dc/terms/created": "1949", "http://purl.org/dc/terms/medium": { "@language": "ja", "@value": "油彩/キャンバス" }, "http://purl.org/dc/terms/title": { "@language": "ja", "@value": "カフェ" } } JSON-LD
  73. 73. RDFのシリアライズ形式 <?xml version="1.0" encoding="UTF-8"?> <rdf:RDF xmlns:dc="http://purl.org/dc/terms/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"> <rdf:Description rdf:about="http://example.jp/001"> <dc:title xml:lang="ja">カフェ</dc:title> <dc:medium xml:lang="ja">油彩/キャンバス</dc:medium> <rdf:type rdf:resource="http://example.jp/artwork"/> <dc:created>1949</dc:created> </rdf:Description> </rdf:RDF> RDF/XML <div> <div itemtype="http://example.jp/artwork" itemid="http://example.jp/001" itemscope> <meta itemprop="http://purl.org/dc/terms/created" content="1949" /> <meta itemprop="http://purl.org/dc/terms/medium" content="油彩/キャンバス" /> <meta itemprop="http://purl.org/dc/terms/title" content="カフェ" /> </div> </div> RDFa
  74. 74. SPARQLクエリとEndpoint RDFデータを使う
  75. 75. SPARQLとは •RDFデータの検索や操作するためのクエリ言語 •対象データモデル:RDF •プロトコル: HTTP クエリ言語 SQL SPARQL データ格納 RDB (MySQL, FileMaker等) Triple Store (Virtuosso,OWLIM等) データ構造 リレーショナルモデル RDF モデル 一般的なRDBMS Linked Data用
  76. 76. SPARQL Endpointとは •RDF StoreへのSPARQLクエリを受け付けるURI  → プログラムからSPARQLクエリを発行し、結果を取得する場合に利用 •クエリを試せる入力フォームを備えている場合がある
  77. 77. データベース&API 実装・表示 APIは公開するサイトごとに仕様が異なる → 開発者はAPIを理解する手間が掛かる サイトの API仕様を理解 APIの仕様に合わせて データ抽出・加工 http://example.jp/001 http://example.jp/001のdc:title の値を抽出して表示しなさい データの整形・表示 dc:titleの値を返す SPARQLクエリは標準化されたRDF問合わせ言語 従来のWeb上のデータ利用方法(API) SPARQL Endpointを用いたRDFデータの利用 クエリに合わせて データ抽出・加工・整形
  78. 78. SPARQL Endpoint 例: DBpedia Japanese Wikipediaのテンプレートデータをメタデータマッピングし、 RDFデータをLODで公開しているサイト http://ja.dbpedia.org/
  79. 79. 問: 「夏目漱石の出生地はどこですか?」
  80. 80. SPARQLクエリ例 PREFIX dbp:<http://ja.dbpedia.org/resource/> PREFIX dbp-owl:<http://dbpedia.org/ontology/> SELECT ?seichi ?label WHERE {    dbp:夏目漱石 dbp-owl:birthPlace ?seichi .    ?seichi rdfs:label ?label. } http://ja.dbpedia.org/resource/夏目漱石 夏目漱石 dbp:小説 rdfs:label dbp-owl:genre dbp:夏目漱石dbp:武蔵国 武蔵国 rdfs:label dbp-owl:birthPlace http://ja.dbpedia.org/resource/武蔵国 http://ja.dbpedia.org/resource/小説 小説 rdfs:label リソース リテラル
  81. 81. PREFIX dbp:<http://ja.dbpedia.org/resource/> PREFIX dbp-owl:<http://dbpedia.org/ontology/> SELECT ?seichi ?label WHERE {    dbp:夏目漱石 dbp-owl:birthPlace ?seichi .    ?seichi rdfs:label ?label. } 結果
  82. 82. PREFIX dbp:<http://ja.dbpedia.org/resource/> PREFIX dbp-owl:<http://dbpedia.org/ontology/> SELECT ?seichi ?label WHERE {    dbp:夏目漱石 dbp-owl:birthPlace ?seichi .    ?seichi rdfs:label ?label. } SELECTにはクエリの結果として受け取りたいデータの変数を指定。 ?seichi = 生地のリソースIRI、?label = 文字列の格納変数 結果
  83. 83. PREFIX dbp:<http://ja.dbpedia.org/resource/> PREFIX dbp-owl:<http://dbpedia.org/ontology/> SELECT ?seichi ?label WHERE {    dbp:夏目漱石 dbp-owl:birthPlace ?seichi .    ?seichi rdfs:label ?label. } SELECTにはクエリの結果として受け取りたいデータの変数を指定。 ?seichi = 生地のリソースIRI、?label = 文字列の格納変数 WHERE の{ }にRDFグラフの組み合わせを記述します 結果
  84. 84. PREFIX dbp:<http://ja.dbpedia.org/resource/> PREFIX dbp-owl:<http://dbpedia.org/ontology/> SELECT ?seichi ?label WHERE {    dbp:夏目漱石 dbp-owl:birthPlace ?seichi .    ?seichi rdfs:label ?label. } SELECTにはクエリの結果として受け取りたいデータの変数を指定。 ?seichi = 生地のリソースIRI、?label = 文字列の格納変数 WHERE の{ }にRDFグラフの組み合わせを記述します dbp:夏目漱石は、PREFIXによりリソースを指定 http://ja.dbpedia.org/resource/夏目漱石 dbp-owl:birthPlaceは「生地」を意味するメタデータ ?seichi はdbp-owl:birthPlaceのリンク先IRIを格納する変数 結果
  85. 85. PREFIX dbp:<http://ja.dbpedia.org/resource/> PREFIX dbp-owl:<http://dbpedia.org/ontology/> SELECT ?seichi ?label WHERE {    dbp:夏目漱石 dbp-owl:birthPlace ?seichi .    ?seichi rdfs:label ?label. } SELECTにはクエリの結果として受け取りたいデータの変数を指定。 ?seichi = 生地のリソースIRI、?label = 文字列の格納変数 WHERE の{ }にRDFグラフの組み合わせを記述します dbp:夏目漱石は、PREFIXによりリソースを指定 http://ja.dbpedia.org/resource/夏目漱石 dbp-owl:birthPlaceは「生地」を意味するメタデータ ?seichi はdbp-owl:birthPlaceのリンク先IRIを格納する変数 ?seichi(http://ja.dbpedia.org/resource/武蔵国) のメタデータ rdfs:label の値を 変数?labelに格納する 結果
  86. 86. 3.Linked Open Data利用事例
  87. 87. Publication Events Author Series Subject Identifiers Title Miscellaneous literals British Library Data Model - Book @prefix blt: <http://www.bl.uk/schemas/bibliographic/blterms#> . @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix owl: <http://www.w3.org/2002/07/owl#> . @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix dct: <http://purl.org/dc/terms/> . @prefix isbd: <http://iflastandards.info/ns/isbd/elements/> . @prefix skos: <http://www.w3.org/2004/02/skos/core#> . @prefix bibo: <http://purl.org/ontology/bibo/> . @prefix rda: <http://rdvocab.info/ElementsGr2/> . @prefix bio: <http://purl.org/vocab/bio/0.1/> . @prefix foaf: <http://xmlns.com/foaf/0.1/> . @prefix event: <http://purl.org/NET/c4dm/event.owl#> . @prefix org: <http://www.w3.org/ns/org#> . @prefix geo: <http://www.w3.org/2003/01/geo/wgs84_pos#> . Tim Hodson - tim.hodson@talis.com Corine Deliot - Corine.Deliot@bl.uk Alan Danskin - Alan.Danskin@bl.uk Heather Rosie - Heather.Rosie@bl.uk Jan Ashton - Jan.Ashton@bl.ukV.1.4 August 2012 All properties with a range of blt:PublicationEvent can be used with blt:PublicationStartEvent and blt:PublicationEndEvent. Arrows omitted for clarity. Assume that most instance data will have an rdfs:label. These properties have been omitted for clarity. skos:prefLabelskos:notation Resource BL URI dct:BibliographicResource bibo:Book or bibo:MultiVolumeBook Lexvo URI dct:language PublicationEvent BL URI blt:publication blt:PublicationEvent a event:Event rdfs:subClassOf Place BL URI MARC country code URI Agent BL URI foaf:Agent dcterms:Agent geo:SpatialThing a a http://r.d.g/id/year/ xxxx Person-as-Concept BL URI dct:subject Topic LCSH BL URI dct:subject skos:notation a Skos:Concept GeoNames URI foaf:focus foaf:focus CalendarYear a skos:broader LCSH URI if available Organization-as-Concept BL URI Family-as-Concept BL URI id.loc.gov URI for scheme Family-as-Agent BL URI a a blt:bnb bibo:isbn10 bibo:isbn13 dct:abstract dct:tableOfContents foaf:focus dct:subject skos:inScheme owl:sameAs skos:inScheme skos:inScheme dct:spatial dct:hasPart dct:subject Place-as-Concept BL URI LCSH URI if available Place-as-Thing BL URIfoaf:focus owl:sameAs event:time event:agent event:place event:place dct:title dct:alternative Person-as-Agent BL URI foaf:Agent dct:Agent foaf:Person a foaf:name foaf:familyName Birth BL URI Death BL URI rda:periodOfActivityOfThePerson bio:Birth bio:Death a a VIAF URI if available owl:sameAs bio:date bio:date bio:event bio:event foaf:givenName Organization-as-Agent BL URI foaf:Agent dct:Agent foaf:Organization org:Organization rdfs:label [foaf:name] a blt:hasContributedTo dct:creator dct:contributor dct:creator dct:subject dct:subject foaf:focus a a Dewey BL URI Dewey Info URI Dewey Info URI for scheme a rdfs:subClassOf rdfs:subClassOf isbd:P1042 (content note) isbd:P1053 (extent) MARC language code URI foaf:focus geo:SpatialThing dct:Location blt:OrganizationConcept a rdfs:subClassOf id.loc.gov URI for scheme skos:inScheme rdfs:subClassOf id.loc.gov URI for scheme skos:inScheme a rdfs:subClassOf Series BL URI bibo:Series bibo:issn blt:PlaceConcept blt:TopicLCSH blt:TopicDDC blt:FamilyConcept blt:PersonConcept a rdfs:subClassOf id.loc.gov URI for scheme A Class Key A Literal An Instance External Link dct:description blt:hasCreated blt:hasCreated dct:contributor blt:hasContributedTo rdfs:label dct:isPartOf bibo:numVolumes isbd:P1008 (edition statement) isbd:P1073 (note on language) blt:PublicationStartEvent blt:PublicationEndEvent blt:publicationStart blt:publicationEnd PublicationEndEvent BL URI PublicationStartEvent BL URI rdfs:subClassOf rdfs:subClassOf a a a skos:notation skos:prefLabel The British Library
  88. 88. 国立国会図書館典拠データ http://iss.ndl.go.jp/ndla/about/
  89. 89. Yale Centre for British ART メタデータから高精細画像までLODとして公開(CC0). LIDO、CIDOC CRM、ULAN等 既存メタデータをなるべく利用
  90. 90. BookSampo (フィンランドナショナルライブラリー) 文学研究や文献検索用のLinked Dataポータル 内外のWeb上のデータへのリンクと、フィンランド内で構築された人物典拠や 博物館資料情報等との連携も図られている
  91. 91. europeana OAI ORE (Open Archives Initiative Object Reuse & Exchange) for organizing an object’s metadata and digital representation(s) Dublin Core for descriptive metadata SKOS (Simple Knowledge Organization System) for conceptual vocabulary representation CIDOC-CRM for event and relationships between objects Adopt Semantic Web representation principles (RDF) Re-use and mix different vocabularies together Preserve original data and still allow for interoperability Europeana Data Model (EDM)
  92. 92. Linked JAZZ 人物情報はJazz Archive、DBpedia、LC Authority等 を利用。 ミュージシャン同士の関係性の定義は、 マニアユーザーによる人物間の関係をつくる
  93. 93. 福井県鯖江市の観光案内アプリケーション ‣ 鯖江市オープンデータ(公共情報、文化施設、ランドマークなど)をRDFデータ化 鯖江市だけでなく、外部のRDFデータと関連づけて情報を提示
  94. 94. GeoNLP ユーザー参加型の地名辞書作成・共有ポータル ユーザーが作成した辞書データを用い、自然言語に含まれる辞書単語を解析する GeoNLPの地名情報SPARQL Endpointも利用可能
  95. 95. 所蔵館 公共・地域・文化・芸術・学術... あらゆる情報がリンクすることで Web上に分散する関連情報をより使いやすく 同一人物 アーカイブズ 作者 作品 作品 作者 所蔵館 所蔵館
  96. 96. 著作権利を 「可能な限り放棄する」 著作権切れや作者の意志表示等で 「完全に自由に利用可能」
  97. 97. 再利用される情報は, インターネット経由でアクセスして 他のデータからリンクして利用できる オープンライセンスが望ましい
  98. 98. Linked Open Data オープンライセンスを適用した 標準化されたデータ
  99. 99. ★4 ★5でデータ公開をめざす意義 利用の立場 1. インターネットに接続されたコンピュータからデータにリンクできる 2. データの一部(例えば項目の1つ)を取り出して使うことができる 3. 他のデータと複数組み合わせて使う事ができる 4. データのリンク情報から関連する情報を発見することができる ❖ただし、利用者はRDFデータの構造を理解する必要がある 公開の立場 1.データ項目へのアクセスを細かく設定でき、利用者にあわせて設計できる  (データ構造及び公開のシステムとして) 2.他のデータ公開者からデータに対してのリンクができる  同様の仕組みで公開されたデータならば、リンクのみでリンク先のデータ項目を使うことができる
  100. 100. データ共有への5つのステップ どんな形式でもよいのでオープンライセンスで公開する 例:PDF, jpg コンピュータが処理可能な形式で公開 例:xlsx, doc オープンに利用できる形式で公開 例:csv, tsv, json IRIを含めたRDFデータで情報公開 例:RDF, SPARQL Endpoint 他のRDFデータへのリンクを含めたオープンライセンスの データを公開
  101. 101. ウ ェ ブ の 発 展 に 貢 献 し ま す 。 ご静聴ありがとうございました kamura@linkedopendata.jp
  102. 102. 参考サイト Creative Commons http://creativecommons.org/ Open Data Handbook http://opendatahandbook.org/ja/what-is-open-data/index.html G8 2013 http://www.mofa.go.jp/mofaj/gaiko/page3_000060.html OPEN DATA SITES(Government) http://www.data.gov/opendatasites Your Art http://apps.usa.gov/yourart.shtml Library of Congress- Virtual Tour http://apps.usa.gov/library-of-congress-virtual-tour.shtml Open Data METI http://datameti.go.jp/ 鯖江市 http://www.city.sabae.fukui.jp/pageview.html?id=11552 税金はどこへ行った? http://spending.jp CKAN(日本) http://data.linkedopendata.jp/ オープンデータニュース http://itpro.nikkeibp.co.jp/article/NC/20130829/501046/ 5Stars Model http://5stardata.info/ja/ NTT Data「電子行政オープンデータ戦略」の決定と今後の課題 http://e-public.nttdata.co.jp/topics_detail2_prev/id=711 生貝直人 "EUにおけるオープンデータ政策とクリエイティブ・コモンズ・ライセン ス " http://ikegai.jp/yokohama130823.pdf IRI(国際化資源(リソース)識別子):Internationalized Resource Identifier)
  103. 103. http://www.w3.org/International/articles/idn-and-iri/ Turtle(N3) http://www.w3.org/TR/turtle/ JSON-LD http://json-ld.org/ RDF/XML http://www.w3.org/TR/rdf-syntax-grammar/ RDF-Translator http://rdf-translator.appspot.com/ 国会図書館 名称実体URI http://iss.ndl.go.jp/ndla/function/#2 SPARQL1.1 http://www.w3.org/TR/sparql11-query/ DBpedia Japanese http://ja.dbpedia.org/ LODAC http://lod.ac/ British National Bibliography http://bnb.data.bl.uk/ Stanford http://library.stanford.edu/projects/linked-data Book Sampo http://www.seco.tkk.fi/publications/2013/makela-et-al-booksampo-swj.pdf data.europeana.eu http://pro.europeana.eu/web/guest/support-for-open-data http://europeana.ontotext.com/ datahub (linked data) http://datahub.io/group/lld Linked Jazz http://linkedjazz.org/

×