Web標準: LODによるオープンデータ・オーブンガバメント

735 views

Published on

2012年5月の鯖江市訪問などを経て、改めてウェブ標準ベースのオープンデータ・オープンガバメントに関する基本的なコンセプトの紹介スライドを作成いたしましたので、公開いたします。

Web標準: LODによるオープンデータ・オーブンガバメント

  1. 1. Web標準: LODによる
オープンデータ・オーブンガバメント
 の効果と始めかた
 (updated) 2012年5月17日 W3C/Keio 慶應義塾大学大学院 政策・メディア研究科 特任助教 深見嘉明 @rhys_no1 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  2. 2. 1 W3Cの概要•  世界中の企業・研究機関・団体によって構成
 される、ウェブ標準規格を策定する団体•  加入企業・研究機関・団体の数は300以上。 –  http://www.w3.org/Consortium/ Member/List•  加入企業・団体から参加するエンジニアに
 よって議論が進められ、標準規格が策定される。•  今この瞬間も、電話会議で、メールで、
 仕様に関する議論が進められています。 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  3. 3. 2「オープンガバメント」  「オープンデータ」  という用語を  よく耳にするように  なりました These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  4. 4. 3はじめに考えるべきこと• 何のための
 オープン?• 誰のための
 オープン? These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  5. 5. 4 これまでの「オープン」•  議会や審議会、研究会といった政策形成 プロセスの公開 –  動画配信や議事録のウェブ公開等•  施策立案担当者や議員、首長との、
 直接的な意見交換 –  TwitterやFacebookといったソーシャル
 メディアを介した交流 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  6. 6. 5「オープン」に期待されていること•  行政執行や施策立案に透明性 が確保できる•  公開されたデータを民間が活 用することによる効率性の向 上と経済の活性化 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  7. 7. 6今までの「オープン」はどこ まで有効だったのか?•  平日昼間やっている議会や審議会、
 誰が見るの?•  長時間の審議、議論を全部聞くの?•  議事録などの全文採録を読んで、価値のある 情報を容易に取り出せるのか?•  特定の個人間のやりとりを一般化して、政策 形成や施策立案に落としこむことは、本当に 効率的なのか? These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  8. 8. 7今までの「オープン」はどこ まで有効だったのか?•  似たようなデータが各省庁・部局・外郭 団体・自治体等からバラバラに開示されて いて、活用したいデータがすぐに見つから ない。•  PDFにデータが記載されていると、それを 入力し直さなければ分析・活用できない。 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  9. 9. 8必要とされる「オープン」のかたち •  議論の中身だけではなく、議論の前提と なるデータが開示されること。 •  データの活用が効率的に進むよう、 –  探しやすく、重複がないような体制でデータ が開示されること。 –  最初から分析プログラムやアプリケーション で活用可能なデータ形式・粒度で開示される こと。 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  10. 10. 9 具体的にどうするか•  分析・加工する前の生データ
 (raw data)、もしくはそれに近い
 データを公開する。•  コンピュータ/プログラムで
 扱いやすい形式・フォーマットで
 公開する。•  適切な著作権・情報保護の設定の元、 公開する。 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  11. 11. 10 回答:Linked Data•  データ公開時のルール –  IDはURI –  RDF (Resource Description Framework)に 従った要素を含む –  データフォーマットは標準的な計算機可読な ものであればよい。
 具体的には、RDF/XML、JSONなど。 –  分類項目や項目の定義=データ構造は、
 既存の標準があればそれを用いる。無ければ、
 自由に定義してよいが、その定義も公開し、
 標準化に向けて提案することが理想。 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  12. 12. 11 ID=URI•  URI –  Uniform Resource Identifier –  URLとほぼ同義。
 「http://」ではじまるアドレス(注)。•  なぜURI? –  ウェブ上の公開に適している –  どこからでも、誰でもアクセス可能 –  IDのつけ方に自由度が高い –  固有性を維持するのが容易 注:厳密には、ウェブサイトのアドレスはURIの一種 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  13. 13. 12RDF: Resource Description Framework •  主語・述語・目的語という
 単純な組み合わせ=triple/三つ組 •  他のURI(データリソース)と
 リンクする 述語:名前 World Wide http:// Web www.w3.org Consortium 主語 目的語 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  14. 14. 13 Linked Dataの記述のしかた•  例:Turtleでの記述<http://d.hatena.ne.jp/yofukami/about> rdf:type foaf:Person .<http://d.hatena.ne.jp/yofukami/about> foaf:name "深見嘉明" .<http://d.hatena.ne.jp/yofukami/about> foaf:gender "mail" .<http://d.hatena.ne.jp/yofukami/about> foaf:knows 
<http://www-kasm.nii.ac.jp/~takeda#me> <foaf:Person> <http:// rdfs:type d.hatena.ne.jp/ yofukami/about> foaf:knows <http://www- kasm.nii.ac.jp/ foaf:name foaf:gender ~takeda#me>“深見嘉明” “male” These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  15. 15. 14 データフォーマットと構造•  コンピュータが処理できれば(machine readable)、何でも良い、が、RDF/XMLや JSONが推奨される。•  構造を示すのは前スライドの “foaf:Person” などの部分。•  foaf、dc (Dublin Core)等、既存の標準的な フォーマットがあれば、それに従う。•  Google、Yahoo!、Microsoftが提唱する schema.orgなど、大手企業も積極的に標準 を提唱・実装。 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  16. 16. 15 Linked DataとLOD•  LOD= Linked Open Data•  標準に従って生成・公開されたデータで あれば、マッシュアップして活用すること が可能•  だから、フォーマットも、データ構造も、 標準ベースで•  多様な形態での利用が前提なので、適切な 著作権処理(例えば、CC-BY)がなされるこ とが望ましい。 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  17. 17. 16 データ共有プラットフォームとしてのLOD•  既に各分野でリンクされたデータセットが多数 生成されています (http://www4.wiwiss.fu- –  203のデータセット berlin.de/lodcloud/state/) –  2500万の RDF triples –  3億9500万の RDF links These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  18. 18. 17 Linked Dataの本質•  世界共通の識別子(Identifier)•  世界共通の標準フォーマット・
 構造の採用 Web全体を データリソースとして アプリケーションが 作れる These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  19. 19. 18 エコシステムの構造 3) サービスを創る 2) アプリケーションを創る1) データを提供する標準仕様に則っていることにより、より広い層からの利用を見込むことができる   These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  20. 20. 19 情報開示とオープンデータの差•  既存の「情報開示」 –  開示までにかかるコスト が大きい データ収集 –  特定の分析視点に
 加工   された   分析 基づいてデータが
 データ 提示される プレゼン –  「データそのもの」が
 テーション 必要な場合、それを
 取り出すコストがかかる These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  21. 21. 20情報開示とオープンデータの差•  LODによるオープンデータ データ データ データ データ ニーズ   ニーズ   ニーズ   ニーズ   These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  22. 22. 21情報開示とオープンデータの差•  LODによるオープンデータ –  データ生成・公開/利用の分離 –  データ利用に伴う負担の分散化 –  必要なデータを各所から収集して用いる (マッシュアップ)が容易 –  ニーズがある場所で、効率的に
 アプリケーションやサービスが
 開発される These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  23. 23. 22LODによるオープンガバメントの意義•  負荷分散効果による、データ提供側・利 用者側の負荷低減•  アプリケーションやサービスの
 DIY・地産地消を実現•  スケーラビリティ効果 –  効率的な情報発信、サービス提供範囲拡大 –  他所の成功事例を簡単に導入 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  24. 24. 23 標準という観点から見たLOD•  W3CはRDFという基本
 コンセプトと、RDF/ ユーザ XMLなどのデータ
 データ構造 からの フォーマットの一部のみ 提案 データ   を標準として策定 フォーマット•  データ構造はユーザや
 W3C 企業からの提案が
 RDF (&others) デファクトスタンダード になるのが普通。 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  25. 25. 24標準という観点から見たLOD•  車輪の再発明は避けるべし•  自身の使い勝手のよいデータ構造 を、どんどん世界標準にするため の提案をすべき These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
  26. 26. ありがとうございました。Keio-contact@w3.orghttp://www.w3.org@rhys_no1 These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

×