地場産業としての
オープンデータの可能性
国立情報学研究所

大向 一輝
@i2k
自己紹介
オープンデータの例

http://www.tepco.co.jp/forecast/index-j.html
http://www.kepco.co.jp/setsuden/graph/index.html
オープンデータとは

•

データを誰でも使えるように

•
•
•
•

ウェブ上で公開

再利用しやすい形で

本当に盛り上がっているのか?
何が難しいのか?
オープンデータの潮流
•

世界のデータ公開

•
•
•
•

•

アメリカ:政府情報のオープンデータ化に関する大統領令
EU:公共セクター情報の再利用指令
G8:オープンデータ憲章
日本:電子行政オープンデータ戦略

進捗の確認・ランキン...
日本のオープンデータ
•

政府レベル

•
•
•
•

Open DATA METI(経済産業省)
次世代統計利用システム(総務省・統計センター)
内閣官房データカタログ
重点5分野

•
•

白書、防災・減災、 地理空間情報、人の移動、...
Open DATA METI

http://datameti.go.jp
次世代統計利用システム

http://statdb.nstac.go.jp
日本のオープンデータ
•

地方自治体レベル

•
•
•

データシティさばえ(福井県鯖江市)

•
•

・・・

千葉県流山市役所・市議会
ビッグデータ・オープンデータ活用推進協議会(千葉市・
奈良市・福岡市・武雄市)
主な公開データ

...
データシティさばえ

http://www.city.sabae.fukui.jp/pageview.html?id=11552
日本のオープンデータ
•

草の根レベル

•
•

税金はどこへ行った?(52都市)
Wikipediaタウン(横浜・二子玉川)

http://spending.jp
http://www.solabo.net/wiki0525/
International Open Data Day

青森・会津若松・千葉・東京・横浜
名古屋・東海・鯖江・福岡
オープンデータとコミュニティ
•

2つのコミュニティ

•
•

2つのアクティビティ

•
•

•

ハッカーと市民
ハッカソンとアイデアソン
オープンデータ・カレンダー

CODE for AMERICA

•
•
•

Civic t...
LOD

識別子
非独占的
再利用可
ライセンス
ライセンス

•

オープンライセンス

•

「Open Definition」に基づくライセンス

•
•

•

商用・非商用を問わない2次利用
出典の表示を求めてもよい

Creative Commonsまたは互換ライセンスがデ
ファク...
構造化
•

中身の構造化

•
•
•

コード・項目名の共通化

データ群の構造化

•
•
•

「ネ申Excel」問題

カタログサイト

メタデータ・管理体制

課題

•
•

ファイルかAPIか

Data.govの例
Linked Open Data
図書

作品
作品
Linked Open Data
人物
友人

作品
作品

在住
Linked Open Data

友人

作品
作品

在住

観光地
観光地
舞台

観光
現実のデータ

同じ?

同じ?
関係ある?
Linked Open Dataの技術
•

異なるデータベース上のデータ同士をつなぐ

•

識別する

•
•

関係づける

•

•

同じものに同じアドレスをつける
リンクし、その意味(理由)を記述する

ウェブの仕組みそのもの

•...
Linked Open Data(詳細)
作家N
foaf:name
名前

作品B
dc:creator
著者

dc:title
タイトル

夏目漱石
dc:publisher
出版者

図書館サービス
http://library.j
p...
つながるデータ

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jenvtzsch. http://lod-cloud.net/ CC-BY-SA
LODの利点
•

標準化による分業体制の確立

•

データの書き方:RDF

•
•

分野のスペシャリストはデータの記述に集中

データの取り出し方:SPARQL

•
•

RDFストアのクエリ言語

データの抽出に独自プログラムを必要...
DBpedia Japanese

http://ja.dbpedia.org
DBpedia Japanese

<prop-ja:選手名 xml:lang="ja">藤浪 晋太郎</prop-ja:選手名>
<prop-ja:出身地 xml:lang="ja">大阪府堺市南区</prop-ja:出身地>
<prop-j...
SPARQLエンドポイント

SELECT DISTINCT ?label ?birthYear
WHERE {
?s <http://ja.dbpedia.org/property/生日
> 1 ;
<http://ja.dbpedia.or...
プロ野球因縁サーチ

http://innen-search.com
SPARQL Timeliner

http://uedayou.net/SPARQLTimeliner/
地場産業としてのオープンデータ
•

いますぐオープンデータだけで儲かるか?→ たぶんNo

•
•

データのあるところに人は集まる

•
•

•

人を呼び込むこと・注目を集めること
行政と開発者の直接的な信頼関係

「横浜モデル」人口3...
地場産業としてのオープンデータ
•

使う側から作る側へ

•
•

データ提供側の「痛み」を知る

•
•
•
•

「情報の構造化」の専門家として
出したけど使われない
他の部署から反対される

具体的な「できない理由」と抽象的な「する理由...
データを公開しない理由(1/5)
•

無関心

•
•
•

誰も気にしていない

コミュニティからの支援が得られない(市民ハッカーがいない)

混乱

•
•
•
•
•
•

明確な事例がない
データを何のために使うのかわからない

どん...
データを公開しない理由(2/5)
•

困難

•
•
•
•
•

•

大量のバックログを抱えている
ついていけない、時間がない、変化が早すぎる
データの量が膨大である
自分の時間の大部分が取られてしまう

費用

•
•

とにかく複雑で...
データを公開しない理由(3/5)
•

合法性

•
•
•
•
•

データや記録を公開する法的な権限を持っていない

•
•
•
•
•
•
•

機密データではないが、公開することでよいPRになるとは思えない

このデータを公開すれば、市...
データを公開しない理由(4/5)
•

正確さ

•
•
•
•
•

データを一括して公開すると、だれかがそれを変更してしまう

データを公開したりすると、私たちがハックされる
データを公開すると、やり方によっては人々が誤解する危険がある
市...
データを公開しない理由(5/5)
•

その他

•

データが優秀な技術者集団や高等教育を受けたコミュニティに利用さ
れると、デジタルデバイド問題がさらに深刻化する

•
•

今、それは優先事項ではない
それについてはペンディング状態だ、似...
データの地産地消

•

LODチャレンジ

•
•
•
•
•

オープンデータのコンテスト
アプリ部門・可視化部門・アイデア部門
データ部門:データそのものを評価
プラットフォーム部門:データを作る仕組
みを評価

MA9シビックハック賞
LODチャレンジ

http://lod.sfc.keio.ac.jp/
受賞作品 – アプリケーション部門
•

LinkData (http://linkdata.org/)

•
•
•

テーブルデータをRDF形式に変換・公開
LOD公開のインフラ
CityData・LinkData Appなどの派生プロジェ...
受賞作品 – データセット部門
•

saveMLAK (http://savemlak.jp/)

•

ボランティアによる社会教育施設(図書館・博物館・文書
館・公民館)の被災情報共有

•

実質的に入手可能な唯一の施設リスト
残念な日本地図

http://cheese-factory.info
オープンデータを広げるために
•

知る

•
•
•
•

NHK NEWS WEB
Open Knowledge Foundation Japan

使う

•
•
•

日経オープンデータ情報ポータル

LODチャレンジ
ハッカソン・アイ...
オープンデータ・アイデアソン
•
•

11/9@グランフロント(受付終了)
http://opendata-contest.jp

•
•

11/21@東京
11/26@松江
LODハッカソン
•
•
•

12/6 18:00〜20:00@グランフロント
12/7 10:00〜18:00@大阪大学吹田キャンパス
https://www.facebook.com/events/583277111709485
AIツール入門セミナー
•
•
•

12/16 10:00-17:00@大阪大学中之島センター
http://www.ai-gakkai.or.jp/no05_jsai_tool_introductory_course/

有料(16000円...
まとめ
•
•

政府レベルのオープンデータは着地点が見えてきた
地域・都市レベルはこれから

•
•
•

•

多様性を生み出す土壌
開発者コミュニティのコミットメントが必要不可欠
地場産業へ!

“Information wants to...
Upcoming SlideShare
Loading in …5
×

地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

4,831 views

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
4,831
On SlideShare
0
From Embeds
0
Number of Embeds
2,460
Actions
Shares
0
Downloads
14
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

  1. 1. 地場産業としての オープンデータの可能性 国立情報学研究所 大向 一輝 @i2k
  2. 2. 自己紹介
  3. 3. オープンデータの例 http://www.tepco.co.jp/forecast/index-j.html http://www.kepco.co.jp/setsuden/graph/index.html
  4. 4. オープンデータとは • データを誰でも使えるように • • • • ウェブ上で公開 再利用しやすい形で 本当に盛り上がっているのか? 何が難しいのか?
  5. 5. オープンデータの潮流 • 世界のデータ公開 • • • • • アメリカ:政府情報のオープンデータ化に関する大統領令 EU:公共セクター情報の再利用指令 G8:オープンデータ憲章 日本:電子行政オープンデータ戦略 進捗の確認・ランキング Open Data Index (WWWF) Open Data Census (OKFN)
  6. 6. 日本のオープンデータ • 政府レベル • • • • Open DATA METI(経済産業省) 次世代統計利用システム(総務省・統計センター) 内閣官房データカタログ 重点5分野 • • 白書、防災・減災、 地理空間情報、人の移動、予算・ 調達 制限 • 個人情報、安全保障に関わる情報、法令で取り扱いが 定められた情報
  7. 7. Open DATA METI http://datameti.go.jp
  8. 8. 次世代統計利用システム http://statdb.nstac.go.jp
  9. 9. 日本のオープンデータ • 地方自治体レベル • • • データシティさばえ(福井県鯖江市) • • ・・・ 千葉県流山市役所・市議会 ビッグデータ・オープンデータ活用推進協議会(千葉市・ 奈良市・福岡市・武雄市) 主な公開データ • 統計・地域情報・GIS・予算…
  10. 10. データシティさばえ http://www.city.sabae.fukui.jp/pageview.html?id=11552
  11. 11. 日本のオープンデータ • 草の根レベル • • 税金はどこへ行った?(52都市) Wikipediaタウン(横浜・二子玉川) http://spending.jp http://www.solabo.net/wiki0525/
  12. 12. International Open Data Day 青森・会津若松・千葉・東京・横浜 名古屋・東海・鯖江・福岡
  13. 13. オープンデータとコミュニティ • 2つのコミュニティ • • 2つのアクティビティ • • • ハッカーと市民 ハッカソンとアイデアソン オープンデータ・カレンダー CODE for AMERICA • • • Civic tech/hackのコミュニティ 公共セクターへの技術者派遣 日本版CODE for ***
  14. 14. LOD 識別子 非独占的 再利用可 ライセンス
  15. 15. ライセンス • オープンライセンス • 「Open Definition」に基づくライセンス • • • 商用・非商用を問わない2次利用 出典の表示を求めてもよい Creative Commonsまたは互換ライセンスがデ ファクトスタンダード • • • CC-BY CC0 ODC-by:Open Data Commons
  16. 16. 構造化 • 中身の構造化 • • • コード・項目名の共通化 データ群の構造化 • • • 「ネ申Excel」問題 カタログサイト メタデータ・管理体制 課題 • • ファイルかAPIか Data.govの例
  17. 17. Linked Open Data 図書 作品 作品
  18. 18. Linked Open Data 人物 友人 作品 作品 在住
  19. 19. Linked Open Data 友人 作品 作品 在住 観光地 観光地 舞台 観光
  20. 20. 現実のデータ 同じ? 同じ? 関係ある?
  21. 21. Linked Open Dataの技術 • 異なるデータベース上のデータ同士をつなぐ • 識別する • • 関係づける • • 同じものに同じアドレスをつける リンクし、その意味(理由)を記述する ウェブの仕組みそのもの • • ウェブページとハイパーリンク 「文書のウェブ」から「データのウェブへ」 同じ!
  22. 22. Linked Open Data(詳細) 作家N foaf:name 名前 作品B dc:creator 著者 dc:title タイトル 夏目漱石 dc:publisher 出版者 図書館サービス http://library.j p 春陽堂 dc:date 出版年 1907 foaf:topic 観光サイト http://visitor.j p 主語 http://library.jp/B http://library.jp/B http://library.jp/B 坊っちゃん テーマ 述語 目的語 dc:creator http://library.jp/N dc:publisher 春陽堂 foaf:topic http://visitor.jp/M 地域M
  23. 23. つながるデータ Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jenvtzsch. http://lod-cloud.net/ CC-BY-SA
  24. 24. LODの利点 • 標準化による分業体制の確立 • データの書き方:RDF • • 分野のスペシャリストはデータの記述に集中 データの取り出し方:SPARQL • • RDFストアのクエリ言語 データの抽出に独自プログラムを必要としない • • • TXT・CSV・XLS・XMLとの相違点 開発者はアプリケーションに集中 アプリに合わせてデータを作る • 「逆マッシュアップ」
  25. 25. DBpedia Japanese http://ja.dbpedia.org
  26. 26. DBpedia Japanese <prop-ja:選手名 xml:lang="ja">藤浪 晋太郎</prop-ja:選手名> <prop-ja:出身地 xml:lang="ja">大阪府堺市南区</prop-ja:出身地> <prop-ja:打席 xml:lang="ja">右</prop-ja:打席> <prop-ja:wikiPageUsesTemplate rdf:resource="http://ja.dbpedia.org/resource/Template:阪神タイガース" /> <prop-ja:所属球団 xml:lang="ja">阪神タイガース</prop-ja:所属球団> <prop-ja:背番号>19</prop-ja:背番号> <prop-ja:身長>197</prop-ja:身長> <prop-ja:生年月日>1994-04-12</prop-ja:生年月日> <prop-ja:利き腕 xml:lang="ja">右</prop-ja:利き腕> <prop-ja:ドラフト順位 xml:lang="ja">ドラフト1位</prop-ja:ドラフト順位> <prop-ja:守備位置 rdf:resource="http://ja.dbpedia.org/resource/投手" /> <prop-ja:経歴 xml:lang=“ja”>* 大阪桐蔭高等学校 * 阪神タイガース</prop-ja:経歴 <prop-ja:体重>86</prop-ja:体重> <prop-ja:年俸>1500</prop-ja:年俸>
  27. 27. SPARQLエンドポイント SELECT DISTINCT ?label ?birthYear WHERE { ?s <http://ja.dbpedia.org/property/生日 > 1 ; <http://ja.dbpedia.org/property/生月> 1 ; <http://ja.dbpedia.org/property/生年 > ?birthYear ; rdfs:label ?label . } ORDER BY ?birthYear
  28. 28. プロ野球因縁サーチ http://innen-search.com
  29. 29. SPARQL Timeliner http://uedayou.net/SPARQLTimeliner/
  30. 30. 地場産業としてのオープンデータ • いますぐオープンデータだけで儲かるか?→ たぶんNo • • データのあるところに人は集まる • • • 人を呼び込むこと・注目を集めること 行政と開発者の直接的な信頼関係 「横浜モデル」人口370万人 • • ウェブAPI・ソーシャルメディア 「鯖江モデル」人口5万人 • • 他のデータとの組み合わせ 市民団体・NPOとの連携 規模と状況はそれぞれ、それぞれの方法で
  31. 31. 地場産業としてのオープンデータ • 使う側から作る側へ • • データ提供側の「痛み」を知る • • • • 「情報の構造化」の専門家として 出したけど使われない 他の部署から反対される 具体的な「できない理由」と抽象的な「する理由」 オープンデータならではの分業 • • • アプリ構築 データ変換 プラットフォーム提供
  32. 32. データを公開しない理由(1/5) • 無関心 • • • 誰も気にしていない コミュニティからの支援が得られない(市民ハッカーがいない) 混乱 • • • • • • 明確な事例がない データを何のために使うのかわからない どんなデータが必要とされるのかがわからない データを公開する前に、どんな便益があるか明確にしてほしい 今のシステムで十分だ 人々を混乱させるだけだ
  33. 33. データを公開しない理由(2/5) • 困難 • • • • • • 大量のバックログを抱えている ついていけない、時間がない、変化が早すぎる データの量が膨大である 自分の時間の大部分が取られてしまう 費用 • • とにかく複雑で難しい 予算がない スタッフ問題 • • • それは私の仕事ではない 私の上司や政治家はデータ公開を望んでいない やり方を知っている人がいない
  34. 34. データを公開しない理由(3/5) • 合法性 • • • • • データや記録を公開する法的な権限を持っていない • • • • • • • 機密データではないが、公開することでよいPRになるとは思えない このデータを公開すれば、市民は私たちを訴える 私たちはデータに対する権利を持っていない 私たちがデータの所有者なのかどうなのかわからない データは販売するべきである。もし売りたくなったらどうすればよいのか?す でに売っている 私たちの弁護士は特別なライセンスを付与するべきだと言っている このデータを集めるのに、膨大な時間・人・資源を投入した なぜデータを必要としているのかを知りたいので、直接窓口に来てほしい 誰かがパッケージングし直して売り払ってしまうのではないか データをだれが利用して、何を行ったのかをコントロールしたい 連邦政府や他の政府機関がすでにデータをもっているので、そちらから入手し て欲しい
  35. 35. データを公開しない理由(4/5) • 正確さ • • • • • データを一括して公開すると、だれかがそれを変更してしまう データを公開したりすると、私たちがハックされる データを公開すると、やり方によっては人々が誤解する危険がある 市民が混乱する、データの品質がそもそも高くない プライバシー • • • • • • • プライバシー保護の懸念があり、データを公開できない もう既に公開している 窓口やプロバイダーを通じてすでに公開している 情報公開制度があるではないか すでに十分にデータは公開している APIを提供しているではないか データポータルが必要なら、同じようなものはすでにある
  36. 36. データを公開しない理由(5/5) • その他 • データが優秀な技術者集団や高等教育を受けたコミュニティに利用さ れると、デジタルデバイド問題がさらに深刻化する • • 今、それは優先事項ではない それについてはペンディング状態だ、似たようなプロジェクトもすで に始まっている 出典: Reasons to Not Release Data, Part 1-Part 10, Sunlight Foundation (日本語訳: 「公的機関がデータを公開しない理由」Open Knowledge Foundation Japan)
  37. 37. データの地産地消 • LODチャレンジ • • • • • オープンデータのコンテスト アプリ部門・可視化部門・アイデア部門 データ部門:データそのものを評価 プラットフォーム部門:データを作る仕組 みを評価 MA9シビックハック賞
  38. 38. LODチャレンジ http://lod.sfc.keio.ac.jp/
  39. 39. 受賞作品 – アプリケーション部門 • LinkData (http://linkdata.org/) • • • テーブルデータをRDF形式に変換・公開 LOD公開のインフラ CityData・LinkData Appなどの派生プロジェクト
  40. 40. 受賞作品 – データセット部門 • saveMLAK (http://savemlak.jp/) • ボランティアによる社会教育施設(図書館・博物館・文書 館・公民館)の被災情報共有 • 実質的に入手可能な唯一の施設リスト
  41. 41. 残念な日本地図 http://cheese-factory.info
  42. 42. オープンデータを広げるために • 知る • • • • NHK NEWS WEB Open Knowledge Foundation Japan 使う • • • 日経オープンデータ情報ポータル LODチャレンジ ハッカソン・アイデアソン・街歩き 支える • • 多様なステイクホルダーとの議論 意思決定者への働きかけ • 「うちはまだオープンデータやらないんですか?」
  43. 43. オープンデータ・アイデアソン • • 11/9@グランフロント(受付終了) http://opendata-contest.jp • • 11/21@東京 11/26@松江
  44. 44. LODハッカソン • • • 12/6 18:00〜20:00@グランフロント 12/7 10:00〜18:00@大阪大学吹田キャンパス https://www.facebook.com/events/583277111709485
  45. 45. AIツール入門セミナー • • • 12/16 10:00-17:00@大阪大学中之島センター http://www.ai-gakkai.or.jp/no05_jsai_tool_introductory_course/ 有料(16000円)
  46. 46. まとめ • • 政府レベルのオープンデータは着地点が見えてきた 地域・都市レベルはこれから • • • • 多様性を生み出す土壌 開発者コミュニティのコミットメントが必要不可欠 地場産業へ! “Information wants to be free, and linked.” 大向 一輝(国立情報学研究 所) http://researchmap.jp/i2k i2k@nii.ac.jp Twitter:@i2k

×