Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

オープンデータ公開プラットフォームとしてのWordPressへの期待

914 views

Published on

WordCamp Kansai 2016(2016/07/09)のセッションでの講演スライドです.

Published in: Technology
  • Be the first to comment

  • Be the first to like this

オープンデータ公開プラットフォームとしてのWordPressへの期待

  1. 1. オープンデータ公開プラットフォーム としてのWordPressへの期待 LODチャレンジ実行委員会 関西支部長 /大阪大学 産業科学研究所 古崎 晃司 kozaki@ei.sanken.osaka-u.ac.jp WordCamp Kansai 2016 2016/07/09 2016/7/9 WordCamp Kansai 2016 1
  2. 2. はじめに,質問  「オープンデータ」という言葉を 聞いたことがある方?  「LOD(Linked Open Data)」と いう言葉を聞いたことがある方? 2016/7/9 WordCamp Kansai 2016 2
  3. 3. 自己紹介  コミュニティ活動  LODチャレンジ実行委員会(2011~) 関西支部長 →LOD(Linked Open Data)を技術普及させたい 「LODチャレンジ」(コンテスト)への応募作品を増やしたい  特に,地元「大阪(関西)」でのコミュニティを大きくしたい 2016/7/9 3 研究成果として 公開中のソフト WordCamp Kansai 2016  古崎(こざき)晃司 @koujikozaki  本職: 大阪大学の研究者  専門: 人工知能(オントロジー工学) =“かしこい”コンピュータ(ソフトウェア)を作る →学問にとどまらず, 世の中で使われる技術を作りたい
  4. 4. 開催年度\応募部門 データセット アイデア アプリケー ション ビジュアライ ゼーション 基盤技術 2015年度(290作品) 2014年度(245作品) 2013年度(321作品) 2012年度(205作品) 2011年度( 73作品) 67 87 101 87 21 97 51 67 50 34 83 69 122 44 18 26 20 18 24 17 18 13 Linked Open Data(LOD) チャレンジ LODの技術普及を目的として開催している日本初の オープンデータに関するコンテスト(2011年度より毎年開催)  これまでの応募状況 http://lodc.jp 年々,応募作品数の増加/質の向上が見られる=LOD利用の広がり 2013年度以降には,オープンデータのコンテストが多数開催される 2016/7/9 WordCamp Kansai 2016 4
  5. 5. LODハッカソン関西 大阪イノベーションハブ(OIH)を 中心に開催(2013-,計7回) LODの技術資料の公開にも注力 http://wp.lodosaka.jp 2016/7/9 WordCamp Kansai 2016 5
  6. 6. オープンデータとは  オープンデータとは  誰でも自由に使える形で公開されているデータ  オープンデータの定義(Open Definition)  “Open data and content can be freely used, modified, and shared by anyone for any purpose” (http://opendefinition.org/)  オープンデータでない例  改変や再配布が禁止されている  利用者を限定 例)学術機関のみ,個人利用不可  利用目的を限定 例)商用利用不可,コンテスト応募目的のみ 2016/7/9 WordCamp Kansai 2016 6
  7. 7. オープンデータの2つの観点  オープンなライセンスを用いる  使用目的を限定せず(例:商用も可),再配布,改変も可  「作成者クレジットの表示」の義務付け程度の制限はOK →オープンデータの2次利用が促進される  cf.オープンソース, わぷー(https://2016.kansai.wordcamp.org/original-wapuu/)  オープンデータでは「クリエティブ・コモンズ (https://creativecommons.jp/)を用いることが多い  使いやすい(機械可読な)フォーマットで提供する  プログラムで処理しやすいフォーマットが望まれる →“使いたい人”が,簡単に使える =低コストで多くのアプリ(活用事例)が作れる 2016/7/9 WordCamp Kansai 2016 7
  8. 8. G8サミット「オープンデータ憲章」 http://www.mofa.go.jp/mofaj/gaiko/page23_000044.html 2013/06/18 我々は,オープンデータが,イノベーションと繁 栄を可能にし,また,市民のニーズに合致した, 強固かつ相互に繋がった社会を構築していく ための大きな可能性をもった未開発の資源で あることに合意する。 そのため,我々は,以下の原則に合意する。 • 原則としてのオープンデータ • 質と量 • すべての者が利用できる • 改善したガバナンスのためのデータの公表 • イノベーションのためのデータの公表 G8各国が, 「オープンデータを推進する」 ことに合意 82016/7/9 WordCamp Kansai 2016 オープン・バイ ・デフォルト
  9. 9. 政府標準利用規約(第2.0版)  日本政府が各サイトで公開するコンテンツの利用 規約の「ひながた」を与えるもの  クリエイティブ・コモンズ・ライセンスの表示4.0国際 (CC BY)に互換性を持つ.  https://creativecommons.org/licenses/by/4.0/legalcode  政府のサイトに公開されている情報利用が「自由に」 行えることを明記.  参考)「政府標準利用規約(第2.0版)」の概要  http://www.kantei.go.jp/jp/singi/it2/densi/kettei/g l2_betten_1_gaiyou.pdf 2016/7/9 WordCamp Kansai 2016 9
  10. 10. 日本のオープンデータ都市マップ 2016/7/9 10 http://fukuno.jig.jp/2013/opendatamap • 早期からオープンデータに 取り組んでいた鯖江市で オープンデータの推進をさ れている福野さん(jig.jp) がまとめられている 「オープンデータに取り組ん でいる日本の都市の一覧」 • この一覧自体がLODとして 公開されている • 2016/05/31時点で204都市 WordCamp Kansai 2016 多くの自治体が, オープンデータを 提供しつつある
  11. 11. オープンデータの2つの観点  オープンなライセンスを用いる  使用目的を限定せず(例:商用も可),再配布,改変も可  「作成者クレジットの表示」の義務付け程度の制限はOK →オープンデータの2次利用が促進される  cf.オープンソース  オープンデータでは「クリエティブ・コモンズ( https://creativecommons.jp/)を用いることが多い  使いやすい(機械可読な)フォーマットで提供する  プログラムで処理しやすいフォーマットが望まれる →“使いたい人”が,簡単に使える =低コストで多くのアプリ(活用事例)が作れる 2016/7/9 WordCamp Kansai 2016 11
  12. 12. Data.go.jp:日本政府の オープンデータカタログサイト http://data.go.jp/ 本格運用を開始 2014年10月1日 2013年12月 ↓ 2014年4月休止 ※コミュニティが ミラーサイト作成 122016/7/9 WordCamp Kansai 2016
  13. 13. data.go.jpのデータの形式 2016/7/9 WordCamp Kansai 2016 13 まだまだ,PDFなど 機械可読でない フォーマットが多い 技術的なサポートが 必要とされる
  14. 14. オープンデータ公開の仕組み 2016/7/9 WordCamp Kansai 2016 14
  15. 15. オープンデータ公開の仕組み  公開用のWebページにファイルを置く  オープンデータのカタログサイト (ポータルサイト)の公開  オープンデータにアクセスするための (Web-)APIの提供 2016/7/9 WordCamp Kansai 2016 15
  16. 16. 大阪市 オープンデータポータルサイト 2016/7/9 WordCamp Kansai 2016 16 2016年3月17日 オープン https://data.city.osaka.lg.jp/ 一部のデータには,API (SPARQLエンドポイント) も提供
  17. 17. 神戸市 オープンデータポータルサイト 2016/7/9 WordCamp Kansai 2016 17 https://data.city.kobe.lg.jp/
  18. 18. Linked Open Data (LOD) -Webの仕組みを用いた オープンデータの公開- =Linked Data + Open Data(オープンデータ) =Linked Dataとして公開されたOpen Data ※Linked Data: Webの仕組みを用いて相互に“リンクされた”データ 2016/7/9 WordCamp Kansai 2016 18
  19. 19. 5 ★ オープンデータ http://5stardata.info/ より 2016/7/9 WordCamp Kansai 2016 オープン ライセンス (形式問わず) 機械可読な フォーマット オープンな フォーマット 19
  20. 20. Webの仕組み  URLを指定することで,Webページにアクセス  例)http://wida.jp/2016/02/18/openhashimoto/ 「オープンデータフォーラムin橋本」のページ  URLは,世界中“すべて”のWebページの場所(ID) を一意に特定できる仕組み  ハイパーリンクにより,Webページを“つなげる”  リンク先のURLを指定することで,好きなWebページ と自由に“リンク”できる  リンクを辿って,様々な情報にたどり着ける  リンクを解析による様々なビジネス  例)Googleなどの検索エンジン 2016/7/9 WordCamp Kansai 2016 20
  21. 21. Webの仕組み→Linked Data  URLを指定することで,Webページにアクセス  例) http://wida.jp/2016/02/18/openhashimoto/ 「オープンデータフォーラムin橋本」のページ  URLは,世界中“すべて”のWebページの場所(ID) を一意に特定できる仕組み  ハイパーリンクにより,Webページを“つなげる”  リンク先のURLを指定することで,好きなWebページ と自由に“リンク”できる  リンクを辿って,様々な情報にたどり着ける  リンクを解析による様々なビジネス  例)Googleなどの検索エンジン 2016/7/9 WordCamp Kansai 2016 データ データ Linked Data Webと同じ仕組みでデータを“公開”し, 相互に“つなぐ”(リンクする) 21
  22. 22. LODを公開する仕組み  公開用のWebページにファイルを置く  小規模なLODの公開  大量アクセス向けのダンプファイルの提供  オープンデータにアクセスするための (Web-)APIの提供  データのURIを用いたWebと同じ方法でのアクセス  参照解決可能なhttp URI  コンテンツネゴシエーション  LOD用に標準化されたWeb-API(SPARQLエンドポ イント)の公開 2016/7/9 WordCamp Kansai 2016 22
  23. 23. LODの公開例:DBpedia Wikipediaの各記事のインフォボックスの情報を抽出して自動生成 されるLOD 様々なデータをつなぐLODのハブ的な存在となっている. http://dbpedia.org/ 日本語版のDBPediaは http://jp.dbpedia.org/ インフォボックスの例 232016/7/9 WordCamp Kansai 2016
  24. 24. URIを用いたLODへのアクセス DBpediaのデータ例(和歌山県) 2016/7/9 WordCamp Kansai 2016 すべてのWikipediaの記事が http://ja.dbpedia.org/resource/和歌山県 のようなURL(IRI)でデータ化されている 24
  25. 25. 2016/7/9 WordCamp Kansai 2016 DBpediaの元データ(和歌山県) 主にこの部分 がLODに変換 されている 25
  26. 26. URIを用いたLODへのアクセス  アクセスする方法・ツールに応じて適切な形式 でデータを取得することができる (Content Negotiation)  例:DBpedia Japaneseにおける和歌山県  事物(非情報リソース) http://ja.dbpedia.org/resource/和歌山県  HTML表現(情報リソース) http://ja.dbpedia.org/page/和歌山県  N3/Turtle表現(情報リソース) http://ja.dbpedia.org/data/和歌山県.n3  RDF/XML表現(情報リソース) http://ja.dbpedia.org/data/和歌山県.rdf  RDF/JOSN表現(情報リソース) http://ja.dbpedia.org/data/和歌山県.json 2016/7/9 WordCamp Kansai 2016 Webブラウザ用 各種 アプリ向け 26
  27. 27. Web-API(SPARQLエンドポイント) によるLODへのアクセス http://jp.dbpedia.org/ SPARQL Endpoint (Linked Data用の標準検索API) ※ここから,検索可能 2016/7/9 WordCamp Kansai 2016 27
  28. 28. SPARQLによるRDFの検索  SPARQL  RDFデータに対するクエリ言語  「指定したグラフ構造」に一致するトリプルを検索する  最も基本的な検索 select ?s ?p ?o where { ?s ?p ?o . } LIMIT 100 ←取得する数の制限 ←検索するグラフのパターン ←返す要素 (*は全て) この例では「任意のトリプルの組み合わせ」 このパターンを変 えることで,欲しい データを取得する 282016/7/9 WordCamp Kansai 2016
  29. 29. DBpedia Japaneseの SPARQL Endpoint サンプルクエリ集 http://wp.lodosaka.jp/tool/sparqlquery/ http://ja.dbpedia.org/sparql ここに,クエリを入れる ※プログラムからのクエリ +結果取得も可能 Virtuosoという RDF-DBを利用 2016/7/9 WordCamp Kansai 2016 「橋本市」のデータを取得するクエリ例 select distinct * where { <http://ja.dbpedia.org/resource/橋本市> ?p ?o . } 29
  30. 30. DBpedia Japaneseの検索例  「各都道府県で生まれた政治家の数」を調べる PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX dbpedia-owl: <http://dbpedia.org/ontology/> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX dbpedia-ja: <http://ja.dbpedia.org/resource/> PREFIX category-ja: <http://ja.dbpedia.org/resource/Category:> select distinct ?pref (count(?s) AS ?c) where { ?pref rdf:type dbpedia-owl:Place. ?pref dbpedia-owl:wikiPageWikiLink category-ja:日本の都道府県. ?s rdf:type dbpedia-owl:Politician; dbpedia-owl:birthPlace ?pref. }GROUP BY ?pref ORDER BY ?c 2016/7/9 WordCamp Kansai 2016 30 (解説)Qiita:DBpediaを使った都道府県別ランキング http://qiita.com/koujikozaki/items/439fa7ce3e28b738fe10
  31. 31. DBpedia Japaneseの検索例  「各都道府県で生まれた芸人の数」を調べる PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX dbpedia-owl: <http://dbpedia.org/ontology/> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX dbpedia-ja: <http://ja.dbpedia.org/resource/> PREFIX category-ja: <http://ja.dbpedia.org/resource/Category:> select distinct ?pref (count(?s) AS ?c) where { ?pref rdf:type dbpedia-owl:Place. ?pref dbpedia-owl:wikiPageWikiLink category-ja:日本の都道府県. ?s rdf:type dbpedia-owl:Comedian; dbpedia-owl:birthPlace ?pref. }GROUP BY ?pref ORDER BY ?c 2016/7/9 WordCamp Kansai 2016 ここを, Politician→Comedian に変えるだけ! 31
  32. 32. LODが利用できるサイト例(1) 2016/7/9 32 経済産業省法人ポータル 経済産業省OPEN DATA METI eStat 統計LOD 国立国会図書館LOD 大阪市オープンデータポータル DBpedia(WikipediaのLOD) WordCamp Kansai 2016
  33. 33. LODが利用できるサイト例(2) 2016/7/9 33 LinkData.org SparqlEPCU LOD4ALL GeoNames.jp 大河配役LOD LODハッカソン関西 WordCamp Kansai 2016
  34. 34. 既に公開・リンクされているLOD ~LODクラウド~ Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/ 2014/08/30 342016/7/9 WordCamp Kansai 2016 DBpedia
  35. 35. オープンデータ公開の課題 とWordPressへの期待 2016/7/9 WordCamp Kansai 2016 35
  36. 36. “ラーメン好き”あるある 2016/7/9 WordCamp Kansai 2016 36 Facebookのアルバムが 「ラーメン」の写真であふれる. ネットで調べて行った 「ラーメン屋」が, つぶれている... データは継続的な メンテナンス(更新・修正) が必要
  37. 37. オープンデータの継続的な公開 を助ける仕組み  オープンデータを公開するWebサービス  LinkData.org,SparqlEPCU など  オープンデータ・ポータル/カタログサイト  GitHubの利用  行政機関がGitHubアカウントを作ってオープンデータ の公開に利用している例が多数あり  https://government.github.com/  日本では,国土地理院,国会図書館,和歌山県,神戸市…  CMSの利用  CMSで記事を書く=そのままオープンデータが公開 という仕組みがオープンデータの普及に貢献! 2016/7/9 WordCamp Kansai 2016 37
  38. 38. GitHub and Government 2016/7/9 WordCamp Kansai 2016 38 https://government.github.com/
  39. 39. Made for _____ 2016/7/9 WordCamp Kansai 2016 39 https://github.com/madefor GitHubでオープンデータ+ WebAPIを提供する有志の 取り組み
  40. 40. LODの公開例:DBpedia Wikipediaの各記事のインフォボックスの情報を抽出して自動生成 されるLOD 様々なデータをつなぐLODのハブ的な存在となっている. http://dbpedia.org/ 日本語版のDBPediaは http://jp.dbpedia.org/ インフォボックスの例 402016/7/9 WordCamp Kansai 2016 • Wikipedia=Wikiベースで書かれ た記事,をLODに変換 • テンプレートを利用することで, 構造化されたデータに! • Wikipediaの記事が増えると その分DBpediaのデータも増える
  41. 41. スマートフォン アプリ & Webアプリ により配信 「PUSH大阪」&「PUSH広報」 RSSをオープンデータとして活用する仕組み 2016/7/9 WordCamp Kansai 2016 41 各自治体がWebサイトで 配信しているRSSを自動収集 + メタデータ RSSの内容を解析し, 各記事の想定対象 者などのメタデータ を自動付与 RDFデータ ベースに格納 ユーザが登録した 属情報に応じた 情報を配信 Linked Open Data (LOD)として公開(※) HPの新着情報(RSS)を自動収集 追加情報の自動付与 「PUSH広報」 約100都市 に対応 「PUSH大阪」 「PUSH豊中市」 ※自治体のCMSで自動生成されるRSSを収集・加工して, オープンデータとして活用している.
  42. 42. 「PUSH 大阪」とは 行政が発信する情報が,なかなか市民に届かない という課題を, ユーザが関心のある情報のみを,簡単に取得できる仕組み で解決しよう!というアプリ( iOS・Androidアプリ版/Web版を提供) 2016/7/9 42 カテゴリ で絞込 地域(区) や対象者 で絞込 記事の閲覧 (大阪市HPへ) 「PUSH大阪」の特徴 • 大阪市HPの最新情報が, スーマートフォン等で簡単に閲 覧できる • 興味があるカテゴリ,地域を登 録しておくと,「興味がある情報」 のみが届く • Android版では配信された情報 を定期的に通知バーに表示す ることで,普段見落としがちな 情報に気づかせる工夫. • 大阪市HPの更新情報(RSS) を利用するので,導入に際し 自治体での追加作業は不要 http://push.jp.net WordCamp Kansai 2016 汎用版の「PUSH広報」 豊中市との共同研究 による「PUSH豊中市」 も開発
  43. 43. WordPressをオープンデータ 公開に用いる取り組み  LOD作成・公開プラットフォームとして  オープンデータを公開する人は,非エンジニアも多数  オープンデータを簡単にLODとして公開できるCMSとして, WordPressを活用できないか?  例)Make JSON-LD for WordPress With Custom Fields(by Okamoto Hidetakaさん) https://ja.wordpress.org/plugins/make-json-ld-for-custom-fields/  WordCamp Kansai 2015/2016ハンズオン  “オープンデータ”をあなたのサイトで可視化してみる! ハンズオン&ミニ・ハッカソン<2015>  https://2015.kansai.wordcamp.org/session/opendata- wordpress-of-hackathon/  WordPressで多言語オープンデータを発信するハンズ オン<2016>  https://2016.kansai.wordcamp.org/handson/#hanson_6 2016/7/9 WordCamp Kansai 2016 43
  44. 44. まとめ  オープンデータ公開プラットフォームとしての WordPressへの期待  WordPressの「使いやすさ」と,Web-APIなどの技術 的な仕組みをうまく活用すれば,オープンデータを簡 単に公開できる基盤としての活用が期待できそう!  JavaScriptのものは多数あるので,移植すればOK?  ご興味のある方は,ぜひ,お声がけください!  ご質問などは  @koujikozakiへ 2016/7/9 WordCamp Kansai 2016 44

×