Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

共通語彙基盤について

1,589 views

Published on

2017/12/19 オープンデータトークシリーズ#22発表資料

Published in: Technology
  • Be the first to comment

  • Be the first to like this

共通語彙基盤について

  1. 1. オープンデータ・トークシリーズ第22回 共通語彙基盤について 2017年12月19日 独立行政法人 情報処理推進機構(IPA) 国際標準推進センター 清水 響子
  2. 2. 「人が普通に使っている用語の意味を共通的に定義したい」と考えるのが共通語彙基盤です。 「住所」というデータ項目(セル)には、何がどう書かれるべきなのか、イベントデータセット中の「住所」は、「開 催場所」なのか「主催者連絡先」なのか 各データ項目が何を意味するのかを共通語彙基盤の語彙に関連付け、データセットの相互運用性を確保(A 市の「所在地」とB市の「居住地」はともに「住所」である) 共通語彙基盤でいう語彙とは 用語の持つ意味や典拠を明確にする 用語が指す事柄と、その事柄の性質や事柄と事柄との関係を示す情報を体系化・階層構造化 共通語彙基盤って? 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 2 共通語彙基盤における語彙のイメージ B市「居住地」データセット A市「所在地」データセット 共通語彙 住所 郵便番号 全て「住所」を表す クラス用語 プロパティ用語 都道府県 市区町村 番地 「住所」は様々な 属性を持つ 113-6591 東京都 文京区本駒込 2-28-2 〒1008901 東京都千代田区霞が関一丁目3-1 郵便番号 都道府県 市区町村 番地 〒 住所 各データ項目の意味を 関連付け
  3. 3. サービス・アプリ データをつなぐIMI共通語彙基盤 データが相互につながりやすく、ユーザーへ届けやすくするための施策のひとつとしての基盤。 一度のデータ公開で多様なチャネルを通じたユーザーへの情報発信が可能に。 2017年12月11日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 3 プロモーション イベント TSR企業情報 統一資格有資格者 広報紙記事 ごみ処理 ・・・ 法人番号 特許・意匠・商標 自 治 体 官 公 庁 民 間 官 民 デ ー タ 活 用 推 進 基 本 計 画 情報流通を円滑に ・・・ ・・・ データユーザー
  4. 4. 共通語彙基盤の取組み 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 4
  5. 5. 共通語彙基盤の取組み コア語彙の整備を進めるとともに、共通語彙基盤の活用や相互運用性の高い語彙検討のため の情報やツールなどを検討・公開しています。 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 5 語彙 コア語彙 •HTML •Excel •JSON-LDコンテキスト •RDFスキーマ •XMLスキーマ •imiv データモデル •法人基本情報 •法人活動情報 •施設 など 技術仕様 語彙の記述仕 様 •IMI語彙記法 •IMI語彙文字セット 指定の記法 データモデルの 記述仕様 •データモデル仕様 •構造化項目名記 法 ツール・データベー ス等提供 提供中 •表形式データ →RDF、XMLへの変 換ツール 公開予定 •語彙データベース •語彙作成・変換・ 情報交換などの ユーザー支援ツー ル 情報提供 imi.go.jp • データ公開手順 • 解説 • 検討中の語彙 セミナー • 講演資料・動画 検討プロセス •検討・策定の体制 や手順 IMIパートナー 語彙整備・活用 •埼玉県 •さがみオープン データ推進協議会 •法人インフォ •・・ 相互運用性向 上 •XBRL •統計LOD •GeoJSON
  6. 6. コア語彙 移動・交通 地理空間・施設 市場 住所 駅 災害 復旧費 病院 IMIが検討・運用 IMIパートナーが検討し IMIが助言 応用語彙 ドメイン 語彙 農業 財務 観光 入場料 ゆるキャラ 農産物A 入場料 ゆるキャラ 史跡B 入場料 ゆるキャラ 飲食店 イベントC 日本食 農産物A 農産物B 花きA 農地 観光名所 イベントA コア語彙と応用語彙 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 6 コア語彙 IMI共通語彙基盤の基礎。氏名、住所、組織等、あらゆる社会活動で使用される中核的な約60 の用語を集約した、用語に関する意味や根拠、体系、階層構造等の定義集合。IMI検討部会が 策定・改定し、継続的に改善。 応用語彙 コア語彙の領域を超える場合、分野における事情に応じて策定される、独自の用語に関する意 味や根拠、体系、階層構造等の定義。→コア語彙の拡張による定義をお願いします!
  7. 7. コア語彙は共通データのデータ項目と構造を定義 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 7 平成29年12月1日 デジタル・ガバメント技術検討会議 データ・タスクフォース「データ標準の社会全体への展開について」より
  8. 8. コア語彙 これまでの改版と提供形式 人間用(青)とアプリ等機械用(緑)で公開しています。 最新版ではIMI語彙記法(語彙及び語彙の中の語の定義を、特定の利用形式に依存しない中立的な形式で記述する ための記法)で記述したファイルをマスターとしました。 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 8 年 月 版 主な変更点 改版の背景 提供形式 HTML XMLス キーマ RDFス キーマ JSON-LD コンテキ スト imiv(IMI 語彙記法) XLS 2014 6月 2.0 ○ ○ 10月 2.1 RDFスキーマ追加 試 用 プ ロ ジ ェ ク ト フィードバック ○ ○ ○ 2015 2月 2.2 プロパティ汎用化 命名規則の改善 パブコメ反映 ○ ○ ○ 12月 2.3 組織・イベント等定義の実データへ の親和性拡大 単位・スケジュール等の定義改善 「作業」等の追加 実運用フィードバック ○ ○ ○ 2016 2月 2.3.1 英語表記の追加、説明文の見直し ○ ○ ○ 11月 2.3.2 ドメイン(名前空間)の変更 IMIサイト開設 ○ ○ ○ 2017 3月 2.4.0 プロパティ用語「ID」「表記」「参照」 「画像」「説明」の定義改善 要望が高い9つのクラス用語追加 パブコメ反映 実運用フィードバック ○ ○ ○ ○ ○ 11月 2.4.1 クラス用語「事物型」に記述プロパ ティ(種別、説明)を追加 クラス用語「概念型」に以下プロパ ティを追加 • 種別 • 種別コード • メタデータ(文書型) 値の有無や数量を記述しやすく パブコメ反映 実運用フィードバック 推奨データセット対 応 ○ ○ ○ ○ ○ ○
  9. 9. 語彙データベースとユーザー支援ツール Excel、CSVからIMI共通語彙に基づいた構造化データに変換するツール「表からデータモデ ル」を無償公開しています。 語彙やDMDの作成を支援したり、自治体システムから呼び出されて構造化データの作成を支 援するなど、共通語彙基盤を活用するためのツールを開発中です。 92017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/
  10. 10. 自治体における取組み 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 10
  11. 11. オープンデータの取組み状況(2015-2016) IPAが毎年実施している全国自治体アンケート調査では、「取組を行っている」自治体が3割に 達しています。 他方、「未検討」「検討しているかどうかわからない」約半数の比率は減っていません。 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 11 16% 25% 4% 5% 34% 25% 45% 42% 2% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 2015年(n=741) 2016年(n=654) 取組みを行っている 取組みを開始予定である(具体的なスケジュールが決まっている) 検討中である(具体的なスケジュールが決まっていない) 未検討である 取り組んでいるかどうか分からない
  12. 12. 共通語彙基盤の活用状況(2015-2016) 共通語彙基盤の認知度は上がっていますが、調達条件や規範として活用する自治体は5%程 度にとどまっています。 とっつきにくいということでしょうか..。 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 12 1% 1% 5% 3% 52% 43% 42% 53% 0% 20% 40% 60% 80% 100% 2016(n=654) 2015(n=737) 調達条件や規範として用いている 調達の参考にしている 知っている 知らなかった 実装は5%程度
  13. 13. 公開しているオープンデータの5スターにおける段階(2015-2016) 1つ星は約1/3に減り、3つ星(CSV)が56%に、4つ星が11%に、5つ星が7%に増加しました。 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 13 14% 37% 12% 26% 56% 25% 11% 7% 7% 5% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 2016年(n=180) 2015年(n=303) ★ ★★ ★★★ ★★★★ ★★★★★
  14. 14. オープンデータの取組みにあたっての課題(2016) 「スキル、ノウハウ」「人員、時間、予算」「推進体制」が課題トップスリーでした。 データ形式など「技術的課題の検討」は進んだ模様です(2015年は56%)。 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 14 72% 65% 50% 46% 43% 37% 34% 31% 31% 16% 4% 4% 0% 10% 20% 30% 40% 50% 60% 70% 80% 職員のスキル、ノウハウが不足している 対応するだけの人員、時間及び予算がない(2015年は「費用がかかる」) 推進体制が決まっていない 取り組むことによる効果やメリットが十分に感じられない 公開したデータの管理および運用するための体制づくりが済んでいない オープンデータの知識を得る機会が少ない 公開対象とすべきデータの範囲(分野、期間など)が決められない 法的(ライセンス、著作権、プライバシーなど)課題の検討が済んでいない 保有する情報が電子化されていない オープンデータ化のためのシステム構築に課題がある アクセスログなど、情報の利用状況を把握しにくくなる その他 2016(n=648)
  15. 15. 自治体の方の声(SNS、オフラインなど) 「法律で義務付けたから、各自治体さん頑張っ てね」と言われても、前に進む気が全くしません。 一方、他の地域の取り組み事例を聞くと、もっと 可能性が広がってきそうでワクワクしてきます。 行政区域が変わると、提供されるデータの種類 も形式も変わるとなると、使う側にメリットが出 にくく、結局普及が進まない。 共通語彙基盤に基づいた統一したCMSで作ら れていれば、今になってオープンデータなど言 わずとも、そのCMSからデータを吐き出せば全 国統一のデータが取得できたのになぁ。 データ公開後に、表からデータモデルを再活用 して、容易に内容を更新できるような仕組みが 確立できれば。 コア語彙の用語の選び方がわからない>事例 を分かりやすい部分に載せてほしい 自治体では、データをどう出せば良いのかを決 めるハードルが意外に高い。ワーキンググルー プ*には、行政がデータを出しやすくなるきっか けを作る意味があった。 ITに詳しい自分でも、共通語彙基盤は難しい。 普通の自治体にはハードルが高いので、入力 支援ツールなどデータを簡単に作れる仕組みが 必要。 成果が他の自治体に真似されるようになれば、 町の知名度が向上し、標準・ひな型として全国 に普及する動機づけにもできる。 各部署で作成される文書の管理が効率化された。 さらに、庁内システムのデータが棚卸できたこと で、どのデータを開示して良いか、開示してはいけ ないかの判断基準も明確になってきた。 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 15 コア語彙未採用 コア語彙採用済み * 地元金融機関やITベンダーといった民間企業等や、県内自治体担 当者の計約60人を集めて、県・市町村共通で活用される可能性が 高い公共施設情報や観光地情報などについて、どんなデータ項目 が必要になるか検討したワーキンググループ
  16. 16. 相互運用性が高いオープンデータのメリットを感じられるような”ワクワクする”事例や、入門編 解説の拡充に努めます。 課題は沢山ありますが、データ流通の明るい未来に向かってまいりましょう。 対象選定 1 データ項目選定 2-7 データ項目定義 1-2 データ形式定義 3-4 データ作成 1-2 公開 3-4 運用 実施内容 作業対象 参照資料等 まずは、取り組んでもらうことが最優先かもしれません。 2017年12月19日 16 4. データを公開・運用する 3. 目的に合った記述方法を決 めて実装する 2. データに意味づけを行う 1. 目的の設 定 保有データ 推奨 データセット IMIコア語彙 ニーズの確認 対象選定 データ項目の選定 データ項目定義 入力 変換 公開 コア語彙対応 の確認 公開データセット RDF XML Excel、csv 運用データ形式定義 応用語彙 定義 データ入力 フォーマット データ項目 定義書 パブコメなど 表から データモデル 推奨 データセット PD(語彙) データカタログ データカタログ (公開フォーマット) データセット 定義 独立行政法人 情報処理推進機構 https://imi.go.jp/ IMIサイト「IMI共通語彙に対応したデータ公開手順」より ワクワクする 事例 公開し始めて 気づく課題の 共有 難しそう 大変そうの 払拭
  17. 17. ご清聴ありがとうございました 2017年12月19日 独立行政法人 情報処理推進機構 https://imi.go.jp/ 17

×