Data datadata


Published on

「Data,data and data」①

Published in: Technology
Data datadata

  1. 1. Data, Data and Data
  2. 2. 1 Data, Data and Data
  3. 3. 2 Data policy is not sexy. 成果が出るまでに時間がかかる。 成果は大きいが、サービスとして表に出ない。 困っていない。(影でクレンジングしている人がいる)
  4. 4. 3 相田みつを 土 の 中 の 水 道 管 高 い ビ ル の 下 の 下 水 大 事 な も の は 表 に 出 な い 花 を 支 え る 枝 枝 を 支 え る 幹 幹 を 支 え る 根 根 は 見 え ね ん だ な
  5. 5. 4 地味だが 頑張るしかない
  6. 6. 5 20世紀のインフラは、道路や橋や建物であった。 21世紀のインフラは、データやその連携基盤である。 0101001001001001010101000101010101010101101010101000001010010111010110100010100101001010101010100 1010010010010010101010001010101010101011010101010000010100101110101101000101001010010101010101000 0001010010111010110100010100101001010101010100101001001001001010101000101010101010101101010101000 0010100101110101101000101001010000101001001001001010101000101010101001010010010010010101010001010
  7. 7. 6 Society5.0の実現には、とにかく基盤が必要 量、多様性、網羅性等、クオリティの高いデータ データの持つポテンシャルを100%引き出すためのツール・基盤 データ利用、流通が円滑にできるようなルール 基盤 ツール ルール データ (燃料) AI 社会のポテンシャルとしてデータを考える。
  8. 8. 7 AI 実証 区間 やるべきことは実証か?
  9. 9. 8 ゆがみ 低い生産性 高い開発費 維持費 既存のデータ 遺構の上にビルを建てるのか?
  10. 10. 9 このままでは飲みなくないな。
  11. 11. 10 少しづつでも基盤を固める
  12. 12. 11 世界との関係でどんな感じなのよ?
  13. 13. 12 戦略 体制 標準等 ◎ ◎ ◎ 戦略 体制 標準等 △ ☓ △ 戦略 体制 標準等 ◎ ◎ ◎ 統合イノベーション戦略 世界最先端デジタル国家創造宣言・ 官民データ活用推進基本計画 オープンデータ基本指針 デジタル・ガバメント推進方針 民間デジタルサービスは、GAFAに席巻された。 国のデジタルインフラは、太刀打ちできているのか。 ルール、ツール、データの整備を着々と推進 2020年中に次期戦略が整理される 各パーツの取り組みを統合していく必要がある これまでの取組を束ねる新データ戦略を、 2020年に一気に推進 Digital single Market Connecting Europe Facility European Interoperability Framework タリン宣言
  14. 14. 欧州の取り組み Digital single Market デジタル経済の中で人やビジネスが、そのデジタル化のチャンスを活かせるようにするための戦略 European Interoperability Frameworkに基づくデータ標準群 ISA2 2020年12月を目標に行政機関のインタオペラ ビリティ確保を目的にECが推進するプログラム 52のアクション 9のソリューションを展開 Horizon2020 2020年を目標に欧州全体での研究開発プロジェクト CEF(Connecting Europe Facility) ヨーロッパ全体で、経済成長、雇用創出、競争力強化のために共通インフラ を整備する政策。その中でDigital Service Infrastructuresを推進。 マーケット系と行政系で別組織が推進してきたが、今後は一緒に取り組む方向
  15. 15. 14 eInvoicing • Send and receive electronic invoices  CEF:Connecting Europe Facility Big Data Test Infrastructure  • Experiment with big data in a safe environment  Context Broker  • Collect & share real‐ time data from multiple sources eArchiving • Store and preserve digital information  eID • Securely identify European citizens  eDelivery  • Exchange data and documents securely  eSignature  • Create and verify legally recognised electronic signatures Data Economy eIDAS enablers eInvoicing Directive eTranslation • Provide a multi‐lingual public service  デジタルデータを連携する共通機能を 欧州全体で整備
  16. 16. 15 Tallinn Declaration on eGovernment Policy action lines 1) Digital-by-default, inclusiveness and accessibility) 2) Once only 3) Trustworthiness and Security 4) Openness and transparency 5) Interoperability by default 6) Horizontal enabling policy steps User-centricity principles for design and delivery of digital public services When interacting with public administrations and using digital public services, citizens and businesses should expect: • Digital Interaction • Accessibility, security, availability and usability • Reduction of the administrative burden • Digital delivery of public services • Citizen engagement • Incentives for digital service use • Protection of personal data and privacy • Redress and complaint mechanisms
  17. 17. 16 • Information exchange between the EU and Member States to monitor the EU law application • Strengthening the EU’s telecommunications backbone • Providing big data opportunities for public administrations • Reusable tools for EU public participation • Simplifying e-procurement and e-invoicing adoption • Sharing statistical services and solutions • Improving semantic interoperability in European eGovernment systems • Facilitating the exchange of legislation data in Europe • Developing next generation digital networks • Reducing the administrative burden on businesses • Sharing information on the powers and mandates of legal entities • Sharing information for the maritime surveillance • Reusable tools for information collection • Towards better financial data reporting • Overcoming language barriers • Digitising EU law production • Improving EU data reusability and visualisation • Facilitating secure file exchange • A platform for sharing knowledge, good practices and IT solutions in the public sector • Fostering national interoperability frameworks across Europe • ISA² collaborative platform: a hub for community building activities • Contributing to efficient implementation of EU law • Supporting data exchange on competition case management across Europe • A platform to test IT systems, services and products • Defining a common approach to electronic document and file exchange • Achieving a modern ICT standardisation policy • Improving national and cross-border access to government data • Accessing Member State information resources at European level • Communicating the ISA² programme and its solutions • Promoting sharing and reuse of IT solutions • Towards a European Interoperability Architecture • The role of interoperability in organisations • Continual support and service improvements for online communities • A tool for Europe-wide online consultations and surveys • Evaluating and rationalising ICT in public administrations • Assessing progress being made towards interoperability of public services • Open Source software for editing legislation • Evaluating progress in implementing the ISA² Programme • Facilitating archive management across Europe • Improving exchange of legislation data • Facilitating cooperation on EU legislation • Improving the transparency of delegated acts • Common architecture for the Single Digital Gateway • Bringing new technologies in the public sector • Processing open source data with exchangeable components • Enhancing the discoverability and analysis of statistical data and metadata • Towards a renewed Comitology Register • Improving public access to European Commission documents • Measuring maturity of data • Semantic similarity platform for research & innovation grant applications • Developing an open source CAPTCHA • Making the usage of Cloud safer • Improving digital skills in the public sector ISA2 Actions
  18. 18. 17 EIRA and CarTool : European Interoperability Reference Architecture and Cartography tool Joinup : A collaborative platform facilitating the sharing and reuse of IT solutions developed for public administrations DCAT Application Profile for data portals in Europe : Specification describing public sector datasets Core Vocabularies: Simplified, reusable and extensible data models Asset Description Metadata Schema (ADMS) : Metadata standard Core Public Service Vocabulary Application Profile (CPSV-AP) : A data model for describing public services and the associated life and business events NIFO : The National Interoperability Framework Observatory The European Union Public Licence (EUPL) : Open source licence e-Documents Reference Architecture : ArchiMate diagrams visualising e-Document lifecycle IMAPS : Interoperability Maturity Assessment of a Public Service Re3gistry : A tool to manage and share reference codes LEOS : A tool facilitating the drafting of legislative texts OCS for ECIs : Online Collection Software to support European Citizens' Initiatives European Single Procurement Document (ESPD) : A single tool facilitating participation in public procurement across the EU EUSurvey : A tool for creating, managing and analysing online surveys and public consultationsInteroperability Test Bed Interoperability and conformance testing platform TESTA : A data communication network service, operated by the European Commission CAMSS : Common assessment method for standards and specifications OpenPM² : Open Project Management Methodology VocBench3 : A multilingual platform for collaborative thesaurus management ISA2 Solutions
  19. 19. 18 欧州が2025-2030年に実現する世界 データ形式 データ項目 データモデル 文字 コード センサー データ サービス・カタログ データ連携基盤 ルール データ品質管理・ガバナンス データ連携基盤 戦略 認 証 ・セ キ ュ リ テ ィ 戦略・政策 ルール 組織 ビジネス 利活用機能 データ データ連携 アセット セ キ ュ リ テ ィ ・ 認 証 組織 ビジネス アセット 認 証 ・セ キ ュ リ テ ィ IMAPS Core Vocabulary、 Service Catalogue Context Broker等、CEF eTranslation Control led Vocabu lary Context Broker等 Digital single market Base  Registries INSPIRE DCAT、CPSV等 GDPR BLIS、TOOP • 各パートの取り組みが同じ方向 eIDAS • 必要な機能がほぼ揃っている • ベースレジストリ整備 が進んでいる • 人材もチームもある • Digital ready legislation • ワンスオンリーの推進 青:完了もしくは3月末までに目処がある 黃:1年以内に目処 赤:5-10年で解決 EIF CEF、SEMIC • アーキテクチャがある • 民間ツール含め充実 • 品質やガバナンスルールが充実 人材が豊富で、蓄積もあるので、普及フェーズになっている syncronicity
  20. 20. 19 A European strategy for data The European data space 1. A cross-sectoral governance framework for data access and use 2. Enablers: Investments in data and strengthening Europe’s capabilities and infrastructures for hosting, processing and using data, interoperability 3. Competences: Empowering individuals, investing in skills and in SMEs 4. Common European data spaces in strategic sectors and domains of public interest Industry (manufacturing) , Green Deal, Mobility, Health, Financial, Energy, Agriculture, Public administration, Skills 2022年まで集中投資
  21. 21. 20 1. Uphold Ethics 2. Exercise Responsibility 3. Promote Transparency 4. Ensure Relevance 5. Harness Existing Data 6. Anticipate Future Uses 7. Demonstrate Responsiveness 8. Invest in Learning 9. Develop Data Leaders 10.Practice Accountability Principles 1. 倫理を守る 2. 責任を遂行する 3. 透明性を高める 4. 関連性を確認する 5. 既存データを活用する 6. 将来の使用を予測する 7. 応答性を実証する 8. 学習に投資する 9. データ リーダーを作る 10.説明責任を実践する ETHICAL GOVERNANCE 倫理的ガバナンス CONSCIOUS DESIGN 意識的なデザイン LEARNING CULTURE 学習文化 米国のFederal Data Strategy
  22. 22. 21 Building a Culture that Values Data and Promotes Public Use Practices 1-10 1.Identify Data Needs to Answer Key Agency Questions 2.Assess and Balance the Needs of Stakeholders 3.Champion Data Use 4.Use Data to Guide Decision-Making 5.Prepare to Share 6.Convey Insights from Data 7.Increase Accountability of Federal Spending 8.Monitor and Address Public Perceptions 9.Connect Data Functions Across Agencies 10.Provide Resources Explicitly to Leverage Data Asset Governing, Managing, and Protecting Data Practices 11-26 11.Prioritize Data Governance 12.Govern Data to Protect Confidentiality and Privacy 13.Protect Data Integrity 14.Convey Data Authenticity 15.Assess Maturity 16.Inventory Data Assets 17.Recognize the Value of Data Assets 18.Manage with a Long View 19.Maintain Data Documentation 20.Leverage Data Standards 21.Align Agreements with Data Management Requirements 22.Identify Opportunities to Overcome Resource Obstacles 23.Allow Amendment 24.Enhance Data Preservation 25.Coordinate Federal Data Assets 26.Share Data Between State, Local, and Tribal Governments and Federal Agencies データを大切にし、公共利用を促進する文化の構築 プラクティス 1-10 1.各組織に対して回答すべき主要なデータを定義する 2.ステークホルダーのニーズを、評価し、バランスをとる 3.データの使用を奨励する 4.意思決定のためにデータを使用する 5.共有の準備をする 6.データからインサイトを得る 7.連邦政府支出の説明責任を高める 8.一般の認識をモニターし、対処する 9.複数の機関間でデータ機能を接続する 10.データ資産を活用するためのリソースの明示的な提供 データのガバナンス、管理、保護 プラクティス 11-26 11.データガバナンスの優先順位付け 12.機密性とプライバシーを保護するためのデータの管理 13.データの整合性を守る 14.データの信頼性を確保する 15.成熟度を評価する 16.データ資産をインベントリにする 17.データ資産の価値を認識する 18.長いビューで管理する 19.データドキュメントの更新 20.データ標準の活用 21.データ管理要件に合わせた契約 22.リソースの障壁を克服するための機会を定義する 23.修正を許可 24.データ保存の強化 25.連邦データ資産を調整する 26.州政府、地方政府、部族政府および連邦政府機関間でデータを共有する 今後5年から10年で行う40の実践項目 国、自治体を通じたベースレジス トリ、データ標準、品質の強化 ワンスオンリー 重要データの特定 データの活用と共有の推進
  23. 23. 22 Promoting Efficient and Appropriate Data Use Practices 27-40 27.Increase Capacity for Data Management and Analysis 28.Align Quality with Intended Use 29.Design Data for Use and Re-Use 30.Communicate Planned and Potential Uses of Data 31.Explicitly Communicate Allowable Use 32.Harness Safe Data Linkage 33.Promote Wide Access 34.Diversify Data Access Methods 35.Review Data Releases for Disclosure Risk 36.Leverage Partnerships 37.Leverage Buying Power 38.Leverage Collaborative Computing Platforms 39.Support Federal Stakeholders 40.Support Non-Federal Stakeholders 効率的かつ適切なデータ利用の促進 プラクティス 27-40 27.データ管理と分析のための能力向上 28.使用目的と品質の整理をする 29.使用および再利用のためのデータの設計 30.データの計画された使用内容やデータの持つポテンシャルを検討する 31.許可された使用内容を明示的に公開する 32.セーフデータリンケージの利用 33.幅広いアクセスを促進する 34.データ アクセス方法の多様化 35.開示リスクに関するデータリリースのレビュー 36.パートナーシップの活用 37.購買力を活用 38.コラボレーション コンピューティング プラットフォームの活用 39.連邦政府の利害関係者を支援する 40.非連邦政府の利害関係者をサポート 優れた設計、ルール公開、アクセス方法の多 様化、プラットフォームの活用、人材育成・支援 今後5年から10年で行う40の実践項目
  24. 24. 23 Agency Actions 1: Identify Data Needs to Answer Priority Agency Questions 2: Constitute a Diverse Data Governance Body 3: Assess Data and Related Infrastructure Maturity 4: Identify Opportunities to Increase Staff Data Skills 5: Identify Priority Data Assets for Agency Open Data Plans 6: Publish and Update Data Inventories Community of Practice Actions 7: Launch a Federal Chief Data Officer Council 8: Improve Data and Model Resources for AI Research and Development 9: Improve Financial Management Data Standards 10: Integrate Geospatial Data Practices into the Federal Data Enterprise Shared Solution Actions 11: Develop a Repository of Federal Enterprise Data Resources 12: Create OMB Federal Data Policy Committee 13: Develop a Curated Data Skills Catalog 14: Develop a Data Ethics Framework 15: Develop a Data Protection Toolkit 16: Pilot a One-stop Standard Research Application 17: Pilot an Automated Tool for Information Collection Reviews that Supports Data Inventory Creation and Updates 18: Pilot Enhanced Data Management Tool for Federal Agencies 19: Develop Data Quality Measuring and Reporting Guidance 20: Develop a Data Standards Repository 各組織のアクション 1: 各組織に対し、優先的に回答すべきデータを定義する 2: 多様なデータガバナンス機関を構成する 3: データと関連するインフラストラクチャの成熟度を評価する 4: スタッフデータスキルを向上させる機会を定義する 5: 各組織のオープンデータ計画のための優先データ資産を定義する 6: データ インベントリの公開と更新 実践チームのコミュニティによるアクション 7: 連邦最高データ責任者(CDO)会議を立ち上げる 8: AI研究開発のためのデータとモデルリソースの改善 9: 財務管理データ基準の改善 10: 地理空間データプラクティスを連邦データ体系に統合する 共有ソリューションによるアクション 11: 連邦組織横断データリソースのリポジトリを開発する 12: OMBに連邦データ政策委員会を設置する 13: 統合データスキルカタログを開発する 14: データ倫理フレームワークを開発する 15: データ保護ツールキットを開発する 16: ワンストップ標準研究アプリケーションの試行をする 17: データ インベントリの作成と更新をサポートする情報収集レビュー用の自 動化ツールの試行をする 18: 連邦政府機関のための拡張データ管理ツールの施行をする 19: データ品質測定およびレポートガイダンスを開発する 20: データ標準リポジトリを開発する 2020 Action Plan 2020年中に、ベースとなるデータの定義と体制の整備、品質などのルール整備を行う
  25. 25. 24 米国が2025-2030年に実現する世界 データ形式 データ項目 データモデル 文字 コード センサー データ サービス・カタログ データ連携基盤 ルール データ品質管理・ガバナンス データ連携基盤 戦略 認 証 ・セ キ ュ リ テ ィ 戦略・政策 ルール 組織 ビジネス 利活用機能 データ データ連携 アセット セ キ ュ リ テ ィ ・ 認 証 組織 ビジネス アセット 認 証 ・セ キ ュ リ テ ィ データ品質ガイダンス データ標準やデータリポジトリ プラットフォーム データ収集ツール Federal Data Strategy 優先デー タの定義 土地 ルール作成 法人デジタルプラットフォーム • 全体戦略が整備された ツール • 基本データの整備が 急速に進む • 体制整備が急速に進められている • ルールは次のステージ 青:完了もしくは3月末までに目処がある 黃:1年以内に目処 赤:5-10年で解決 CDO CDO council、専門委員会 戦略が強力に推進され、2020年度中に環境整備をすすめる 人材が揃っているので、方針が決まると進むのは早い
  26. 26. 25 日本のデータ関連の戦略 •電子行政オープンデータ戦略(2012‐7) •オープンガバメントの推進 に当たっては、公共データは国民共有の財産であるという認識の下、公共デー タの活用を促進するための取組に速やかに着手し、それを 広く展開することに より、国民生活の向上、企業活動の活性化等を図り、我が国の社会経済全体の 発展に寄与することが重要であるため、公共データの活用促進 のための基本戦略 官民データ活用推進基本法(2016‐12) •官民データ活用の推進に関する施策を総合的かつ効果的に推進し、もって国民が安全で安心して暮らせる社会及び快適な生活環境の実現に寄与する。 オープンデータ基本指針(2017‐5) •オープンデータ・バイ・デザインの考え に基づき、今後、国、地方公共団体、事業者が公共データの公開及び活用に取り組 む上での基本指針 デジタル・ガバメント推進方針(2017‐5) •国民や事業者が行政サービス の生み だす価値を享受できるよう、サービスのあり方に焦点を当て、デジタル社会に向けた電 子行政の目指す方向性を示すもの 世界最先端デジタル国家創造宣言・官民データ活用推進基本計画(毎年改定) •全ての国民がデジタル技術とデータ利活用の恩恵を享受するとともに、安全で安心な暮らしや豊かさを実感できるデジタル社会の実現に向けた、政府全体のデジタ ル政策を取りまとめたものです。この戦略では、国際データ流通網の構築を含めた「データ利活用」と、令和元年5月に成立したデジタル手続法を起点とした「デジタ ル・ガバメント」を両輪で実行しつつ、5Gと交通信号機との連携をはじめとした「社会実装プロジェクトの推進」、インフラからデジタル格差対策までを含む「社会基盤の 整備」に取り組む 統合イノベーション戦略(2019‐06) •世界で破壊的イノベーションが進展し、ゲームの構造が一変し、過去の延長線上の政策では世界に勝てないという、認識の下、我が国の強みを生かしつつ、弱みを 克服して「全体最適な経済社会構造」を柔軟かつ自律的に見出す社会を創造することを目的に、従来の総合戦略を抜本的に見直し、グローバルな視座に立ち、基礎 研究から社会実装まで一気通貫の戦略 統合イノベーション戦略推進会議 デジタル社会構築タスクフォース(2020‐01) •様々な分野で進められている官民のデータ連携の取組を棚卸し し、分野を超えた連携を可能にするために必要となる、データ形式や機能、データ取扱いに係るルー ルの共通化を検討する。 デジタル・ガバメント グランドデザイン(仮称)(2020‐03) •行政のデジタル化の目的は、単に紙をデジタルに置き換えることではなく、BPRを進めつつ、デジタル技術を前提とした政策手法の改革や行政サービスの質の向上 を進めることにある。これを実現するためには、政府情報システムの一層の改革を進め、データの標準化、情報システム間の互換性、スムーズな情報連携、高度な セキュリティ対応等の確保を、統一性を確保しつつ効率的に実現していくことが必要となる。
  27. 27. 26 データ視点での各戦略等のまとめイメージ Other Acts Privacy act and Info. disclosure act Society 5.0 (2016)  Economic Growth Strategy (2019‐6) Innovation Strategy  (2019‐6) Digital Strategy (2019‐6) Data Strategy (2019‐6) Digital Government Policy (2017‐5) • Connected Industries • Digital first • Once only • One stop Vision National Strategies Digital Strategies IT ACT (2000)  DATA ACT (2016) Digital First ACT (2019) Society 5.0 Reference Architecture Data Exchange Platform Government Interoperability Framework (IMI) Data Strategy / Policy Rule Organization Business Data harness  functions Data Data broker  function Asset Sensor, Actuator, Hardware, Network Gathering, Integration,  Cleansing, Device management Data definition, Data model, Code Catalogue, Search,  AI, Analysis Business process Business Rule Coordination Team Legislation Regulation Vision Priority domain Security / Authentication Lifecycle Open Data Policy (2017‐5) AI Principal (2019‐3) AI Strategy (2019‐6) AI Strategy Digital Government Action Plan (2019‐12) Ground Design  (2020‐3) Vision of D-Gov
  28. 28. 27 データ形式 データ項目 データモデル 文字 コード センサー データ サービス・カタログ データ連携基盤 ルール データ品質管理・ガバナンス データ連携基盤 戦略 認 証 ・セ キ ュ リ テ ィ 戦略・政策 ルール 組織 ビジネス 利活用機能 データ データ連携 アセット セ キ ュ リ テ ィ ・ 認 証 組織 ビジネス アセット 認 証 ・セ キ ュ リ テ ィ データ品質フレームワーク 共通語彙基盤 行政データ連携標準 サービス・カタログ 分野間データ連携基盤 文字情報基盤、文字ガイド コード 一覧 データクレンジングツール Society5.0、グランドデザイン ベース・レ ジストリ 土地 推奨データセット、行政 サービスデータ連携標準 創造宣言、DG実行計画 法人デジタルプラットフォーム • データに関する総合戦略ではない gBizID • 必要な機能の特定ができていない • ベースレジストリ担当 府省に自覚がない • 体制がない • 人材がいない • 実務的なルール整備ができていない • 個人向けの検討ができていない • ワンスオンリーの推進 青:完了もしくは3月末までに目処がある 黃:1年以内に目処 赤:5-10年で解決 Society5.0リファレンスアーキテクチャ ベースラインは作ったが人材と体制がない。ベースレジストリが ないのも課題である 日本が2025-2030年に実現する世界
  29. 29. 分野間データ連携基盤の整備に向けた方針 28 14kai/siryo2-1.pdf 総合科学技術・イノベーション会議 重要課題専門調査会(第14回) Society5.0 参照モデル
  30. 30. 戦略・政策 ルール 組織 ビジネス 利活用機能 データ データ連携 アセット センサー、アクチュエーター ハードウェア、ネットワーク データ収集、データ統合 データクレンジング、デバイス管理 データ項目定義、データセット定義 コード カタログ、検索、AI、解析 業務プロセス 業務ルール 組織間調整 体制 法律 規則 ビジョン 重点分野 セ キ ュ リ テ ィ ・ 認 証 ライフサイクル Society5.0 参照モデルの中核をなすデータ体系  アーキテクチャ全体の中で、ルール整備、ツール整備とともに、データ体系 が重要 29 Society5.0 コネクテッド・インダストリ スマート・シティ データ流通市場 ツール群
  31. 31. 病院 建物 診療科 所在(住所) 施設情報 建築物情報 状況 ベッド数 小学校 建物 生徒数 所在(住所) 施設情報 建築物情報 避難所情報コア 語彙 ドメイン 語彙 イベント 建物 スケジュール 所在(住所) 連絡先 IMIの特徴 • 分野横断  社会基盤のコアな情報を重点推進 • グローバル連携  EU、米国との情報交換 • IoTへの配慮  連携を視野に入れて設計 • オープンデータでの活用  社会全体のデータ利活用を促進 • 検索性向上への配慮  検索サービス標準の参照 • 既存システムへの配慮  既存データを活かしデータ連携時に活用 共通語彙基盤(IMI:Infrastructure for Multi‐layer Interoperability)  分野横断でのデータ交換を目的としたフレームワーク  社会の中核になるコア語彙と分野別の専門分野(ドメイン)語彙を体系的に整理
  32. 32.  先進事例や技術に注目が集まるが、そこで使われるデータが安価に安定 的に供給される持続可能なエコシステムが重要。社会の基本データは、デ ジタル時代のインフラであり、地力(ポテンシャル)。  ワンスオンリーとスマートシティを実現するために、ベース・レジストリ(台帳 類)の整備を推進。  ベース・レジストリとは、公的機関等で公開され、様々な場面で参照される、人、法人、土地、資格等の社会の基本データ ベース・レジストリ 31 土地 データ インフラ データ 交通 データ 土地 データ インフラ データ 交通 データ すぐに新ビジネスを開始できる 暮らしやすい 新ビジネスのスタートアップコストが大きい サービスレベルが向上しない 人や企業、投資は、 より魅力的な場所 へ移動 データが、低品質であったり、利用制限されている場合がある。 ベース・レジストリが整備済みの国・都市 ベース・レジストリの整備が遅れている国・都市 データ収集で コストと時間を浪費 法人 データ 法人 データ データは最新かつ正確で自由に使える。また、連携している。 実証できても 持続できない オープン データ ベースレジストリ +民間データ
  33. 33. ベースレジストリのある世界とない世界  ベースレジストリがあるから、ワンスオンリーが実現できる。 32 何回も同じことを書かせる 条件が合えば自動で申請される 前回の申請内容が自動入力される ベース・レジストリが整備済みの国・都市 ベース・レジストリの整備が遅れている国・都市 住民票 確定申告 建築確認 地図 住所 氏名 電話番号 ・・・ “あなたは補助金対象です。振り込みが 行われましたので口座を確認ください” “修正がある場合には修正してください。 問題がなければ情報を追記してください” データの変更は全体が連動して変更される “住所の変更内容は全てのデータにされます がよろしいですか。よろしければ住所変更の 手続きにお進みください” 変更は個別に行う必要がある “この前の手続きで変更したのに、 こっちもか” 住民票 確定申告 建築確認 地図
  34. 34. ベースレジストリのある世界とない世界  ベースレジストリがあるから、事業の意思決定が素早く正確にできる。 33 いろいろな情報が簡単に手に入るので、事業計 画が精度よく、しかもすぐに作れる。 情報がどこにあるかわからない。 ルールが厳しくて使えない。 信頼できる取引先を探せる。 ベース・レジストリが整備済みの国・都市 ベース・レジストリの整備が遅れている国・都市 時間をかけて見つけても、情報が古かった りして使えない。 “データベースが見つからない” “紙のスキャンだ”し、再利用禁止と 書いてある“ “東京府東京市麹町区ってどこ” “この情報抜け漏れがないか” 法人登記 税申告 地図 法人活動 民間データ 統計 法人登記 税申告 地図 法人活動 民間データ 統計 “現在の市内の店舗情報と昼間人 口が地図上で見られるのは便利だ ね” “地域の景況が厳しい。行政機関と の取引実績が沢山あるこの企業と 組んでみたいな。
  35. 35. ベースレジストリのある世界とない世界  ベースレジストリがあるから、都市計画を正確にできる。 34 ベース・レジストリが整備済みの国・都市 ベース・レジストリの整備が遅れている国・都市 地図 橋梁台帳 道路台帳 建築物 民間データ 統計 様々なシミュレーションを臨機応変に実施できる “地図と道路台帳のデータに人の流 れを重ねてみられない” 所有者不明土地や空き家対策が効率的に できる。 新しい都市計画による影響がわからない メンテナンスのタイミングや対象の詳細情 報がわからない 地図 橋梁台帳 道路台帳 建築物 民間データ 統計 “橋のそばの地盤の歪データと橋の データを重ねると何か見えるかな” “市外居住者が管理する空き家は どのくらいあるのだろう” “地下埋設物の台帳は紙だし、掘っ てみると違うこと多いんだよな” “次の角に車を止めて、シェアバイ クで行こう” 固定資産 固定資産 分野横断のサービスが作れる。
  36. 36. ベースレジストリのある世界とない世界  ベース・レジストリがあるから、災害対策を分野横断でできる。 35 ベース・レジストリが整備済みの国・都市 ベース・レジストリの整備が遅れている国・都市 被災地の状況がわからない “国、県、市のデータがバラバラで、 全ての状況が把握できない。”地図 避難所 道路台帳 病院 民間データ 統計 固定資産 地図 避難所 道路台帳 病院 民間データ 統計 固定資産 復興させたいが、土地情報が複雑すぎる。 総合的な緊急対策ができる。 総合的な緊急開発ができる “原本情報が古すぎて、どこから手 を付けてよいかわからない。” “国、県、市のデータがバラバラで、 全ての状況が把握できない。” “原本情報が古すぎて、どこから手 を付けてよいかわからない。”
  37. 37. データ品質  AI、スマートシティやデータ取引市場ではデータ品質が重要となる。効果的 に必要なデータ品質を実現するための体系を実現。 正確性 完全性 一貫性 信憑性 最新性 標準適合性 アクセシビリティ 機密性 効率性 精度 追跡可能性 理解性 可用性 移植性 回復性 以下を参照し作成 ISO/IEC 25024:2015 Systems and software engineering -- SQuaRE -- Measurement of data quality ISO/IEC 25012:2008 Software engineering -- SQuaRE -- Data quality model 品質が不十分データを手作業で収集し、クレンジングしているのは、中世の作業場と基本構造は同じ データ設計 データ収集 データ統合 外部データ 連携 データ 処理 Webサイト API データ蓄積 廃棄 サイト 登録データA 登録データB ベース レジストリ 登録データx コード サービス クレンジング クレンジング
  38. 38. データマネジメント(ガバナンス)  データドリブンな社会には、高い品質のデータを安定的に供給する仕組み が必要となる。そのガバナンス体系を整備。 37 データ関連サポート リソース規定 導入 データ品質計画 要求管理 品質戦略の管理 品質ポリシー/標準/調達管理 品質導入プラン データ品質改善 本質課題の分析と ソリューション開発 データクレンジング データのルール非準拠を防止 するためのプロセス改善 データ品質管理 データ仕様や作業の規定 データ処理 品質のモニタリング とコントロール データ品質保証 データ品質のレビュー 測定規定 データ品質と プロセスパフォーマンスの測定 測定結果の評価 データアーキテクチャ管理 データ転送管理 データ運用管理 データセキュリティ管理 データ品質管理組織の管理 人材管理 Detailed structure of data quality management (ISO8000-61)
  39. 39. ルール  データを使いこなすには、複数の情報源のルールを確認し調整する必要 がある。  データを使いやすくするためルールの標準化をしつつ、サービスの事情に 応じて容易に応用ができ、利用者が判断しやすい仕組みを実現。 38 情報ソース A ルール A 情報ソース B ルール B 情報ソース C ルール C 情報ソース Z ルール Z サービス標準ルール サービスは、複数ソースの情報を組み 合わせてサービスを作るのが一般的で あり、他者が加工済みのデータを使う 場合もある。 情報ソースの利用ルールの差を明確に することで、調整のための無駄な時間 を削減。 追加ルール 情報ソース s ルール s
  40. 40. データ・エコシステム  データは長期にわたり、業務の流れの中で、安価に安定的に収集・活用で きる仕組みが必要となる。  データの生成から活用まで、関係者すべての負担を増やさず持続できるエ コシステムが必要。 39 活用 収集 蓄積 公開 申請 センサーデータ収集 ベースレジストリ オープンデータ Webサイト データカタログ APIカタログ データ標準 ・推奨データセット ・共通語彙基盤 ・行政―多連携標準 データ品質 ルール EBPM 設計品質管理 API連携 プラットフォーム (AI) (BC) 行政 外部
  41. 41. 40 日本にはデータ専門家が少ない 多くの事例を分析 する 抽象化した汎用モ デルを作る サブセット化やカ スタマイズする ベースが共通なの で分析もかんたん 個々にヒアリン グする 独自のデータ定 義を表で作る 実装する 分析が大変 海外 パッケージ型 国内 個別SI型 外資企業の 国内技術者は ここからスタート 基本はヒアリングによる 積み上げ キー項目等の最小限の 共通構造は作るが全体 は構造化しない 2019年末に国内ベンダのデータ標準化専門委員会が、「データは最小限共通化、あとは個別追 加カスタマイズで対応」と提言。提出を受けたユーザが参加する委員会で炎上。 国外が、「社会全体のデータの汎用モデル化とサブセットでの活用」を提言しているのと対象的。 データサイエンティストを 投入しても歯が立たない
  42. 42. DXの基盤となる法⼈デジタルプラットフォームの実現  2016年度以来、経済産業省では、法人番号をキーに認証・手続き・共有等の階層からな る法人デジタルサービスの全体デザインのもと、デジタル化を進めてきた。  補助金など主要先行分野のほか他省庁・自治体のサービスも接続する、政府全体の法 人デジタルプラットフォームに育ちつつある。先行プラクティスを活用し、今後更に取組を 拡大。 省内・官⺠データ連携(法⼈データ交換基盤) オープンデータ(法⼈インフォ) API API API API API API API API 41 事業者のログイン(GビズID(法⼈共通認証基盤)) API API 補助⾦ (Jグランツ) 中⼩企業 (ミラサポplus) 産業保安 (保安ネット) 貿易管理 資源エネルギー 本⼈確認 サービス ⼿続き データ (クローズド) (オープン) ・・・ 共通語彙基盤
  43. 43. 42 法⼈関連サービスを円滑にするためのデータ標準群の整備と適⽤  法人デジタルプラットフォームでは、法人に関連する各種情報の書式を精査。共通語彙 基盤をベースとしたデータモデルの整備と現場に向けた導入ガイドを整備。  α版で経産省で導入検証を行いながら、デジタルガバメント技術検討会議 データ連 携タスクフォースで内容精査し政府全体に展開。  欧州の行政データ標準化とも相互運用可能な仕組みを整備。 申請データ ガイド 証明データ ガイド 事例データ ガイド 行政サービス ・制度データ ガイド イベントデータ ガイド 報告書・ 会議資料等 ガイド 行政サービス 拠点・ 支援機関等 ガイド サービス・カタログ ガイド 法人法人及び法人活動データ ガイド (全体編) 法人デジタルプラットフォーム(ツール)とデータ標準群により、デジタル時代に 合った国際競争力のあるプラットフォームを提供 これまでの経産省中心の取り組みを、政府(自治体)全体に迅速に展開
  44. 44. 43 推奨データセット 法人・個人向けデータテンプレート この2つがスタートラインです!! 共通語彙基盤などの難しいことは意識しないでOKです!