SlideShare a Scribd company logo
1 of 25
オープンデータとLinked Open Data

              武田英明
           takeda@nii.ac.jp
          国立情報学研究所
NPO法人 リンクト・オープン・データ・イニシアティブ
オープンデータへの5つのス
     テップ
オープンデータへの5つのス
       テップ
     ★ どんなフォーマットでよいからオープンラ
       インセスでデータ公開
         例:PDF, jpg
   ★ ★ コンピュータが処理可能なフォーマットで
       公開
  ★★★    例:xls, doc
       オープンに利用できるフォーマットで公開
 ★★★★    例:csv
       RDF(とSPARQL)でデータ公開
★★★★★    例:RDFa, RDFストア
       他へのリンクを入れたデータを公開
         LOD Cloudへの参加
オープンデータへの5つのス
          テップ
     ★ どんなフォーマットでよいからオープンラ
       インセスでデータ公開                        ライセン
                                             ス
         例:PDF, jpg
   ★ ★ コンピュータが処理可能なフォーマットで
       公開
  ★★★    例:xls, doc
       オープンに利用できるフォーマットで公開      データカタログ・サ
                                       イト
 ★★★★    例:csv
       RDF(とSPARQL)でデータ公開
★★★★★    例:RDFa, RDFストア
       他へのリンクを入れたデータを公開
         LOD Cloudへの参加 Data/ Linked Open Data (LOD)
                     Linked
データ共有のアーキテクチャ
                           データがどうやっ
• データカタログの公開、共有            て手に入るかを知
                               る
 – データセット(データベース)のカタログ
 – データセットに関する情報
  • 名称、公開者、ライセンス、形式、アクセス方法、利活用
    例…
                            データを実際に
• データ(データセット)の公開、共有          手に入れる

 – データの形式
  • 固有の形式、オープンな形式(XML, RDF …)
 – データベースの公開
  • (個別)HTML, 、URI dereference
  • (インタラクティブ)Webフォーム、API、SPARQL
  • (ダウンロード)個別ファイル、ダンプファイル
CKAN
• データ・ハブ、あるいはデータのカタログ化、
  公開、共有及び検索のための"データ管理システ
  ム“
• オープンソース・ソフトウエア
• 機能
 – データ(リソース)のカタログ編集、公開
     • 名称、公開者、ライセンス、形式、アクセス方法、利活用
       例…
 –   データの保存と管理
 –   ユーザインタフェース
 –   REST API
 –   Linked Data
データの公開、共有



      Linked Data
Linked Open Data (LOD)
http://www.data.gov/
文書のWeb
データのWeb
          このデータに
          別のデータと
このデータに
          同じ
対応する別の
データ




         この属性の意
         味は?




 異なるデータ源のデータが相互に結びつ
 く
Linked Open Data (LOD)
• オープンでリンクできるデータ
  – 今のWebが“文書のWeb” 、LODは“データのWeb”
• Linked   Dataの5原則
  – 事柄の名前にURIを使うこと
  – 名前の参照がHTTP URIでできること
  – URIを参照したときに関連情報が手に入るように
    理解可能なデータを提供
  – 外部へのリンクも含めよう

(必ずしもオープンとは限らない⇒Linked Data)
Linked Dataの記述のしかた
• RDF(+RDFS, OWL)の利用
    – 簡便な記述方法:<主語> <述語> <目的語> .
<http://www-kasm.nii.ac.jp/~takeda#me> <rdfs:type> <foaf:Person> .
<http://www-kasm.nii.ac.jp/~takeda#me> <foaf:name> “武田英明” .
<http://www-kasm.nii.ac.jp/~takeda#me> <foaf:gender> “male” .
<http://www-kasm.nii.ac.jp/~takeda#me> <foaf:knows> <http://foaf.me/danbri#me> .

                                                <foaf:Person>
                             rdfs:type
   <http://www-kasm.nii.ac.jp/
          ~takeda#me>          foaf:knows
    foaf:name        foaf:gender                                <http://foaf.me/danbri#me>

“武田英明”                      “male”
LOD Cloud    200以上のデータセッ
                  トが公開され、相互に
                  リンクづけられている
(Linking Open Data)
DBpedia Mobile
Yokohama Art Spot




SPARQLによる連携
LOD Cloudとオープンガバメント
       (Linking Open Data)
例:センサや地域情報の統合




                         様々な機関からの公開
   http://lsm.deri.ie/   データを第3者が集めて表
Linked Open Data普及への道筋
• 技術の展開
  Open Dataに向けて
 – データ・カタログ
 – 持続的URI
   • Digital Object Identifier (DOI)
      – 例)OPOCE (Office des publications EU)、DataCite、(JaLC)
 Linked Dataに向けて
                                                 コミュニティでの
 – スキーマの共有、再利用                                      活動
   • Linked Open Vocabulary (LOV), MetaBridge
 – 識別子の共有、再利用                                   公的機関が得意
   • 持続的かつ再利用性の高い識別子の設計、公開
Linked Open Data普及への道筋
• データキュレーション
 – 適切なデータ公開ができるように、データを
   加工・選択・変換などを行うこと
 – データ設計:相互運用性、持続可能性
  • スキーマ設計
  • 識別子設計
 – データキュレータの養成
  • 技術と内容のわかる人
まとめ
• オープンデータの5つのステップ
  – ライセンス
  – データカタログ
  – LOD
• LOD
  – “データのWeb”、つながるデータ
  – データの再利用性を高める
• オープンデータ、LODの普及の道筋
  – 技術の展開:持続性のあるURI,スキーマの共
    有
  – データ・キュレーション

More Related Content

More from National Institute of Informatics (NII)

趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)
趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)
趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)National Institute of Informatics (NII)
 
趙簡単LOD入門 〜デジタル庁をデジタル化する〜
趙簡単LOD入門 〜デジタル庁をデジタル化する〜趙簡単LOD入門 〜デジタル庁をデジタル化する〜
趙簡単LOD入門 〜デジタル庁をデジタル化する〜National Institute of Informatics (NII)
 
セマンティックWeb技術を用いた農業分野の標準語彙の構築
セマンティックWeb技術を用いた農業分野の標準語彙の構築セマンティックWeb技術を用いた農業分野の標準語彙の構築
セマンティックWeb技術を用いた農業分野の標準語彙の構築National Institute of Informatics (NII)
 
NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ
NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ
NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ National Institute of Informatics (NII)
 
Presenting and Preserving the Change in Taxonomic Knowledge for Linked Data
Presenting and Preserving the Change in Taxonomic Knowledge for Linked DataPresenting and Preserving the Change in Taxonomic Knowledge for Linked Data
Presenting and Preserving the Change in Taxonomic Knowledge for Linked DataNational Institute of Informatics (NII)
 
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜National Institute of Informatics (NII)
 
研究データ利活用に関する国内活動及び国際動向について
研究データ利活用に関する国内活動及び国際動向について研究データ利活用に関する国内活動及び国際動向について
研究データ利活用に関する国内活動及び国際動向についてNational Institute of Informatics (NII)
 

More from National Institute of Informatics (NII) (20)

趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)
趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)
趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)
 
趙簡単LOD入門 〜デジタル庁をデジタル化する〜
趙簡単LOD入門 〜デジタル庁をデジタル化する〜趙簡単LOD入門 〜デジタル庁をデジタル化する〜
趙簡単LOD入門 〜デジタル庁をデジタル化する〜
 
"分人"型社会とAI
"分人"型社会とAI"分人"型社会とAI
"分人"型社会とAI
 
セマンティックWeb技術を用いた農業分野の標準語彙の構築
セマンティックWeb技術を用いた農業分野の標準語彙の構築セマンティックWeb技術を用いた農業分野の標準語彙の構築
セマンティックWeb技術を用いた農業分野の標準語彙の構築
 
研究オープンデータにおける大学と研究者の役割
研究オープンデータにおける大学と研究者の役割研究オープンデータにおける大学と研究者の役割
研究オープンデータにおける大学と研究者の役割
 
NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ
NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ
NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ
 
Presenting and Preserving the Change in Taxonomic Knowledge for Linked Data
Presenting and Preserving the Change in Taxonomic Knowledge for Linked DataPresenting and Preserving the Change in Taxonomic Knowledge for Linked Data
Presenting and Preserving the Change in Taxonomic Knowledge for Linked Data
 
Crop vocabulary (CVO): Core vocabulary of crop names
Crop vocabulary (CVO): Core vocabulary of crop namesCrop vocabulary (CVO): Core vocabulary of crop names
Crop vocabulary (CVO): Core vocabulary of crop names
 
ORCIDとオープンサイエンス
ORCIDとオープンサイエンスORCIDとオープンサイエンス
ORCIDとオープンサイエンス
 
How to build ontologies - a case study of Agriculture Activity Ontology
How to build ontologies - a case study of Agriculture Activity OntologyHow to build ontologies - a case study of Agriculture Activity Ontology
How to build ontologies - a case study of Agriculture Activity Ontology
 
LODとオープンデータ (DBpediaとIMIの周辺を中心に)
LODとオープンデータ(DBpediaとIMIの周辺を中心に)LODとオープンデータ(DBpediaとIMIの周辺を中心に)
LODとオープンデータ (DBpediaとIMIの周辺を中心に)
 
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
 
Working with Global Infrastructure at a National Level
Working with Global Infrastructure at a National LevelWorking with Global Infrastructure at a National Level
Working with Global Infrastructure at a National Level
 
Activities of JaLC as a national service
Activities of JaLC as a national serviceActivities of JaLC as a national service
Activities of JaLC as a national service
 
Development and Application of Agriculture Ontologies
Development and Application of Agriculture Ontologies Development and Application of Agriculture Ontologies
Development and Application of Agriculture Ontologies
 
Design Process of Agriculture Ontologies
Design Process of Agriculture OntologiesDesign Process of Agriculture Ontologies
Design Process of Agriculture Ontologies
 
AIの未来 ~技術と社会の関係のダイナミクス~
AIの未来~技術と社会の関係のダイナミクス~AIの未来~技術と社会の関係のダイナミクス~
AIの未来 ~技術と社会の関係のダイナミクス~
 
Towards Knowledge-Enabled Society
Towards Knowledge-Enabled SocietyTowards Knowledge-Enabled Society
Towards Knowledge-Enabled Society
 
研究データ利活用に関する国内活動及び国際動向について
研究データ利活用に関する国内活動及び国際動向について研究データ利活用に関する国内活動及び国際動向について
研究データ利活用に関する国内活動及び国際動向について
 
オープンサイエンスとオープンデータ
オープンサイエンスとオープンデータオープンサイエンスとオープンデータ
オープンサイエンスとオープンデータ
 

オープンデータとLinked Open Data

  • 1. オープンデータとLinked Open Data 武田英明 takeda@nii.ac.jp 国立情報学研究所 NPO法人 リンクト・オープン・データ・イニシアティブ
  • 3. オープンデータへの5つのス テップ ★ どんなフォーマットでよいからオープンラ インセスでデータ公開 例:PDF, jpg ★ ★ コンピュータが処理可能なフォーマットで 公開 ★★★ 例:xls, doc オープンに利用できるフォーマットで公開 ★★★★ 例:csv RDF(とSPARQL)でデータ公開 ★★★★★ 例:RDFa, RDFストア 他へのリンクを入れたデータを公開 LOD Cloudへの参加
  • 4. オープンデータへの5つのス テップ ★ どんなフォーマットでよいからオープンラ インセスでデータ公開 ライセン ス 例:PDF, jpg ★ ★ コンピュータが処理可能なフォーマットで 公開 ★★★ 例:xls, doc オープンに利用できるフォーマットで公開 データカタログ・サ イト ★★★★ 例:csv RDF(とSPARQL)でデータ公開 ★★★★★ 例:RDFa, RDFストア 他へのリンクを入れたデータを公開 LOD Cloudへの参加 Data/ Linked Open Data (LOD) Linked
  • 5. データ共有のアーキテクチャ データがどうやっ • データカタログの公開、共有 て手に入るかを知 る – データセット(データベース)のカタログ – データセットに関する情報 • 名称、公開者、ライセンス、形式、アクセス方法、利活用 例… データを実際に • データ(データセット)の公開、共有 手に入れる – データの形式 • 固有の形式、オープンな形式(XML, RDF …) – データベースの公開 • (個別)HTML, 、URI dereference • (インタラクティブ)Webフォーム、API、SPARQL • (ダウンロード)個別ファイル、ダンプファイル
  • 6. CKAN • データ・ハブ、あるいはデータのカタログ化、 公開、共有及び検索のための"データ管理システ ム“ • オープンソース・ソフトウエア • 機能 – データ(リソース)のカタログ編集、公開 • 名称、公開者、ライセンス、形式、アクセス方法、利活用 例… – データの保存と管理 – ユーザインタフェース – REST API – Linked Data
  • 7.
  • 8. データの公開、共有 Linked Data Linked Open Data (LOD)
  • 10.
  • 12. データのWeb このデータに 別のデータと このデータに 同じ 対応する別の データ この属性の意 味は? 異なるデータ源のデータが相互に結びつ く
  • 13. Linked Open Data (LOD) • オープンでリンクできるデータ – 今のWebが“文書のWeb” 、LODは“データのWeb” • Linked Dataの5原則 – 事柄の名前にURIを使うこと – 名前の参照がHTTP URIでできること – URIを参照したときに関連情報が手に入るように 理解可能なデータを提供 – 外部へのリンクも含めよう (必ずしもオープンとは限らない⇒Linked Data)
  • 14. Linked Dataの記述のしかた • RDF(+RDFS, OWL)の利用 – 簡便な記述方法:<主語> <述語> <目的語> . <http://www-kasm.nii.ac.jp/~takeda#me> <rdfs:type> <foaf:Person> . <http://www-kasm.nii.ac.jp/~takeda#me> <foaf:name> “武田英明” . <http://www-kasm.nii.ac.jp/~takeda#me> <foaf:gender> “male” . <http://www-kasm.nii.ac.jp/~takeda#me> <foaf:knows> <http://foaf.me/danbri#me> . <foaf:Person> rdfs:type <http://www-kasm.nii.ac.jp/ ~takeda#me> foaf:knows foaf:name foaf:gender <http://foaf.me/danbri#me> “武田英明” “male”
  • 15. LOD Cloud 200以上のデータセッ トが公開され、相互に リンクづけられている (Linking Open Data)
  • 18.
  • 19.
  • 20.
  • 22. 例:センサや地域情報の統合 様々な機関からの公開 http://lsm.deri.ie/ データを第3者が集めて表
  • 23. Linked Open Data普及への道筋 • 技術の展開 Open Dataに向けて – データ・カタログ – 持続的URI • Digital Object Identifier (DOI) – 例)OPOCE (Office des publications EU)、DataCite、(JaLC) Linked Dataに向けて コミュニティでの – スキーマの共有、再利用 活動 • Linked Open Vocabulary (LOV), MetaBridge – 識別子の共有、再利用 公的機関が得意 • 持続的かつ再利用性の高い識別子の設計、公開
  • 24. Linked Open Data普及への道筋 • データキュレーション – 適切なデータ公開ができるように、データを 加工・選択・変換などを行うこと – データ設計:相互運用性、持続可能性 • スキーマ設計 • 識別子設計 – データキュレータの養成 • 技術と内容のわかる人
  • 25. まとめ • オープンデータの5つのステップ – ライセンス – データカタログ – LOD • LOD – “データのWeb”、つながるデータ – データの再利用性を高める • オープンデータ、LODの普及の道筋 – 技術の展開:持続性のあるURI,スキーマの共 有 – データ・キュレーション