More Related Content Similar to つながるデータShare (20) つながるデータShare2. 小出誠二 プロフィール
• 株式会社IHIで人工知能とセマンティックウェブ研究開発に
従事
• 国立情報学研究所にてPh.D取得
• 「オブジェクト指向セマンティックWeb言語の理論と実装」
• 国立情報学研究所特任研究員
• NPO法人 リンクト・オープン・データ・イニシアティブ理事
• datameti.go.jp 構築コンサル支援(日立コンサルティング)
• data.go.jp 本格版構築支援(日立システムズ)
• オントロノミー合同会社代表社員
• 共訳:「Webをグローバルなデータ空間にする仕組みLinked
Data」
• ブログサイト「セマンティックウェブ・ダイアリー」
koide@nii.ac.jp
koide@linkedopendata.jp
koide@ontolonomy.co.jp
seijikoide0@gmail.com
小出 誠二
Seiji Koide
10. • オープンデータを公開する自治体:約170団体(※1)(全自治体の約10%)
RDFを公開している自治体
【引用】
※1 日本のオープンデータ都市一覧, http://fukuno.jig.jp/2013/opendatamap
※2 LinkData.orgによるオープンデータのスタートアップ支援, http://www.sigswo.org/papers/37program, (2015)
• LinkDataのサービスを利用してRDFを公開している自治体:42団体(※2)
51団体が公開する約1,200件のRDFを確認し,特徴の抽出を実施
1 北海道室蘭市 16 新潟県十日町市 31 静岡県静岡市 46 岡山県玉野市
2 北海道森町 17 新潟県見附市 32 静岡県三島市 47 広島県呉市
3 北海道八雲町 18 新潟県糸魚川市 33 静岡県島田市 48 山口県宇部市
4 宮城県石巻市 19 富山県砺波市 34 静岡県磐田市 49 山口県周南市
5 秋田県横手市 20 福井県 35 静岡県掛川市 50 香川県高松市
6 福島県会津若松市 21 福井県福井市 36 静岡県裾野市 51 熊本県菊池市
7 埼玉県川口市 22 福井県敦賀市 37 静岡県御前崎市
8 埼玉県和光市 23 福井県鯖江市 38 愛知県長久手市
9 埼玉県北本市 24 福井県越前市 39 三重県津市
10 千葉県流山市 25 長野県上田市 40 滋賀県大津市
11 千葉県我孫子市 26 長野県須坂市 41 大阪府高槻市
12 東京都品川区 27 長野県駒ヶ根市 42 大阪府枚方市
13 東京都杉並区 28 長野県中野市 43 兵庫県神戸市
14 神奈川県鎌倉市 29 長野県塩尻市 44 鳥取県
15 新潟県三条市 30 長野県軽井沢町 45 島根県松江市
• RDFを公開している自治体:51団体
29. • それはグラフ構造で表現できますか
• 主要なノードに名前をつけます
• 制御可能なドメイン名がありますか
• ノード名をIRIで表現します
• ノード間のリンクの意味を考えます
• すでに世の中に同様なリンクが定義済みであればそ
れを使います
• どうしても無ければ、自分で定義します
• 主題・述語・目的語の三つ組でグラフをテキスト化
リンクト・データの作り方
30. Information Management: A Proposal
Tim Berners-Lee
foaf:Person
foaf:Agent
rdfs:Resource
rdf:Property
rdfs:range
rdfs:subClassOfrdfs:subClassOf
foaf:maker
dct:title
foaf:Document
foaf:maker
owl:Thing
https://www.w3.org/History/1989/proposal.html
rdfs:subClassOf
rdfs:subClassOf rdfs:subClassOfrdfs:range
rdf:type rdf:type
rdf:type
foaf:name
31. RDFグラフ
• ノード
• IRI ノード
• ブランクノード
• リテラル
• エッジ
• IRI エッジ
2016/3/5 31
http://.../シャープ株式会社
シャープ株式会社
rdf:type
34. 株式会社
ic:法人型
ic:組織
ic:金額型
ic:資本金
ic:組織 a owl:ObjectProperty ;
rdfs:label "組織"@ja ;
rdfs:comment "連絡先の組織※連絡先が他組織に委任されているときなどに記載など"@ja ;
schema:domainIncludes ic:連絡先型, ic:組織関連型 ;
rdfs:range ic:組織型
.
ic:組織型 a owl:Class ;
rdfs:label "組織型"@ja ;
rdfs:comment "組織を表現するためのクラス用語"@ja ;
rdfs:subClassOf ic:実体型
.
ic:業務組織型 a owl:Class ;
rdfs:label "業務組織型"@ja ;
rdfs:comment "業務組織を表現するためのクラス用語"@ja ;
rdfs:subClassOf ic:組織型
.
ic:法人型 a owl:Class ;
rdfs:label "法人型"@ja ;
rdfs:comment "法人を表現するためのクラス用語"@ja ;
rdfs:subClassOf ic:業務組織型
これらはいずれもクラスです
42. • IRI ノード
• RDFグラフでは楕円
• 名前はIRI あるいは短縮表記(prefixed name)
• リテラルノード
• RDFグラフでは矩形
• 平リテラル (”This is a plane literal.”@en)
• 型付きリテラル (”100”^^xsd:positiveInteger )
• ブランクノード
• RDFグラフでは空の楕円
三種類のノードを書き分ける
43. Information Management: A Proposal
Tim Berners-Lee
foaf:Person
foaf:Agent
rdfs:Resource
rdf:Property
rdfs:range
rdfs:subClassOfrdfs:subClassOf
foaf:maker
dct:title
foaf:Document
foaf:maker
owl:Thing
https://www.w3.org/History/1989/proposal.html
rdfs:subClassOf
rdfs:subClassOf rdfs:subClassOfrdfs:range
rdf:type rdf:type
rdf:type
foaf:name
47. • それはグラフ構造で表現できますか
• 主要なノードに名前をつけます
• 制御可能なドメイン名がありますか
• ノード名をIRIで表現します
• ノード間のリンクの意味を考えます
• すでに世の中に同様なリンクが定義済みであればそ
れを使います
• どうしても無ければ、自分で定義します
• 主題・述語・目的語の三つ組でグラフをテキスト化
リンクト・データの作り方
59. sharp:シャープ株式会社
業種
株式会社
種類
東証1部 6753
市場情報
大阪市阿倍野区長池町22-22
本社所在地
電気機器エレクトロニクス,電子部品
事業内容
ic:代表者
5億円
資本金
ic:設立日
@prefix sharp: <http://lod.sharp.co.jp/data/> .
@prefix ic: <http://imi.ipa.go.jp/ns/core/rdf#> .
@prefix gn: <http://www.geonames.org/ontology#> .
@prefix gnjp: <http://geonames.jp/resource/> .
ic:代表者 a owl:ObjectProperty ;
rdfs:label "代表者"@ja ;
rdfs:comment "組織の代表者"@ja ;
schema:domainIncludes ic:組織型 ;
rdfs:range ic:構成員型 .
sharp:高橋興三
ic:構成員型
ic:組織型
rdf:type
rdf:type
ic:設立日 a owl:ObjectProperty ;
rdfs:label "設立日"@ja ;
rdfs:comment "組織の代表者"@ja ;
schema:domainIncludes ic:組織型 ;
rdfs:range ic:日付型 .
1935年5月1日
ic:表記
ic:日付型rdf:type
60. sharp:シャープ株式会社
業種
株式会社
種類
東証1部 6753
市場情報
大阪市阿倍野区長池町22-22
本社所在地
電気機器エレクトロニクス,電子部品
事業内容
ic:代表者
ic:資本金
ic:設立日
@prefix sharp: <http://lod.sharp.co.jp/data/> .
@prefix ic: <http://imi.ipa.go.jp/ns/core/rdf#> .
@prefix gn: <http://www.geonames.org/ontology#> .
@prefix gnjp: <http://geonames.jp/resource/> .
ic:資本金 a owl:ObjectProperty ;
rdfs:label “資本金"@ja ;
rdfs:comment “法人などの資本金"@ja ;
schema:domainIncludes ic:法人型 ;
rdfs:range ic:金額型 .
sharp:高橋興三
ic:構成員型
ic:組織型
rdf:type
rdf:type
ic:設立日 a owl:ObjectProperty ;
rdfs:label "設立日"@ja ;
rdfs:comment "組織の代表者"@ja ;
schema:domainIncludes ic:組織型 ;
rdfs:range ic:日付型 .
1935年5月1日
ic:表記
500000000 ic:日付型rdf:type
ic:金額型
円
ic:数値 ic:通貨
rdf:type
ic:法人型
rdf:type
61. sharp:シャープ株式会社
業種
株式会社
種類
東証1部 6753
市場情報
大阪市阿倍野区長池町22-22
本社所在地
電気機器エレクトロニクス,電子部品
事業内容
ic:代表者
ic:資本金
ic:設立日
@prefix sharp: <http://lod.sharp.co.jp/data/> .
@prefix ic: <http://imi.ipa.go.jp/ns/core/rdf#> .
@prefix gn: <http://www.geonames.org/ontology#> .
@prefix gnjp: <http://geonames.jp/resource/> .
ic:資本金 a owl:ObjectProperty ;
rdfs:label “資本金"@ja ;
rdfs:comment “法人などの資本金"@ja ;
schema:domainIncludes ic:法人型 ;
rdfs:range ic:金額型 .
sharp:高橋興三
ic:構成員型
ic:組織型
rdf:type
rdf:type
ic:法人型 a owl:Class ;
rdfs:label "法人型"@ja ;
rdfs:comment “法人を表現するためのクラス用語"@ja ;
rdfs:subClassOf ic:業務組織型.
ic:業務組織型 a owl:Class ;
rdfs:label "法人型"@ja ;
rdfs:comment “業務組織を表現するためのクラス用語"@j
rdfs:subClassOf ic:組織型 .
1935年5月1日
ic:表記
500000000 ic:日付型rdf:type
ic:金額型
円
ic:数値 ic:通貨
rdf:type
ic:法人型
rdf:type
ic:業務組織型
rdfs:subClassOf
rdfs:subClassOf
62. sharp:シャープ株式会社
sharp:業種
東証1部 6753
sharp:市場情報
大阪市阿倍野区長池町22-22
sharp:本社所在地
電気機器エレクトロニクス,電子部品
sharp:事業内容
ic:代表者
ic:資本金
ic:設立日
@prefix sharp: <http://lod.sharp.co.jp/data/> .
@prefix ic: <http://imi.ipa.go.jp/ns/core/rdf#> .
@prefix gn: <http://www.geonames.org/ontology#> .
@prefix gnjp: <http://geonames.jp/resource/> .
sharp:事業内容 a owl:DatatypeProperty ;
rdfs:label "事業内容"@ja ;
rdfs:comment "弊社の事業内容"@ja ;
schema:domainIncludes ic:業務組織型 ;
rdfs:range xsd:string .
sharp:業種 a owl:DatatypeProperty ;
rdfs:label "業種"@ja ;
rdfs:comment “弊社の業種"@ja ;
schema:domainIncludes ic:業務組織型 ;
rdfs:range xsd:string .
sharp:高橋興三
1935年5月1日
ic:表記
500000000 円
ic:数値 ic:通貨
sharp:本社所在地 a owl:DatatypeProperty ;
rdfs:label "本社所在地"@ja ;
rdfs:comment "弊社本社所在地"@ja ;
schema:domainIncludes ic:法人型 ;
rdfs:range xsd:string .
sharp:市場情報 a owl:DatatypeProperty ;
rdfs:label "市場情報"@ja ;
rdfs:comment “弊社の市場情報"@ja ;
schema:domainIncludes ic:法人型 ;
rdfs:range xsd:string .
63. • それはグラフ構造で表現できますか
• 主要なノードに名前をつけます
• 制御可能なドメイン名がありますか
• ノード名をIRIで表現します
• ノード間のリンクの意味を考えます
• すでに世の中に同様なリンクが定義済みであればそ
れを使います
• どうしても無ければ、自分で定義します
• リンクと同じ名前のノードを作ってはいけません
• 主題・述語・目的語の三つ組でグラフをテキスト化
リンクト・データの作り方
64. • それはグラフ構造で表現できますか
• 主要なノードに名前をつけます
• 制御可能なドメイン名がありますか
• ノード名をIRIで表現します
• ノード間のリンクの意味を考えます
• すでに世の中に同様なリンクが定義済みであればそ
れを使います
• どうしても無ければ、自分で定義します
• リンクと同じ名前のノードを作ってはいけません
• 主題・述語・目的語の三つ組でグラフをテキスト化
リンクト・データの作り方
66. • RDF 1.1 Primer
• RDF 1.1 Concepts and Abstract Syntax
• RDF 1.1 N-Triples
• RDF 1.1 N-Quads
• RDF 1.1 Turtle
• RDF 1.1 TriG
• RDF 1.1 XML Syntax
• RDF Schema 1.1
• RDF 1.1 Semantics
W3C の RDF 勧告
69. sharp:シャープ株式会社
sharp:業種
東証1部 6753
sharp:市場情報
大阪市阿倍野区長池町22-22
sharp:本社所在地
電気機器エレクトロニクス,電子部品
sharp:事業内容
ic:代表者
ic:資本金
ic:設立日
@prefix sharp: <http://lod.sharp.co.jp/data/> .
@prefix ic: <http://imi.ipa.go.jp/ns/core/rdf#> .
@prefix gn: <http://www.geonames.org/ontology#> .
@prefix gnjp: <http://geonames.jp/resource/> .
sharp:事業内容 a owl:DatatypeProperty ;
rdfs:label "事業内容"@ja ;
rdfs:comment "弊社の事業内容"@ja ;
schema:domainIncludes ic:業務組織型 ;
rdfs:range xsd:string .
sharp:業種 a owl:DatatypeProperty ;
rdfs:label "業種"@ja ;
rdfs:comment “弊社の業種"@ja ;
schema:domainIncludes ic:業務組織型 ;
rdfs:range xsd:string .
sharp:高橋興三
ic:構成員型
ic:組織型
rdf:type
rdf:type
1935年5月1日
ic:表記
500000000 ic:日付型rdf:type
ic:金額型
円
ic:数値 ic:通貨
rdf:type
ic:法人型
rdf:type
ic:業務組織型
rdfs:subClassOf
rdfs:subClassOf
sharp:本社所在地 a owl:DatatypeProperty ;
rdfs:label "本社所在地"@ja ;
rdfs:comment "弊社本社所在地"@ja ;
schema:domainIncludes ic:法人型 ;
rdfs:range xsd:string .
sharp:市場情報 a owl:DatatypeProperty ;
rdfs:label "市場情報"@ja ;
rdfs:comment “弊社の市場情報"@ja ;
schema:domainIncludes ic:法人型 ;
rdfs:range xsd:string .
72. 2.2.6 Anyone can say anything about anything
To facilitate operation at Internet scale, RDF is an open-world framework that allows
anyone to say anything about anything. In general, it is not assumed that all information
about any topic is available. A consequence of this is that RDF cannot prevent anyone
from making nonsensical or inconsistent assertions, and applications that build upon RDF
must find ways to deal with conflicting sources of information. (This is where RDF departs
from the XML approach to data representation, which is generally quite prescriptive and
aims to present an application with information that is well-formed and complete for the
application's needs.)
80. • オープンデータを公開する自治体:約170団体(※1)(全自治体の約10%)
RDFを公開している自治体
【引用】
※1 日本のオープンデータ都市一覧, http://fukuno.jig.jp/2013/opendatamap
※2 LinkData.orgによるオープンデータのスタートアップ支援, http://www.sigswo.org/papers/37program, (2015)
• LinkDataのサービスを利用してRDFを公開している自治体:42団体(※2)
51団体が公開する約1,200件のRDFを確認し,特徴の抽出を実施
1 北海道室蘭市 16 新潟県十日町市 31 静岡県静岡市 46 岡山県玉野市
2 北海道森町 17 新潟県見附市 32 静岡県三島市 47 広島県呉市
3 北海道八雲町 18 新潟県糸魚川市 33 静岡県島田市 48 山口県宇部市
4 宮城県石巻市 19 富山県砺波市 34 静岡県磐田市 49 山口県周南市
5 秋田県横手市 20 福井県 35 静岡県掛川市 50 香川県高松市
6 福島県会津若松市 21 福井県福井市 36 静岡県裾野市 51 熊本県菊池市
7 埼玉県川口市 22 福井県敦賀市 37 静岡県御前崎市
8 埼玉県和光市 23 福井県鯖江市 38 愛知県長久手市
9 埼玉県北本市 24 福井県越前市 39 三重県津市
10 千葉県流山市 25 長野県上田市 40 滋賀県大津市
11 千葉県我孫子市 26 長野県須坂市 41 大阪府高槻市
12 東京都品川区 27 長野県駒ヶ根市 42 大阪府枚方市
13 東京都杉並区 28 長野県中野市 43 兵庫県神戸市
14 神奈川県鎌倉市 29 長野県塩尻市 44 鳥取県
15 新潟県三条市 30 長野県軽井沢町 45 島根県松江市
• RDFを公開している自治体:51団体
81. • 事前調査の結果
現在公開されているRDFのLOD実現度はさまざま
LODの4つの原則を基準とするだけでは実態がつかめない
調査基準
• 新しい基準の作成
LODの4つの原則に,7つの基準を追加した「LOD実現のための11の基準」を定義
No 基準名 内容
1 機械判読 機械判読可能であること
2 IRI付与 事物の名前としてIRIが付与されていること
3 HTTP IRIの利用 名前を参照できるよう,HTTP IRIを用いていること
4 共通の語彙の利用 共通の語彙を利用していること
5 語彙の正確な利用 語彙の利用が正確であること
6 IRIのドメイン リソースのドメインがリソースを管理する自治体の所有するド
メインであること
7 IRIの参照 主語IRIの参照する先が存在すること
8 HTTP コンテントネゴシエーション HTTPコンテントネゴシエーションにより,要求に応じた形式で
情報提供をしていること
9 アウトバウンドリンク 外部IRIへのリンクを含むこと
10 実在するIRIへの
アウトバウンドリンク
参照解決可能な外部IRIへのリンクを含むこと
11 RDFリソースへの
アウトバウンドリンク
参照解決可能なRDFリソースIRIへのリンクを含むこと
【LOD実現のための11の基準】
82. 調査結果
• 今回調査した51の自治体の多くが,基準を満たすRDFと基準を満たさないRDFの
両方のタイプを公開している.
No 基準名 全て
満たす
一部
満たす
全て
満たさない
1 機械判読 49 2 0
2 IRI付与 34 14 3
3 HTTP IRIの利用 50 1 0
4 共通の語彙の利用 19 23 9
5 語彙の正確な利用 30 11 10
6 IRIのドメイン 4 4 43
7 IRIの参照 38 4 9
8 HTTP コンテントネゴシエーション 0 0 51
9 アウトバウンドリンク 5 3 43
10 実在するIRIへの
アウトバウンドリンク
0 2 49
11 RDFリソースへの
アウトバウンドリンク
0 1 50
【RDFが基準を満たす自治体数(n=51)】
83. 参考図書
• 情報処理,特集「Linked Open Data の利活用」(2016-7予定)
• 人工知能,特集「Linked Data と セマンティック技術」,30-5,pp.560-606(2015-9)
• 情報処理,特集「オープンデータ活用」,54-12, pp.1202-1247(2013-11)
• 人工知能学会誌,特集「Linked Dataとオントロジー」,27-2,pp.162-206(2012-3)
• 情報処理,特集「リンクするデータ~広がり始めたデータのクラウド」,52-3,
pp.282-333(2011-3)
• トム・ヒース,クリスチャン・バイツァー(武田監訳) : Linked Data – Web をグロー
バルなデータ空間にする仕組み,近代科学社(2013)
• オープン&ビッグデータ活用・地方創生推進機構,オープンデータガイド第2版,
http://www.vled.or.jp/news/1507/150730_001192.php
• オープンデータ時代の標準Web API SPARQL,株式会社インプレスR&D (2015)