LODデータベースAPIの紹介
LODチャレンジ実行委員会
2013/08/10
第2回LODチャレンジデー @ 渋谷ミクシィ
LOD
Linked Webの仕組みで
相互にリンクされた
Open (一定のルールのもとで)
二次利用可能な
Data 計算機可読なデータ
ボルト?
CC-BY 2.0 http://en.wikipedia.org/wiki/File:Usain_Bolt_2012_Olympics_1.jpg
CC-BY-SA 3.0 http://commons.wikimedia.org/wiki/File:P_Mickey.png
CC-BY-SA 3.0 http://en.wikipedia.org/wiki/File:DCA_06_2012_Chevy_Volt_4035.JPG
CC-BY-SA 2.5 http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Bolt-with-nut.jpg
ボルト
陸上選手
自動車
アニメ映画部品
CC-BY-SA 3.0 http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Berlino_Leichtathletik-WM.jpg
CC-By-SA 3.0 http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Olympicstadium2.jpg
100m 9秒58 (WR)
Web空間上でのデータ共有=LOD
100m 9秒58 (WR)
LODとは
• Web技術を利用して,オープンなデータ(Open Data)
を公開し,つなげる(Linkする)仕組み
• Web空間を巨大なデータベース化して,問い合わせ
や利用が可能
• オープンデータの主要なデータモデルの1つ
データ
データ
データ
公開 問い合わせ
利用Web空間
(グラフデータベース)
文書のWeb
• 文書ファイル(HTML)+リンク
• 各文書の所在をURIで表す
• 人間が読むことを想定
• 文書群に対してキーワード検索し,必要な情報を取
得する
HTML
HTML
HTML
HTML
リンク
リンク
LODによるデータのWeb
• データ(RDF)+リンク
• 各データの所在をURIで表す
• 計算機が読むことを想定
• データ群に対してSQLライクな条件式で検索し,必要
な情報を得る
RDFデータ
RDFデータ
RDFデータ
LODの基本的な仕組み
1. 情報とリンクに名前をつける
2. 情報の所在とリンクをURIで表現
– 同じURIは同じモノを表現
3. 名前空間の接頭辞を利用
Japan Tokyo
Capital
http://dbpedia.org
/resource/Japan
http://dbpedia.org
/resource/Tokyo
http://dbpedia.org/ontology/capital
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
LODの基本的な仕組み
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
dbpedia:Tokyo dbpedia:Naoki_Inose
dbpedia-owl:leaderName
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
dbpedia:Naoki_Inose
dbpedia-owl:leaderName
URIが同じノードで2つのグラフを結合
LODの基本的な仕組み
分野,ドメインを越えてデータどうしをリンクすること
で,つながりが広がっていく
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
dbpedia-owl:leaderName
dbpedia:Naoki_Inoseowl:sameAs
http://data.nytimes.com/59436095099277148161
DBpedia
NYTimes
LODクラウド
分野,ドメインを越えてデータどうしをリンクする
ことで,データセットどうしがつながったLODクラ
ウドが形成されている
RDFデータ
RDFデータ
RDFデータ
DBpediaNYTimes
BBC
DBpedia Japanese
Wikipedia日本語版 DBpedia Japanese
SPARQL
• LODデータセットに対するクエリ言語
• W3C標準のAPI(エンドポイントと呼ぶ)
PREFIX dbpja: <http://ja.dbpedia.org/property/>
PREFIX dcterms: <http://purl.org/dc/terms/>
select
distinct ?movie ?director ?actor // 映画名,監督名,出演者名を取得
where {
?m dcterms:subject <http://ja.dbpedia.org/resource/Category:日本の映画作品> .
// 映画 ?m の主題は日本の映画作品である
?m dbpja:監督 ?d . // 映画 ?m の監督は ?d である
?m dbpja:出演者 ?a . // 映画 ?m の出演者は ?a である
?m rdfs:label ?movie . // 映画 ?m の名前は ?movie である
?d rdfs:label ?director . // 監督 ?d の名前は ?director である
?a rdfs:label ?actor . // 出演者 ?a の名前は ?actor である
}
?m
?d
dbpja:監督
?a
?director
dbpja:出演者
?actor
rdfs:label
rdfs:label
?movie
rdfs:label
Category:
日本の映画作品
dcterms:subject
SPARQL package for R
• RでSPARQLを利用するためのパッケージ
• コードは4行だけ!
• URIに日本語を含むと,うまく動作しない場合がある
> library(SPARQL)
> endpoint <- "http://ja.dbpedia.org/sparql" // エンドポイントのURI
> query <-'select ...' // クエリ
> res <- SPARQL(endpoint,query)$results
movie director actor
1 パラサイト・イヴ 落合正幸 稲垣吾郎
2 パラサイト・イヴ 落合正幸 別所哲也
3 パラサイト・イヴ 落合正幸 三上博史
4 パラサイト・イヴ 落合正幸 中嶋朋子
5 パラサイト・イヴ 落合正幸 葉月里緒菜
...
http://semanticweb.cs.vu.nl/R/
http://linkedscience.org/tools/sparql-package-for-r/
http://cran.r-project.org/web/packages/SPARQL/
http://www.slideshare.net/nezuQ/rsparql
Gephiで監督と出演者の関係を可視化
日本の主なSPARQLエンドポイント
http://lodcu.cs.chubu.ac.jp/SparqlEPCU/index.jsp
http://lod.ac/
http://id.ndl.go.jp/auth/ndla
http://fp.yafjp.org/yokohama_art_lod
SparqlEPCU
RDFデータ格納,および登録したRDFデータのSPARQL検索
LODAC
博物館・美術館データ,生物種データなど
Web NDL Authorities
国立国会図書館典拠データ
検索・提供サービス
ヨコハマ・アート・LOD
LinkData.org App.LinkData.org
データを使ってアプリを作る
アプリで使えるデータを作る
データ公開とアプリ公開の
両方ができるプラットフォーム
テーブルデータの変換と公開をサポートする LinkData.org
テーブル形式の
データをアップロード
• R
• Simple Data Format
• TSV
• RDF/Turtle
• RDF/JSON
• RDF/XML
• RSS
• KML(緯度・経度情報が含ま
れる場合)
様々な形式のAPIに
変換して公開
現在提供しているAPIは全8種
地域資源の情報をオープンデータとして
共有するためのデータベースサイト CityData.jp
データを使ったアプリの作成・公開をサポートする App.LinkData.org
LinkDataに公開されている
全てのデータが、アプリの
入力データとして利用可能
オンラインエディタでJavaScriptを
書いて即、アプリとして公開
公開アプリはフォーク可能
Fork

LODデータベースAPIの紹介