Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

LODを始めるにあたって「最初に試すとよい」ツールの紹介

5,443 views

Published on

Linked Open Dataと オントロジー勉強会(第2回)
2013年8月5日(月)
於:大阪大学中之島センター
LODを始めるにあたって
“最初に試すとよい”ツールの紹介
大阪大学産業科学研究所  古崎晃司

Published in: Technology

LODを始めるにあたって「最初に試すとよい」ツールの紹介

  1. 1. Linked Open Dataと オントロジー勉強会(第2回) LODを始めるにあたって “最初に試すとよい”ツールの紹介 大阪大学産業科学研究所 古崎晃司 2013年8月5日(月) 於:大阪大学中之島センター 2013/8/5 第2回LODとオントロジー勉強会 1
  2. 2. 発表概要  発表目的  LODを使い始めるにあたって,「最初に試して見 ると良いツール」の紹介  発表概要  公開されているLODを“眺める”  SPARQLを用いた簡単な検索  LODを“作る”  手持ちのデータを“LOD化”するツール  LODを“公開する”  LODを公開する為のデータベース(トリプルストア) 2013/8/5 第2回LODとオントロジー勉強会 2
  3. 3. SPARQL  SPARQL  RDFデータに対するクエリ言語  「指定したグラフ構造」に一致するトリプルを検索する  例  select distinct * where { ?s ?p ?o . } LIMIT 100  select distinct * where { <http://ja.dbpedia.org/resource/東京都> ?p ?o . } LIMIT 100  select distinct ?s where { ?s <http://www.w3.org/2000/01/rdf-schema#label> ?o FILTER(regex(str(?o), “Osaka", "m")) . } 2013/8/5 第2回LODとオントロジー勉強会 3 日本語DBPediaでのクエリ検索例 http://ja.dbpedia.org/ で指定したパターンに一致するトリプルを検索する. ←取得する数 ↑同じパターンは除外する ↓返す要素(*は全て) 全トリプルの組み合わせ 東京都を主語(Subject)に含むトリプル ラベルに“Osaka”を含むトリプル ※日本語DBPediaでは 日本語のラベル検索 が上手く動かない?
  4. 4. 日本語で“今”使えるLOD  DBPedia Japanense  http://ja.dbpedia.org/  日本語LODのハブとして多くのデータから参照されている.  DBPedia(英語版)  http://dbpedia.org/  各言語版のDBPediaとのリンクの活用が可能  日本語Wikipediaオントロジー  http://www.wikipediaontology.org/index.html  インフォボックスに加え,よりリッチな情報を含んだオントロジーを提供.  CiNii  http://ci.nii.ac.jp/  日本語文献の情報をLODとして取得可能  KAKEN - 科学研究費助成事業データベース  http://kaken.nii.ac.jp/  研究者・研究課題の情報をLODとして取得可能  CKAN日本語  http://data.linkedopendata.jp/  日本のオープンデータのカタログサイト. 2013/4/25 第1回LODとオントロジー勉強会 4 SPARQL エンドポイント あり
  5. 5. 簡易SPARQL検索ツール  コンセプト  SPARQLを全く知らない人でも,公開されている任意のLODのSPARQLエ ンドポイントをつかった「キーワード検索」ができるツール  公開されているLODに“どんなデータが含まれているか”を簡単に調べる ことが出来る  http://www.facebook.com/LodOnt にて公開中  LODを用いた基本的な操作を実現するプログラムのサンプルとするため, ソースコードも公開.(※フィードバックを歓迎します!)  できること  簡易検索機能  キワードに“URI”/“ラベル”が一致する(部分一致・完全一致)リソースを検索  検索結果の一覧から選択したリソースを主語(subject)とする全トリプルの検索  任意のSPARQLクエリを用いた検索  検索結果の保存  DBに格納されているトリプルの簡易編集(AllegroGraphのみ対応) 2013/8/5 第2回LODとオントロジー勉強会 5
  6. 6. 簡易SPARQL検索ツールの画面例 2013/8/5 第2回LODとオントロジー勉強会 6 SPARQLエンドポイ ントの選択・追加 検索キーワードの入力 検索実行 検索キーワードに一致 したリソース一覧 検索オプション 選択したリーソースを 主語とするトリプル一覧 検索に用いたSPARQL クエリ 任意のSPARQLクエリ 検索への切り替え ※注意 DBPedia(英語版)に対して 「部分一致検索」を行うと 結果が帰ってくるまで数分 かかるので注意.
  7. 7. SPARQLについての参考資料  LOD技術解説  LODチャレンジJapanサイト  http://lod.sfc.keio.ac.jp/challenge2013/slideresources2.html  第4回AIツール入門講座:LOD : Linked Open Data 入門の資料  加藤 文彦さん(情報・システム研究機構 新領域融合研究セン ター 国立情報学研究所)  http://fumi.me/aitool_4/sparql.html 2013/8/5 第2回LODとオントロジー勉強会 7
  8. 8. 参考情報: RDFデータベースでの文字列検索  トリプルストアの文字列検索は遅い?  日本語DBPediaくらいの規模なら大丈夫?  英語版DBPediaだとかなり厳しい...  一部のトリプルストアでは,文字列検索用の拡張 コマンドをサポートしている.  例)Virtuso ただし日本語がうまく通らない? SELECT * WHERE { ?subject <http://www.w3.org/2000/01/rdf- schema#label> ?Literal . FILTER bif:contains(?Literal, "Japan") } ※ DBpedia Lookup Serviceではかなり高速.何か特別な実装をし ている? http://wiki.dbpedia.org/lookup/ 2013/8/5 第2回LODとオントロジー勉強会 8
  9. 9. LODを「作る」 手持ちのデータを「LOD化」するツール  LinkData.org  http://linkdata.org/  簡単な操作でRDFを公開することがサイト.Web上でア プリケーションを開発する機能も有り.  始めてLODを作るツールとしてオススメ.  LODRefine  http://code.zemanta.com/sparkica/  様々な形式のデータを読み込み,データの整形・公開 に必要な様々な処理を行うことが出来るツール.RDF extensionを用いることで,手持ちのデータをRDFに変 換することが可能.  DBPediaなどとのリンク付けを支援するツールもあり.  本格的なLODの公開に利用可能なツール 2013/8/5 第2回LODとオントロジー勉強会 9
  10. 10. LODを「公開する」 :LODを公開する為のDB(トリプルストア)  Virtuoso  http://virtuoso.openlinksw.com/  商用版とオープンソース版がある  DBPediaを初め,最近は,このソフトを試用しているプロジェクトが 多い?  日本語のドキュメントも探せば割と見つかる.  OWLIM  http://www.ontotext.com/owlim  OWLIM Liteは申請するとフリーで使用可能.(改変等は不可)  AllegroGraph  http://www.franz.com/agraph/allegrograph/  商用データベース.  フリー版では500万トリプルまで格納可能.  Gruffという可視化ツールも使える  本勉強会のFBページで,日本語インストール手順書を公開予定 2013/8/5 第2回LODとオントロジー勉強会 10
  11. 11. LODを用いたソフト開発  Jena  RDFを処理するためのJavaライブラリ  その他,各言語向けのRDFライブラリがあるの で,必要に応じて利用するとよい  参考資料  人工知能学会誌 私のブックマーク Linked Open Data  加藤 文彦さん(情報・システム研究機構)  http://www.ai-gakkai.or.jp/my-bookmark_vol28-no5 2013/8/5 第2回LODとオントロジー勉強会 11
  12. 12. アナウンス 2013/8/5 第2回LODとオントロジー勉強会 12 http://lod.sfc.keio.ac.jp/challenge2013/

×