Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Linked Dataとオントロジーによるセマンティック技術の実際

3,660 views

Published on

JSAI2017
人工知能学会全国大会(第31回)
OS-7 意味と理解のコンピューティング
2017年5月24日@名古屋

Published in: Technology

Linked Dataとオントロジーによるセマンティック技術の実際

  1. 1. Linked Dataとオントロジーによる セマンティック技術の実際 大阪大学産業科学研究所 古崎 晃司 kozaki@ei.sanken.osaka-u.ac.jp JSAI2017 人工知能学会全国大会(第31回) OS-7 意味と理解のコンピューティング 2017年5月24日@名古屋
  2. 2. 自己紹介  コミュニティ活動  古崎(こざき)晃司 @koujikozaki  本職: 大阪大学・准教授  専門: オントロジー工学,Linked Data  研究方針:基礎理論に基づいたツール開発と, それを用いた応用研究の実践. 22017/5/24 JSAI2017@名古屋 2011より 毎年開催している コンテスト 関西を中心とした LODの普及活動 大阪をITの力でよくしよ うと活動している団体 http://code4.osaka/about/ 研究成果として 公開中のソフト
  3. 3. LODチャレンジ (2011年~) ※自由課題型 http://lodc.jp/ アーバンデータチャレンジ (2013年~) ※課題解決型 http://urbandata‐challenge.jp/ 重複応募可能 2017年度も 実施します! 2017/5/24 JSAI2017@名古屋 3
  4. 4. 研究内容  ①オントロジー工学の基礎理論  基礎理論:ロール理論【JAIST,立命大】  構築方法論:オントロジー洗練支援,半自動構築  ②オントロジー構築・利用ソフトウェアの開発  オントロジー構築ツール「法造」および利用API  Linked Open Data (LOD)関連ツール  ③各領域でのオントロジー・LODの構築,および応用システム開発  サステナビリティ・サイエンス(環境分野)オントロジー【地球研】  生物規範工学オントロジーに基づくDB【科学博物館,JAIST,立命大】  臨床医学オントロジーの構築と利用【東大,JAIST】  バイオインフォマティクスDB【DBCLS,理研】  JSTシソーラスの高度化(オントロジー化)【JST,NBDC】  行政オープンデータの活用・地域課題解決【大阪市,豊中市,他】  「ISWC2016@神戸」連携企画【NHK技研,神戸情報大,立教大,他】 2017/5/24 4 【 】:主な共同研究・連携先 LOD技術の 普及活動にも従事 JSAI2017@名古屋
  5. 5. オントロジー構築利用環境「法造」  オントロジー工学の基礎理論に基づいて開発された, オントロジー(=法)の構築(=造)および利用を支援す るソフトウェア  1996年より開発  http://www.hozo.jpにて フリーソフトウェアとして公開  登録ユーザ数:約5,000  ダウンロード数:約12,000 (共に,国内外含む)  研究室内外のオントロジー開発 プロジェクトでの多数の利用実績 2017/5/24 5JSAI2017@名古屋 法造の画面例 近日(6月上旬?) 最新版を公開予定
  6. 6.  2002-2007 ナノテクノロジーオントロジーの構築  NEDO「材料技術の知識の構造化」  2006-継続中 臨床医学オントロジーの構築  共同研究:東京大学医学研究科  2007-2009 サスティナビリティ・オントロジーの構築  共同研究:大阪 大学サスティナビリティ・サイエンス研究機構(RISS)  2007-2010 文科省:統合データベース整備事業・統合医科学データベース の構築  共同研究:東京医科歯科大学・大阪大学大学院医学系研究科  2008-2012 蛋白実験プロトコールオントロジーの構築  共同研究:大阪大学蛋白質研究所(文科省:ターゲットタンパクプロジェクト)  2008-2010 バイオ燃料オントロジーの構築  環境省:Hc-082「アジア太平洋地域における地球温暖化の持続可能な発展のため のバイオ燃料利用戦略に関する研究」(研究代表者:東京大学・武内和彦教授)  2009-2011 災害リスクオントロジーの構築  共同研究:防災科学研究所  2012-2017 生物規範工学オントロジーの構築  科研新学術領域  2013-2015 情報リテラシーリスクオントロジーの構築  共同研究:山形大学 2017/5/24 JSAI2017@名古屋 6 これまで構築したオントロジー
  7. 7. はじめに,質問  以下の用語をご存知の方?  オントロジー  セマンティック・ウェブ  Linked Data/Linked Open Data(LOD)  ナレッジグラフ  SPARQL  DBpedia  Wikidata  ティム・バーナーズ・リー(人名) 2017/5/24 JSAI2017@名古屋 7
  8. 8. はじめに,質問  以下の用語をご存知の方?  オントロジー  セマンティック・ウェブ  Linked Data/Linked Open Data(LOD)  ナレッジグラフ  SPARQL  DBpedia  Wikidata  ティム・バーナーズ・リー(人名) 2017/5/24 JSAI2017@名古屋 8 知識をグラフ構造で表したもの (Linked Data・オントロジーの 両方を含む) 本日,イチ押しのキーワード
  9. 9. 発表概要  発表のねらい  Linked Data/オントロジーが意味処理に “どれくらい”使えそうか?を感じていただく.  発表内容  セマンティック(Web)技術の変遷  Linked Dataの基盤技術  Linked Dataの構築事例  Linked Data/オントロジーのセマンティクスの利用  セマンティクスの利用形態  利用事例  まとめ 2017/5/24 JSAI2017@名古屋 9
  10. 10. セマンティック技術の変遷 (Semantic Web→Linked Data) 2017/5/24 JSAI2017@名古屋 10
  11. 11. Semantic Webの概要  Semantic Webとは  従来の「人が読む(理解する)ためのWeb」から, 「コンピュータが理解(意味処理)可能なWeb」へ [Berners-Lee 2001]  技術的には,  Web上のドキュメントにコンピュータによる意味処理に用いる 「メタデータ」を付与する(タグを付ける)」  その際に用いるフォーマットが「RDF」  メタデータに用いる語彙を定義するのが「オントロジー」 (RDFSやOWLで書かれる)  RDFで書かれたメタデータを検索するためのクエリー言語が 「SPARQL」 ... 112017/5/24 JSAI2017@名古屋 [Berners-Lee 2001] Tim Berners-Lee, James Hendler and Ora Lassila :The Semantic Web,Scientific American, MAY 2001.
  12. 12. Layer Cake  Semantic Webに必要な要素技術を階層状に表したもの http://www.w3.org/2001/09/06-ecdl/slide17-0.html http://www.dajobe.org/talks/200905-redland/ 122017/5/24 JSAI2017@名古屋
  13. 13. Semantic Webの研究動向の変遷  研究動向(流行トピック)の変遷  語彙(オントロジー)に基づいたメタデータによる意味処理の実現  誰がメタデータを?→Web2.0的共同構築  データ(インスタンス)のLinkの重視:Linked Data リ ッ チ な 意 味 記 述 スケーラビリティ(大量データ) Semantic Web (の理想) すぐに使えるタグを(RSS,FOAF) SNS利用・Web2.0 DBPedia × Linked Data 2004-2006 2007 2008- 132017/5/24 JSAI2017@名古屋
  14. 14. 2017/5/24 JSAI2017@名古屋 14 ISWC2011: Keynote Frank van Harmelen氏の講演より Terminological knowledge is much smaller than the factual knowledge オントロジー Linked Data オントロジー Linked Data Frank van Harmelen, 10 Years of Semantic Web: does it work in theory? 入手先:http://www.cs.vu.nl/~frankh /spool/ISWC2011Keynote/
  15. 15. ISWC2011:Openingより 2017/5/24 JSAI2017@名古屋 15 大幅増 大幅増 大幅減 変化なし
  16. 16. ISWC2016のトピック 2017/5/24 JSAI2017@名古屋 16 ISWC2016オープニング (http://videolectures.net/iswc2016_chairs_opening_ceremony/)より
  17. 17. まとめ:セマンティック技術の変遷  セマンティックWeb  データにメタデータとしてセマンティクス(意味)を付与す ることで,「データのWeb」を目指す.  ISWC(International Semantic Web Conference)は, 2001~開始  メタデータ付与のコストが当初から課題  Linked Data  DBpedia[2007]の発表以降,Linked Data研究が加速  データをゼロから作るのではなく,既にあるデータ(事実情報) をLinked Dataとして公開することから始める  ISWCでの研究トピックとしても「データ」の比率が増加  「オントロジー」,「セマンティック」も一定数を維持 2017/5/24 JSAI2017@名古屋 17
  18. 18. Linked Dataの基盤技術 182017/5/24 JSAI2017@名古屋
  19. 19. Linked Data  Linked Data:Web上のデータを,つなぐ(linkする)ことで,新しい価値 を生み出そうとする取り組み.Webの創始者Tim Berners-Lee氏が提唱 ※ Linked Open Data(LOD):オープンな形で公開されたLinked Data http://linkeddata.org/ “Webの仕組み”に基づいてデータを公開すること で, Web上に公開された膨大なデータを 統合した1つの知識ベースとして利用可能にす2017/5/24 JSAI2017@名古屋 19
  20. 20. Webの仕組み  URLを指定することで,Webページにアクセス  例)http://spaceappschallenge.space/ 「NASA Space Apps Challenge OSAKA」のページ  URLは,世界中“すべて”のWebページの場所(ID) を一意に特定できる仕組み  ハイパーリンクにより,Webページを“つなげる”  リンク先のURLを指定することで,好きなWebページ と自由に“リンク”できる  リンクを辿って,様々な情報にたどり着ける  リンクを解析による様々なビジネス  例)Googleなどの検索エンジン 202017/5/24 JSAI2017@名古屋
  21. 21. Webの仕組み→Linked Data  URLを指定することで,Webページにアクセス  例)http://www.ai-gakkai.or.jp/jsai2017/ 「JSAI2017」のWebページ  URLは,世界中“すべて”のWebページの場所(ID) を一意に特定できる仕組み  ハイパーリンクにより,Webページを“つなげる”  リンク先のURLを指定することで,好きなWebページ と自由に“リンク”できる  リンクを辿って,様々な情報にたどり着ける  リンクを解析による様々なビジネス  例)Googleなどの検索エンジン 212017/5/24 JSAI2017@名古屋 データ データ Linked Data Webと同じ仕組みでデータを“公開”し, 相互に“つなぐ”(リンクする) IRI データ(モノ・コト) データ(モノ・コト)
  22. 22. Linked Data (RDF)の例 大阪府 大阪市 都道府県 223㎢ 2,687,287人 面積 人口 吹田市 豊中市 … バラ科 市の木 隣接自治体 隣接自治体 … http://ja.dbpedia.org/resource/大阪市 というIRIから得られる情報 サクラ 科 Cherry blossom英名 リソース: URIで表される モノ・コト プロパティ: リソース間の関 係を表す リテラル :文字列 主語 述語 目的語 トリプル ※RDF(Linked Dataのデータ モデル)は,「トリプルの組み 合わせ」で表される (DBpedia Japaneseより) 目的語が他のリソースのとき,トリプル を辿って更なる情報が得られる JSAI2017@名古屋2017/5/24 22
  23. 23. Linked Data (RDF)の例 http://ja.dbpe dia.org/resour ce/大阪府 http://ja.dbpe dia.org/resour ce/大阪市 http://ja.dbpedia.org/resource/都道府県 223㎢ 2,687,287人 http://ja.dbpedia.org/resource/面積 http://ja.dbpedia.org/resource/人口 http://ja.dbpe dia.org/resour ce/吹田市 http://ja.dbpe dia.org/resour ce/豊中市 … http://ja.dbpe dia.org/resour ce/バラ科 http://ja.dbpedia.org/resource/市の木 http://ja.dbpedia.org/resource/隣接自治体 http://ja.dbpedia.org/resource/隣接自治体 … http://ja.dbpedia.org/resource/大阪市 というIRIから得られる情報 http://ja.dbpe dia.org/resour ce/サクラ http://ja.dbpedia.org/resource/科 Cherry blossomhttp://ja.dbpedia.org/resource/英名 (DBpedia Japaneseより) ※実際のリソースとプロパティは,すべてURIで表される. JSAI2017@名古屋2017/5/24 23
  24. 24. データを「つなげる」仕組み  「3つ組(トリプル)」により様々な構造のデータの “つながりを柔軟に表現”できる  Webサイトのリンクを辿るのと同様に,プロパティ(リンク)を辿る ことで関連するデータの情報を辿ることが出来る.  RDFのプロパティは,“関係の意味”を定義できる.  cf. Webのハイパーリンクは単に“つながり”を表すのみ  データ(リソース)をIRIで表すことで,“外部のデータとつ なげる”ことができる.  URIは,グローバルに一意のIDを表す.  WebサイトのURLと同じ仕組み.  cf.単なる数字をIDとすると,異なるDBが同じIDを使っている可能性 がある  Linked Data = 外部のデータとつながったデータ ≠ RDFフォーマットのデータ 2017/5/24 JSAI2017@名古屋 24
  25. 25. Linked Dataの基本原則 1. Use URIs as names for things 全てのモノやコトにURIをつけましょう 2. Use HTTP URIs so that people can look up those names. それらのURIをhttp(Webブラウザと同じ方法) で参照(アクセス)できるようにしましょう 3. When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) そのURIを参照したら,標準の技術(RDFやSPARQL)を使用し て,役に立つ情報を提供するように 4. Include links to other URIs. so that they can discover more things. 多くのモノ・コトを発見できるように,外部へのリンクを含めよ う. 原文引用元 http://www.w3.org/DesignIssues/LinkedData.html 日本語訳参考 http://www.slideshare.net/takeda/lod-5163454 2017/5/24 JSAI2017@名古屋 25
  26. 26. Linked Dataの基本原則 1. Use URIs as names for things 全てのモノやコトにURIをつけましょう 2. Use HTTP URIs so that people can look up those names. それらのURIをhttp(Webブラウザと同じ方法) で参照(アクセス)できるようにしましょう 3. When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) そのURIを参照したら,標準の技術(RDFやSPARQL)を使用し て,役に立つ情報を提供するように 4. Include links to other URIs. so that they can discover more things. 多くのモノ・コトを発見できるように,外部へのリンクを含めよう. 原文引用元 http://www.w3.org/DesignIssues/LinkedData.html 日本語訳参考 http://www.slideshare.net/takeda/lod-5163454 2017/5/24 JSAI2017@名古屋 26 Linked Data の公開方法について
  27. 27. LODの公開方法  参照解決可能なhttp URIsを用いた公開  URIでデータにアクセスが可能  通常のWebページと同様に,データのURIを用いて 「つながり」を辿ることが出来る =システムによる処理(リンク解析等)が可能  SPARQLエンドポイントの公開  RDF用のクエリ言語SPARQLにより検索可能なAPIを公開  クエリによるデータ検索・抽出が可能  RDFファイルのダンプの公開  全データをダウンロードできる形で公開  ダウロードしたファイルをRDFパーサー,RDF-DBなどの ツールを用いて処理可能 2017/5/24 JSAI2017@名古屋 27
  28. 28. まとめ: Linked Dataの基盤技術  Linked Dataは,Web上で公開されたデータを 「つなぐ」仕組み  URL(IRI)を用いたグローバルに一意なデータの識別  データ間の“リンク”  Webと同じ仕組みを用いたデータのアクセス  URIによる直接アクセス  SPARQLエンドポイント(API)によるアクセス  これらの仕組みが標準化されているため, データ・オントロジーの共有が容易に行える.  公開されているLinked Data(LOD)を利用することで, -データ構築コストの削減, -データへのセマンティクスの付与 が可能に! 2017/5/24 JSAI2017@名古屋 28
  29. 29. Linked Dataの構築事例 292017/5/24 JSAI2017@名古屋
  30. 30. 既に公開・リンクされているLOD ~LODクラウド~ 2007/5/1 2007/10/82008/9/182009/7/14 2010/9/222011/9/19時点 Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/ 1つの丸が個別に公開 されたDBを表す. 2014/08/30時点 2017/5/24 JSAI2017@名古屋 30 DBpedia
  31. 31. 既に公開・リンクされているLOD ~LODクラウド~ 31 Domains # of dataset % Government 183 18.05 Publications 96 9.47 Life sciences 83 8.19 User-generated content 48 4.73 Cross-domain 41 4.04 Media 22 2.17 Geographic 21 2.07 Social web 520 51.28 Total 1014 2017/5/24 JSAI2017@名古屋
  32. 32. LODクラウドの最新版 Linking Open Data cloud diagram 2017, by Andrejs Abele, John P. McCrae, Paul Buitelaar, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/ 2017-02-20時点 データセット数 :1,139 JSAI2017@名古屋2017/5/24 32
  33. 33. BioPortal 2017/5/24 JSAI2017@名古屋 33 https://bioportal.bioontology.org/ 米国The National Center for Biomedical Ontology(NCBO)により運営されている ライフサイエンス分野のオントロジーレポジトリ
  34. 34. The NBDC RDF Portal 2017/5/24 JSAI2017@名古屋 34 https://integbio.jp/rdf/ 国内のライフサイエンス関連のRDFデータ を集めたポータルサイト
  35. 35. 日本語で使えるLODの例 法人インフォ(経済産業省) eStat 統計LOD 国立国会図書館LOD 大阪市オープンデータポータル DBpedia(WikipediaのLOD) JSAI2017@名古屋 Wikidata 2017/5/24 35
  36. 36. 日本語LODクラウド 2017/5/24 JSAI2017@名古屋 36 日本語Linked Data Cloud図 2014-03-10版 http://linkedopendata.jp/?p=486
  37. 37. DBPedia Wikipediaの各記事のインフォボックスの情報を抽出して自動 生成されるLOD 様々なデータをつなぐLODのハブ的な存在となっている. http://dbpedia.org/ 日本語版のDBPediaは http://jp.dbpedia.org/ 2017/5/24 JSAI2017@名古屋 37 インフォボックスの例
  38. 38. DBpediaのデータ例(大阪市) 2017/5/24 JSAI2017@名古屋 38 すべてのWikipediaの記事が http://ja.dbpedia.org/resource/大阪市 のようなURL(IRI)でデータ化されている 生データの取得 検索API プログラムからの データ取得も可能
  39. 39. Wikidata(http://wikidata.org/) JSAI2017@名古屋 • ウィキメディア財団が運営する Wikipediaの「データ版」 • Wikipediaと同じようにデータを コミュニティで編集,公開できる • Wikipediaの「多言語リソース」 の相互リンクのために整備 • SPARQLエンドポイントや各種検 索ツールなども提供 2017/5/24 39
  40. 40. まとめ: Linked Dataの構築事例  LODクラウド  Linked Open Data(LOD)として公開されているデータセット の“つながり”を可視化した図  2017年2月20日時点で,1,139のデータセットが登録.  ライフサイエンス分野のLinked Data/LOD  研究を進めるうえでデータ共有が必須のため,オントロジー の整備,データのRDF化が進んでいる  オントロジーやRDF共有のためのポータルサイトも整備  日本でのLinked Data/LOD  DBpedia,Wikidataのような汎用のものに加えて,政府デー タのLOD化も一部,進められている.  研究データのLinked Data化は,分野によってあり. 2017/5/24 JSAI2017@名古屋 40
  41. 41. Linked Data・オントロジーの セマンティクスの利用 412017/5/24 JSAI2017@名古屋
  42. 42. Linked Dataとオントロジー  オントロジー  対象世界をどのように捉えたか?(どのように理解したか?)を 表す.  Linked Dataの記述に用いる語彙・記述規則を与える.  Ontologies are systematized knowledge of domains.  Linked Dataにおけるオントロジーの役割  Linked Dataの記述方法を統一し,相互運用性を高める.  RAWデータに対し,セマンティクス(意味)を付与する.  共通語彙レベル/抽象概念レベル/概念構造レベル/推論ロール(公理) レベル  オントロジー自体を既知の体系化された知識として用いる. 2017/5/24 42JSAI2017@名古屋
  43. 43. Linked Data/オントロジーの 利用形態 メタデータ層 ... Linked Data / LODLinked Data / LOD オントロジー層 データ層 43 オントロジーオントロジー 領域を横断した データ/知識統合 領域知識を深堀した 意味処理 2017/5/24 JSAI2017@名古屋 データ自体を Linked Dataと する場合もあり 利用目的に応じて,“どの層を利用するか?” 各層で記述される(用いられる)“セマンティクスの詳細度”が異なる
  44. 44. セマンティクスの利用形態  Linked Dataから知識を検索/抽出  事実情報の取得  解析に用いるデータ(一覧)の取得  複数のLinked Dataの統合(マッシュアップ)  Linked Data/オントロジーを用いたデータへの セマンティクス付与  RAWデータ,自然言語などへのメタデータ付与  既存Linked Dataを用いたLinked Data/オントロジー拡充  オントロジーの利用  共通語彙を用いたデータ統合・検索  領域を横断したDB/知識連携  オントロジーで定義されたクラスレベルの知識利用  概念定義の利用→一般化された知識  公理(推論ルールの利用) 2017/5/24 JSAI2017@名古屋 44
  45. 45. セマンティクスの利用事例 Linked Dataから知識を検索/抽出  事実情報の取得  解析に用いるデータ(一覧)の取得  複数のLinked Dataの統合(マッシュアップ) 2017/5/24 JSAI2017@名古屋 45
  46. 46. 例)LODからの事実情報の取得 2017/5/24 JSAI2017@名古屋 46  DBpediaを百科事典的な “知識”(事実情報)を取得する ための汎用情報源として利用 医療分野での利用例 http://lodc.med-ontology.jp/ 生物分野での利用例 http://biomimetics.hozo.jp/ 多言語対応も可能!
  47. 47. DBpediaを利用したアプリ例 2017/5/24 JSAI2017@名古屋 47 DBpediaの情報の“つながり” を辿ることで, バーチャルな宇宙旅行を! ※「第7回LODハッカソン関西 in IODD大阪(1日イベント)」の成果 http://museums-info.net/spacemachine/navi/
  48. 48. 例)Bpedia/Wikidataからの解析用 のデータ取得 2017/5/24 JSAI2017@名古屋 48  簡単なランキングデータの取得  例)都道府県毎の「〇〇」の数  政治家(出生地)...1位は東京  「??」 ...1位は大阪  簡単な場所情報の取得  位置情報データの一覧  例:大阪市内の位置情報 http://lodosaka.jp/tool/wikidataMap/  例:東京都内の位置情報 http://lodosaka.jp/tool/wikidataMapTokyo/ (解説)Qiita:DBpediaを使った都道府県別ランキング http://qiita.com/koujikozaki/items/439fa7ce3e28b738fe10
  49. 49. DBpedia Japaneseの検索例  「各都道府県で生まれた政治家の数」を調べる PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX dbpedia-owl: <http://dbpedia.org/ontology/> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX dbpedia-ja: <http://ja.dbpedia.org/resource/> PREFIX category-ja: <http://ja.dbpedia.org/resource/Category:> select distinct ?pref (count(?s) AS ?c) where { ?pref rdf:type dbpedia-owl:Place. ?pref dbpedia-owl:wikiPageWikiLink category-ja:日本の都道府県. ?s rdf:type dbpedia-owl:Politician; dbpedia-owl:birthPlace ?pref. }GROUP BY ?pref ORDER BY ?c 49 (解説)Qiita:DBpediaを使った都道府県別ランキング http://qiita.com/koujikozaki/items/439fa7ce3e28b738fe10 2017/5/24 JSAI2017@名古屋
  50. 50. DBpedia Japaneseの検索例  「各都道府県で生まれた芸人の数」を調べる PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX dbpedia-owl: <http://dbpedia.org/ontology/> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX dbpedia-ja: <http://ja.dbpedia.org/resource/> PREFIX category-ja: <http://ja.dbpedia.org/resource/Category:> select distinct ?pref (count(?s) AS ?c) where { ?pref rdf:type dbpedia-owl:Place. ?pref dbpedia-owl:wikiPageWikiLink category-ja:日本の都道府県. ?s rdf:type dbpedia-owl:Comedian; dbpedia-owl:birthPlace ?pref. }GROUP BY ?pref ORDER BY ?c ここを, Politician→Comedian に変えるだけ! 502017/5/24 JSAI2017@名古屋
  51. 51. 複数データの統合例 2017/5/24 JSAI2017@名古屋 51 LODチャレンジ2014 ビジュアライゼーション部門 優秀賞 「警察署・交番から距離 が遠いエリア」と犯罪発 生地点を重ね合わせ
  52. 52. セマンティクスの利用事例 Linked Data/オントロジーを用いた データへのセマンティクス付与  RAWデータ,自然言語などへのメタデータ付与  既存Linked Dataを用いたLinked Data/オントロ ジー拡充 2017/5/24 JSAI2017@名古屋 52
  53. 53. Web閲覧履歴 (アクセスログ) Web行動オントロジー ユーザの購買 行動を分析 Web行動オントロジーに基づく Webアクセスログデータの構造化 共同研究: コンシューマファースト 2017/5/24 JSAI2017@名古屋 53
  54. 54. 基となるオントロジー  基となるオントロジーを⼈⼿で⽤意して,それに 関係する概念や関係を追加する  専⾨⽂書の「キーワード索引」(*)を基に構築  キーワード索引の単語に最上位クラスを定義する  最上位クラス︓「ゴール」「構造」「性質」 「⽣物」「部位」「物質」「振る舞い」「その他」 専⾨⽂書とLinked Open Dataを⽤いた⽣物規範 ⼯学オントロジーの⼤規模化⼿法の開発 56 構造 性質⽣物 特徴的構造 関連性質 (*)本研究では「昆⾍ミメティックス」のキーワード索引 (656語)を利⽤.
  55. 55. ⽣物規範⼯学オントロジー ⼤規模化の⼿法 57 専⾨書の⾃然⾔語処理 基となるオントロジーを構築する ①オントロジーに追加する概念の候補を選択する ②オントロジーに追加する概念の上位クラスを 同定する(is-a関係の同定) ③⽣物規範⼯学で注⽬される関係の種類を同定する 専⾨書の⾃然⾔語処理 Linked Open Dataの利⽤ 2つのアプローチ から⾏う 共通の 3ステップで⾏う 専⾨書の⾃然⾔語処理 Linked Open Dataの利⽤
  56. 56.  追加候補単語を全て評価するのは難しいため, ランダムサンプリングし,正解上位クラスを付与  正解付与はオントロジー専⾨家3⼈で⾏った  これらの適合率・再現率を計算し評価した オントロジー⼤規模化の試⾏・評価 ②追加する概念の上位クラス(is-a関係)の同定1/2 58 上位クラス同定の 対象となる概念 (追加候補単語) の数 サンプリ ング数 適合率 再現率 専⾨⽂書を⽤いた⼿法 14,272語 500語 18.3% 18.8% LODを⽤ いた⼿法 DBpedia Japanese 1,362語 500語 56.3% 32.8% JST科学技術⽤語 シソーラス 203語 203語 82.8% 37.9%
  57. 57. オントロジー⼤規模化の試⾏・評価 ②追加する概念の上位クラス(is-a関係)の同定2/2 59 0.0% 10.0% 20.0% 30.0% 40.0% 50.0% 60.0% 70.0% 80.0% 90.0% 100.0% ゴール 構造 性質 ⽣物 部位 物質 振る舞い その他 全体 0.0% 10.0% 20.0% 30.0% 40.0% 50.0% 60.0% 70.0% 80.0% 90.0% 100.0% ゴール 構造 性質 ⽣物 部位 物質 振る舞い その他 全体 上位クラス同定 の適合率 上位クラス同定 の再現率 専⾨⽂書 DBpedia Japanese JST科学技術⽤語シソーラス 全体では, 専⾨⽂書⼀番低く, JST科学技術⽤語 シソーラスが⼀番 ⾼い 最上位クラスに よっては LODを⽤いた 再現率が低い ⇒専⾨⽂書を⽤い た⼿法も併⽤する ことが重要 専⾨⽂書のみの追加候補例 ゴール︓網膜マイクロスキャナ 構造︓接触表⾯ 振る舞い︓⾶び越える,営巣
  58. 58.  10種の関係を同定  関連構造,関連振る舞い,関連性質, 根拠となる構造,使⽤部位,特徴的構造, 特徴的振る舞い,部位,部分構造,部分振る舞い  同定した関係を全て評価するのは難しいため, 同定した関係をランダムサンプリングし, 関係の種類同定の適合率を計算し評価した オントロジーの⼤規模化の試⾏・評価 ③⽣物規範⼯学で注⽬される関係の種類の同定1/2 60 関係の種類が 同定された関 係の数 サンプリング 数 適合率 専⾨⽂書を⽤いた⼿法 23,481組 200組 8.0% LODを⽤い た⼿法 DBpedia Japanese 1,224組 200組 37.0% JST科学技術⽤語 シソーラス 73組 73組 56.2%
  59. 59. セマンティクスの利用事例 オントロジーの利用  共通語彙を用いたデータ統合・検索  領域を横断したDB/知識連携  オントロジーで定義されたクラスレベルの知識利用  概念定義の利用→一般化された知識  公理(推論ルールの利用) 2017/5/24 JSAI2017@名古屋 61 生物規範工学 疾患オントロジー
  60. 60. 生物規範工学オントロジーに 基づくキーワード探索  バイオミメティクス(biomimetics)研究  「自然に学ぶものつくり」=bio+mimetic(模倣)  研究事例  蓮の葉の撥水性(ロータス効果)を模倣した,塗装や セルフクリーニングに関する研究  ヤモリの指の粘着性に着目した接着剤の開発  蝶や玉虫の「構造色」  流体抵抗の低いサメ肌の構造を模した高速水着  バイオミメティクス・データベースの開発  生物の知識の無い工学者が,「新製品開発の際に模倣でき そうな“生物”」を見つけたい  工学,生物学の知識をオントロジーとして体系化し,製品で 実現したいこと(ゴール)から,発想の“ヒント”となるキー ワードを探索する 2017/5/24 62JSAI2017@名古屋 生物規範工学オントロジー[鳥村]
  61. 61. バイオミメティクス・データベースから有用な情報 を見つけるには,“工学”と“生物学”の用語の違 いを適切に“つなぐ”ことが重要 オントロジー 機能分解 機能オントロジー 生物種 Taxonomy 構造 振る舞い 生息環境 オントロジーは,概念の本質的な構造を捉え,領域を横断 した概念(用語)の“つながり”(関係)を明らかにする 異分野間の用語の違い工学 ニーズ 課題 生物学 多様な生物種 と豊富な情報 2017/5/24 JSAI2017@名古屋 63
  62. 62. オントロジーを用いることで,キーワードの連想的 な検索(キーワード探索)が行える 汚れない 汚れても 落ちる 洗い流す 水で覆う 撥水性 親水性 バラの花 凹凸構造 蓮の葉泥の中 に住む ミミズ 生物種 構造 生物種 生物種 性質 性質 生息環境 機能 機能 機能 機能 論文 著者 画像DB 画像 文献DB オントロジーから 得られる情報 外部DBからの情報2017/5/24 JSAI2017@名古屋 64
  63. 63. 生物規範工学オントロジーの 主な上位概念の定義 2017/5/24 JSAI2017@名古屋 65 主要な上位概念と 「機能」の関連を定義
  64. 64. オントロジー探索ツール  利用者の視点に応じてオントロジーを探索(Explore)し, その結果を「概念マップ」として可視化する. 1.オントロジーの探索 着目する概念(Focal point)を 法造上で指定した後,注目する 関係性(aspect)を繰り返し選択 法造 – オントロジーエディタ 概念マップ 2.概念マップ表示 探索の結果を利用者が把握しやすい ように概念マップとして可視化 多視点概念鎖 (Multi- perspective conceptual chains) 利用者の興味のある視点に応じて オントロジーから概念連鎖を抽出 他ツール (コンテンツ管理システム) 連携 662017/5/24 JSAI2017@名古屋
  65. 65. オントロジーの探索・可視化 着目する概念 (Focal point) 任意の関係性 を指定した視点 (aspect)にそっ て辿る 概念マップ 関係性を辿った結果 (多視点概念鎖)を概 念マップとして可視化 672017/5/24 JSAI2017@名古屋
  66. 66. オントロジーを用いた探索例 各ノードの色が 表す概念の種類 ノードは概念 (用語)を表す 「始点」として選んだ 用語を中央に表示 リンクは概念間 の関係を表す マウスを持ってくる と「ラベル」を表示 始点からの“つながり”を表す「パス」 が,ゴールを実現するために関係し そうな“生物”へのつながりを示す 実現したいこと(ゴール)を始点とし,関連する生物を探索した例 http://biomimetics.hozo.jp/ にて公開 2017/5/24 JSAI2017@名古屋 68 得られたキーワードを DB検索に利用する
  67. 67. 医療分野におけるLinked Dataの構築 事例ー疾患コンパスー 2017/5/24 JSAI2017@名古屋 69
  68. 68. 研究背景  臨床医学オントロジーの構築(2007年度~)  医療情報システムの高度化を支える知識基盤を目指し,オン トロジー工学者と臨床医を含む医療領域の専門家の綿密な 協力の下で,深い専門性とオントロジー的な整合性を両立し た臨床医学オントロジーの構築が進められている.  13診療科の代表的な約6,000の疾患を対象とした疾患オントロジー  人体の全血管,神経,筋肉および骨の接続関係の記述を含む,主要 な解剖学構造を定義した解剖学オントロジー  これらの成果を有効に活用し,様々な医療情報システムの開 発を促進するには,臨床医学オントロジーを知識基盤として応 用システムを開発する仕組みが必要とされる. 2017/5/24 医療情報システムのための医療知識基盤データベース研究開発事業 (研究代表者:東京大学医学系研究科・大江和彦教授) http://www.med-ontology.jp/ JSAI2017@名古屋 70
  69. 69. 疾患コンパス 疾患に関する様々な情報をナビゲートするWebシステム 2017/5/24 71 表示する疾患の検索・選択 選択した疾患の 因果連鎖を可視化 (疾患連鎖LD) 疾患に関する一般知識 (DBpediaより) リンクを辿ることで 関連する医療コード など外部DBへ 選択した異常状 態の対象部位を ハイライト 疾患が対象とする臓器・ 器官を3D画像で表示 http://lodc.med-ontology.jp/ にて公開 JSAI2017@名古屋
  70. 70. 疾患コンパスのシステム構成  疾患オントロジーをLinked Dataに変換した「疾患連鎖LD」を中心 に,既存サービスやDB(LOD)を連携させることで実装. 2017/5/24 72 DBpedia http://lifesciencedb.jp/bp3d/ 疾患連鎖LD BodyParts3D http://dbpedia.org/ ICD MeSH … 解剖学構造 の3D画像 一般知識 疾患オントロジー convert 疾患コンパス … 他の LOD SPARQL SPARQL SPARQL mapping mapping link link 関連情報 他のWeb サービス API API 関連情報 臨床医が構築 API:サービス間を連携させるための仕組み.システム毎に構築が必要. SPARQL:Linked Dataの検索用に標準化されたクエリ言語.汎用のAPIとして利用可. JSAI2017@名古屋
  71. 71. 臨床医学オントロジーの 上位構造の概略図 2017/5/24 もの 独立実在物 オブジェクト 生起物 従属的実在物 人体 状態プロセス 特性 属性 従属的 因果構造物 因果 構造物 疾患 オント ロジー 対象依存 異常状態 汎用 異常状態 参照 特性木 属性木 参照 分解 同時 並行型 プロセス解剖 オント ロジー 汎用 構造物 参照 イベント JSAI2017@名古屋 73
  72. 72. 2017/5/24 JSAI2017@名古屋 74 臨床医学オントロジーの上位構造の詳細 参照 参照 参照 特殊化 特殊化 特殊化
  73. 73. 疾患・解剖学オントロジーと トップオントロジーの関係 2017/5/24 もの 独立実在物 オブジェクト 生起物 従属的実在物 人体 状態プロセス 特性 属性 従属的 因果構造物 因果 構造物 疾患 オント ロジー 対象依存 異常状態 汎用 異常状態 参照 特性木 属性木 参照 分解 同時 並行型 プロセス解剖 オント ロジー 汎用 構造物 参照 イベント JSAI2017@名古屋 75 疾患・解剖学オントロジーともに,共通の概念構造を参照し, それらをコンテキストに応じて特殊化することで, 概念の共通性・コンテキスト依存性を適切に表している
  74. 74. 疾患・解剖学オントロジーと トップオントロジーの関係 2017/5/24 もの 独立実在物 オブジェクト 生起物 従属的実在物 人体 状態プロセス 特性 属性 従属的 因果構造物 因果 構造物 疾患 オント ロジー 対象依存 異常状態 汎用 異常状態 参照 特性木 属性木 参照 分解 同時 並行型 プロセス解剖 オント ロジー 汎用 構造物 参照 イベント JSAI2017@名古屋 76 疾患・解剖学オントロジーともに,共通の概念構造を参照し, それらをコンテキストに応じて特殊化することで, 概念の共通性・コンテキスト依存性を適切に表している
  75. 75. 概念の共通性・コンテキスト依存性 -疾患オントロジーにおける例- 疾患概念疾患概念 共通の概念構造 =「異常状態」 の組み合わせよる 因果連鎖 異常状態 …など 様々な疾患に共通性な 「汎用的な異常状態」を参照 例)「時間当たり不足状 態」, 「属性異常」,「梗塞」, …など 各疾患に固有な性質は, 「コンテキスト依存の特殊化」で定義 例)「脳梗塞」→対象=脳の血管 「心筋梗塞」→対象=心筋の血管 2017/5/24 JSAI2017@名古屋 77
  76. 76. 糖尿病における疾患連鎖の例 インスリン 作用不足 受容体異常 失明 β細胞 の破壊 高血糖 血中インスリン量 の絶対的低下 ステロイド投与 1型糖尿病 失明を伴った糖尿病 ステロイド糖尿病 糖尿病 注目する連鎖の範囲 (疾患定義連鎖)の違い で各疾患を定義する 疾患定義連鎖の 上流への追加 原因系となる 異常状態の連鎖 結果系となる 異常状態の連鎖 … … … … 疾患定義連鎖の 下流への追加 2017/5/24 78 異常状態を 表すノード 因果関係を 表すリンク 凡例 JSAI2017@名古屋
  77. 77. 疾患・解剖学オントロジーと トップオントロジーの関係 2017/5/24 もの 独立実在物 オブジェクト 生起物 従属的実在物 人体 状態プロセス 特性 属性 従属的 因果構造物 因果 構造物 疾患 オント ロジー 対象依存 異常状態 汎用 異常状態 参照 特性木 属性木 参照 分解 同時 並行型 プロセス解剖 オント ロジー 汎用 構造物 参照 イベント JSAI2017@名古屋 79 疾患・解剖学オントロジーともに,共通の概念構造を参照し, それらをコンテキストに応じて特殊化することで, 概念の共通性・コンテキスト依存性を適切に表している
  78. 78. 器官・臓器 概念の共通性・コンテキスト依存性 -解剖学オントロジーにおける例- 人体構造 (構成部品) 共通の概念構造 =「人体構造(構成部品)」 の組み合わせ 様々な器官・臓器に共通な 「汎用的な構造物」を参照 例)「管状構造物」, 「壁状構造物」, …など 各器官・臓器に固有な性質は, 「コンテキスト依存の特殊化」で定義 例)「血管」→血液が流れる 「食道」→食べ物が流れる, 噴門腺あり 2017/5/24 JSAI2017@名古屋 80
  79. 79. 血管壁に独自 な層構造, 血管内皮細胞 独自の機能 概念の共通性・コンテキスト依存性 -汎用構造物の特殊化の例- 汎用構造物汎用構造物胃壁も血管壁も壁構造 胃壁に独自な 層構造, 胃腺という 器官の存在 各構造物に独自な情報 胃壁 血管の壁 2017/5/24 81JSAI2017@名古屋
  80. 80. 疾患コンパスのサブシステム① 異常状態オントロジーViewer 2017/5/24 82 異常状態の詳細な定義を 検索・閲覧し,関連情報へ ナビゲートするシステム ・疾患コンパス ・マッピングした外部 リソース(DB) …と連携 詳細な条件で 異常状態を検索 異常状態の is-a(分類)階層 詳細定義 +関連情報 JSAI2017@名古屋
  81. 81. 2017/5/24 83 疾患コンパスのサブシステム② 汎用因果連鎖Viewer • 疾患連鎖LD内の全因果連鎖を対象と した「検索・閲覧」システム • 「指定した異常状態を含む因果連鎖」 を表示し,そこから「選択した異常状 態を含む疾患」を検索できる • 赤:指定した異常状態 • 緑:原因のみを辿った連鎖 • 紫:結果のみを辿った連鎖 JSAI2017@名古屋
  82. 82. 3つのナビゲーションシステム の連携 2017/5/24 JSAI2017@名古屋 84 疾患定義 異常状態の定義 異常状態の因果連鎖 (疾患連鎖)
  83. 83. 疾患コンパスのデモ  疾患定義のナビゲーション  疾患連鎖の可視化  関連知識へのナビゲーション  異常状態の因果連鎖の可視化  異常状態の定義(異常状態オントロジー) の閲覧 2017/5/24 JSAI2017@名古屋 85
  84. 84. まとめ  疾患コンパス  疾患オントロジーをLinked Data化した「疾患連鎖LD」を他 のデータセットとつなげることで「疾患に関する様々な情報 を統合的に閲覧」できるWebサービス.  現状の機能  DBpedia(日本語/英語)を介した,疾患の概要表示,ICD, Meshなど既存コード体系へのリンク  DBCLSが提供しているBodyPart3Dとの連携による,疾患 影響範囲(関連する部位)の3D画像を表示  異常状態オントロジー/汎用因果連鎖のViewerとの連携  公開ページ  http://lodc.med-ontology.jp/ 2017/5/24 86JSAI2017@名古屋
  85. 85. まとめ(1)  Linked Dataとオントロジー  トップダウンのアプローチから,ボトプアップな構築 への方針転換より,この10年で多くのデータが Linked Data/LODとして公開されている.  オントロジーは語彙統一/セマンティック付与に用いらえる  Linked Dataを用いたシステム多く開発されている 2017/5/24 JSAI2017@名古屋 87 使えそうな/面白そうな LODがないか? 探してみてください!
  86. 86. まとめ(2)  セマンティック技術の実際  LODを大規模な知識ベースとして利用することで, 様々なレベルでの意味処理が簡単に行える  ただし用途によっては,まだまだ知識の拡充が必要  Linked Dataの(自動)拡充手法の開発が盛んに…  推論レベルの利用については,まだ少ない?  データにセマンティクスを付与するには, Linked Data/オントロジーと“ひもづける”手法 (Entity Linking)が重要 2017/5/24 JSAI2017@名古屋 88 皆さんのお得意なアプローチでの 研究参入をお待ちしています!
  87. 87. ご清聴ありがとうございました Linked Data / オントロジーにご関心のある方へ の参考Webサイト オントロジー構築利用環境「法造」 http://www.hozo.jp 人工知能学会セマンティックウェブとオントロジー (SWO)研究会 http://sigswo.org Linked Open Dataチャレンジ http://lodc.jp/

×