Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Upcoming SlideShare
What to Upload to SlideShare
Next
Download to read offline and view in fullscreen.

Share

ナレッジグラフ推論チャレンジ技術勉強会(2018/10/18)

Download to read offline

2018 年 10月18日(木)開催の
SWO研究会ワークショップ「ISWC2018参加報告&推論チャレンジ技術勉強会」
第2部:ナレッジグラフ推論チャレンジ:応募に向けた「技術勉強会」の資料

Related Books

Free with a 30 day trial from Scribd

See all

ナレッジグラフ推論チャレンジ技術勉強会(2018/10/18)

  1. 1. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 SWO研究会ワークショップ ナレッジグラフ推論チャレンジ「技術勉強会」 人工知能学会セマンティックウェブとオントロジー(SWO)研究会 1 2018年10月18日(木)@JST東京本部「別館」
  2. 2. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 公式Webサイト 2 http://challenge.knowledge‐graph.jp/
  3. 3. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 本日の概要 本日のねらい 10月末の応募締切に向け,チャレンジの概要,想定 される推論例,応募のポイントなどを解説し,具体的 な応募イメージをつかんでいただく. 本日の予定 16:00 ナレッジグラフ推論チャレンジの紹介[古崎] ・開催趣旨,概要 ・提供するナレッジグラフの説明 16:30 SPARQLと推論ルールを用いた例+デモ[江上] 16:50 応募イメージの紹介[川村] 17:30 質疑応答 17:45 終了 3
  4. 4. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 開催趣旨 “何に”チャレンジするのか? シャーロック・ホームズのような “推理”(推論)ができるAI技術の開発 にチャレンジする! 具体的には, 与えられた事実(情報)に基づいて… 事件の犯人を,正しく突き止める その理由(証拠,トリック,etc.)を,適切に説明する →“説明能力(解釈可能性)”をもったAI技術の開発 4
  5. 5. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 タスク(課題)の概要 推理小説の内容をもとに,事件の背景,起こった出 来事,人物像などを知識化したナレッジグラフ(LOD) を用いて,“犯人を推理する” ただし,“その理由をきちんと説明できる”こと! 対象とする推理小説 「シャーロック・ホームズ」短編シリーズから人気No.1 の「まだらのひも」をナレッジグラフ(LOD)化 5 どのような“推理・推論・説明”に, どのような“知識”が,どの程度必要か? を考察するテストケースと位置づけられる. 2018/9/8 課題の概要
  6. 6. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 想定している応募内容 推理?推論?推定?する手法は,情報技術であれば なんでもOK! 手法1 SPARQLで検索して探す 例) 特定の時間に特定の場所に居た人をUnionで探す,など 手法2 一階述語論理に基づくルールを加えて推論す 例) ナイフに個人の指紋がある ⇒ 犯人である,など 手法3 オントロジーに基づいて記述論理で推論する 例) 犯人クラスを定義し,犯人候補との包摂関係を推論する,など 手法4 機械学習を用いて分類,クラスタリングして推定する 例) 他の事件における犯人の特徴群から学習・推定する,など 提供されたナレッジグラフ以外の外部知識も利用可  適切な推理を進める上で必要な“捜査戦略”や“常識知識”の 導入も,キーポイントの1つ. 6
  7. 7. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 推理(推論)の例 ジュリアの死に不審な点があると,ヘレンから相 談を受ける ↓ ←犯人は現場にいた人【外部知識】 「ジュリアが死んだ日」に現場の屋敷にいた人物 の一覧を取得する ジュリアが結婚すると,ロイロット博士に入るお金 が減る ↓ ←お金は殺人の動機になりうる【外部知識】 ロイロット博士がジュリアを殺す動機になる 7
  8. 8. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 応募要領の概要 提出物 応募は本部門とアイデア部門に分かれています. アイデア部門は以下の1,2のみで結構です. 1. 応募者に関する情報 2. 推論・推理過程の説明 3. 実行プログラム (ただし,ソースコードの提出は必須ではありません) 審査基準 1. 正しく犯人を当てているか? 2. 説明が納得できるか? 3. 技術的な工夫  推論の仕方  拡張した知識 4. 評価観点  汎用性:一般的な知見となりうるか?  少ない知識をうまく使う vs. 多量の知識? 8
  9. 9. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 開催スケジュール(これまで) 2017/02/26 推論チャレンジ(仮称)の構想開始 in 第41回SWO研究会@志賀島 2017/11/25 第1回公開WS:推論チャレンジ(仮称)開催予告 in 第43回SWO研究会@人工知能学会合同研究会2017 2017/12/19 第2回公開WS:スキーマ検討会 2018/02/28 第3回公開WS:スキーマ設計会 2018/03/18 第4回公開WS:ナレッジグラフの構築テスト in 第44回SWO研究会@五島市(合宿)併設ワークショップ 2018/04/23 第5回公開WS:「推論チャレンジ」ワークショップ 2018/06/05 ナレッジグラフ公開・チャレンジ開始 2018/08/07 応募に向けた技術勉強会 9
  10. 10. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 今後の予定 2018/10/18:応募に向けた技術勉強会(2回目) 2018/10/30: チャレンジ応募締切 2018/11/25: 授賞式 (JIST2018@淡路島での併設イベントを予定) 2018/12月以降 応募者共著で国際会議での発表,論文投稿も予定 数年目以降は国際イベント化し,海外からの参加も募集! ナレッジグラフ構築の自動化など,タスク範囲の拡大も検討 10 詳細は公式サイト,http://challenge.knowledge‐graph.jp/ もしくは「推論チャレンジ」で検索
  11. 11. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 提供するナレッジグラフの説明 本チャレンジの課題(タスク)向けに 提供するナレッジグラフのスキーマ, データ内容についての説明します ナレッジグラフ推論チャレンジ:応募に向けた「技術勉強会」 11 ※以下の説明は,2018/08/07開催した「技術勉強会」と同じ内容です.
  12. 12. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 ナレッジグラフ化の手順検討 手順決定に至るまでの経緯 ワークショップにてスキーマ検討 テンプレートを作成し,ワークショップ入力テスト →フィードバックを受けて,構築方法再検討 コアメンバー(3名)で構築作業 構築方法の再検討結果 小説全文をKG化 → 推理に必要な部分に絞ってKG化 小説の原文を残しKG化 → 予め,簡易な日本語に直したものKG化 構築方法が決定したら,クラウドソーシングでKG化 →ワーカへの支持が難しそうなので,学生バイトで… →(1年目は)コアメンバーで手分けしてKG化 12
  13. 13. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 実際のナレッジグラフ化の手順 1. 小説の内容から,ナレッジグラフ化の対象とする部分を抽出 (赤色でマーク) 2. 1.でマークした部分を(中心に),短い文を箇条書きした形 に要約する  短い一文を「一つの場面」とする 例)ホームズはそれをヘレンに説明した。 ヘレンは真っ青になった。 3. 要約した短い文を基に,ナレッジグラフ化する情報を 「テンプレート」に記入  場面ごとにIDを付与,表記ゆれを統制,場面間の関係性の記述... 1. 全体を3つに分けて分担作業(1人7-10時間程度の作業) 途中,作業方針すり合わせのミーティングを開催(2-3回) 2. 各単文を英訳+表記統制 3. 場面の関係性,時間の記述+最終確認 4. テンプレートに記入いた内容を,プログラムでRDFに変換 13
  14. 14. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 ナレッジグラフ化の考え方 ナレッジグラフの要求仕様 犯人を推論(推理)するのに必要な知識を提供する 「推理小説」で描かれる様々な状況を,できるだけ統一的 な形式で計算機処理(検索・推論・etc.)可能にする ナレッジグラフ化の基本方針 「推理小説」の内容を,最小単位の「場面(シーン)」に分割 →場面ごとにID(IRI)を付与 「各場面の記述内容」および「場面間の関係」をグラフ化 →グラフ化に必要なクラス・プロパティを定義 場面1 場面2 場面3 場面4 場面5 ・・・ ・・・ 14
  15. 15. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 抽出した文章+要約の例 15
  16. 16. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 テンプレートのサンプル 16
  17. 17. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 スキーマ:「場面」 場面 原文 主語 述語 目的語 subject hasPredicate source その他 他の場面 場面間 主語 目的語 述語 の形でないことに注意 スキーマの基本構造 「場面」の記述に用いるプロパティ(赤字は必須)  subject:その場面の記述において主語となる人や物  hasPredicate:その場面の内容を表す述語  場面の詳細を表す目的語:whom(だれに), where(どこで), when (いつ), what(何を), how(どのように), …etc.  場面間の関係:then,if, because, …etc.  time:その場面が起こった絶対時間(xsd:DateTime)  source:その場面の原文(英語/日本語のリテラル) →場面に関わる複数の 情報をまとめるため 「場面」中心に記述 17
  18. 18. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 スキーマ設計における工夫点 「事実・状況」と「発言・考え」の書き分け Aの(Bへの)発言,Aの考え :A,Bに相当する人(情報源)を記述 複数の主語・目的語の扱い AND:場面を中心とした記述にしているため,主語/目的 語を表すプロパティを複数記述することで表現 OR:「ORの組み合わせ」を表すリソースを導入することで 統一的な扱いが可能 述語の否定(〇〇しない,できない)の扱い NOT,CanNOTを表す行為クラスを導入 人やものがもつ「性質」 hasProperty+「性質」で表現 18
  19. 19. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 例:「場面」の記述 原文(英語/日本語) 各場面には 一意の ID(IRI) を与える 絶対時間※小説内に基準 日時を設定している 主語・述語・目的語は全て 「リソース」として定義 →他の場面で同じ目的語 を参照できる 述語 主語 他の場面 場面の種類(クラス)分け Scene:上位クラス -Situation:事実・状況の描写 -Statement:Aの発言 -Talk:AのBへの発言 -Thought:Aの考え 19
  20. 20. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 例:AのBへの発言 情報源となる人物A と受け手B 情報源となる人物A 受け手B ※Talkの場合のみ 20 Talk:AのBへの発言
  21. 21. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 シーン間の関係 シーン間の関係を表す プロパティ 21
  22. 22. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 シーン間の関係の種類 シーン間の関係を表す プロパティ 22
  23. 23. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 ANDの扱い 同じプロパティによるトリプルを複数記述することで表現する 23
  24. 24. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 ORの扱い ORで表された組を指すリ ソースをORobjとタイプの インスタンスとして記述 ORobjタイプ ※Objectのサブクラス ORの対象となるリソース 24
  25. 25. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 動詞の「Not」の扱い TypeをNotActionとす ることで表現 ※NotActionはActionの サブクラス →Actionタイプである ことも明記 原型のAction 「できない」の 場合は, CanNotActionと する 原型のAction 25
  26. 26. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 hasPropertyの例 kgcc:Propertyタイプ 26 「性質」を表す 任意のリソースを 導入する
  27. 27. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 クラス,プロパティ一覧 27
  28. 28. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 ナレッジグラフ利用技術の紹介 ナレッジグラフの処理に利用できるツール (データベース,API,など)や関連技術 (SPARQLなど)の情報を紹介します. ナレッジグラフ推論チャレンジ:応募に向けた「技術勉強会」 28
  29. 29. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 利用可能なデータ(テキスト) 原文 青空文庫「まだらのひも」からダウンロード ナレッジグラフ化のための加工データ Speckled Band_Soruce.docx 原文からRDF化する部分をマーク(赤字)+該当箇所を要約(青字) したもの SpeckledBand.xlsx 要約した文をもとに,テンプレートに入力したもの SpeckledBand.tsv テンプレート入力結果をTSVに変換したもの これらのテキストデータを利用した処理もOK 29
  30. 30. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 RDFデータの提供方法 RDFファイル  SpeckledBand.nt,SpeckledBand.rdf,SpeckledBand.ttl  kgc.owl スキーマ定義(各RDFファイルにも含む) SPARQLエンドポイント  http://lod.hozo.jp/repositories/kgc 参照解決可能URL  http://kgc.knowledge-graph.jp/data/SpeckledBand/XXX (XXX=1から401の数字,または,k001) というURLにより,RDFデータに参照解決可能なアクセス可能  拡張子を変更することで,各種形式のRDFを取得可能 →プログラムから直接処理も可  例)  http://kgc.knowledge-graph.jp/data/SpeckledBand/36  http://kgc.knowledge-graph.jp/data/SpeckledBand/36.ttl  http://kgc.knowledge-graph.jp/data/SpeckledBand/36.rdf  http://kgc.knowledge-graph.jp/data/SpeckledBand/36.json  http://kgc.knowledge-graph.jp/data/SpeckledBand/36.jsonld 30
  31. 31. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 RDFを扱うための技術・ツール RDF用のライブラリ https://github.com/KnowledgeGraphJapan/sparql-library- examples にプログラム言語でのサンプルあり Javaを使うなら,Apache Jenaがおススメ OWL形式のファイルを開くには protégéなどのオントロジーエディタを使用(RDFファイルも開ける) https://protege.stanford.edu/ RDFファイルをDBに格納して使用するには FusekiやVirtuosoなどのRDF-DBを使用 チュートリアル資料 Jena,Fusekiの簡単な使用方法,SPARQLクエリの書き方など https://github.com/KnowledgeGraphJapan/LODws2nd 31 RDF処理に利用可能な技術
  32. 32. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 1 2017/11/25 JSAI合同研究会 推論チャレンジ技術勉強会 SPARQLと推論ルールを用いた例 人工知能学会セマンティックウェブとオントロジー(SWO)研究会 2018/10/18 @JST東京別館
  33. 33. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 発表内容 今年のナレッジグラフ推論チャレンジの題材 「まだらのひも」ではなく「白銀号事件」を題材に紹介 2 2017年11月の人工知能学会合同研究会@慶應矢上キャンパスで行った 「第1回公開WS:推論チャレンジ(仮称)開催予告~解釈可能な人工知能を 目指して~ 」のデモ発表内容と一部重複します。
  34. 34. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 白銀号事件 短編集「シャーロック・ホームズの思い出」より 青空文庫「白銀の失踪」 https://www.aozora.gr.jp/cards/000009/card4292 9.html あらすじ ウェセックス・カップの本命馬である白銀号が突然失踪す る。 さらに調教師のストレイカーが死体で発見され、殺人事件 として捜査が進められる。 ※本デモではネタバレがあります 3
  35. 35. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 あらすじ (1/4) 白銀号が失踪した晩、予想屋と思われる怪しい男(=フィッ ツロイ・シンプソン)が白銀号の厩舎(きゅうしゃ)にやってきた。 世話係のネッド・ハンターがその男に犬をけしかけようとす るが、すでに逃げ出していなくなっていた。 4 白銀と栗毛、確実 な予想を教えてく れませんかね 予想屋だな。 出てけ
  36. 36. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 あらすじ (2/4) その夜中の1時に、調教師のストレイカーが馬の様子を見に いったまま戻らず、 翌朝厩舎にストレイカーの妻が行ったところ、見張り当番の ネッド・ハンターが薬で眠らされており、 白銀号もストレイカーもいなくなっていた。 5 Zzz… 夫と白銀号は どこ行った?
  37. 37. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 あらすじ (3/4) ストレイカーは厩舎から4分の1マイルほど離れた茂みの中で、 頭を鈍器のようなもので殴られ、腿を刃物で切られた死体で 発見された。 死体の右手には血の付いた外科用のメス、左手には昨晩厩 舎にやってきた男がつけていたネクタイ(スカーフ)を持ってい た。 6 Zzz…
  38. 38. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 あらすじ (4/4) 警察は殺人事件の容疑者としてネクタイの持ち主、フィッツロ イ・シンプソンを逮捕し、ストレイカーがメスで傷つけたと考え る共犯を探していた。 白銀号の行方と真犯人をホームズが推理する。 7 やってない! ネクタイ君ので しょ。逮捕!
  39. 39. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 作中の主な登場人物 (KG化の際には簡略化のため何人か除外) シャーロック・ホームズ ワトソン グレゴリ警部 馬:白銀号 白銀号の調教師:ジョン・ストレイカー (死亡) 白銀号の馬主:ロス大佐 白銀号の厩舎の馬丁(ばてい):ネッド・ハンター ストレイカーの妻 ストレイカーの女中 怪しい男:フィッツロイ・シンプソン ライバル馬:デスボロ デスボロの調教師:サイラス・ブラウン ジプシー 8
  40. 40. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 事実を簡易的にKnowledge Graph化 9 今回のチャレンジ「まだらのひも」とは若干構造が異なるが、だいたい同じ
  41. 41. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 実行環境 MacBook Pro High Sierra (メモリ16G, Core i7 3.5GHz) RDFストア: Stardog Community 4.1.3 (無償) 推論エンジン: Pellet (Stardogに組み込み) 10 https://www.stardog.com/
  42. 42. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 遺留物から推論するアプローチ 「犯行現場に落ちていた物の所有者は誰か」 SELECT * where { ?x kgc:where kd:犯行現場 ; kd:所有者 ?s . filter(?s != kd:ジョン・ストレイカー) } 11
  43. 43. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 遺留物から推論するアプローチ(結果) 12 ジョン・ストレイカーの所有物以外では、フィッツロイ・シンプ ソン(予想屋)のネクタイのみ該当
  44. 44. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 行動から推論するアプローチ 「犯行当日に現場を通ったのは誰か」 SELECT * where { ?action kgc:who ?s ; kgc:hasPredicate kd:通った ; kgc:where kd:犯行現場 ; kgc:when "事件当日" . } 13
  45. 45. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 行動から推論するアプローチ(結果) 14 ジョン・ストレイカーと白銀号のみ。 犯人が浮かび上がってこない。
  46. 46. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 ホームズの推理をルールとして追加 ホームズの推理 「白銀号が連れ出された時に犬が吠えなかったということは、 白銀号を連れ出した犯人は犬がよく知っている人」 Semantic Web Rule Language (SWRL) (kd:犬 kd:not吠える ?x), (kd:犬 kd:知っている ?y) -> (?x kd:候補 ?y) 15 白銀号を連れ 出した人 ジョン・スト レイカー 犬 not吠える ネッド・ ハンター 白銀号知っている 候補
  47. 47. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 Stardogにルールを追加 StardogにSWRLを追加することも可能だが、SPARQLのよう にルールを書けるStardog Rules Syntax (SRS)が推奨されて いる。ルールが増えてくると見やすくなる。 16 PREFIX rule: <tag:stardog:api:rule:> PREFIX kd: <http://kgc.knowledge-graph.jp/data/SilverBlaze/> [] a rule:SPARQLRule ; rule:content """ IF { kd:犬 kd:not吠える ?x . kd:犬 kd:知っている ?y . } THEN { ?x kd:候補 ?y . } """. 「“」3つで囲んだ中に ルールを記述 前件 後件
  48. 48. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 Stardogにルールを追加 Data > Addからルールを記述したttlファイルをRDFと 同じ場所にロード 17
  49. 49. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 犯人を推論付きSPARQLで探す 「白銀号を連れ出した人, かつ犯行当日に現場を通った人」 SELECT * WHERE { kd:白銀号を連れ出した人 kd:候補 ?s . ?action kgc:who ?s ; kgc:hasPredicate kd:通った ; kgc:where kd:犯行現場 ; kgc:when "事件当日" . ?s rdf:type kd:Person . } 18
  50. 50. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 犯人を推論付きSPARQLで探す(結果) 19 推論無しでは該当なし 推論有りではストレイカーのみ該当
  51. 51. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 検索経路(サブグラフ) 独自定義したルールとRDFSルールにより新たなリンクが追 加される 20 白銀号を連れ 出した人 ジョン・スト レイカー 調教師 人 rdf:type rdfs:subClassOf rdf:type kd:候補 Action4 通った 犯行現場 kgc:who kgc:hasPredicate kgc:where 事件当日 kgc:when
  52. 52. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 真相 (1/2) シャーロック・ホームズが調査を進め、近くの窪地に馬の足跡 を見つける。 その足跡を追うとライバル厩舎の前まで来ていた。 ライバル厩舎の調教師はレースに有利になるため白銀号を隠 し持っていたが殺人事件とは無関係。 21 魔が差した ライバル馬(デスボロ) の調教師
  53. 53. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 真相 (2/2) 睡眠薬(阿片)は匂いと味が強いため隠すのは容易ではない。 ホームズは,夕飯がカレーと知っており,あやしまれずに阿片混入 ができたストレイカーかその妻が犯人と考えた。 さらに,白銀号が連れ出された時に犬が吠えなかったことに着目 し,犯人は犬がよく知っているものと推理(今回ルールに使用) 現場にマッチ,メスが落ちており,厩舎にいた羊が何匹か足を悪 くしていることから,ストレイカーは白銀号がレースで負けるよう に手術を施す予定だったと推理。羊はその練習。 明かりに驚いた白銀号がストレイカーを蹴り殺した 22
  54. 54. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会 課題 不足していたor使用しなかった知識 馬(の蹴り)が人を殺しうる 阿片は匂いが強い 足を怪我した羊 自殺・事故の可能性 ……その他多数 推論にもいろいろ 知識をどのように追加・補完(推論)していくか どのような検索経路(推論)で真相へ辿り着くか ホームズの推理だけが答えとは限らない(?) …… 23
  55. 55. 第1回ナレッジグラフ推論チャレンジ2018 ~解釈可能な人工知能を目指して~ 主催: 人工知能学会 セマンティクWebとオントロジー(SWO)研究会 1
  56. 56. 本日の内容 別の小説「白銀号事件」をベースに少し具体的な応募イメージの説明  推論・推定処理の例  応募シート記入例 【参考】 推論チャレンジ 応募要項 http://challenge.knowledge-graph.jp/application.html 2
  57. 57. 推論・推定処理の設計方法 1. 小説にはないが,必要そうな知識をファクト,ルール化していく  本チャレンジは答えが分かっている問題でルールの書き方を学ぶスタンス 2. 独自の推論・推定処理を考案する  さまざまな方法の組み合わせを考えるのが望ましい 前向き推論 後向き推論(プラニング) SPARQL検索 オントロジー推論 機械学習,など 3 以下の例では取り得る(適用できる)ルール,ファクトの内の1つの道筋を説明しています. 実際には,実行過程において多数の道筋が取り得て,その内の1つ,または,いくつかが 矛盾を起こさない形となって残る点に留意.
  58. 58. グレゴリ警部の(間違った)推論 R: Aのモノが現場に落ちていた → Aが犯人 F: 現場に落ちていたモノ has ?X(スカーフ); F: シンプソン has ?X(スカーフ); F: 予想屋 typeOf シンプソン; R: Aは予想屋である → Aはまっとうな人間ではない R: Bが馬を近くLに隠している → 馬が見つからない F: B exist ?L(近くの荒野); F: ジプシー exist ?L(近くの荒野); R: Bはジプシーである → Bはまっとうな人間ではない ∴ 犯人Aはシンプソンで,馬を隠しているBはジプシー 問題点: 状況証拠(モノが落ちている=犯人)と偏見に頼った推論となっている 4 F: 提供されたナレッジグラフ内のファクト R: 追加すべきルール 後ろ向き推論 ドメイン知識(ナレッジグラフ)から 前件部変数Aに入る値を検索する シンプソンが何者か検索 常識的知識を追加 ドメイン知識(ナレッジグラフ)から 前件部変数Bに入る値を検索する 常識的知識 知識>偏見(小説的ミスリード) 知識>偏見(小説的ミスリード)
  59. 59. ホームズの推理 R: Aのモノが現場にあった → Aが犯人である R: Aのモノが現場にあった → Aが犯人かもしれない R: Aが馬を連れ出した → Aが犯人である F: Aは見張り(ハンター)を眠らせた next Aは馬を連れ出した; F: ハンター眠った causedBy (夕食に入っていた)アヘン; R: ハンターの夕食の味が濃い → ハンターはアヘンを摂取する F: 夕食 has マトンのカレー煮; F: 夕食 decidedBy ストレイカー家の家族 F:ストレイカー家の家族 typeOf {ストレイカー,妻} A= {ストレイカー,妻} 5 ドメイン知識 確率的な知識という位置づけ (ただ,ホームズも現場に着くまで シンプソンが犯人と考えていた) ドメイン知識 眠った理由を検索 小説的肝① (なくてもよい) 味が濃い理由を検索 味が濃い理由を検索 F: 提供されたナレッジグラフ内のファクト R: 追加すべきルール
  60. 60. ホームズの推理 cont’d R: Bが馬を連れ出した@時刻T → Bが犯人 R: 見張りが寝ていた@時刻T → 馬を連れ出せた R: 静かだった@時刻T → 見張りが寝ていた(起きなかった) R: 犬が吠えなかった@時刻T → 静かだった R: Bが犬を飼っている → 犬はBに吠えない F: {ストレイカー,見張り(馬丁)3人,ロス大佐} keep 犬; B= {ストレイカー,見張り(馬丁)3人,ロス大佐} A ∩ B = {ストレイカー} 6 時刻Tに絞って ドメイン知識を 後ろ向きにトレース 小説的肝② ドメイン知識からBを検索 結論1 F: 提供されたナレッジグラフ内のファクト R: 追加すべきルール 一般的なルールを上手に使いまわして推論する場合や, ドメインに依存したルールをたくさん用意して少ないステップで推論する場合などがある
  61. 61. ホームズの推理 cont’d R: Cが馬を近くLに隠している → 馬が見つからない F: C exist ?L(ブラウンの厩舎); F: ブラウン exist ?L(ブラウンの厩舎); R: Dがストレイカーを殺した → Dが犯人 R: Dは殺人現場Sに居た → Dがストレイカーを殺した F: {ストレイカー,馬} exist 殺人現場S R: Dはストレイカーである → ストレイカーがストレイカーを殺した! 必然的にもう1つの可能性{馬}となる ∴犯人A,Bはストレイカー,馬を隠しているCはブラウン,ストレイカーを殺したDは馬である 7 結論2 変数Cに入る値を検索 常識的知識 常識的知識 確率的知識 変数Dを検索 【矛盾】 結論3 F: 提供されたナレッジグラフ内のファクト R: 追加すべきルール
  62. 62. 別の推理の可能性 例) 動物(馬)も人を殺せる点を推論過程に入れる  オントロジー推論(この場合,プロパティ推論) Person is-a Mammal; Person canKill Animal; Person canKill Person; 定義済みプロパティとする Animal is-a Mammal; Animal canKill Animal ; (Animal canKill Person ;) 兄弟概念であるAnimalに上記プロパティを追加 例) 羊を使って馬の脚を怪我させる実験をしていた点をいれてもよい  機械学習(この場合,ナレッジグラフ補完) ストレイカー has 羊; ストレイカー hurt 羊; ストレイカー has 馬;(ストレイカー hurt 馬;) 欠損(missing)プロパティとして推定 8
  63. 63. 応募シート1.応募者に関する情報 氏名またはチーム名: 推論 太郎 所属: IT Tech. Inc. メールアドレス(代表): it@tech.com 9
  64. 64. 応募シート2.推論・推理過程の説明 プログラムのログなどを用いてポイントを解説.アイデアの場合は自由形式. (図などを用いて分かりやすく説明してください)  推論・推定処理における流れ,工夫点などをアピールしてください 使用した知識の範囲(ID)  ID: 100-200など 推論・推理のために追加した知識についての記述 (追加した知識をWeb上で公開されている場合は,入手先のURL等も記載. ただし,追加した知識の公開は必須ではありません)  追加した知識についてまとめて記載してください パフォーマンス情報(計算機のスペック,実行時間,使用するメモリなど)  MacBook Pro, Memory 8GB, Core i5 2.6 GHz, OS X12 参考情報(もしあれば応募者のWebサイトや関連する論文など)  http://www.it.tech.com 10
  65. 65. 応募シート3.実行プログラム 実行形式のアプリケーションがダウンロードできるURL,またはWebサービスの URL (ただし,ソースコードの提出は必須ではありません)  http://www.it.tech.com/application 実行方法の説明  上記サイトからkgc.zipをダウンロードをしてjavaでapp.jarを実行 既存ツールを利用する場合は,ツールの詳細(名称,バージョン,有償/無償など)  Java 1.8  Stardog Community 4.1.3 (RDFデータベース)  Pellet (推論エンジン) 11
  66. 66. 是非,チャレンジにご参加ください 12
  • ssusercc42c4

    Apr. 4, 2019
  • takatsugunokubi

    Dec. 13, 2018
  • muranamihideaki

    Oct. 26, 2018
  • JunghoPark1

    Oct. 26, 2018

2018 年 10月18日(木)開催の SWO研究会ワークショップ「ISWC2018参加報告&推論チャレンジ技術勉強会」 第2部:ナレッジグラフ推論チャレンジ:応募に向けた「技術勉強会」の資料

Views

Total views

1,422

On Slideshare

0

From embeds

0

Number of embeds

81

Actions

Downloads

25

Shares

0

Comments

0

Likes

4

×