CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
SWO研究会ワークショップ
ナレッジグラフ推論チャレンジ2018
ミートアップ@東京
1
2018年12月26日(水)@JST東京本部
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
公式Webサイト
2
http://challenge.knowledge-graph.jp/
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
本日の予定
13:30 第1回ナレッジグラフ推論チャレンジの
開催報告・振り返り
14:00 応募作品紹介&ディスカッション
-本部門:45-60分×3件
-アイデア部門:20-30分×2件
17:30 第2回ナレッジグラフ推論チャレンジに
向けた意見交換
18:00 閉会
18:30 懇親会(※事前申込者のみ)
3
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
第1回ナレッジグラフ推論チャレンジ
の開催報告・振り返り
4
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
開催スケジュール
2017/02/26 推論チャレンジ(仮称)の構想開始
in 第41回SWO研究会@志賀島
2017/11/25 第1回公開WS:推論チャレンジ(仮称)開催予告
in 第43回SWO研究会@人工知能学会合同研究会2017
2017/12/19 第2回公開WS:スキーマ検討会
2018/02/28 第3回公開WS:スキーマ設計会
2018/03/18 第4回公開WS:ナレッジグラフの構築テスト
in 第44回SWO研究会@五島市(合宿)併設ワークショップ
2018/04/23 第5回公開WS:「推論チャレンジ」ワークショップ
2018/06/05 ナレッジグラフ公開・チャレンジ開始
2018/08/07 応募に向けた技術勉強会
2018/10/18:応募に向けた技術勉強会(2回目)
2018/10/30: チャレンジ応募締切(11/11まで延長)
2018/11/25: 発表会&授賞式
in 第45回SWO研究会@淡路島(JIST2018併設イベント)
5
構想9カ月
開催準備
6カ月
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
開催趣旨
“何に”チャレンジするのか?
シャーロック・ホームズのような
“推理”(推論)ができるAI技術の開発
にチャレンジする!
具体的には,
与えられた事実(情報)に基づいて…
事件の犯人を,正しく突き止める
その理由(証拠,トリック,etc.)を,適切に説明する
→“説明能力(解釈可能性)”をもったAI技術の開発
6
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
タスク(課題)の概要
推理小説の内容をもとに,事件の背景,起こった出
来事,人物像などを知識化したナレッジグラフ(LOD)
を用いて,“犯人を推理する”
ただし,“その理由をきちんと説明できる”こと!
対象とする推理小説
「シャーロック・ホームズ」短編シリーズから人気No.1
の「まだらのひも」をナレッジグラフ(LOD)化
7
どのような“推理・推論・説明”に,
どのような“知識”が,どの程度必要か?
を考察するテストケースと位置づけられる.
2018/9/8
課題の概要
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
ナレッジグラフ化の考え方
ナレッジグラフの要求仕様
犯人を推論(推理)するのに必要な知識を提供する
「推理小説」で描かれる様々な状況を,できるだけ統一的
な形式で計算機処理(検索・推論・etc.)可能にする
ナレッジグラフ化の基本方針
「推理小説」の内容を,最小単位の「場面(シーン)」に分割
→場面ごとにID(IRI)を付与
「各場面の記述内容」および「場面間の関係」をグラフ化
→グラフ化に必要なクラス・プロパティを定義
場面1 場面2 場面3
場面4
場面5
・・・
・・・
8
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
スキーマ:「場面」
場面
原文
主語
述語
目的語
subject
hasPredicate
source
その他
他の場面
場面間
主語 目的語
述語
の形でないことに注意
スキーマの基本構造
「場面」の記述に用いるプロパティ(赤字は必須)
 subject:その場面の記述において主語となる人や物
 hasPredicate:その場面の内容を表す述語
 場面の詳細を表す目的語:whom(だれに), where(どこで), when
(いつ), what(何を), how(どのように), …etc.
 場面間の関係:then,if, because, …etc.
 time:その場面が起こった絶対時間(xsd:DateTime)
 source:その場面の原文(英語/日本語のリテラル)
→場面に関わる複数の
情報をまとめるため
「場面」中心に記述
9
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
例:「場面」の記述
原文(英語/日本語)
各場面には
一意の
ID(IRI)
を与える
絶対時間※小説内に基準
日時を設定している
主語・述語・目的語は全て
「リソース」として定義
→他の場面で同じ目的語
を参照できる
述語
主語
他の場面
場面の種類(クラス)分け
Scene:上位クラス
-Situation:事実・状況の描写
-Statement:Aの発言
-Talk:AのBへの発言
-Thought:Aの考え
10
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
想定していた応募内容
推理?推論?推定?する手法は,情報技術であれば
なんでもOK!
手法1 SPARQLで検索して探す
例) 特定の時間に特定の場所に居た人をUnionで探す,など
手法2 一階述語論理に基づくルールを加えて推論する
例) ナイフに個人の指紋がある ⇒ 犯人である,など
手法3 オントロジーに基づいて記述論理で推論する
例) 犯人クラスを定義し,犯人候補との包摂関係を推論する,など
手法4 機械学習を用いて分類,クラスタリングして推定する
例) 他の事件における犯人の特徴群から学習・推定する,など
提供されたナレッジグラフ以外の外部知識も利用可
 適切な推理を進める上で必要な“捜査戦略”や“常識知識”の
導入も,キーポイントの1つ.
11
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
応募結果
応募数:8作品(本部門:5,アイデア部門:3)
本部門:プログラムで推論を実行して答えを出す
【最優秀賞】株式会社野村総合研究所
【優秀賞】上小田中411(株式会社富士通研究所)
【ベストリソース賞】FLL-ML(株式会社富士通研究所,
神戸常盤大学,神戸市立西神戸医療センター)
teamOIF(立命館大学)
塚越雄登(電気通信大学)
アイデア部門:どのような推論を行うかのアイデア
【ベストアイデア賞】白松研 feat. 59(名古屋工業大学)
生島高裕(株式会社数理先端技術研究所)
橋本一成,他(富士ゼロックス株式会社)
12
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
第1回開催の総括(私見)
構想~開催準備まで,WSおよび打ち合わせを重ねる
ことで,ようやく “ひとつのカタチ” にまとまった
(1回目としては,) 十分な数の応募があった
 半数以上が企業からの応募
 想定していた,すべてのアプローチからの応募
第2回目以降の継続に向けて,
とても良いスタートを切れた!
13
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
本日のイベント
背景
11/25開催の発表会&授賞式では,発表時間が
限られていたため,「もっと,じっくり話が聞きたい」
という希望
(淡路島は遠くて行けなかった人)
第2回の開催に向けてのフィードバックが欲しい
イベント開催の狙い
発表・質疑の時間を十分にとって,各応募作品の
内容について,しっかりと議論する
第2回をよりよいものとするための意見交換をする
14
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
本日の予定
13:30 第1回ナレッジグラフ推論チャレンジの
開催報告・振り返り
14:00 応募作品紹介&ディスカッション
-本部門:45-60分×3件
-アイデア部門:20-30分×2件
17:30 第2回ナレッジグラフ推論チャレンジに
向けた意見交換
18:00 閉会
18:30 懇親会(※事前申込者のみ)
15
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
発表順番
本部門:40-60分/件
teamOIF(立命館大学)[欠席]
塚越雄登(電気通信大学)[欠席]
【ベストリソース賞】FLL-ML(株式会社富士通研究所,
神戸常盤大学,神戸市立西神戸医療センター)
【優秀賞】上小田中411(株式会社富士通研究所)
【最優秀賞】株式会社野村総合研究所
アイデア部門:20-30分/件
【ベストアイデア賞】白松研 feat. 59(名古屋工業大学)[欠席]
生島高裕(株式会社数理先端技術研究所)
橋本一成,他(富士ゼロックス株式会社)
16
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
本日の予定
13:30 第1回ナレッジグラフ推論チャレンジの
開催報告・振り返り
14:00 応募作品紹介&ディスカッション
-本部門:45-60分×3件
-アイデア部門:20-30分×2件
17:30 第2回ナレッジグラフ推論チャレンジに
向けた意見交換
18:00 閉会
18:30 懇親会(※事前申込者のみ)
17
第2回ナレッジグラフ推論チャレンジに向けた意見交換
来年度方針
➢ 基本的なタスク(犯人当て)は変更なし
➢ 対象とする短編小説(ナレッジグラフ)を4編増やして,
計5編としたい
➢ 小説リクエストの募集(1月中)
https://goo.gl/forms/rMH9DPTAny4ClzOm2
ナレッジグラフ作成方針
➢ (文章を単純化SVOCした上で) NLP技術の活用を進めたい
➢ 文章単純化タスクに関してアルバイト募集(4~5名募集)
案: 1編約500文,1文20円の書き換えで実働8時間で1万円程度
ナレッジグラフスキーマの見直し
➢ 語彙の整理要望 (能動態/受動態,時間表現,物体の区別など)
スケジュール案
➢ 応募開始: JSAI2019 (2019年6月4日(火)~6月7日(金)@新潟)
➢ 募集締切: 10-11月?
1
公表スケジュール
2019/12/?: 人工知能学会誌2019年1月号 JIST開催報告にて付記
↓
2019/1/18: 受賞者原稿〆(各1~2頁)
↓ (4頁版)
2019/2/8: JSAI2019原稿〆
↓ (8頁版)
2019/2/E: 人工知能学会誌2019年5月号 解説論文原稿〆
↓
2019/3/10: SWO研究会@石垣島 開催報告会(スライドのみ)
↓ (英語版)
2019/5/?: JIST2019@杭州 論文投稿〆
↓ (第2回の結果と併せて)
2019/12/?: ESWC2020 論文投稿〆
メディア発表も検討
2

ナレッジグラフ推論チャレンジ2018ミートアップ@東京(2018/12/26)