CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
ナレッジグラフ推論チャレンジ Tech Live!
2020/10/21(水)
イベント概要
・ナレッジグラフ推論チャレンジの紹介
2020/10/21 1
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
ご案内
イベントの録画について
→この案内あと,録画を開始します.
質疑応答はチャットで随時
資料は動画と共に,推論チャレンジのサイトに公開し
ます
2020/10/21 2
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
ナレッジグラフ推論チャレンジ Tech Live!
2020/10/21(水)
イベント概要
・ナレッジグラフ推論チャレンジの紹介
2020/10/21 3
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
イベント概要
15:00 イベントの趣旨説明
15:10 ナレッジグラフ推論チャレンジの紹介
15:30[Tech Live 1]ナレッジグラフ統合技術を用いた
推論知識拡充のアプローチ
16:30 休憩
16:40[Tech Live 2]ナレッジグラフから機械学習による
知識補完のアプローチ
17:40 質疑応答, 技術相談
17:55 閉会
42020/10/21
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
Tech Live! の開催趣旨
Tech Live! のねらい
第3回ナレッジグラフ推論チャレンジ2020へ
の応募(11月末締切)に向け,
作品作成に「使える!実践的な技術」 を紹介
想定内容
まずは,ツール部門/アイデア部門に応募で
きるレベルを目指す
提供されているナレッジグラフだけでは問題を解
くのに「不足している知識」を補う方法を考える
知識処理/機械学習の双方のアプローチの具体
例をでも形式で示す
2020/10/21 5
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
ナレッジグラフ推論チャレンジ Tech Live!
ナレッジグラフ推論チャレンジの紹介
2020/10/21 6
2020/10/21(水)
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
推論チャレンジとは?
シャーロック・ホームズのような
“推理”(推論)ができるAIシステムの開発
を目指した技術コンテスト
チャレンジのねらい
説明可能性(解釈可能性)を有するAI技術に関する最新技
術の促進・共有と,その分析・評価,体系化を行う.
チャレンジタスク
推理小説のナレッジグラフ (ホームズの短編小説) を対象に,
ホームズと同じ結論に辿り着き,その理由を説明する.
72020/10/21
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
チャレンジの概要
推理(推論)の例
ジュリアの死に不審な点があると,ヘレンから相談を受ける
↓ ←犯人は現場にいた人【外部知識】
「ジュリアが死んだ日」に現場の屋敷にいた人物の一覧を
取得する
2020/10/21 8
ホームズ
の推理小説
ナレッジグラフ(知識グラフ)
としてデータ化
さまざまな知識/手法を用いて
事件の真相を推理し,理由を
説明するAIシステムの開発
捜査
手法
動機
DB
…. 犯人はXX!
なぜなら…
動機は…
トリックは…
適切な推論には,何らかの「外部知識」を補う
必要がある場合が多い!
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
ナレッジグラフ推論チャレンジ2020
コロナの影響で国際版チャレンジ併催を企画していたJISTが延期…
6/9より、第3回国内版推論チャレンジ2020の作品応募を開始!
 既存の5つのナレッジグラフの洗練化版
まだらのひも、踊る人形、背中の曲がった男、
悪魔の足、 花婿失踪事件
 新規に3つのナレッジグラフを追加
(公開済み)僧坊荘園、白銀号殺人事件
(近日公開予定)入院患者
 スケジュール
2020/06/09 応募開始
2020/11/30 チャレンジ応募〆切
2020/01/05 最終審査会・授賞式(※)
(※社会状況を見てオンライン開催も含めて検討)
新審査基準:
可能な限り複数の作品に共通的に適用できる手法を高く評価します!
2020/10/21 9
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
タスクの実行条件・応募部門
対象とするKG
8つの小説のうち,いずれの小説を対象にしてもよい
(どれか1つだけ,2つだけ…などでもOK)
できるだけ多くの小説が,同じシステム(仕組み)で解けるとよい
各小説で使用するKGの範囲を段階的に変える(昨年同様)
→完全(すべてのKG)/不完全(10%)/不完全(25%)
ナレッジグラフの独自拡張も可能(昨年同様)
対象とするタスク
①本部門:対象小説1つ以上のタスクを解くシステムを開発
②ツール部門:いずれかのタスクを部分的に解くツールを開発
例)容疑者の推定,アリバイ検証,動機説明,など
★「自然言語文をトリプル化」するKG構築支援ツールの応募も可
③アイデア部門:①,②の実現方法のアイデア(実装なしでOK)
102020/10/21
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
ナレッジグラフ化の考え方
ナレッジグラフの要求仕様
犯人を推論(推理)するのに必要な知識を提供する
「推理小説」で描かれる様々な状況を,できるだけ統一的
な形式で計算機処理(検索・推論・etc.)可能にする
ナレッジグラフ化の基本方針
「推理小説」の内容を,最小単位の「場面(シーン)」に分割
→場面ごとにID(IRI)を付与
「各場面の記述内容」および「場面間の関係」をグラフ化
→グラフ化に必要なクラス・プロパティを定義
場面1 場面2 場面3
場面4
場面5
・・・
・・・
112020/10/21
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
場面(シーン)のスキーマ
場面ID
原文
主語
述語
目的語
subject
hasPredicate
source
その他
他の場面
場面間
場面を表現するプロパティ
 subject:その場面の記述において主語となる人や物
 hasPredicate:その場面の内容を表す述語
 場面の詳細を表す目的語:whom(だれに), where(どこで), when(いつ),
what(何を), how(どのように), …etc.
 場面間の関係:then,if, because, …etc.
 time:その場面が起こった絶対時間(xsd:DateTime)
 source:その場面の原文(英語/日本語のリテラル)
主語 目的語
述語
の形でないことに注意
→場面に関わる複数の
情報をまとめるため
場面ID中心に記述
122020/10/21
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
原文(英語/日本語)
絶対時間※小説内に基準日
時を設定している
主語・述語・目的語は全て
「リソース」として定義
→他の場面で同じ目的語を
参照可能
述語
主語
他の場面
場面の種類(クラス)分け
Scene:上位クラス
-Situation:事実・状況の描写
-Statement:Aの発言
-Talk:AのBへの発言
-Thought:Aの考え
13
場面(シーン)スキーマ 記述例
※図中のPREFIXは
古いものです
2020/10/21
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
ナレッジグラフの記述・検索例
以下,提供するナレッジグラフの記述例,および,そ
れを踏まえたSPARQLクエリによる検索例を示す.
クエリのサンプルは,下記に公開している
https://github.com/KnowledgeGraphJapan/LOD-ws-
2020/blob/master/kgrc2020ws/SPARQL-Sample-
KGRC2020.md
これをコピーして
http://knowledge-graph.jp/sparql.html
のクエリ欄に入力することで実行できる
2020/10/21 14
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
[Tech Live 1]
ナレッジグラフ統合技術を用いた
推論知識拡充のアプローチの紹介
2020/10/21 15
2020/10/21(水)
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
今回のアプローチ
取り組みたい課題
元のナレッジグラフ(元のKG)だけを用いて推理(推論)に
は,不十分と思われる知識を補完する
課題解決のアプローチ
1. 提供されているナレッジグラフでは不十分と思われる知
識を検討する
2. 補足する外部知識を作成する(/既存のKG等から探す)
3. 2.で作成した知識を,元のナレッジグラフと統合して利
用できるようにする
4. 統合したナレッジグラフを用いて推論を行う
2020/10/21 16
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
1.不足している知識の検討
例:
「事件性のある行動」 や「不審な行動」が行われた
「場面」見つける
考え方
「殺す」,「疑う」…など,その場面の述語で判定する?
2020/10/21 17
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
1.不足している知識の検討
2020/10/21 18
SPARQLクエリを用いて
「まらだのひも」で使用されているhasPredicate(その場
面の内容を表す述語)の一覧を取得する
クエリを実行して試す
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
1.不足している知識の検討
例:
「事件性のある行動」 や「不審な行動」が行われた
「場面」見つける
考え方
「殺す」,「疑う」…など,その場面の行動で判定する?
特定の述語を直接用いるのではなく,行動の種類で判定
ができないか?
元のKGでは,述語の種類は定義されていない
行動の種類を外部知識として補完する
2020/10/21 19
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
2.補足する知識の作成
例: 元KGで場面を表すのに利用されている「行動」
に「行動の種類」に関する知識を追加したい
考え方
既存のKGを利用/独自の知識をKGとして作成
追加する知識の内容の検討
元KGの「行動」に「行動の種類」を追加
– クラス階層を追加/プロパティとして追加
追加する知識の形式(モデル)の検討
2020/10/21 20
死ぬ 事件性の
ある行動
行動の種類
逃げる 疑わしい
行動
行動の種類
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
2.補足する知識の作成
追加するKG用の語彙の設計
「行動」と「行動の種類」を結ぶプロパティ
<http://kgc-example.org/actionKind>
「行動の種類」を表す語彙
事件性のある行動
<http://kgc-example.org/IncidentalAction>
疑わしい行動
<http://kgc-example.org/SuspiciousAction>
2020/10/21 21
死ぬ 事件性の
ある行動
行動の種類
逃げる 疑わしい
行動
行動の種類
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
2.補足する知識の作成
追加するKG用のデータ作成
簡単にするため,今回は,N-Triple形式で作成
<http://kgc.knowledge-graph.jp/data/predicate/die>
<http://kgc-example.org/actionKind>
<http://kgc-example.org/IncidentalAction> .
<http://kgc.knowledge-graph.jp/data/predicate/escape>
<http://kgc-example.org/actionKind>
<http://kgc-example.org/SuspiciousAction> .
2020/10/21 22
死ぬ 事件性の
ある行動
行動の種類
逃げる 疑わしい
行動
行動の種類
<主語> <述語> <目的語> .
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
2.補足する知識の作成
作成したデータ例
テキストエディタ等で作成
ファイルはUTF-8形式,拡張子.ntで保存
全角スペースや不正な文字が入らないように注意
2020/10/21 23
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
2.補足する知識の作成
2020/10/21 24
大規模な知識を作成するときは,表計算ソフトなどを用
いて,まとめて編集することも可能
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
3.ナレッジグラフの統合
前準備:RDF-DB(トリプルストア)の準備
RDF-DBを設定する
今回は,Apache Jena Fusekiを使用
(参考)Fusekiのインストール方法
https://qiita.com/yayamamo/items/6a10651e88c5d65506a0
RDF-DBに元KGを格納する
KG公開サイト(GitHub)からダウンロード
RDF-DBに格納(ダウンロードしたファイルをロード)
作成したKGを追加
元KGと同じRDF-DBに,作成したKGを格納すると,両者をと統
合した検索が可能になる
※別のRDF-DBに格納し,Federated クエリ(統合クエリ)で検索
する方法もある
(参考) 古崎 晃司, つながったデータの作り方, 情報の科学と技術, 2020, 70(8)
https://www.jstage.jst.go.jp/article/jkg/70/8/70_406/_pdf/-char/ja
2020/10/21 25
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
4.統合結果を用いた推論
統合したKGを用いることで,追加した知識を用いた
検索・推論が可能になる
例) 「事件性のある行動」を検索
2020/10/21 26
CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
まとめ
推論チャレンジに取り組むアプローチの1つとして,
推論に必要な(有効な)「知識を拡充」する方法の例
を示した
他の知識についても,同様の手法で拡張が可能
“どのような知識を拡充するか?”が重要なポイントとなる
より発展させるためには…
拡充する知識のモデルについては検討の余地あり
クラス階層を利用することで,より柔軟な種類分けが可能
既存のKG/LODの内容を取り入れることで,より効率の良
い知識拡充が行える可能性あり
拡充の手順自体は,今回の例と同等な方法で可能
2020/10/21 27

[part 1]ナレッジグラフ推論チャレンジ・Tech Live!