2018人工知能学会合同研究会発表資料

人狼ゲームにおける
ベイジアンネットワークを用いた
推論モデルの検討
発表者：愛知工業大学福井敬徳

研究背景
人狼ゲーム
研究目的
問題点
2

人狼ゲーム
村人役と人狼役の2つの陣営に分かれる
話し合いによって他のプレイヤの正体を探る
村人と人狼は互いの排除を目指す
3
研究背景
村人側
人狼側
・・・
・・・
・・・

投票による追放
会話によって追放したいプレイヤを多数決によって決定す
る
4
研究背景
1
1
1
2
0

本研究の目的
会話に基づいた投票先決定ができる
推論モデルの構築
5
研究背景
・・・
・・・
・・・
・・・
推論
モデル

人狼知能プラットフォーム
人工知能エージェント同士の対戦ができるプラットフォーム
◦いくつかの定型文を用いて会話
◦Javaパッケージの提供と対戦環境
◦対戦ログの書き出し
対戦ログ
6
研究背景

会話から投票先を決定することが困難である
・・・
・・・
・・・
投票
人工知能エージェントの問題
7
研究背景
・・・
・・・
• 村人の場合
• 人狼だと思う人に投票する
• 人狼の場合
• 投票されやすそうな人に投票する
会話の内容は多岐にわたるため
全ての会話を理解することは難しい

提案手法
推論モデル
学習データの作成
8

推論モデル
参加者エージェントのうち，
どのプレイヤに投票すべきかを決定するモデル
9
提案手法
会話
推論モデル
xx%
xx%
xx% xx%
投票確率

ベイジアンネットワーク
不確実性を含む事象の予測や合理的な意思決定などに
利用できる確率モデル
10
提案手法
X1
X2
X4 X5
X3
P(x3|x2)P(x2|x1, x5)
P(x4|x1) P(x5|x4)
P(x1)

学習データの整形
ログデータからベイジアンネットワークに用いる
学習データを準備する
2018年8月に開催された人狼のログデータ
11
提案手法
大会の
ログデータ
ベイジアン
ネットワーク
学習データ
学習データの
整形

12
大会の
ログデータ
ベイジアン
ネットワーク
学習データ
学習データの
整形
学習データの整形手順
1. 人狼知能大会のログから会話の要素を抽出する
2. 抽出されたデータを日別・役職別で分割する
3. 投票に強く影響している要素を選出するため，決定木分析をおこなう
提案手法
◦ 学習データの整形

13
提案手法
大会の
ログデータ
1. 要素の抽出
2. データの分割
3. 決定木分析
ベイジアン
ネットワーク
学習データ

14
提案手法
大会の
ログデータ
1. 要素の抽出
3. 決定木分析
ベイジアン
ネットワーク
学習データ

要素の抽出
あるプレイヤに投票する際に考慮すべき要素を抽出
投票者
の発言
投票先候補者が受けている発言ゲームの
状況
投票先候補者
の発言
15
提案手法

ログから抽出された要素
要素数要素の例
投票者の発言 16 （非）同意発言，役職予想発言，占い結果発言，
役職宣言発言投票先候補者の発言 16
投票先候補者が
受けている発言
18 被投票数，被（非）同意発言数，
被役職予想発言数，被占い結果発言数
ゲームの状況 1 占い師宣言したプレイヤ数
※占い結果 2 投票先候補者に出た判定
ログから抽出された要素数と例
16
提案手法
1日目の要素数

ログから抽出された要素
ログから抽出された要素数と例
17
提案手法
2日目の要素数
要素数要素の例
投票者の発言 32 （非）同意発言，役職予想発言，占い結果発言，
役職宣言発言投票先候補者の発言 32
投票先候補者が
受けている発言
36 被投票数，被（非）同意発言数，
被役職予想発言数，被占い結果発言数
ゲームの状況 2 占い師宣言したプレイヤ数
※占い結果 4 投票先候補者に出た判定

抽出手順
1
２
18
3
4
5
提案手法
ID 投票者
id
投票先
id
要素1 要素2 … 要素n
1 1 2 2 1 … 1

抽出手順
1
２
19
3
4
5
提案手法
ID 投票者
id
投票先
id
1 1 2 2 1 … 1
2 1 3 1 0 … 2

抽出手順
1
２
20
3
4
5
提案手法
ID 投票者
id
投票先
id
1 1 2 2 1 … 1
2 1 3 1 0 … 2
3 1 4 1 0 … 1

抽出手順
1
２
21
3
4
5
提案手法
ID 投票者
id
投票先
id
1 1 2 2 1 … 1
2 1 3 1 0 … 2
3 1 4 1 0 … 1
4 1 5 2 1 … 2

抽出手順
22
提案手法
ID 投票者
id
投票先
id
1 1 2 2 1 … 1
2 1 3 1 0 … 2
3 1 4 1 0 … 1
4 1 5 2 1 … 2
5 2 1 1 1 … 0
2
3
4
5
1

抽出データ
実際に投票先に投票した場合を1，していない場合を0とした列を追加する
１ゲーム分のログから20行（2日目は6行）分のレコードを抽出
ID 投票者
id
投票先
id
要素1 要素2 … 要素n 投票したか
1 1 2 2 1 … 1 1
2 1 3 1 0 … 2 0
3 1 4 1 0 … 1 0
4 1 5 2 1 … 2 0
5 2 1 1 1 … 0 1
23
提案手法

24
提案手法
大会の
ログデータ
1. 要素の抽出
3. 決定木分析
ベイジアン
ネットワーク
学習データ

データセットの分割
ゲームは1日目で終わる場合と2日目で終わる場合がある
日別で抽出データを取る
日別
25
提案手法

データセットの分割
役職ごとに投票する基準や重視する情報が変わる
役職別で抽出データを取る
1日目村人
役職別
26
提案手法
日別

抽出データ数
日数役職件数
1日目村人 120,000
占い師 60,000
裏切り者 60,000
人狼 60,000
2日目村人 6,796
占い師 7,466
裏切り者 9,850
人狼 12,056
27
提案手法

28
提案手法
大会の
ログデータ
1. 要素の抽出
3. 決定木分析
ベイジアン
ネットワーク
学習データ

ログから抽出した要素は投票先決定に関係があるか不明
である
決定木分析をおこない，投票先決定に強く影響している要
素を取り出す
要素の妥当性
29
投票
提案手法

決定木分析
説明変数
a
説明変数
b
説明変数
d
説明変数
e
説明変数
c
説明変数
f
説明変数
g
目的変数に影響する説明変数を見つけ樹木状のモデルを
作成する分析方法
30
提案手法
大
小

決定木分析
説明変数
a
説明変数
b
説明変数
d
説明変数
e
説明変数
c
説明変数
f
説明変数
g
目的変数に影響する説明変数を見つけ樹木状のモデルを
作成する分析方法
31
提案手法
大
小
説明変数
＝要素
目的変数
＝投票したか

要素の選出
要素を決定木分析の浅い順から10個，15個，20個選出
それぞれでベイジアンネットワークを構築し，実験をおこなう
10個
15個
20個
24個の
データセット
32
提案手法

学習データからベイジアンネットワークを構築
33
提案手法
ベイジアン
ネットワーク
学習データ

投票の決定前に要素を収集しベイジアンネットワークに入れる
34
推論モデル
提案手法
会話

ベイジアンネットワークから「実際に投票した確率」を取り出す
最も投票確率が高いプレイヤに投票する
35
推論モデル
1
２
3
4
5
・・・
提案手法

推論モデルの特色
37
評価実験
推論モデル
大会の
ログデータ
推論モデルを組み込んだ
エージェントは勝率が上がる
適切な投票先に投票することが
できる

評価方法
人狼知能対戦
◦ 本推論モデルを組み込んだエージェント1体と大会上位4体による対戦
◦ 推論モデルを搭載していないエージェントとの比較により有効性を確認する
ログ読み
◦ 対戦後，ログを読み会話に基づく投票先決定ができているかを確認する
38
評価実験

実験エージェント
39
評価実験
◦ 人狼知能対戦
勝率の比較実験をおこなうために，エージェントを4体作成

40
評価実験
NonSpeak
発言をしないエージェント
投票行為はランダムでおこなわれる

41
Sample
人狼知能プラットフォームに標準で搭載されているエージェント
適当な会話をおこなう
投票は組み込まれた推論モデルに基づきおこなわれる
評価実験

42
NonSpeak_w/BN
発言をしないエージェント
投票行為のみ本推論モデルに基づき決定する
評価実験

43
Sample_w/BN
Sampleエージェントの投票行為のみ本推論モデルに基づく
評価実験

44
発言投票
NonSpeak 発言をしないランダム
Sample 発言をする組み込まれた推論モデル
NonSpeak_w/BN 発言をしない本推論モデル
Sample_w/BN 発言をする本推論モデル
評価実験

対戦環境
大会上位4名と実験エージェント1名の対戦
1セット1,000回の対戦をし10セット試合をおこなう
45
評価実験

評価結果
46
役職 NonSpeak
勝率平均
要素数 NonSpeak_w/BN
勝率平均
平均勝率の差有意差
村人 0.5888
10 0.7428 0.1540 ○
15 0.7296 0.1408 ○
20 0.8374 0.2486 ○
占い師 0.5684
10 0.7840 0.2156 ○
15 0.7868 0.2184 ○
20 0.8216 0.2532 ○
村人陣営側の勝率結果
評価実験

評価結果
47
役職 Sample
勝率平均
要素数 Sample_w/BN
勝率平均
村人 0.5776
10 0.4762 -0.1014 ○
15 0.4558 -0.1218 ○
20 0.7054 0.1278 ○
占い師 0.5598
10 0.8206 0.2608 ○
15 0.8102 0.2504 ○
20 0.8284 0.2686 ○
村人陣営側の勝率結果
評価実験

評価結果
48
役職 NonSpeak
勝率平均
要素数 NonSpeak_w/BN
勝率平均
裏切り者 0.0362
10 0.0548 0.0186 ○
15 0.0664 0.0302 ○
20 0.0520 0.0158 ○
人狼 0.0772
10 0.0882 0.0110 ○
15 0.0814 0.0042 △
20 0.0902 0.0130 ○
人狼陣営側の勝率結果
評価実験

評価結果
49
役職 Sample
勝率平均
要素数 Sample_w/BN
勝率平均
裏切り者 0.0397
10 0.0448 0.0051 △
15 0.0678 0.0281 ○
20 0.0504 0.0107 ○
人狼 0.0926
10 0.1320 0.0394 ○
15 0.1426 0.0500 ○
20 0.1070 0.0144 △
人狼陣営側の勝率結果
評価実験

評価実験に基づく考察（ログ読み）
村人陣営
◦ 占い師を宣言していないプレイヤに対して投票している
50
占い師
占い師
評価実験
◦ ログ読み
人狼プレイヤを推定して
投票している

評価実験に基づく考察（ログ読み）
人狼陣営
◦ 占い師が判明した時に，占い師宣言をしたプレイヤに対して投票している
51
占い師
占い師
評価実験
◦ ログ読み
無意味な投票を
おこなっている

まとめと今後の課題
まとめ
今後の課題
52

まとめ
問題点
◦ 会話から投票先を決定することが困難である
提案手法
◦ ベイジアンネットワークによる推論モデル
評価実験
◦ 本推論モデルを組み込んだエージェントの対戦
結果
◦ 村人陣営では高い勝率向上が見られた
◦ 人狼陣営では勝率の向上が見られたが適切な投票先決定がされていると
は言えない
53

今後の課題
観測要素の選定が不十分
◦観測要素の選定数と選定手法の検討
学習データの精査
◦適切な投票ができているログのみで学習など
推論モデルの応用
◦ 他のプレイヤに本推論モデルを当てはめることで，他のプレイヤ
がどこに投票するかがわかる
◦ 人狼の襲撃先決定や占い先決定などにも応用が可能
54

2018人工知能学会合同研究会発表資料

Recommended

Recommended

More Related Content

Similar to 2018人工知能学会合同研究会発表資料

Similar to 2018人工知能学会合同研究会発表資料 (14)

More from Takanori Fukui

More from Takanori Fukui (6)

2018人工知能学会合同研究会発表資料

Editor's Notes