SlideShare a Scribd company logo
人狼ゲームにおける
ベイジアンネットワーク を用いた
推論モデルの検討
発表者:愛知工業大学 福井敬徳
研究背景
人狼ゲーム
研究目的
問題点
2
人狼ゲーム
村人役と人狼役の2つの陣営に分かれる
話し合いによって他のプレイヤの正体を探る
村人と人狼は互いの排除を目指す
3
研究背景
村人側
人狼側
・・・
・・・
・・・
投票による追放
会話によって追放したいプレイヤを多数決によって決定す
る
4
研究背景
1
1
1
2
0
本研究の目的
会話に基づいた投票先決定ができる
推論モデルの構築
5
研究背景
・・・
・・・
・・・
・・・
推論
モデル
人狼知能プラットフォーム
人工知能エージェント同士の対戦ができるプラットフォーム
◦いくつかの定型文を用いて会話
◦Javaパッケージの提供と対戦環境
◦対戦ログの書き出し
対戦ログ
6
研究背景
会話から投票先を決定することが困難である
・・・
・・・
・・・
投票
人工知能エージェントの問題
7
研究背景
・・・
・・・
• 村人の場合
• 人狼だと思う人に投票する
• 人狼の場合
• 投票されやすそうな人に投票する
会話の内容は多岐にわたるため
全ての会話を理解することは難しい
提案手法
推論モデル
学習データの作成
推論モデルの構築
8
推論モデル
参加者エージェントのうち,
どのプレイヤに投票すべきかを決定するモデル
9
提案手法
会話
推論モデル
xx%
xx%
xx% xx%
投票確率
ベイジアンネットワーク
不確実性を含む事象の予測や合理的な意思決定などに
利用できる確率モデル
10
提案手法
X1
X2
X4 X5
X3
P(x3|x2)P(x2|x1, x5)
P(x4|x1) P(x5|x4)
P(x1)
学習データの整形
ログデータからベイジアンネットワークに用いる
学習データを準備する
2018年8月に開催された人狼のログデータ
11
提案手法
大会の
ログデータ
ベイジアン
ネットワーク
学習データ
学習データの
整形
12
大会の
ログデータ
ベイジアン
ネットワーク
学習データ
学習データの
整形
学習データの整形手順
1. 人狼知能大会のログから会話の要素を抽出する
2. 抽出されたデータを日別・役職別で分割する
3. 投票に強く影響している要素を選出するため,決定木分析をおこなう
提案手法
◦ 学習データの整形
学習データの整形手順
13
提案手法
◦ 学習データの整形
大会の
ログデータ
1. 要素の抽出
2. データの分割
3. 決定木分析
ベイジアン
ネットワーク
学習データ
1. 人狼知能大会のログから会話の要素を抽出する
2. 抽出されたデータを日別・役職別で分割する
3. 投票に強く影響している要素を選出するため,決定木分析をおこなう
学習データの整形手順
14
提案手法
◦ 学習データの整形
大会の
ログデータ
1. 要素の抽出
2. データの分割
3. 決定木分析
ベイジアン
ネットワーク
学習データ
1. 人狼知能大会のログから会話の要素を抽出する
2. 抽出されたデータを日別・役職別で分割する
3. 投票に強く影響している要素を選出するため,決定木分析をおこなう
要素の抽出
あるプレイヤに投票する際に考慮すべき要素を抽出
投票者
の発言
投票先候補者が受けている発言ゲームの
状況
投票先候補者
の発言
15
提案手法
◦ 学習データの整形
ログから抽出された要素
要素数 要素の例
投票者の発言 16 (非)同意発言,役職予想発言,占い結果発言,
役職宣言発言投票先候補者の発言 16
投票先候補者が
受けている発言
18 被投票数,被(非)同意発言数,
被役職予想発言数,被占い結果発言数
ゲームの状況 1 占い師宣言したプレイヤ数
※占い結果 2 投票先候補者に出た判定
ログから抽出された要素数と例
16
提案手法
◦ 学習データの整形
1日目の要素数
ログから抽出された要素
ログから抽出された要素数と例
17
提案手法
◦ 学習データの整形
2日目の要素数
要素数 要素の例
投票者の発言 32 (非)同意発言,役職予想発言,占い結果発言,
役職宣言発言投票先候補者の発言 32
投票先候補者が
受けている発言
36 被投票数,被(非)同意発言数,
被役職予想発言数,被占い結果発言数
ゲームの状況 2 占い師宣言したプレイヤ数
※占い結果 4 投票先候補者に出た判定
抽出手順
1
2
18
3
4
5
提案手法
◦ 学習データの整形
ID 投票者
id
投票先
id
要素1 要素2 … 要素n
1 1 2 2 1 … 1
抽出手順
1
2
19
3
4
5
提案手法
◦ 学習データの整形
ID 投票者
id
投票先
id
要素1 要素2 … 要素n
1 1 2 2 1 … 1
2 1 3 1 0 … 2
抽出手順
1
2
20
3
4
5
提案手法
◦ 学習データの整形
ID 投票者
id
投票先
id
要素1 要素2 … 要素n
1 1 2 2 1 … 1
2 1 3 1 0 … 2
3 1 4 1 0 … 1
抽出手順
1
2
21
3
4
5
提案手法
◦ 学習データの整形
ID 投票者
id
投票先
id
要素1 要素2 … 要素n
1 1 2 2 1 … 1
2 1 3 1 0 … 2
3 1 4 1 0 … 1
4 1 5 2 1 … 2
抽出手順
22
提案手法
◦ 学習データの整形
ID 投票者
id
投票先
id
要素1 要素2 … 要素n
1 1 2 2 1 … 1
2 1 3 1 0 … 2
3 1 4 1 0 … 1
4 1 5 2 1 … 2
5 2 1 1 1 … 0
2
3
4
5
1
抽出データ
実際に投票先に投票した場合を1,していない場合を0とした列を追加する
1ゲーム分のログから20行(2日目は6行)分のレコードを抽出
ID 投票者
id
投票先
id
要素1 要素2 … 要素n 投票したか
1 1 2 2 1 … 1 1
2 1 3 1 0 … 2 0
3 1 4 1 0 … 1 0
4 1 5 2 1 … 2 0
5 2 1 1 1 … 0 1
23
提案手法
◦ 学習データの整形
学習データの整形手順
24
提案手法
◦ 学習データの整形
大会の
ログデータ
1. 要素の抽出
2. データの分割
3. 決定木分析
ベイジアン
ネットワーク
学習データ
1. 人狼知能大会のログから会話の要素を抽出する
2. 抽出されたデータを日別・役職別で分割する
3. 投票に強く影響している要素を選出するため,決定木分析をおこなう
データセットの分割
ゲームは1日目で終わる場合と2日目で終わる場合がある
日別で抽出データを取る
日別
25
提案手法
◦ 学習データの整形
データセットの分割
役職ごとに投票する基準や重視する情報が変わる
役職別で抽出データを取る
1日目村人
役職別
26
提案手法
◦ 学習データの整形
日別
抽出データ数
日数 役職 件数
1日目 村人 120,000
占い師 60,000
裏切り者 60,000
人狼 60,000
2日目 村人 6,796
占い師 7,466
裏切り者 9,850
人狼 12,056
27
提案手法
◦ 学習データの整形
学習データの整形手順
28
提案手法
◦ 学習データの整形
大会の
ログデータ
1. 要素の抽出
2. データの分割
3. 決定木分析
ベイジアン
ネットワーク
学習データ
1. 人狼知能大会のログから会話の要素を抽出する
2. 抽出されたデータを日別・役職別で分割する
3. 投票に強く影響している要素を選出するため,決定木分析をおこなう
ログから抽出した要素は投票先決定に関係があるか不明
である
決定木分析をおこない,投票先決定に強く影響している要
素を取り出す
要素の妥当性
29
投票
提案手法
◦ 学習データの整形
決定木分析
説明変数
a
説明変数
b
説明変数
d
説明変数
e
説明変数
c
説明変数
f
説明変数
g
目的変数に影響する説明変数を見つけ樹木状のモデルを
作成する分析方法
30
提案手法
◦ 学習データの整形
大
小
決定木分析
説明変数
a
説明変数
b
説明変数
d
説明変数
e
説明変数
c
説明変数
f
説明変数
g
目的変数に影響する説明変数を見つけ樹木状のモデルを
作成する分析方法
31
提案手法
◦ 学習データの整形
大
小
説明変数
=要素
目的変数
=投票したか
要素の選出
要素を決定木分析の浅い順から10個,15個,20個選出
それぞれでベイジアンネットワークを構築し,実験をおこなう
10個
15個
20個
24個の
データセット
32
提案手法
◦ 学習データの整形
推論モデルの構築
学習データからベイジアンネットワークを構築
33
提案手法
◦ 学習データの整形
ベイジアン
ネットワーク
学習データ
推論モデルの構築
投票の決定前に要素を収集しベイジアンネットワークに入れる
34
推論モデル
提案手法
◦ 学習データの整形
会話
推論モデルの構築
ベイジアンネットワークから「実際に投票した確率」を取り出す
最も投票確率が高いプレイヤに投票する
35
推論モデル
1
2
3
4
5
・・・
提案手法
◦ 学習データの整形
評価実験
36
推論モデルの特色
37
評価実験
推論モデル
大会の
ログデータ
推論モデルを組み込んだ
エージェントは勝率が上がる
適切な投票先に投票することが
できる
評価方法
人狼知能対戦
◦ 本推論モデルを組み込んだエージェント1体と大会上位4体による対戦
◦ 推論モデルを搭載していないエージェントとの比較により有効性を確認する
ログ読み
◦ 対戦後,ログを読み会話に基づく投票先決定ができているかを確認する
38
評価実験
実験エージェント
39
評価実験
◦ 人狼知能対戦
勝率の比較実験をおこなうために,エージェントを4体作成
実験エージェント
40
評価実験
◦ 人狼知能対戦
NonSpeak
発言をしないエージェント
投票行為はランダムでおこなわれる
実験エージェント
41
Sample
人狼知能プラットフォームに標準で搭載されているエージェント
適当な会話をおこなう
投票は組み込まれた推論モデルに基づきおこなわれる
評価実験
◦ 人狼知能対戦
実験エージェント
42
NonSpeak_w/BN
発言をしないエージェント
投票行為のみ本推論モデルに基づき決定する
評価実験
◦ 人狼知能対戦
実験エージェント
43
Sample_w/BN
Sampleエージェントの投票行為のみ本推論モデルに基づく
評価実験
◦ 人狼知能対戦
実験エージェント
44
発言 投票
NonSpeak 発言をしない ランダム
Sample 発言をする 組み込まれた推論モデル
NonSpeak_w/BN 発言をしない 本推論モデル
Sample_w/BN 発言をする 本推論モデル
評価実験
◦ 人狼知能対戦
対戦環境
大会上位4名と実験エージェント1名の対戦
1セット1,000回の対戦をし10セット試合をおこなう
45
評価実験
◦ 人狼知能対戦
評価結果
46
役職 NonSpeak
勝率平均
要素数 NonSpeak_w/BN
勝率平均
平均勝率の差 有意差
村人 0.5888
10 0.7428 0.1540 ○
15 0.7296 0.1408 ○
20 0.8374 0.2486 ○
占い師 0.5684
10 0.7840 0.2156 ○
15 0.7868 0.2184 ○
20 0.8216 0.2532 ○
村人陣営側の勝率結果
評価実験
◦ 人狼知能対戦
評価結果
47
役職 Sample
勝率平均
要素数 Sample_w/BN
勝率平均
平均勝率の差 有意差
村人 0.5776
10 0.4762 -0.1014 ○
15 0.4558 -0.1218 ○
20 0.7054 0.1278 ○
占い師 0.5598
10 0.8206 0.2608 ○
15 0.8102 0.2504 ○
20 0.8284 0.2686 ○
村人陣営側の勝率結果
評価実験
◦ 人狼知能対戦
評価結果
48
役職 NonSpeak
勝率平均
要素数 NonSpeak_w/BN
勝率平均
平均勝率の差 有意差
裏切り者 0.0362
10 0.0548 0.0186 ○
15 0.0664 0.0302 ○
20 0.0520 0.0158 ○
人狼 0.0772
10 0.0882 0.0110 ○
15 0.0814 0.0042 △
20 0.0902 0.0130 ○
人狼陣営側の勝率結果
評価実験
◦ 人狼知能対戦
評価結果
49
役職 Sample
勝率平均
要素数 Sample_w/BN
勝率平均
平均勝率の差 有意差
裏切り者 0.0397
10 0.0448 0.0051 △
15 0.0678 0.0281 ○
20 0.0504 0.0107 ○
人狼 0.0926
10 0.1320 0.0394 ○
15 0.1426 0.0500 ○
20 0.1070 0.0144 △
人狼陣営側の勝率結果
評価実験
◦ 人狼知能対戦
評価実験に基づく考察(ログ読み)
村人陣営
◦ 占い師を宣言していないプレイヤに対して投票している
50
占い師
占い師
評価実験
◦ ログ読み
人狼プレイヤを推定して
投票している
評価実験に基づく考察(ログ読み)
人狼陣営
◦ 占い師が判明した時に,占い師宣言をしたプレイヤに対して投票している
51
占い師
占い師
評価実験
◦ ログ読み
無意味な投票を
おこなっている
まとめと今後の課題
まとめ
今後の課題
52
まとめ
問題点
◦ 会話から投票先を決定することが困難である
提案手法
◦ ベイジアンネットワークによる推論モデル
評価実験
◦ 本推論モデルを組み込んだエージェントの対戦
結果
◦ 村人陣営では高い勝率向上が見られた
◦ 人狼陣営では勝率の向上が見られたが適切な投票先決定がされていると
は言えない
53
まとめと今後の課題
今後の課題
観測要素の選定が不十分
◦観測要素の選定数と選定手法の検討
学習データの精査
◦適切な投票ができているログのみで学習など
推論モデルの応用
◦ 他のプレイヤに本推論モデルを当てはめることで,他のプレイヤ
がどこに投票するかがわかる
◦ 人狼の襲撃先決定や占い先決定などにも応用が可能
54
まとめと今後の課題
55

More Related Content

Similar to 2018人工知能学会合同研究会発表資料

ゲームAIとマルチエージェント(下)
ゲームAIとマルチエージェント(下)ゲームAIとマルチエージェント(下)
ゲームAIとマルチエージェント(下)
Youichiro Miyake
 
Hadoop conference Japan 2011
Hadoop conference Japan 2011Hadoop conference Japan 2011
Hadoop conference Japan 2011Takahiko Ito
 
ゲームにおける遺伝的アルゴリズム「NERO における学習と進化 」(前半)
ゲームにおける遺伝的アルゴリズム「NERO における学習と進化 」(前半)ゲームにおける遺伝的アルゴリズム「NERO における学習と進化 」(前半)
ゲームにおける遺伝的アルゴリズム「NERO における学習と進化 」(前半)
Youichiro Miyake
 
TechCommit_LT_20210620
TechCommit_LT_20210620TechCommit_LT_20210620
TechCommit_LT_20210620
MasahiroShimono
 
チームで1番弱い子がアジャイルレトロスペクティブやってみたら ・・・
チームで1番弱い子がアジャイルレトロスペクティブやってみたら ・・・チームで1番弱い子がアジャイルレトロスペクティブやってみたら ・・・
チームで1番弱い子がアジャイルレトロスペクティブやってみたら ・・・
Rakuten Group, Inc.
 
Windows10とRaspberryPiで MakerFaireTokyoに参加
Windows10とRaspberryPiでMakerFaireTokyoに参加Windows10とRaspberryPiでMakerFaireTokyoに参加
Windows10とRaspberryPiで MakerFaireTokyoに参加
Yuki Ando
 
Deeplearning bank marketing dataset
Deeplearning bank marketing datasetDeeplearning bank marketing dataset
Deeplearning bank marketing dataset
TellSun
 
競輪車券の購買支援に向けたコンテンツ自動生成に関する研究
競輪車券の購買支援に向けたコンテンツ自動生成に関する研究競輪車券の購買支援に向けたコンテンツ自動生成に関する研究
競輪車券の購買支援に向けたコンテンツ自動生成に関する研究
harmonylab
 
河野ゼミ研究紹介20211020
河野ゼミ研究紹介20211020河野ゼミ研究紹介20211020
河野ゼミ研究紹介20211020
義広 河野
 
可視化法学 smips登壇
可視化法学 smips登壇可視化法学 smips登壇
可視化法学 smips登壇
(shibao)芝尾 (kouichiro)幸一郎
 
クラウドセキュリティ基礎 @セキュリティ・ミニキャンプ in 東北 2016 #seccamp
クラウドセキュリティ基礎 @セキュリティ・ミニキャンプ in 東北 2016 #seccampクラウドセキュリティ基礎 @セキュリティ・ミニキャンプ in 東北 2016 #seccamp
クラウドセキュリティ基礎 @セキュリティ・ミニキャンプ in 東北 2016 #seccamp
Masahiro NAKAYAMA
 
データジャケット入力方法
データジャケット入力方法データジャケット入力方法
データジャケット入力方法
Teruaki Hayashi
 
UnityでつくるはじめてのPONG
UnityでつくるはじめてのPONGUnityでつくるはじめてのPONG
UnityでつくるはじめてのPONG
Kohei Kadowaki
 
Introduction to Multi Agent simulation
Introduction to  Multi Agent simulationIntroduction to  Multi Agent simulation
Introduction to Multi Agent simulationNaoki Shinbo
 

Similar to 2018人工知能学会合同研究会発表資料 (14)

ゲームAIとマルチエージェント(下)
ゲームAIとマルチエージェント(下)ゲームAIとマルチエージェント(下)
ゲームAIとマルチエージェント(下)
 
Hadoop conference Japan 2011
Hadoop conference Japan 2011Hadoop conference Japan 2011
Hadoop conference Japan 2011
 
ゲームにおける遺伝的アルゴリズム「NERO における学習と進化 」(前半)
ゲームにおける遺伝的アルゴリズム「NERO における学習と進化 」(前半)ゲームにおける遺伝的アルゴリズム「NERO における学習と進化 」(前半)
ゲームにおける遺伝的アルゴリズム「NERO における学習と進化 」(前半)
 
TechCommit_LT_20210620
TechCommit_LT_20210620TechCommit_LT_20210620
TechCommit_LT_20210620
 
チームで1番弱い子がアジャイルレトロスペクティブやってみたら ・・・
チームで1番弱い子がアジャイルレトロスペクティブやってみたら ・・・チームで1番弱い子がアジャイルレトロスペクティブやってみたら ・・・
チームで1番弱い子がアジャイルレトロスペクティブやってみたら ・・・
 
Windows10とRaspberryPiで MakerFaireTokyoに参加
Windows10とRaspberryPiでMakerFaireTokyoに参加Windows10とRaspberryPiでMakerFaireTokyoに参加
Windows10とRaspberryPiで MakerFaireTokyoに参加
 
Deeplearning bank marketing dataset
Deeplearning bank marketing datasetDeeplearning bank marketing dataset
Deeplearning bank marketing dataset
 
競輪車券の購買支援に向けたコンテンツ自動生成に関する研究
競輪車券の購買支援に向けたコンテンツ自動生成に関する研究競輪車券の購買支援に向けたコンテンツ自動生成に関する研究
競輪車券の購買支援に向けたコンテンツ自動生成に関する研究
 
河野ゼミ研究紹介20211020
河野ゼミ研究紹介20211020河野ゼミ研究紹介20211020
河野ゼミ研究紹介20211020
 
可視化法学 smips登壇
可視化法学 smips登壇可視化法学 smips登壇
可視化法学 smips登壇
 
クラウドセキュリティ基礎 @セキュリティ・ミニキャンプ in 東北 2016 #seccamp
クラウドセキュリティ基礎 @セキュリティ・ミニキャンプ in 東北 2016 #seccampクラウドセキュリティ基礎 @セキュリティ・ミニキャンプ in 東北 2016 #seccamp
クラウドセキュリティ基礎 @セキュリティ・ミニキャンプ in 東北 2016 #seccamp
 
データジャケット入力方法
データジャケット入力方法データジャケット入力方法
データジャケット入力方法
 
UnityでつくるはじめてのPONG
UnityでつくるはじめてのPONGUnityでつくるはじめてのPONG
UnityでつくるはじめてのPONG
 
Introduction to Multi Agent simulation
Introduction to  Multi Agent simulationIntroduction to  Multi Agent simulation
Introduction to Multi Agent simulation
 

More from Takanori Fukui

著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの
Takanori Fukui
 
論文の書き方(研究室用)
論文の書き方(研究室用)論文の書き方(研究室用)
論文の書き方(研究室用)
Takanori Fukui
 
著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの
Takanori Fukui
 
Gat2017-AITWolfアルゴリズム紹介
Gat2017-AITWolfアルゴリズム紹介Gat2017-AITWolfアルゴリズム紹介
Gat2017-AITWolfアルゴリズム紹介
Takanori Fukui
 
Automatic classification of remarks in Werewolf BBS
Automatic classification of remarks in Werewolf BBSAutomatic classification of remarks in Werewolf BBS
Automatic classification of remarks in Werewolf BBS
Takanori Fukui
 
Up ai wolfプレゼン資料
Up ai wolfプレゼン資料Up ai wolfプレゼン資料
Up ai wolfプレゼン資料
Takanori Fukui
 

More from Takanori Fukui (6)

著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの
 
論文の書き方(研究室用)
論文の書き方(研究室用)論文の書き方(研究室用)
論文の書き方(研究室用)
 
著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの
 
Gat2017-AITWolfアルゴリズム紹介
Gat2017-AITWolfアルゴリズム紹介Gat2017-AITWolfアルゴリズム紹介
Gat2017-AITWolfアルゴリズム紹介
 
Automatic classification of remarks in Werewolf BBS
Automatic classification of remarks in Werewolf BBSAutomatic classification of remarks in Werewolf BBS
Automatic classification of remarks in Werewolf BBS
 
Up ai wolfプレゼン資料
Up ai wolfプレゼン資料Up ai wolfプレゼン資料
Up ai wolfプレゼン資料
 

2018人工知能学会合同研究会発表資料

Editor's Notes

  1. 一般的に人狼ゲームとはプレイ同士が顔を合わせて話すコミュニケーションゲームの一つです. 村人役と人狼役の2つの陣営に分かれ,話し合いによって,他のプレイヤの正体を探りつつ,村人と人狼は互いの排除を目指します. 人狼ゲームには一人のプレイヤに一つずつ役職が決められ, 村人,人狼,の他に占い師と裏切り者という役職があります.
  2. 人狼ゲームでは参加プレイヤ同士の会話があり,2分ほどの制限時間を設けて,行われます. 会話終了後,各プレイヤは追放したいプレイヤに対して投票し,多数決によって追放されるプレイヤが決定されます. 本研究では,この投票による追放に着目しました.
  3. 本研究の目的は参加プレイヤが会話した内容を踏まえて,適切な投票先決定ができる推論モデルの構築です. 一般的に人狼ゲームは5人から十数名でプレイするゲームですが,本研究では5人プレイヤで行われる人狼ゲームを対象とします.
  4. また,対象とするプラットフォームを人狼知能プラットフォームとします. 人狼知能プラットフォームとは,人狼知能プロジェクトから提供されている人工知能エージェント同士の対戦ができるプラットフォームです. いくつかの定型文を用いて会話をし,人工知能エージェント同士の対戦が実現できます. 人狼知能プラットフォームでは,エージェントの作成のためのJavaパッケージの提供,エージェント同士の対戦環境が用意されています. また,対戦のログを出力するため,デバック作業や,エージェントの動作確認,エージェントの対戦状況を振り返ることができます.
  5. 本研究で解決させる問題点を述べます. 人狼ゲームはコミュニケーションゲームのため,様々な発言が行われます. そのため,全ての発言を想定して投票先を決定することは困難です. また,村人の場合は人狼だと思う人に投票する のに対して 人狼の場合は,投票されやすそうな人に投票するなど,自身の状況も踏まえた上で投票先の決定をする必要があります. このように, 会話は多岐にわたるため,会話を総括して投票先を決定することが困難である問題があります. また,自身の役職に合わせて投票先の判断基準も変える必要があります
  6. 3’05 後何をやるのかを明確にする 自分がやる仕事と引き継ぎの仕事を考えておく
  7. 本研究で提案する推論モデルは,参加者エージェントの会話と,投票者,投票先を入力として取り込み,各プレイヤに対して投票する確率を出力するモデルです. この推論モデルにはベイジアンネットワークを用います.
  8. ベイジアンネットワークとは,不確実性を含む事象の予測や合理的な意思決定などに利用できる確率モデルのことです. ある,確率変数をノードとしたとき,確率変数間の依存関係をリンクで示します. 本研究では確率変数に発言などの要素を当てはめ,依存関係を対戦のログデータから推定します.
  9. ベイジアンネットワークの構造や依存関係を推定するために,学習データを作成します. 学習データは2018年8月に開催された5人プレイヤによる人狼のログデータを用います. [ ENTER ENTER ] 学習データの変換 学習データの準備 ログデータから学習データの整形 ログデータから学習データの抽出 丸々の学習データの作成 丸々の抽出など ーーーーー このスライドと前のスライドのつながりが薄い 解決できない
  10. [ ENTER ]
  11. 学習データの作成手順は大きく3つの手順に分かれます. 1つ目は,人狼知能大会のログから会話の要素を抽出する 2つ目は, 3つ目は, となります それぞれについて説明します.
  12. まず要素の抽出です.
  13. あるプレイヤに投票する際に,考慮すべき会話,状況を要素としてログデータより抽出します. 要素は4つに大別されます. 一つは投票者自身の発言,2つ目 ポインタ必須 は投票先候補者の発言,3つ目は投票先候補者が受けている発言,4つ目にゲームの状況からなります.
  14. これらのログから抽出された要素の数と例を示します. 定義した要素数は合計で41個あります. 占い師という役職のみ,占い結果という形で情報を得ることができるため,これを加えて43個となります. (候)を加える または候補者
  15. また2日目は1日目の要素に加えて,2日目の要素を抽出するため,倍数の82個,占い師のみ86個の観測要素を抽出します. 観測要素は 要素 または 観測された要素 とする
  16. 抽出手順を示します. まず,投票者1番が投票候補者2番へ投票すると仮定して,観測要素に従って値を取得します. 取得された値が1レコードとなります.
  17. 抽出手順を示します. まず,投票者1番が投票候補者2番へ投票すると仮定して,観測要素に従って値を取得します. 取得された値が1レコードとなります.
  18. 抽出手順を示します. まず,投票者1番が投票候補者2番へ投票すると仮定して,観測要素に従って値を取得します. 取得された値が1レコードとなります.
  19. これらの手順から抽出されたレコードの最後に,実際に投票を行ったかを加えます. 投票した場合を1,していない場合を0とします. 1ゲーム文のログから20行,2日目はプレイヤが追放や襲撃により3名となるため,6行分のレコードが抽出されます.
  20. 次に手順2のデータの分割です.
  21. 人狼ゲームは1日目で終わる場合と2日目で終わる場合があります. そのため,日別で抽出データを取得します.
  22. さらに,役職ごとに投票する基準や重視する情報が変わるため,別々にベイジアンネットワークを作成する必要があると考え, 役職別に分割します. これにより,データセットは8つに分割されます.
  23. 抽出されたデータ数はこの表のようになります. 村人は5人中2人いるため,他の役職の倍数となっています. また,2日目はゲームが1日目で終わる場合があるため,それぞれバラバラの件数となります.
  24. 最後に手順3の決定木分析について説明します.
  25. これらの抽出された観測要素は投票先の決定に必要な要素かは不明です. そこで,決定木分析を行い,投票先決定に強く影響している観測要素を取り出します. 強く影響している よりよく分けられる の 違い
  26. 決定木分析とは, 決定木分析は,目的変数の値をよりよく分割する説明変数から順に木を構成するため, 決定木の浅い順から要素を選出することで,目的変数に強く影響している説明変数を取り出すことができると考えます.
  27. 本研究では目的変数に投票したかの列とし,説明変数に要素を当てはめ,決定木分析を行いました.
  28. 本研究では決定木分析かの浅い順から10個,15個,20個を選出し,評価実験を行います. そのため,8つのデータセットに対して,3つの選出数をかけ,24個のデータセットを準備します. 24個のデータセットそれぞれでベイジアンネットワークを構築し,評価実験を行います.
  29. 9'24 学習データの作成が終わり,24個の学習データを用いてそれぞれベイジアンネットワークを作成します.
  30. 人工知能エージェントが推論モデルとして用いる時には, 投票を決定する前に,収集可能な要素の値を取得し,投票者,投票先を加えて,ベイジアンネットワークに入れます. 観測要素を入れる というよりは 会話や投票者’とウヒョうっ先を入力して...とする
  31. その後,ベイジアンネットワークから「実際に投票した確率」を取り出し,最も投票確率が高いプレイヤに投票をします.
  32. 9’50 提案した推論モデルの有効性を評価実験にて確かめます.
  33. 提案した推論モデルは大会のログデータから作成されています. そのため,この推論モデルの組み込んだエージェントは勝率が上がると考えられます. また,勝率が上がるためには,適切な投票先に投票する必要があります. そのため,適切な投票先に投票することができると考えられます.
  34. 前のスライドの内容を踏まえて,評価方法を2つ実施しました. 1つ目は人狼知能プラットフォーム上で推論モデルを組み込んだ人工能エージェントと,大会上位4名による対戦を行います また,推論モデルを搭載していないエージェントも用意し,本提案モデルを組み込んだエージェントとの勝率の差を確認します. 2つ目は人狼知能対戦を行った対戦ログ結果を読み, 会話に基づく投票先決定ができているかを確認します. 先ほどお話ししたようにn
  35. 人狼知能対戦の比較実験を行うために,4対のエージェントを用意しました.
  36. 人狼知能対戦の比較実験を行うために,4対のエージェントを用意しました. 1つ目はNonSpeak
  37. ある程度 適切な(適当な)会話を行う その場に沿った会話をする
  38. 4対のエージェントをまとめると,
  39. 対戦環境は,対戦上位4名と実験エージェント1名を交換しながら対戦を行います. 1セット1,000回の対戦をし,10セット試合を行います. その後,有意差を測ります.
  40. まずはじめに,村人陣営の役職,NonSpeakエージェントとNonSpeak_w/BNエージェントの勝率とその差です. 村人のNonSpeakエージェントの勝率は58.8%に対して,本推論モデルを組み込んだエージェントは要素数20で83.7%,差は24.8%となり,有意差検定を行ったところ,有意差が確認できました. また占い師も要素数が多い時に最も高い勝率を得ました.
  41. 続いてサンプルエージェントと,Sample_w/BNの勝率の差です. こちらも同様に要素数が20の時に高い勝率を得ました. しかし,村人の要素10と15の時に勝率が下がるという結果が出ました. これは人狼に投票するために必要な要素がなかったため,適切な投票ができなかったからだと考えます.
  42. 反対に,人狼陣営の勝率結果です. NonSpeakエージェントの勝率は3.6%に対して要素数15の時NonSpeak_w・BNの勝率は6.6%と3%の向上が見られました. ここで要素数が20の時に勝率が下がっています. これは,裏切り者の要素数が増えることで,裏切り者らしい投票が行われる結果 他のプレイヤに裏切り者であることが判明してしまい,勝率の低下を招いていると考えられます.
  43. 次にsampleの勝率平均とsample w BN の勝率平均,その差です. 先ほどと同じように要素数15の時に勝率が最も高く, 要素数20の時には平均勝率が下がるという結果が出ました. 人狼の場合も,人狼らしい投票をしている結果,他のプレイヤに人狼だということがわかってしまうために,勝率が下がってしまっていると考えられます.
  44. 評価実験で得られたログを確認したところ,いくつかの行動が見られました. そのうちの一つは占い師を宣言していないプレイヤに対して投票をしていることです. これは,占い師を宣言しているプレイヤは本当の占い師か,裏切り者である可能性が高いという人狼ゲームにおける定説に従い, 何も宣言していない2人のプレイヤのどちらかに投票を行っています. このように村人陣営の役職では,人狼に対して投票を行っていることが確認できました. ログ分析(評価実験に基づく考察)(ログ分析) なぜそれがいいのか 口頭部分をスライドに書く 城跡という単語を抜く」 定石という言葉は抜けない
  45. 反対に人狼陣営の場合です. 人狼から本当の占い師が判明した場合,占い師に投票をしていることがわかりました. 人狼にとって占い師は積極的に村から追放したい役職となるため,このプレイヤに投票をすることは合理的な判断と言えます しかし,占い師宣言したプレイヤは他のプレイヤから投票されないため,多数決により追放ができません. これにより,人狼の投票は意味がなく,勝率の貢献ができません. 本研究の目的であった.「投票されやすそうなプレイヤに投票する」は達成できていないことを確認しました. スライドに結論まで乗せる
  46. 人狼陣営では勝率の向上があったが,,,
  47. 今後の課題として,観測要素の選定が不十分である問題があります. 本研究では,最大で20個の観測要素を利用しましたが,より多くの観測要素での勝率変化を確認する必要があります. また,選定方法についても検討の余地があります. 2つ目に学習データの精査です. 人狼が適切な投票ができない問題に対して,学習データの選定が必要です. 例えば,適切な投票先決定ができているデータのみ収集する,人狼が勝利したログのみを用いて学習をするなどです. 3つ目に推論モデルの応用です. 本研究で提案したモデルは自分ではない参加者プレイヤに当てはめることで,そのプレイヤがどこに投票するかを知ることができます. これにより,こちらから特定の発言をすることで,相手の投票先を誘導することができると考えています. また,投票先の決定だけでなく,たの意思決定にも応用することが期待されます. 発表は以上です.ありがとうございました. 3つのバランスが悪い バランスを整える