More Related Content
Similar to 2018人工知能学会合同研究会発表資料
Similar to 2018人工知能学会合同研究会発表資料 (14)
More from Takanori Fukui (6)
2018人工知能学会合同研究会発表資料
- 16. ログから抽出された要素
要素数 要素の例
投票者の発言 16 (非)同意発言,役職予想発言,占い結果発言,
役職宣言発言投票先候補者の発言 16
投票先候補者が
受けている発言
18 被投票数,被(非)同意発言数,
被役職予想発言数,被占い結果発言数
ゲームの状況 1 占い師宣言したプレイヤ数
※占い結果 2 投票先候補者に出た判定
ログから抽出された要素数と例
16
提案手法
◦ 学習データの整形
1日目の要素数
- 27. 抽出データ数
日数 役職 件数
1日目 村人 120,000
占い師 60,000
裏切り者 60,000
人狼 60,000
2日目 村人 6,796
占い師 7,466
裏切り者 9,850
人狼 12,056
27
提案手法
◦ 学習データの整形
Editor's Notes
-
一般的に人狼ゲームとはプレイ同士が顔を合わせて話すコミュニケーションゲームの一つです.
村人役と人狼役の2つの陣営に分かれ,話し合いによって,他のプレイヤの正体を探りつつ,村人と人狼は互いの排除を目指します.
人狼ゲームには一人のプレイヤに一つずつ役職が決められ,
村人,人狼,の他に占い師と裏切り者という役職があります.
- 人狼ゲームでは参加プレイヤ同士の会話があり,2分ほどの制限時間を設けて,行われます.
会話終了後,各プレイヤは追放したいプレイヤに対して投票し,多数決によって追放されるプレイヤが決定されます.
本研究では,この投票による追放に着目しました.
- 本研究の目的は参加プレイヤが会話した内容を踏まえて,適切な投票先決定ができる推論モデルの構築です.
一般的に人狼ゲームは5人から十数名でプレイするゲームですが,本研究では5人プレイヤで行われる人狼ゲームを対象とします.
- また,対象とするプラットフォームを人狼知能プラットフォームとします.
人狼知能プラットフォームとは,人狼知能プロジェクトから提供されている人工知能エージェント同士の対戦ができるプラットフォームです.
いくつかの定型文を用いて会話をし,人工知能エージェント同士の対戦が実現できます.
人狼知能プラットフォームでは,エージェントの作成のためのJavaパッケージの提供,エージェント同士の対戦環境が用意されています.
また,対戦のログを出力するため,デバック作業や,エージェントの動作確認,エージェントの対戦状況を振り返ることができます.
- 本研究で解決させる問題点を述べます.
人狼ゲームはコミュニケーションゲームのため,様々な発言が行われます.
そのため,全ての発言を想定して投票先を決定することは困難です.
また,村人の場合は人狼だと思う人に投票する のに対して
人狼の場合は,投票されやすそうな人に投票するなど,自身の状況も踏まえた上で投票先の決定をする必要があります.
このように,
会話は多岐にわたるため,会話を総括して投票先を決定することが困難である問題があります.
また,自身の役職に合わせて投票先の判断基準も変える必要があります
- 3’05
後何をやるのかを明確にする
自分がやる仕事と引き継ぎの仕事を考えておく
- 本研究で提案する推論モデルは,参加者エージェントの会話と,投票者,投票先を入力として取り込み,各プレイヤに対して投票する確率を出力するモデルです.
この推論モデルにはベイジアンネットワークを用います.
- ベイジアンネットワークとは,不確実性を含む事象の予測や合理的な意思決定などに利用できる確率モデルのことです.
ある,確率変数をノードとしたとき,確率変数間の依存関係をリンクで示します.
本研究では確率変数に発言などの要素を当てはめ,依存関係を対戦のログデータから推定します.
- ベイジアンネットワークの構造や依存関係を推定するために,学習データを作成します.
学習データは2018年8月に開催された5人プレイヤによる人狼のログデータを用います.
[ ENTER ENTER ]
学習データの変換 学習データの準備 ログデータから学習データの整形 ログデータから学習データの抽出
丸々の学習データの作成
丸々の抽出など
ーーーーー
このスライドと前のスライドのつながりが薄い
解決できない
- [ ENTER ]
- 学習データの作成手順は大きく3つの手順に分かれます.
1つ目は,人狼知能大会のログから会話の要素を抽出する
2つ目は,
3つ目は,
となります
それぞれについて説明します.
- まず要素の抽出です.
- あるプレイヤに投票する際に,考慮すべき会話,状況を要素としてログデータより抽出します.
要素は4つに大別されます.
一つは投票者自身の発言,2つ目
ポインタ必須
は投票先候補者の発言,3つ目は投票先候補者が受けている発言,4つ目にゲームの状況からなります.
- これらのログから抽出された要素の数と例を示します.
定義した要素数は合計で41個あります.
占い師という役職のみ,占い結果という形で情報を得ることができるため,これを加えて43個となります.
(候)を加える
または候補者
- また2日目は1日目の要素に加えて,2日目の要素を抽出するため,倍数の82個,占い師のみ86個の観測要素を抽出します.
観測要素は 要素 または 観測された要素 とする
- 抽出手順を示します.
まず,投票者1番が投票候補者2番へ投票すると仮定して,観測要素に従って値を取得します.
取得された値が1レコードとなります.
- 抽出手順を示します.
まず,投票者1番が投票候補者2番へ投票すると仮定して,観測要素に従って値を取得します.
取得された値が1レコードとなります.
- 抽出手順を示します.
まず,投票者1番が投票候補者2番へ投票すると仮定して,観測要素に従って値を取得します.
取得された値が1レコードとなります.
- これらの手順から抽出されたレコードの最後に,実際に投票を行ったかを加えます.
投票した場合を1,していない場合を0とします.
1ゲーム文のログから20行,2日目はプレイヤが追放や襲撃により3名となるため,6行分のレコードが抽出されます.
- 次に手順2のデータの分割です.
- 人狼ゲームは1日目で終わる場合と2日目で終わる場合があります.
そのため,日別で抽出データを取得します.
- さらに,役職ごとに投票する基準や重視する情報が変わるため,別々にベイジアンネットワークを作成する必要があると考え,
役職別に分割します.
これにより,データセットは8つに分割されます.
- 抽出されたデータ数はこの表のようになります.
村人は5人中2人いるため,他の役職の倍数となっています.
また,2日目はゲームが1日目で終わる場合があるため,それぞれバラバラの件数となります.
- 最後に手順3の決定木分析について説明します.
- これらの抽出された観測要素は投票先の決定に必要な要素かは不明です.
そこで,決定木分析を行い,投票先決定に強く影響している観測要素を取り出します.
強く影響している よりよく分けられる の 違い
- 決定木分析とは,
決定木分析は,目的変数の値をよりよく分割する説明変数から順に木を構成するため,
決定木の浅い順から要素を選出することで,目的変数に強く影響している説明変数を取り出すことができると考えます.
- 本研究では目的変数に投票したかの列とし,説明変数に要素を当てはめ,決定木分析を行いました.
- 本研究では決定木分析かの浅い順から10個,15個,20個を選出し,評価実験を行います.
そのため,8つのデータセットに対して,3つの選出数をかけ,24個のデータセットを準備します.
24個のデータセットそれぞれでベイジアンネットワークを構築し,評価実験を行います.
- 9'24
学習データの作成が終わり,24個の学習データを用いてそれぞれベイジアンネットワークを作成します.
- 人工知能エージェントが推論モデルとして用いる時には,
投票を決定する前に,収集可能な要素の値を取得し,投票者,投票先を加えて,ベイジアンネットワークに入れます.
観測要素を入れる というよりは 会話や投票者’とウヒョうっ先を入力して...とする
- その後,ベイジアンネットワークから「実際に投票した確率」を取り出し,最も投票確率が高いプレイヤに投票をします.
- 9’50
提案した推論モデルの有効性を評価実験にて確かめます.
- 提案した推論モデルは大会のログデータから作成されています.
そのため,この推論モデルの組み込んだエージェントは勝率が上がると考えられます.
また,勝率が上がるためには,適切な投票先に投票する必要があります.
そのため,適切な投票先に投票することができると考えられます.
- 前のスライドの内容を踏まえて,評価方法を2つ実施しました.
1つ目は人狼知能プラットフォーム上で推論モデルを組み込んだ人工能エージェントと,大会上位4名による対戦を行います
また,推論モデルを搭載していないエージェントも用意し,本提案モデルを組み込んだエージェントとの勝率の差を確認します.
2つ目は人狼知能対戦を行った対戦ログ結果を読み,
会話に基づく投票先決定ができているかを確認します.
先ほどお話ししたようにn
- 人狼知能対戦の比較実験を行うために,4対のエージェントを用意しました.
- 人狼知能対戦の比較実験を行うために,4対のエージェントを用意しました.
1つ目はNonSpeak
- ある程度 適切な(適当な)会話を行う その場に沿った会話をする
- 4対のエージェントをまとめると,
- 対戦環境は,対戦上位4名と実験エージェント1名を交換しながら対戦を行います.
1セット1,000回の対戦をし,10セット試合を行います.
その後,有意差を測ります.
- まずはじめに,村人陣営の役職,NonSpeakエージェントとNonSpeak_w/BNエージェントの勝率とその差です.
村人のNonSpeakエージェントの勝率は58.8%に対して,本推論モデルを組み込んだエージェントは要素数20で83.7%,差は24.8%となり,有意差検定を行ったところ,有意差が確認できました.
また占い師も要素数が多い時に最も高い勝率を得ました.
- 続いてサンプルエージェントと,Sample_w/BNの勝率の差です.
こちらも同様に要素数が20の時に高い勝率を得ました.
しかし,村人の要素10と15の時に勝率が下がるという結果が出ました.
これは人狼に投票するために必要な要素がなかったため,適切な投票ができなかったからだと考えます.
- 反対に,人狼陣営の勝率結果です.
NonSpeakエージェントの勝率は3.6%に対して要素数15の時NonSpeak_w・BNの勝率は6.6%と3%の向上が見られました.
ここで要素数が20の時に勝率が下がっています.
これは,裏切り者の要素数が増えることで,裏切り者らしい投票が行われる結果
他のプレイヤに裏切り者であることが判明してしまい,勝率の低下を招いていると考えられます.
- 次にsampleの勝率平均とsample w BN の勝率平均,その差です.
先ほどと同じように要素数15の時に勝率が最も高く,
要素数20の時には平均勝率が下がるという結果が出ました.
人狼の場合も,人狼らしい投票をしている結果,他のプレイヤに人狼だということがわかってしまうために,勝率が下がってしまっていると考えられます.
- 評価実験で得られたログを確認したところ,いくつかの行動が見られました.
そのうちの一つは占い師を宣言していないプレイヤに対して投票をしていることです.
これは,占い師を宣言しているプレイヤは本当の占い師か,裏切り者である可能性が高いという人狼ゲームにおける定説に従い,
何も宣言していない2人のプレイヤのどちらかに投票を行っています.
このように村人陣営の役職では,人狼に対して投票を行っていることが確認できました.
ログ分析(評価実験に基づく考察)(ログ分析)
なぜそれがいいのか
口頭部分をスライドに書く
城跡という単語を抜く」
定石という言葉は抜けない
- 反対に人狼陣営の場合です.
人狼から本当の占い師が判明した場合,占い師に投票をしていることがわかりました.
人狼にとって占い師は積極的に村から追放したい役職となるため,このプレイヤに投票をすることは合理的な判断と言えます
しかし,占い師宣言したプレイヤは他のプレイヤから投票されないため,多数決により追放ができません.
これにより,人狼の投票は意味がなく,勝率の貢献ができません.
本研究の目的であった.「投票されやすそうなプレイヤに投票する」は達成できていないことを確認しました.
スライドに結論まで乗せる
- 人狼陣営では勝率の向上があったが,,,
- 今後の課題として,観測要素の選定が不十分である問題があります.
本研究では,最大で20個の観測要素を利用しましたが,より多くの観測要素での勝率変化を確認する必要があります.
また,選定方法についても検討の余地があります.
2つ目に学習データの精査です.
人狼が適切な投票ができない問題に対して,学習データの選定が必要です.
例えば,適切な投票先決定ができているデータのみ収集する,人狼が勝利したログのみを用いて学習をするなどです.
3つ目に推論モデルの応用です.
本研究で提案したモデルは自分ではない参加者プレイヤに当てはめることで,そのプレイヤがどこに投票するかを知ることができます.
これにより,こちらから特定の発言をすることで,相手の投票先を誘導することができると考えています.
また,投票先の決定だけでなく,たの意思決定にも応用することが期待されます.
発表は以上です.ありがとうございました.
3つのバランスが悪い
バランスを整える