Webと経済学:
経済主体の意思決定に影響する推薦システム
株式会社サイバーエージェント 秋葉原ラボ
數⾒ 拓朗
WWW-2019 論⽂読み会
⾃⼰紹介
l 數⾒ 拓朗(かずみたくろう)
• 技術本部 秋葉原ラボ
• 経済学(博⼠) → 現職
l おしごと
• ⾃然⾔語処理技術を利⽤したプロダクトの開発
l しゅみ
• スマブラSP
• サッカー
• 漫画‧アニメ
2
取り上げる論⽂と問題意識
l ゲーム理論の視点から⾒た推薦システム
• Immorlica, N. Mao, J. Slivkins, A. Wu Z. S. 2018
Bayesian Exploration with Heterogeneous Agents
l 本発表では、状況設定や問題意識の注⽬して、推薦システムを
ゲーム理論を通じてどのように解釈しているかを明らかにします
3
はじめに
4
はじめに:経済主体の意思決定への介⼊
l 経済主体の意思決定に影響を与えるとは?
5
商品を売りたい店員 商品の購⼊を検討している客
商品の性能
他店の価格
etc.
ニーズ
①推定
コミュニケーションによって経済主体の予想を変化させる
②メッセージの選択
③⾏動の選択
購⼊ or not
はじめに:経済主体の意思決定への介⼊
6
情報提供者
1. 必ず役⽴つ
2. おそらく役⽴つ
3. 役に⽴たない
シグナルの選択
l 情報提供者のメッセージ = シグナル
意思決定者
③⾏動の選択
タイプ
情報提供者の期待利得を最⼤するシグナル = 最適シグナル
推定
メカニズムデザインと意思決定のフロンティア:第4章「最適シグナル」より
はじめに:最適シグナルの分析例
l ユーザのタイプは最適シグナルにどのような影響を与えるか?
• ユーザのタイプが公開されているケース
• ユーザのタイプがゲームが進⾏するにつれて公開されるケース
• ユーザのタイプが秘匿されているケース
l 意思決定者にある⾏動をとらせたい場合、どのような情報提供が
必要か?
• 情報提供者による推奨⾏動以外をとるインセンティブが、意思決定にない
ことを前提とする
7
はじめに:インターネットサービスの解析例
l 推薦システム
• [EC 2016] Moansour, Y. Slivkins, A. Syrgkanis, V. & Wu, Z. S.
“Bayesian Exploration: Incentivizing Exploration in Bayesian Games”
• [WWW 2019] Immorlica, N. Mao, J. Slivkins, A. Wu, Z. S.
“Bayesian Exploration with Heterogeneous Agents”
• 情報提供者 = 推薦システム、意思決定者 = ユーザ、シグナル = ⾏動履歴
l インターネット広告:広告(出稿位置やデザインなど)
• [JPE 2010] Ryao, L. & Segel, I. “Optimal Information Disclosure”
• 情報提供者 = 広告プラットフォーム、意思決定者 = ユーザ、シグナル = 広
告‧デザインなど
8
具体例
9
推薦ゲーム:設定
l 状態‧タイプを考慮しながら、ユーザに⾏動を推奨する
10
1. 起こりうる状態の集合 : Ω = 𝜔$, 𝜔&
2. 選択可能な⾏動の集合 : 𝐴 = 𝑎$, 𝑎&
3. ユーザのタイプの集合 : Θ = 𝜃$, 𝜃&
4. ユーザの利得関数 : 𝑢(𝑎-, 𝜔., 𝜃/)
5. 状態の事前予想の確率分布 : ̅𝜇 ∈ 𝒟 Ω
6. タイプの事前予想の確率分布 : ̅𝜌 ∈ 𝒫 Θ
以下のケースでは、 ̅𝜇 𝜔$ =
&
7
, ̅𝜌 𝜃$ =
&
7
と考える.
推薦ゲーム:設定
11
主体 ⾏動
1 意思決定者 タイプ 𝜃$, 𝜃& を持つユーザが推薦ゲームに参加
2 情報提供者 ⾃⾝の期待利得を最⼤にするような推奨⾏動を意思決定者に提⽰
3 意思決定者 メッセージを受け取り、利得が最⼤になる⾏動𝐴を選択
4 情報提供者 意思決定者の選択した⾏動と利得を観察
主体 ⾏動
1 情報提供者 R1のシグナルより、状態と意思決定者のタイプについての信念を更新
2 情報提供者 ⾃⾝の期待利得を最⼤にするような推奨⾏動を意思決定者に提⽰
3 意思決定者 メッセージを受け取り、利得が最⼤になる⾏動𝐴を選択
4 情報提供者 意思決定者の選択した⾏動と利得を観察
Round 1
Round 2
推薦ゲーム:Round 1
l 具体的に、利得は以下のように設定
l Round 1
12
𝑎$ 𝑎&
𝜃$ 3 4
𝜃& 2 0
𝑎$ 𝑎&
𝜃$ 2 0
𝜃& 3 4
𝜔$のとき 𝜔&のとき
𝑎$を推奨したときの期待利得 : ̅𝜌 𝜃$ 3 ̅𝜇 𝜔$ + 2 ̅𝜇 𝜔& + 1 − ̅𝜌 𝜃$ 2 ̅𝜇 𝜔$ + 3 ̅𝜇 𝜔& ①
𝑎&を推奨したときの期待利得 : ̅𝜌 𝜃$ 4 ̅𝜇 𝜔$ + 0 ̅𝜇 𝜔& + 1 − ̅𝜌 𝜃$ 0 ̅𝜇 𝜔$ + 4 ̅𝜇 𝜔& ②
∴ ̅𝜇 𝜔$ =
&
7
, ̅𝜌 𝜃$ =
&
7
より,①>②.推薦システムの最適シグナルは⾏動𝑎$
𝛚 𝟎が実現すると考えている確率
𝛚 𝟏が実現すると考えている確率
𝛚 𝟎が実現したときのユーザの期待利得 𝛚 𝟏が実現したときのユーザの期待利得
推薦ゲーム:Round 2
l タイプの秘匿は最適シグナルにどのような影響を与える?
l ユーザのタイプが明かされているとき:
• ユーザのRound 1における報酬とタイプから、推薦システムは𝜔$と𝜔&のど
ちらの状態が実現したかを知る
• ユーザのタイプに応じて最も報酬の⾼い 𝜃$, 𝑎& もしくは 𝜃&, 𝑎& を推奨で
きる
l ユーザのタイプが明かされないとき:
• 推薦システムの状態についての情報が更新されずに、 𝑎Cを推奨し続けるこ
とになる
13
おわりに
14
まとめと雑感
l まとめ
• 最適シグナルの観点から推薦システムの理論的解析を試みた論⽂を紹介
• 情報提供者を推薦システム、意思決定者をユーザ、シグナルをユーザ⾏動
履歴と解釈
l 雑感
• 今回の論⽂は、理論的解析にのみスポット
• ゲーム理論の視点がインターネットサービスを良くする?
⁃ Uberの「謝罪モデルと実証分析」論⽂(Halperlin, et al., 2018)のように、インターネッ
トサービスにおける現象(情報の⾮対称性など)をモデル化し施策につなげた例
15

Webと経済学 數見拓朗