SlideShare a Scribd company logo
1 of 13
Download to read offline
contextual package
Japan.R
Shota Yasui
2018/12/1
Shota Yasui (@housecat442)
所属: Adtech Studio AILab
経歴:
2013年 CA新卒入社 広告事業本部
2015年 Adtech Studio 異動 DMP
2016年 Dynalyst(DSP)→ProfitX(SSP)
2017年 AILabで研究をスタート
元々は経済学と因果推論をやってました。
アドテクでは機械学習利用の設計や検証をしたり、
機械学習の知識を前提としたデータ分析をやってます。
2
そもそもバンディットとは・・・?
x
candidates
a,b,c,d
b Y
policy =
Predict + decision
slot
_1
slot
_2
slot
_3
slot_1
slot
_2
● ユーザーに見せる広告のテンプレートを決めたい
● 次々とくるユーザーに対して最も clickされそうなテンプレートを選択する
● 選ぶ→結果を見る→選ぶ→結果を見る→選ぶ・・・・を一定期間続ける
→逐次的に意思決定をする時に望ましい結果をなるべく大きくするようなアルゴリズム
活用と探索の話
slot
_1
slot
_2
slot
_3
slot_1
slot
_2
ABtest
CTR = 10%
CTR = 5%
slot
_1
slot
_2
slot
_3
t = 1 t = 2
割と良くやられている話・・・
どっちが良いか解らないからまずは ABテストで比較 よかった方を採用して使う
活用と探索
slot
_1
slot
_2
slot
_3
slot_1
slot
_2
ABtest
CTR = 10%
CTR = 5%
slot
_1
slot
_2
slot
_3
t = 1 t = 2
というかABテストのモチベーションはほとんど・・・
どっちが良いか解らないからまずは ABテストで比較 よかった方を採用して使う探索 活用
Contextual Package
● Banditのシミュレーションと、オフライン評価を行うもの。
○ 人工データ=シミュレーション(今日はこっち
○ 実データ=オフライン評価(いつもはこっちの話してます
● インストール方法
○ 一応CRANにもあるが
Epsilon-Greedy
● 選択肢の性能を評価して、最も良さそうなものを一定確率で選ぶ。
a. この確率をEpsilonと呼ぶ
● 選択肢の評価方法
a. 単純に集計する:click回数/表示回数 を選択肢ごとに算出
b. モデルで評価する:選択肢ごとに回帰モデルを作ってユーザーの情報とかを入れる
➡このふたつを比較するシミュレーションを行う
シミュレーションの設定を決める
シミュレーションのiteration回数を決める。2000回意思決定させる。
同じシミュレーションを何回繰り返すか決める。 50回
列が選択肢を表す。
→1列目は選択肢1がサンプルタイプ1で0.8の性能があり、他では 0.1しか性能がないことを示している。
行がContextを表す。
→1行目はサンプルタイプ1で、選択肢1が 0.8の性能があり他の選択肢は 0.1しか性能がないことを示す。
三つの腕と、三つのタイプのサンプルで、
それぞれの性能を決める。
シミュレーションのセットアップ
報酬が2値で、contextで報酬の期待値が変化する様な
バンディットシミュレーションを作る。
シミュレーションで評価したいアルゴリズムを決める。
● ContextualBinaryBandit$newで腕とデータの生成を行う。
● weightの設定に基づいて選択肢の登録やデータも勝手に作ってくれる。
● Agent$newで試したいシミュレーションを作れる。
○ EpsilonGreedyPolicy:単純集計で選択肢を評価する
○ ContextualEpsilonGreedyPolicy:回帰モデルで選択肢を評価する
○ 0.1は評価に関わらずランダムに選ぶ確率
シミュレーションのセットアップ
● Simulatorに作ったagentや設定を入れる。
● defaultでdoparallelがONなので注意
● $runでシミュレーションを実行
regretの結果
● 二つの方法の結果を比較
● 理想的な選択の結果からの悪化を regretと呼ぶ
● E Greedyはサンプルのタイプを気にせに全体平
均的に良いものを選ぶ。
● cE Greedyはサンプルのタイプごとに良いものを
モデルで見つける。
● 結果的に後者の方が圧倒的に悪化が小さい
→よりベターな選択ができている。
何が嬉しいのか?
● 色々な設定で検証ができる
○ 他の意思決定方法と性能を比較できる
○ Agentを自分で実装しなくて良いので楽
● 実問題を想定した評価もできる
○ Replay Methodの再現とかもできる
○ ランダムに選択したログをプロダクトからもらえば、バンディットでどの程度改善できそうかは示すこ
とができる。
Enjoy!

More Related Content

Similar to Contextual package

Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Kenji Noguchi
 
プロトタイピングツール投入のケーススタディ
プロトタイピングツール投入のケーススタディプロトタイピングツール投入のケーススタディ
プロトタイピングツール投入のケーススタディ力也 伊原
 
新卒採用を、まっとうに ー面接者への通信簿ー
新卒採用を、まっとうに ー面接者への通信簿ー新卒採用を、まっとうに ー面接者への通信簿ー
新卒採用を、まっとうに ー面接者への通信簿ー慧悟 岩本
 
20180730 ds womens
20180730 ds womens20180730 ds womens
20180730 ds womensRio Kurihara
 
Nds セッション サポートと品質_やまぴー
Nds セッション サポートと品質_やまぴーNds セッション サポートと品質_やまぴー
Nds セッション サポートと品質_やまぴーTakatoshi Yamada
 
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史Leading Edge Co.,Ltd.
 
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点- 『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点- Koichi Hamada
 
データサイエンスの現場で役立つスキルを磨きやすい職場環境
データサイエンスの現場で役立つスキルを磨きやすい職場環境データサイエンスの現場で役立つスキルを磨きやすい職場環境
データサイエンスの現場で役立つスキルを磨きやすい職場環境Masatoshi Abe
 
企業の中の経済学
企業の中の経済学企業の中の経済学
企業の中の経済学Yusuke Kaneko
 
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例BrainPad Inc.
 
ヒートマップで、アクセス解析・仮説検証力を磨く 先生:小原 良太郎
ヒートマップで、アクセス解析・仮説検証力を磨く 先生:小原 良太郎ヒートマップで、アクセス解析・仮説検証力を磨く 先生:小原 良太郎
ヒートマップで、アクセス解析・仮説検証力を磨く 先生:小原 良太郎schoowebcampus
 
Akira shibata at developer summit 2016
Akira shibata at developer summit 2016Akira shibata at developer summit 2016
Akira shibata at developer summit 2016Akira Shibata
 
ゼロイチ人材の存在意義と生存戦略
ゼロイチ人材の存在意義と生存戦略ゼロイチ人材の存在意義と生存戦略
ゼロイチ人材の存在意義と生存戦略Noritaka Shinohara
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標圭輔 大曽根
 
うそのアジャイル、まことのアジャイル 公開用
うそのアジャイル、まことのアジャイル 公開用うそのアジャイル、まことのアジャイル 公開用
うそのアジャイル、まことのアジャイル 公開用ESM SEC
 
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発BrainPad Inc.
 
失敗しない 3 次元 CAD 選びのポイントと Inventor を活用することで出来る作業の効率化
失敗しない 3 次元 CAD 選びのポイントと Inventor を活用することで出来る作業の効率化失敗しない 3 次元 CAD 選びのポイントと Inventor を活用することで出来る作業の効率化
失敗しない 3 次元 CAD 選びのポイントと Inventor を活用することで出来る作業の効率化Teruki Obara
 
深層強化学習 Pydata.Okinawa Meetup #22
深層強化学習 Pydata.Okinawa Meetup #22深層強化学習 Pydata.Okinawa Meetup #22
深層強化学習 Pydata.Okinawa Meetup #22Naoto Yoshida
 

Similar to Contextual package (20)

Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ
 
Tdc 20181121
Tdc 20181121Tdc 20181121
Tdc 20181121
 
プロトタイピングツール投入のケーススタディ
プロトタイピングツール投入のケーススタディプロトタイピングツール投入のケーススタディ
プロトタイピングツール投入のケーススタディ
 
新卒採用を、まっとうに ー面接者への通信簿ー
新卒採用を、まっとうに ー面接者への通信簿ー新卒採用を、まっとうに ー面接者への通信簿ー
新卒採用を、まっとうに ー面接者への通信簿ー
 
20180730 ds womens
20180730 ds womens20180730 ds womens
20180730 ds womens
 
Nds セッション サポートと品質_やまぴー
Nds セッション サポートと品質_やまぴーNds セッション サポートと品質_やまぴー
Nds セッション サポートと品質_やまぴー
 
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
 
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点- 『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
 
データサイエンスの現場で役立つスキルを磨きやすい職場環境
データサイエンスの現場で役立つスキルを磨きやすい職場環境データサイエンスの現場で役立つスキルを磨きやすい職場環境
データサイエンスの現場で役立つスキルを磨きやすい職場環境
 
企業の中の経済学
企業の中の経済学企業の中の経済学
企業の中の経済学
 
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
 
ヒートマップで、アクセス解析・仮説検証力を磨く 先生:小原 良太郎
ヒートマップで、アクセス解析・仮説検証力を磨く 先生:小原 良太郎ヒートマップで、アクセス解析・仮説検証力を磨く 先生:小原 良太郎
ヒートマップで、アクセス解析・仮説検証力を磨く 先生:小原 良太郎
 
Akira shibata at developer summit 2016
Akira shibata at developer summit 2016Akira shibata at developer summit 2016
Akira shibata at developer summit 2016
 
ゼロイチ人材の存在意義と生存戦略
ゼロイチ人材の存在意義と生存戦略ゼロイチ人材の存在意義と生存戦略
ゼロイチ人材の存在意義と生存戦略
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
 
ほめなれワーク
ほめなれワークほめなれワーク
ほめなれワーク
 
うそのアジャイル、まことのアジャイル 公開用
うそのアジャイル、まことのアジャイル 公開用うそのアジャイル、まことのアジャイル 公開用
うそのアジャイル、まことのアジャイル 公開用
 
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
 
失敗しない 3 次元 CAD 選びのポイントと Inventor を活用することで出来る作業の効率化
失敗しない 3 次元 CAD 選びのポイントと Inventor を活用することで出来る作業の効率化失敗しない 3 次元 CAD 選びのポイントと Inventor を活用することで出来る作業の効率化
失敗しない 3 次元 CAD 選びのポイントと Inventor を活用することで出来る作業の効率化
 
深層強化学習 Pydata.Okinawa Meetup #22
深層強化学習 Pydata.Okinawa Meetup #22深層強化学習 Pydata.Okinawa Meetup #22
深層強化学習 Pydata.Okinawa Meetup #22
 

More from Shota Yasui

PaperFriday: The selective labels problem
PaperFriday: The selective labels problemPaperFriday: The selective labels problem
PaperFriday: The selective labels problemShota Yasui
 
木と電話と選挙(causalTree)
木と電話と選挙(causalTree)木と電話と選挙(causalTree)
木と電話と選挙(causalTree)Shota Yasui
 
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)Shota Yasui
 
Factorization machines with r
Factorization machines with rFactorization machines with r
Factorization machines with rShota Yasui
 
Estimating the effect of advertising with Machine learning
Estimating the effect of advertising with Machine learningEstimating the effect of advertising with Machine learning
Estimating the effect of advertising with Machine learningShota Yasui
 
Xgboost for share
Xgboost for shareXgboost for share
Xgboost for shareShota Yasui
 
Dynamic panel in tokyo r
Dynamic panel in tokyo rDynamic panel in tokyo r
Dynamic panel in tokyo rShota Yasui
 
Rで部屋探し For slide share
Rで部屋探し For slide shareRで部屋探し For slide share
Rで部屋探し For slide shareShota Yasui
 

More from Shota Yasui (11)

PaperFriday: The selective labels problem
PaperFriday: The selective labels problemPaperFriday: The selective labels problem
PaperFriday: The selective labels problem
 
TokyoR 20180421
TokyoR 20180421TokyoR 20180421
TokyoR 20180421
 
木と電話と選挙(causalTree)
木と電話と選挙(causalTree)木と電話と選挙(causalTree)
木と電話と選挙(causalTree)
 
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)
 
Factorization machines with r
Factorization machines with rFactorization machines with r
Factorization machines with r
 
Estimating the effect of advertising with Machine learning
Estimating the effect of advertising with Machine learningEstimating the effect of advertising with Machine learning
Estimating the effect of advertising with Machine learning
 
Prml nn
Prml nnPrml nn
Prml nn
 
Xgboost for share
Xgboost for shareXgboost for share
Xgboost for share
 
Dynamic panel in tokyo r
Dynamic panel in tokyo rDynamic panel in tokyo r
Dynamic panel in tokyo r
 
Rで部屋探し For slide share
Rで部屋探し For slide shareRで部屋探し For slide share
Rで部屋探し For slide share
 
Salmon cycle
Salmon cycleSalmon cycle
Salmon cycle
 

Contextual package