Recommended
PDF
強化学習勉強会・論文紹介(第30回)Ensemble Contextual Bandits for Personalized Recommendation
PDF
PDF
Big Data Bootstrap (ICML読み会)
PDF
PDF
Contexual bandit @TokyoWebMining
PDF
PDF
PDF
PPTX
KDD 2016勉強会 Deep crossing
PDF
Tokyowebmining ctr-predict
PDF
PRML上巻勉強会 at 東京大学 資料 第5章5.1 〜 5.3.1
PDF
PDF
PDF
強化学習勉強会・論文紹介(第50回)Optimal Asset Allocation using Adaptive Dynamic Programming...
PDF
【強化学習】Montezuma's Revenge @ NIPS2016
PDF
PDF
PDF
PPTX
Creator's night 05 31 2013
PDF
PPTX
Elastic Beanstalkでアプリ/インフラかんたん一括管理
PPT
Hadoop World 2011: Large Scale Log Data Analysis for Marketing in NTT Communi...
PDF
PDF
PDF
WSDM 2016勉強会 Geographic Segmentation via latent factor model
PDF
1994年頃の電子書籍(LT『本を読む人々 Vol.3』)
PDF
Exreme coffee brewing 2013 summer
PDF
eXtreme Coffee Brewing 2014 summer
PDF
L 05 bandit with causality-公開版
PPTX
Pycon reject banditアルゴリズムを用いた自動abテスト
More Related Content
PDF
強化学習勉強会・論文紹介(第30回)Ensemble Contextual Bandits for Personalized Recommendation
PDF
PDF
Big Data Bootstrap (ICML読み会)
PDF
PDF
Contexual bandit @TokyoWebMining
PDF
PDF
PDF
Viewers also liked
PPTX
KDD 2016勉強会 Deep crossing
PDF
Tokyowebmining ctr-predict
PDF
PRML上巻勉強会 at 東京大学 資料 第5章5.1 〜 5.3.1
PDF
PDF
PDF
強化学習勉強会・論文紹介(第50回)Optimal Asset Allocation using Adaptive Dynamic Programming...
PDF
【強化学習】Montezuma's Revenge @ NIPS2016
PDF
PDF
PDF
PPTX
Creator's night 05 31 2013
PDF
PPTX
Elastic Beanstalkでアプリ/インフラかんたん一括管理
PPT
Hadoop World 2011: Large Scale Log Data Analysis for Marketing in NTT Communi...
PDF
PDF
PDF
WSDM 2016勉強会 Geographic Segmentation via latent factor model
PDF
1994年頃の電子書籍(LT『本を読む人々 Vol.3』)
PDF
Exreme coffee brewing 2013 summer
PDF
eXtreme Coffee Brewing 2014 summer
Similar to Introduction to contexual bandit
PDF
L 05 bandit with causality-公開版
PPTX
Pycon reject banditアルゴリズムを用いた自動abテスト
PDF
効果のあるクリエイティブ広告の見つけ方(Contextual Bandit + TS or UCB)
PDF
PPTX
Pydata_リクルートにおけるbanditアルゴリズム_実装前までのプロセス
PDF
More from 正志 坪坂
PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF
A scalable probablistic classifier for language modeling: ACL 2011 読み会
PDF
Complex network-reading 7
PDF
PDF
PDF
Cvpr2011 reading-tsubosaka
Introduction to contexual bandit 1. 2. 3. 4. 5. 6. 7. Contextual bandit
• 各armの選択の際にcontext 𝑥が与えられているという
設定
• context情報が与えられている場合、例えば線形モデ
ルを使って広告のCTRを以下のように予測する
– 代表的なアルゴリズムとしてLinUCBがある
広告CTR = 0.1 * 男性 + 0.01 * 女性
広告CTR = 0.05 * 男性 + 0.05 * 女性
8. 9. シミュレーション
• 設定
– トラフィック70%男性, 30%女性
– 広告1: 男性CTR 10%, 女性CTR 2%
– 広告2: 男性CTR 2%, 女性CTR 10%
– context 二次元ベクトルで男性もしくは女性を表
す
• 男性なら(1,0), 女性なら(0,1)
10. 11. 参考資料
• A contextual-bandit approach to personalized
news article recommendation, WWW 2010
– LinUCBに関する論文
• An empirical evaluation of thompson sampling,
NIPS 2011
• Content recommendation on web portal,
CACM 2013