Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

アドテクにおける機械学習技術 @Tokyo Data Night #tokyodn

9,561 views

Published on

ソネット・メディア・ネットワークスではデータをいじり倒したい機械学習エンジニア・データサイエンティスト募集中です!
https://www.wantedly.com/projects/26975
---
アドテク領域、とくにReal Time Bidding(RTB)の世界でどのように機械学習が使われているのか(使えるのか)を概観します。

Published in: Technology
  • Be the first to comment

アドテクにおける機械学習技術 @Tokyo Data Night #tokyodn

  1. 1. アドテクにおける機械学習技術 2015.7.23 ソネット・メディア・ネットワークス株式会社 舘野 啓
  2. 2. 2015/7/23 • 舘野 啓 (たての けい) – ソネット・メディア・ネットワークス 所属 – @f_g_hollyhock (連絡用) • 経歴 – 2003.6~2012.3 某メーカー研究所にて機械学習やパーソナライゼーション/リコメンデーション技術 の日々 – 2012.4~2014.7 新規事業立ち上げでもがく(含むSan Franciscoでの活動) – 2014.10~ ソネット・メディア・ネットワークスにてアドテク業界に足を踏み入れる • 好き 自己紹介
  3. 3. 2015/7/23 3 • Demand Side Platform(DSP) “Logicad” の パワーアップ&新機能・新サービス開発 業務紹介 http://www.so-netmedia.jp/company/news/2015/pr_release_20150707.html “潜在顧客ターゲティング”
  4. 4. アドテクにおける機械学習技術 2015/7/23 4
  5. 5. 2015/7/23 5 • お話の内容 – Web広告、特にRTBの仕組みのどんなところに機械学習が使わ れているのか? • お話のターゲット – “アドテク” “機械学習”の言葉ぐらいは知ってるソフトウェア エンジニア • 今日は気にしないこと – 「そもそもネットの広告って・・・」 – 未来の広告の形、マーケティングソリューションのあり方 – アルゴリズムの詳細 – RTB/ビッグデータ分析のためのシステム [12] • 個人の見解です はじめに
  6. 6. 2015/7/23 6 • 機械学習 – ≒ 未知のものを予測するためにデータから学習する ための技術 • "学習"と"予測"って? 機械学習とは サンプル 特徴量 知りたいこと ? 学習アルゴリズム 予測 モデル 予測結果未知サンプル 教師データ
  7. 7. DSP demand side platform DSP demand side platform 2015/7/23 7 Real Time Bidding(RTB)とは SSP supply side platform DSP demand side platform 広告主 A 広告主 B ─── ─── ─── ─── ─── ─── 枠 ad a1 ad a2 ad b1 ad b2 auction ad ─── ─── ─── ─── ─── ─── ¥a ¥b 広告を表示する サイト こちらもご参考に:[1][2]
  8. 8. DSP demand side platform DSP demand side platform 2015/7/23 8 機械学習とRTB SSP supply side platform DSP demand side platform 広告主 A 広告主 B ─── ─── ─── ─── ─── ─── 枠 ad a1 ad a2 ad b1 ad b2 auction ad ─── ─── ─── ─── ─── ─── ¥a ¥b 広告を表示する サイト どんな広告を (what) 誰に (who) いつ (when) 幾らで (how much) どこ{で,に} (where) なぜ (why)メディア・ユーザ・広告主がハッピーになる ためには決めなきゃいけないことたくさん
  9. 9. • RTBにおいて学習したいもの: 行動を引き起こす5W1Hのモデル 2015/7/23 9 機械学習とRTB 𝑷 act user, ad, context ) 誰に (who) どんな広告を (what) いつ (when) 行動 (クリック, CV etc.) 幾らで (how much) 決定 なぜ(why) どこ{で,に} (where)
  10. 10. 2015/7/23 10 機械学習とRTB サンプル 特徴量 act 学習アルゴリズム 予測モデル user ad context 𝑷 act user, ad, context )未知サンプル user ad context 予測結果 act ─── ─── ─── ─── ─── ─── 枠 ad a1 ─── ─── ─── ─── ─── ─── 枠 ad a2 ad b1 ad c3 ─── ─── ─── ─── ─── ─── 枠 ─── ─── ─── ─── ─── ─── 枠 ─── ─── ─── ─── ─── ─── 枠 ad a1 教師データ 入札額 (how much) who, what, when, where
  11. 11. 2015/7/23 11 • 事実ベース – 事前に定義可能な”セグメント”に対して配信 – e.g. リターゲティング※ • 広告主サイトに訪れたユーザに配信(刈り取り) – e.g. オーディエンスターゲティング • 性別・年齢・興味カテゴリなどの属性で指定して配信 • 属性は予測したものも含む • 行動予測ベース – 広告をクリックしそうな人、コンバージョン(CV; 商品購入など)しそうな人を機械学習などで予測[3] して配信 – e.g. ロジスティック回帰モデルによるクリック予測 Who:誰に広告を出すか? ※“リターゲティング”はマイクロアド社の登録商標です
  12. 12. 2015/7/23 12 • 広告のコストパフォーマンスを最大化するに は? – →広告の影響を受ける人を見つけるモデル[4][5] Who:誰に広告を出すか? 行動する 放っておいてもOK 広告の影響を受ける 行動しない あまのじゃく 何しても無駄 行動する 行動しない 広告を 見た場合 広告を見なかった場合 ユーザのタイプの分類
  13. 13. 2015/7/23 13 • インサイトの抽出: 広告主が自身の顧客がどんな人たちかを知り たい – ⇒効いている特徴量で説明 • だいたいわけがわからない – ⇒クラスタリングして名前を付ける • だいたいわけがわからない or 難しい Who:広告に反応したのはどんな人か? 要は何? 統計と 意味の 谷
  14. 14. 2015/7/23 14 • どんな広告= {広告主, 商材, クリエイティブ} – 広告主や商材(の種類)などは特徴量として学習される – RTBでは広告主の意図(入札金額の大小)が入るので、 常にユーザにとって最適な広告が出るわけでは無い – ⇒ここではクリエイティブにfocus • クリックしやすい広告・記憶しやすい広告 – 位置, サイズ, アニメーション, 色, わかりやすさ etc. [6] – まだまだノウハウと感性の領域 ⇔ 解明する余地大 • Deep Learning, 認知科学, 感性工学,・・・? What:どんな広告を出すか?
  15. 15. 2015/7/23 15 What:どんな広告を出すか? • ダイナミッククリエイティブ – 複数商品の写真などを組み合わせて一 つのバナーを動的に生成 – どう組み合わせるか? e.g. 閲覧した商品+ ユーザにおすすめの商品 • “ユーザにおすすめの商品”? – そのユーザが買いそう・気に入りそう な商品を予測 • Jaccard係数などによる商品相関 (“この商品を買った人はこんな商品も 買っています”) • 行列の穴埋め問題として行列分解(Matrix factorization) [7]
  16. 16. 2015/7/23 16 • どんなクリエイティブが効果的かを知る – A/Bテスト • どちら(どれ)がbetterな選択肢なのかを統計的な妥当 性を担保して決定する • 選択肢すべてを平等に試して比較 ⇒選択肢が膨大な場合無駄打ち大=コスト大 – Multi Armed Bandit • なるべく少ないコストで有望な選択肢を決める手法 • e.g. (ダイナミッククリエイティブのように)多様な組 み合わせからベストなものを選ぶ [8] – 色, 配置, 形, パターンなど What:どんな広告を出すか?
  17. 17. 2015/7/23 17 • どこに =どの枠(ドメイン, サイト, ページ内の位置)に – 効果の高い枠は? • 特徴量として学習 – そもそもそこは出すべき面か?:ad verification • 見えない場所に表示しても意味が無い(viewability) [9] • 不正(ad fraud; botによるクリックetc.)が無いか • ブランドにとって不適切なコンテンツでないか • 広告の意図にマッチした内容かどうか – e.g. 飛行機事故の記事に航空会社の広告は・・・ • ⇒自動 vs. 手動 • どこで=ユーザの位置情報 – モバイル+Online-to-Offline(O2O)などでの活用 • e.g. Shufoo! http://www.shufoo.net/ Where:どこ{に,で}広告を出すか?
  18. 18. 2015/7/23 18 • どんなタイミングで提示すれば受け入れやすい か? – 適切な間隔 (frequency, recency, 時刻 etc.) • あまり大量に/頻繁に同じ広告を出されるとウザい etc. – ユーザの状態(センシング情報などから推定)に応じて 変化する [10] • CRM的な観点での広告利用 – e.g. 以前買った洗剤がちょうどなくなるころにおす すめ(imp)する – e.g. サービスのリマインド When:いつ広告を出すか?
  19. 19. 2015/7/23 19 • ユーザの受け入れやすさに関わる(と思われる) – Golden circle的な意味でも • が・・・ – しつこいRT広告→わかっててもウザくなってくる • 「この商品確かに見たけどさ!」 – 大量の手がかり(特徴量)をベースにする機械学習は ”なぜ”をひねり出すのは苦手 • ⇒“なぜ”が問われない広告 – 「あなたの友達の○○さんがいいね!しています」 – ネイティブ広告 • メインコンテンツに違和感なく溶け込む – 動画広告 • コンテンツとして面白い Why:なぜその広告が出たのか?
  20. 20. 2015/7/23 20 • 理想の入札金額:アクション期待価値 – e.g. 目標CPC 100円 × クリック確率 0.1% → 0.1円で入札 – sealed bid & second-price auctionにおいて理論上最適 な戦略 • 実は入札金額で“誰に”出すかは決まる – e.g. 0円でbid=セグメント外 – ただし計算リソースの節約、予算消化の予測、広告主側の 理解etc.によりセグメントを事前に作ることに意味はある How much:いくらで広告を出すか? 𝑷 act user, ad, context ) 広告主にとっての ユーザのアクション価値(金額) 広告提示に対して アクションする確率
  21. 21. 2015/7/23 21 • 発展形 [11] – RTBのすべての事象を確率的にシミュレーションし、 予算内でアクション(クリックやCV)数を最大化する ような入札戦略 b() を学習 How much:いくらで広告を出すか? どんなユーザが どんな頻度で枠 を見るか impしたときに アクションする確率 𝑷 act user, ad, context ) 入札金額 入札の 勝率 ad c3 ─── ─── ─── ─── ─── ─── 枠 𝒙 =
  22. 22. 2015/7/23 22 • 機械学習タスクとして – 大量データ • 1011~トランザクション/月 – 大規模特徴量 • e.g. 広告枠のドメイン数 105~ – 少数の正例 • キャンペーンごとのCV数 数十~数百 だったり • 時間方向の最適化 ⇒ 個人に寄り添った情報提供 – e.g. Life Time Value最大化, 順番を考慮した情報提示 • “統計と意味の谷”の解消 – エンドユーザ側 / 広告主側 これからの課題
  23. 23. 2015/7/23 23 • 𝑷 act user, ad, context ) を頑張ってます • 課題は山積み、やりがい特大 – エンドユーザも広告主も人間、技術だけ突き 詰めても(今は)限界が・・・ • 技術とビジネスが直結するexcitingな 領域です! まとめ
  24. 24. 2015/7/23 24 • [1] アドテク勉強会 http://goo.gl/vFqPRs • [2] 「今さら聞けない ! 」マーケティング担当者のためのアドテクノロジー (1) アドテクノロジーの歴 史 - アドネットワークの誕生まで | マイナビニュース http://goo.gl/PYQqxJ • [3] Chapelle, O., et al., Simple and scalable response prediction for display advertising, ACM TIST, 2015. • [4] Radcliffe, N. J., et al., Real-World Uplift Modelling with Significance-Based Uplift Trees, StocasticSolutions.com, 2011. http://goo.gl/GjSWN4 • [5] 里, Uplift Modelling 入門(1), 2012. http://goo.gl/h2F572 • [6] Nihel, Z., The Effectiveness of Internet Advertising through Memorization and Click on a Banner, Int. J. of Marketing Studies, 2013. • [7] Koren, Y., et al., Matrix factorization techniques for recommender systems, Computer, 2009. • [8] Auer, P., Using confidence bounds for exploitation-exploration trade-offs, JMLR, 2002. • [9] The Importance of Being Seen, 2014. https://goo.gl/f6kWyQ • [10] Pejovic, V., et al., InterruptMe : Designing Intelligent Prompting Mechanisms for Pervasive Applications, UbiComp, 2014. • [11] Zhang, W., et al., Optimal Real-Time Bidding for Display Advertising, KDD, 2014. • [12]クラウド技術を活用したリアルタイム広告 Logicad の入札・配信・ログ解析 #awssummit http://goo.gl/uGVct 参考文献

×