Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Masakazu Sano
PPTX, PDF
4,324 views
Mlct 20150430v2
Machine Learning Casual Talks #3
Data & Analytics
◦
Read more
10
Save
Share
Embed
Embed presentation
Download
Downloaded 12 times
1
/ 24
2
/ 24
3
/ 24
4
/ 24
5
/ 24
6
/ 24
7
/ 24
8
/ 24
9
/ 24
10
/ 24
11
/ 24
12
/ 24
13
/ 24
14
/ 24
15
/ 24
16
/ 24
17
/ 24
18
/ 24
19
/ 24
20
/ 24
21
/ 24
22
/ 24
23
/ 24
24
/ 24
More Related Content
PDF
hivemallを使って4日間で性別推定した話
by
eventdotsjp
PPTX
Sano hmm 20150512
by
Masakazu Sano
PPTX
Sano tokyowebmining 36_20140526
by
Masakazu Sano
PPTX
Masakazu Sano Tokyowebmining 37 20140621
by
Masakazu Sano
PPTX
人工知能Xファッション最前線
by
Kazuki Baba
PPTX
Sano web広告最適化20131018v3
by
Masakazu Sano
PDF
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
by
Koichi Hamada
PPTX
パーソナル広告配信徹底入門
by
yskn67
hivemallを使って4日間で性別推定した話
by
eventdotsjp
Sano hmm 20150512
by
Masakazu Sano
Sano tokyowebmining 36_20140526
by
Masakazu Sano
Masakazu Sano Tokyowebmining 37 20140621
by
Masakazu Sano
人工知能Xファッション最前線
by
Kazuki Baba
Sano web広告最適化20131018v3
by
Masakazu Sano
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
by
Koichi Hamada
パーソナル広告配信徹底入門
by
yskn67
What's hot
PPTX
研究室勉強会資料「データ分析チュートリアル」
by
ymmt3-lab
PDF
機械学習ゴリゴリ派のための数学とPython
by
Kimikazu Kato
PDF
実社会・実環境におけるロボットの機械学習 ver. 2
by
Kuniyuki Takahashi
PDF
Scikit-learnを使って 画像分類を行う
by
Arata Honda
PDF
Tokyowebmining ctr-predict
by
正志 坪坂
PDF
アドテクにおける機械学習技術 @Tokyo Data Night #tokyodn
by
Kei Tateno
PDF
[R勉強会][データマイニング] R言語による時系列分析
by
Koichi Hamada
PDF
10回開催記念 「データマイニング+WEB ~データマイニング・機械学習活用による継続進化~」ー第10回データマイニング+WEB勉強会@東京ー #Toky...
by
Koichi Hamada
PDF
ユーザー分析における特徴量の作り方
by
Kazuya Obanayama
PDF
Deep learning Libs @twm
by
Yuta Kashino
PPTX
多項式あてはめで眺めるベイズ推定~今日からきみもベイジアン~
by
tanutarou
PDF
セレンディピティと機械学習
by
Kei Tateno
PDF
20190723 mlp lt_bayes_pub
by
Yoichi Tokita
PDF
Sapporo20140709
by
Kimikazu Kato
PDF
Shinyを自由に使ってみる
by
Masanori Takano
PDF
Optimizing AIC in Questionnaire Analysis
by
T T
PDF
Pythonで画像処理をやってみよう!第6回 - Scale-space 第3回 -
by
Project Samurai
PPT
Big data解析ビジネス
by
Mie Mori
PDF
レコメンデーション(協調フィルタリング)の基礎
by
Katsuhiro Takata
PDF
[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針
by
Koichi Hamada
研究室勉強会資料「データ分析チュートリアル」
by
ymmt3-lab
機械学習ゴリゴリ派のための数学とPython
by
Kimikazu Kato
実社会・実環境におけるロボットの機械学習 ver. 2
by
Kuniyuki Takahashi
Scikit-learnを使って 画像分類を行う
by
Arata Honda
Tokyowebmining ctr-predict
by
正志 坪坂
アドテクにおける機械学習技術 @Tokyo Data Night #tokyodn
by
Kei Tateno
[R勉強会][データマイニング] R言語による時系列分析
by
Koichi Hamada
10回開催記念 「データマイニング+WEB ~データマイニング・機械学習活用による継続進化~」ー第10回データマイニング+WEB勉強会@東京ー #Toky...
by
Koichi Hamada
ユーザー分析における特徴量の作り方
by
Kazuya Obanayama
Deep learning Libs @twm
by
Yuta Kashino
多項式あてはめで眺めるベイズ推定~今日からきみもベイジアン~
by
tanutarou
セレンディピティと機械学習
by
Kei Tateno
20190723 mlp lt_bayes_pub
by
Yoichi Tokita
Sapporo20140709
by
Kimikazu Kato
Shinyを自由に使ってみる
by
Masanori Takano
Optimizing AIC in Questionnaire Analysis
by
T T
Pythonで画像処理をやってみよう!第6回 - Scale-space 第3回 -
by
Project Samurai
Big data解析ビジネス
by
Mie Mori
レコメンデーション(協調フィルタリング)の基礎
by
Katsuhiro Takata
[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針
by
Koichi Hamada
Viewers also liked
PPTX
Sano tokyowebmining 201625_v04
by
Masakazu Sano
PPTX
LT資料
by
Kazuma Kadomae
PPTX
機械学習に取り組んでいる企業の紹介
by
Kazuma Kadomae
PPTX
クライアントサイドMVVMアーキテクチャとVue.jsをまとめたよ
by
Seki Yousuke
PPTX
第1回文献紹介勉強会20140826
by
Masakazu Sano
PPTX
法人顧客データあれこれ
by
Izumi Akiyama
Sano tokyowebmining 201625_v04
by
Masakazu Sano
LT資料
by
Kazuma Kadomae
機械学習に取り組んでいる企業の紹介
by
Kazuma Kadomae
クライアントサイドMVVMアーキテクチャとVue.jsをまとめたよ
by
Seki Yousuke
第1回文献紹介勉強会20140826
by
Masakazu Sano
法人顧客データあれこれ
by
Izumi Akiyama
Mlct 20150430v2
1.
ネット広告実務で機械学習を活用するうえでの苦労話
2.
アジェンダ • 自己紹介 • FreakOutの概観 •
機械学習苦労話
3.
自己紹介
4.
佐野正和(さのまさかず, @Masa_S3) • データマイニングエンジニア
(Techlead) • バックグラウンドは素粒子物理学 • 5年くらいネット広告分野で分析業務を担当 分析チーム • 5名+3名アルバイト(現時点) • FreakOutとM.T.Burn(スマホ向けアドネットワーク)のプロダクト改善 メンバーを募集しております! • 分析から学習モデルの実装までやってみたい方。 • 自分の実装モデルをリアルなデータで試したい方。 • アナリティクスの力でビジネスをドライブさせてみたい方。
5.
• FreakOutの概観
6.
ネット広告売買の世界:Real Time Bidding(RTB) •
SSP(Supply-Side Platform)がimpressionのオークションを仕切って、 それに複数のDSP(Demand-Side Platform )がセリに参加するイメー ジ。 DSP1 DSP2 DSP3 SSP いくらで 配信す るの? ¥10 ¥30 ¥20 DSP2を配信 ユーザID, 広告サイズ等 を開示 6
7.
DSP (Demand-Side Platform)とは 7 これまで
現在 広告枠 広告主 広告枠 メディア ユーザ 広告枠 ? 広告主のロジックでの買い付けが可能に ネット広告のパラダイムシフト 取引対象が、「広告枠」から「人」へ変化 手売りでの 広告販売 RTBによる 自動買い付け 広告枠
8.
50ms or die. フリークアウトのTechチームが掲げるミッション。 月間2200億のリクエスト、 その1つ1つに対して50msでレスポンスを返さないと、 事業そのものが成り立たない
9.
50msでやっていること 広告主側のロジックで、 必要な枠、必要な人、必要な瞬間だけ をリアルタイムに判定して入札 ↓ 競合十数社でのオークションに勝てば バナーを表示
10.
・入札配信サーバ/Hadoopクラスタは、それぞれ 数百台の規模 ・基本はオンプレミス、一部AWS使用 ・入札サーバは安いコアを並べる FreakOut DSP の構成概要
11.
ロジックのABテスト環境 月間2200億のトラフィックに対して、 複数の入札ロジックを、任意の割合(%)で 並行して走らせることが可能 結果も即座に集計可能 常時複数のアルゴリズムが実環境で検証されている 高速PDCA
12.
• 機械学習苦労話
13.
広告主側のロジックで、 必要な枠、必要な人、必要な瞬間だけ をリアルタイムに判定して入札 • 高精度なユーザ判別(click/CV)の実現 • 制約 •
高速レスポンス • オンプレ 機械学習への制約
14.
機械学習への制約 学習器 Impression log click log 学習 (ロジスティ回帰) Clickする確率 イメージ 過去の履歴 入札価格の決定
15.
ロジックの一例:クリック予測モデル Hivemallのロジスティック回帰を活用 • amplify()関数を活用したアンサンブル学習でイテレーション効 果を得る。 • Hiveで学習から検証まで実行可能で非常に便利。 学習用のログは直近数日分のimpression
& click log • 学習時間;1時間程度
16.
ロジックの一例:クリック予測モデル 課題 • amplifyを使うと処理の途中過程で学習データが10倍程度に なる(設定による)。 • オンプレ環境ではデータ容量を大きくできない •
使用容量が多いと特徴量の種類を増やすことも容易ではな い • 精度を落とさず容量を減らしたい
17.
ロジックの一例:クリック予測モデル Subsamplingの導入 Simple and scalable
response prediction for display advertising[CHAPELLE, MANAVOGLU, ROSALES] Negative Samples (impresion log)Positive Samples (click log)
18.
ロジックの一例:クリック予測モデル Subsamplingの導入 Simple and scalable
response prediction for display advertising[CHAPELLE, MANAVOGLU, ROSALES] Negative samples Positive samples Subsampling rate r(<1)でnegative sampleからサンプリング。 subsampling
19.
ロジックの一例:クリック予測モデル Subsamplingの導入 Simple and scalable
response prediction for display advertising[CHAPELLE, MANAVOGLU, ROSALES] 非常に簡潔
20.
ロジックの一例:クリック予測モデル Subsamplingの導入 Simple and scalable
response prediction for display advertising[CHAPELLE, MANAVOGLU, ROSALES] 精度をほぼ変えずに消費リソースの削減を実現 • r=0.2 • 60-80%の消費リソース減少 • 学習時間も半分以下に
21.
おまけ苦労話:モデルの比較 実配信環境にモデルを投下するためには機械学習モ デルの比較検証が大事 モデルを同じ基準で比較するのが意外と難しい
22.
view cv • Viewからクリックまでは期間が短い • コンバージョンまでにはラグが存在する場合があ る
23.
view cv view cv オンライン検証開始 すでに動いているモデルと新しい モデルを比較検証する場合、 Model Bのような検証開始日より 過去から発生しているコンバー ジョンを除外しないと公平な比較 にならない。 クリック予測モデルと違う点で気 をつけるべき点。 案外落とし穴 。遅れて発生する コンバージョンは割と多い。 New
model A Old model B
24.
まとめ 地味なところ大事。特にデータ周り。 同じくらい業務知識も大事。落とし穴に気づける。
Download