Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Yahoo!デベロッパーネットワーク
PDF, PPTX
4,341 views
Yahoo! JAPANにおけるオンライン機械学習実例 #streamctjp
Stream Processing Casual Talks #1 at Yahoo! JAPAN の発表資料です http://connpass.com/event/35264/
Technology
◦
Read more
4
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 31
2
/ 31
3
/ 31
4
/ 31
5
/ 31
6
/ 31
7
/ 31
8
/ 31
9
/ 31
10
/ 31
11
/ 31
12
/ 31
13
/ 31
14
/ 31
15
/ 31
16
/ 31
17
/ 31
18
/ 31
19
/ 31
20
/ 31
21
/ 31
22
/ 31
23
/ 31
24
/ 31
25
/ 31
26
/ 31
27
/ 31
28
/ 31
29
/ 31
30
/ 31
31
/ 31
More Related Content
PDF
ブラックボックス最適化とその応用
by
gree_tech
PDF
解説#78 誤差逆伝播
by
Ruo Ando
PDF
多人数不完全情報ゲームにおけるAI ~ポーカーと麻雀を例として~
by
Kenshi Abe
PDF
【論文レベルで理解しよう!】 大規模言語モデル(LLM)編
by
ARISE analytics
PPTX
組合せ最適化を体系的に知ってPythonで実行してみよう PyCon 2015
by
SaitoTsutomu
PPTX
【DL輪読会】Scaling Laws for Neural Language Models
by
Deep Learning JP
PPTX
次元の呪い
by
Kosuke Tsujino
PDF
三次元表現まとめ(深層学習を中心に)
by
Tomohiro Motoda
ブラックボックス最適化とその応用
by
gree_tech
解説#78 誤差逆伝播
by
Ruo Ando
多人数不完全情報ゲームにおけるAI ~ポーカーと麻雀を例として~
by
Kenshi Abe
【論文レベルで理解しよう!】 大規模言語モデル(LLM)編
by
ARISE analytics
組合せ最適化を体系的に知ってPythonで実行してみよう PyCon 2015
by
SaitoTsutomu
【DL輪読会】Scaling Laws for Neural Language Models
by
Deep Learning JP
次元の呪い
by
Kosuke Tsujino
三次元表現まとめ(深層学習を中心に)
by
Tomohiro Motoda
What's hot
PDF
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
by
SSII
PDF
強化学習と逆強化学習を組み合わせた模倣学習
by
Eiji Uchibe
PPTX
位置データもPythonで!!!
by
hide ogawa
PDF
[DL輪読会]深層強化学習はなぜ難しいのか?Why Deep RL fails? A brief survey of recent works.
by
Deep Learning JP
PPTX
[DL輪読会]機械学習におけるカオス現象について
by
Deep Learning JP
PDF
バンディットアルゴリズム入門と実践
by
智之 村上
PDF
JDLA主催「CVPR2023技術報告会」発表資料
by
Morpho, Inc.
PDF
Anomaly detection 系の論文を一言でまとめた
by
ぱんいち すみもと
PDF
[DL輪読会]Attention is not Explanation (NAACL2019)
by
Deep Learning JP
PPTX
Noisy Labels と戦う深層学習
by
Plot Hong
PDF
【論文紹介】 Attention Based Spatial-Temporal Graph Convolutional Networks for Traf...
by
ddnpaa
PDF
[DL輪読会]Weight Agnostic Neural Networks
by
Deep Learning JP
PDF
計算論的学習理論入門 -PAC学習とかVC次元とか-
by
sleepy_yoshi
PPTX
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
by
Deep Learning JP
PDF
ディープラーニングのフレームワークと特許戦争
by
Yosuke Shinya
PDF
遺伝的アルゴリズム(Genetic Algorithm)を始めよう!
by
Kazuhide Okamura
PDF
AutoEncoderで特徴抽出
by
Kai Sasaki
PPTX
[DeepLearning論文読み会] Dataset Distillation
by
Ryutaro Yamauchi
PDF
大規模な組合せ最適化問題に対する発見的解法
by
Shunji Umetani
PPTX
充足可能性問題のいろいろ
by
Hiroshi Yamashita
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
by
SSII
強化学習と逆強化学習を組み合わせた模倣学習
by
Eiji Uchibe
位置データもPythonで!!!
by
hide ogawa
[DL輪読会]深層強化学習はなぜ難しいのか?Why Deep RL fails? A brief survey of recent works.
by
Deep Learning JP
[DL輪読会]機械学習におけるカオス現象について
by
Deep Learning JP
バンディットアルゴリズム入門と実践
by
智之 村上
JDLA主催「CVPR2023技術報告会」発表資料
by
Morpho, Inc.
Anomaly detection 系の論文を一言でまとめた
by
ぱんいち すみもと
[DL輪読会]Attention is not Explanation (NAACL2019)
by
Deep Learning JP
Noisy Labels と戦う深層学習
by
Plot Hong
【論文紹介】 Attention Based Spatial-Temporal Graph Convolutional Networks for Traf...
by
ddnpaa
[DL輪読会]Weight Agnostic Neural Networks
by
Deep Learning JP
計算論的学習理論入門 -PAC学習とかVC次元とか-
by
sleepy_yoshi
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
by
Deep Learning JP
ディープラーニングのフレームワークと特許戦争
by
Yosuke Shinya
遺伝的アルゴリズム(Genetic Algorithm)を始めよう!
by
Kazuhide Okamura
AutoEncoderで特徴抽出
by
Kai Sasaki
[DeepLearning論文読み会] Dataset Distillation
by
Ryutaro Yamauchi
大規模な組合せ最適化問題に対する発見的解法
by
Shunji Umetani
充足可能性問題のいろいろ
by
Hiroshi Yamashita
Viewers also liked
PDF
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
by
Yahoo!デベロッパーネットワーク
PDF
Yahoo! JAPANを支えるビッグデータプラットフォーム技術
by
Yahoo!デベロッパーネットワーク
PDF
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
by
Recruit Technologies
PDF
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
by
Yahoo!デベロッパーネットワーク
PDF
Life of an enginner in rakuten osaka diarmaid lindsay
by
Rakuten Group, Inc.
PDF
Rakutenとsreと私 yanagimoto koichi
by
Rakuten Group, Inc.
PDF
Company Recommendation for New Graduates via Implicit Feedback Multiple Matri...
by
Recruit Technologies
PDF
What i learned from translation of the sre ryuji tamagawa
by
Rakuten Group, Inc.
PDF
新卒2年目が鍛えられたコードレビュー道場
by
Recruit Technologies
PDF
ユーザー企業内製CSIRTにおける対応のポイント
by
Recruit Technologies
PPTX
ビックデータ処理技術の全体像とリクルートでの使い分け
by
Tetsutaro Watanabe
PDF
Prestoクエリログの保存/分析機能の構築 #yjdsnight
by
Yahoo!デベロッパーネットワーク
PDF
銀行ロビーアシスタント
by
Recruit Technologies
PDF
IT業界のリーディングカンパニーとして描く「少し先の未来」〜Yahoo! JAPANの事例を通して〜#a11yfuture
by
Yahoo!デベロッパーネットワーク
PDF
Kafka Connect(Japanese)
by
Roman Shtykh
PDF
LT(自由)
by
Recruit Technologies
PDF
COBOL to Apache Spark
by
Rakuten Group, Inc.
PDF
Tableau活用4年の軌跡
by
Recruit Technologies
PDF
cloudera Apache Kudu Updatable Analytical Storage for Modern Data Platform
by
Rakuten Group, Inc.
PDF
Challenge for statup's cto from big company nagaaki hoshi
by
Rakuten Group, Inc.
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
by
Yahoo!デベロッパーネットワーク
Yahoo! JAPANを支えるビッグデータプラットフォーム技術
by
Yahoo!デベロッパーネットワーク
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
by
Recruit Technologies
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
by
Yahoo!デベロッパーネットワーク
Life of an enginner in rakuten osaka diarmaid lindsay
by
Rakuten Group, Inc.
Rakutenとsreと私 yanagimoto koichi
by
Rakuten Group, Inc.
Company Recommendation for New Graduates via Implicit Feedback Multiple Matri...
by
Recruit Technologies
What i learned from translation of the sre ryuji tamagawa
by
Rakuten Group, Inc.
新卒2年目が鍛えられたコードレビュー道場
by
Recruit Technologies
ユーザー企業内製CSIRTにおける対応のポイント
by
Recruit Technologies
ビックデータ処理技術の全体像とリクルートでの使い分け
by
Tetsutaro Watanabe
Prestoクエリログの保存/分析機能の構築 #yjdsnight
by
Yahoo!デベロッパーネットワーク
銀行ロビーアシスタント
by
Recruit Technologies
IT業界のリーディングカンパニーとして描く「少し先の未来」〜Yahoo! JAPANの事例を通して〜#a11yfuture
by
Yahoo!デベロッパーネットワーク
Kafka Connect(Japanese)
by
Roman Shtykh
LT(自由)
by
Recruit Technologies
COBOL to Apache Spark
by
Rakuten Group, Inc.
Tableau活用4年の軌跡
by
Recruit Technologies
cloudera Apache Kudu Updatable Analytical Storage for Modern Data Platform
by
Rakuten Group, Inc.
Challenge for statup's cto from big company nagaaki hoshi
by
Rakuten Group, Inc.
Similar to Yahoo! JAPANにおけるオンライン機械学習実例 #streamctjp
PPT
Hadoop~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
PDF
ストリーム処理プラットフォームにおけるKafka導入事例 #kafkajp
by
Yahoo!デベロッパーネットワーク
PDF
Case study of online machine learning for display advertising in Yahoo! JAPAN
by
DataWorks Summit/Hadoop Summit
PDF
パーソナライズニュースを支えるML業務のまわしかた@Yahoo! JAPAN
by
Yahoo!デベロッパーネットワーク
PDF
広告ログの解析システム
by
Katsuhiro Takata
PDF
Dataworks Summit 2017 SanJose StreamProcessing - Hadoop Source Code Reading #...
by
Yahoo!デベロッパーネットワーク
PDF
広告における機械学習の適用例とシステムについて
by
Yahoo!デベロッパーネットワーク
PPT
Hadoop ~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
PDF
MapReduceによる大規模データを利用した機械学習
by
Preferred Networks
PDF
ソーシャルデザインパターン -評判と情報収集-
by
Koichi Hamada
PDF
Jubatusの紹介@第6回さくさくテキストマイニング
by
Yuya Unno
PPTX
DataEngConf NYC’18 セッションサマリー #2
by
gree_tech
PDF
Fast Data を扱うためのデザインパターン
by
MapR Technologies Japan
PDF
Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop
by
Koichi Hamada
PDF
大規模データに対するデータサイエンスの進め方 #CWT2016
by
Cloudera Japan
PDF
"Mahout Recommendation" - #TokyoWebmining 14th
by
Koichi Hamada
PDF
Mahout Canopy Clustering - #TokyoWebmining 9
by
Koichi Hamada
PDF
Storm×couchbase serverで作るリアルタイム解析基盤
by
NTT Communications Technology Development
PDF
Mahout JP - #TokyoWebmining 11th #MahoutJP
by
Koichi Hamada
PDF
Java Clientで入門する Apache Kafka #jjug_ccc #ccc_e2
by
Yahoo!デベロッパーネットワーク
Hadoop~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
ストリーム処理プラットフォームにおけるKafka導入事例 #kafkajp
by
Yahoo!デベロッパーネットワーク
Case study of online machine learning for display advertising in Yahoo! JAPAN
by
DataWorks Summit/Hadoop Summit
パーソナライズニュースを支えるML業務のまわしかた@Yahoo! JAPAN
by
Yahoo!デベロッパーネットワーク
広告ログの解析システム
by
Katsuhiro Takata
Dataworks Summit 2017 SanJose StreamProcessing - Hadoop Source Code Reading #...
by
Yahoo!デベロッパーネットワーク
広告における機械学習の適用例とシステムについて
by
Yahoo!デベロッパーネットワーク
Hadoop ~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
MapReduceによる大規模データを利用した機械学習
by
Preferred Networks
ソーシャルデザインパターン -評判と情報収集-
by
Koichi Hamada
Jubatusの紹介@第6回さくさくテキストマイニング
by
Yuya Unno
DataEngConf NYC’18 セッションサマリー #2
by
gree_tech
Fast Data を扱うためのデザインパターン
by
MapR Technologies Japan
Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop
by
Koichi Hamada
大規模データに対するデータサイエンスの進め方 #CWT2016
by
Cloudera Japan
"Mahout Recommendation" - #TokyoWebmining 14th
by
Koichi Hamada
Mahout Canopy Clustering - #TokyoWebmining 9
by
Koichi Hamada
Storm×couchbase serverで作るリアルタイム解析基盤
by
NTT Communications Technology Development
Mahout JP - #TokyoWebmining 11th #MahoutJP
by
Koichi Hamada
Java Clientで入門する Apache Kafka #jjug_ccc #ccc_e2
by
Yahoo!デベロッパーネットワーク
More from Yahoo!デベロッパーネットワーク
PDF
ゼロから始める転移学習
by
Yahoo!デベロッパーネットワーク
PDF
継続的なモデルモニタリングを実現するKubernetes Operator
by
Yahoo!デベロッパーネットワーク
PDF
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
by
Yahoo!デベロッパーネットワーク
PDF
オンプレML基盤on Kubernetes パネルディスカッション
by
Yahoo!デベロッパーネットワーク
PDF
LakeTahoe
by
Yahoo!デベロッパーネットワーク
PDF
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
by
Yahoo!デベロッパーネットワーク
PDF
Persistent-memory-native Database High-availability Feature
by
Yahoo!デベロッパーネットワーク
PDF
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
by
Yahoo!デベロッパーネットワーク
PDF
eコマースと実店舗の相互利益を目指したデザイン #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
ビッグデータから人々のムードを捉える #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
サイエンス領域におけるMLOpsの取り組み #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
「新しいおうち探し」のためのAIアシスト検索 #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
by
Yahoo!デベロッパーネットワーク
ゼロから始める転移学習
by
Yahoo!デベロッパーネットワーク
継続的なモデルモニタリングを実現するKubernetes Operator
by
Yahoo!デベロッパーネットワーク
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
by
Yahoo!デベロッパーネットワーク
オンプレML基盤on Kubernetes パネルディスカッション
by
Yahoo!デベロッパーネットワーク
LakeTahoe
by
Yahoo!デベロッパーネットワーク
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
by
Yahoo!デベロッパーネットワーク
Persistent-memory-native Database High-availability Feature
by
Yahoo!デベロッパーネットワーク
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
by
Yahoo!デベロッパーネットワーク
eコマースと実店舗の相互利益を目指したデザイン #yjtc
by
Yahoo!デベロッパーネットワーク
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
by
Yahoo!デベロッパーネットワーク
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
by
Yahoo!デベロッパーネットワーク
ビッグデータから人々のムードを捉える #yjtc
by
Yahoo!デベロッパーネットワーク
サイエンス領域におけるMLOpsの取り組み #yjtc
by
Yahoo!デベロッパーネットワーク
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
by
Yahoo!デベロッパーネットワーク
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
by
Yahoo!デベロッパーネットワーク
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
by
Yahoo!デベロッパーネットワーク
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
by
Yahoo!デベロッパーネットワーク
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
by
Yahoo!デベロッパーネットワーク
「新しいおうち探し」のためのAIアシスト検索 #yjtc
by
Yahoo!デベロッパーネットワーク
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
by
Yahoo!デベロッパーネットワーク
Recently uploaded
PDF
2025→2026宙畑ゆく年くる年レポート_100社を超える企業アンケート総まとめ!!_企業まとめ_1229_3版
by
sorabatake
PDF
Reiwa 7 IT Strategist Afternoon I Question-1 3C Analysis
by
akipii ogaoga
PDF
Reiwa 7 IT Strategist Afternoon I Question-1 Ansoff's Growth Vector
by
akipii ogaoga
PDF
100年後の知財業界-生成AIスライドアドリブプレゼン イーパテントYouTube配信
by
e-Patent Co., Ltd.
PDF
Drupal Recipes 解説 .
by
iPride Co., Ltd.
PDF
第21回 Gen AI 勉強会「NotebookLMで60ページ超の スライドを作成してみた」
by
嶋 是一 (Yoshikazu SHIMA)
PPTX
ddevについて .
by
iPride Co., Ltd.
PDF
さくらインターネットの今 法林リージョン:さくらのAIとか GPUとかイベントとか 〜2026年もバク進します!〜
by
法林浩之
PDF
Starlink Direct-to-Cell (D2C) 技術の概要と将来の展望
by
CRI Japan, Inc.
2025→2026宙畑ゆく年くる年レポート_100社を超える企業アンケート総まとめ!!_企業まとめ_1229_3版
by
sorabatake
Reiwa 7 IT Strategist Afternoon I Question-1 3C Analysis
by
akipii ogaoga
Reiwa 7 IT Strategist Afternoon I Question-1 Ansoff's Growth Vector
by
akipii ogaoga
100年後の知財業界-生成AIスライドアドリブプレゼン イーパテントYouTube配信
by
e-Patent Co., Ltd.
Drupal Recipes 解説 .
by
iPride Co., Ltd.
第21回 Gen AI 勉強会「NotebookLMで60ページ超の スライドを作成してみた」
by
嶋 是一 (Yoshikazu SHIMA)
ddevについて .
by
iPride Co., Ltd.
さくらインターネットの今 法林リージョン:さくらのAIとか GPUとかイベントとか 〜2026年もバク進します!〜
by
法林浩之
Starlink Direct-to-Cell (D2C) 技術の概要と将来の展望
by
CRI Japan, Inc.
Yahoo! JAPANにおけるオンライン機械学習実例 #streamctjp
1.
Yahoo! JAPANにおける オンライン機械学習実例 http://www.yahoo.co.jp/ ヤフー株式会社 野村
拓也 2016年07月22日
2.
自己紹介 Copyright (C) 2016
Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 2
3.
自己紹介 野村 拓也 • 業務 •
社内向けストリーム分散処理基盤の開発 • 機械学習を用いたシステム改善 • Hadoop/Stormなどの分散処理アプリの開発 • 趣味 • 苔 • ボルダリング Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 3
4.
目次 • 今日話すこと • 背景・動機・問題設定 •
ストリーム処理 • ログ処理 • 機械学習 • 結果 • まとめ Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 4
5.
目次 • 今日話すこと • 背景・動機・問題設定 •
ストリーム処理 • ログ処理 • 機械学習 • 結果 • まとめ Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 5
6.
今日話すこと • 広告配信にオンライン機械学習を試験的に採用 • KPIが数%向上 •
構築したシステムについて • ストリーム基盤でのログの処理 • ストリーム機械学習 Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 6
7.
目次 • 今日話すこと • 背景・動機・問題設定 •
ストリーム処理 • ログ処理 • 機械学習 • 結果 • まとめ Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 7
8.
背景・動機 RecSys 2013 Tencent hourlyバッチ処理を リアルタイムに変更 → 34%のCTR改善 (資料が見つからなかったので 聴講者の写真で代用) Copyright
(C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 8 https://twitter.com/torbenbrodt/status/390284591266668544
9.
背景・動機 • Yahoo! JAPANのシステムに適用を検討したい •
特にリアルタイム性 • → 広告配信(YDN)のCTR予測 Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 9
10.
問題設定 - YDNについて 10 http://promotionalads.yahoo.co.jp/service/ydn/ Copyright
(C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
11.
問題設定 - CTR予測 11 •
YDNは「クリック課金」の課金モデル • 期待収益の高い広告を配信したい • 期待収益 = 広告クリック確率 × クリック単価 • クリック率(CTR: Click Through Rate)予測 • 現状バッチ処理で予測モデルを構築 Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 広告主が設定未知・状況で変化
12.
目次 • 今日話すこと • 背景・動機・問題設定 •
ストリーム処理 • ログ処理 • 機械学習 • 結果 • まとめ Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 12
13.
再掲: 一般的なストリーム処理システム構成 Copyright (C)
2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 13 キューサーバ ストリーム処理 サービス ログ回収
14.
今回のシステム構成 Copyright (C) 2016
Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 14 Kafka Storm 内製ログ回収基盤 配信サーバ クリック サーバ KVS モデル配布サーバ ログ転送経路 モデル転送経路 〜 〜 scpscp Web ページ 広告配信 リクエスト 広告 クリック
15.
Copyright (C) 2016
Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 15 Spout(クリックログ) Spout(配信ログ) Bolt(ログ結合) Bolt(学習) モデル Topology Stormクラスタ ディスクに書き出し ストリーム処理
16.
ログ処理 - ログ結合 Copyright
(C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 16 • ログ結合 • オンラインでログ結合 • JavaのLinkedHashMapを利用 • クリックログと紐付いたものは正例とする • そうでないログはサンプリングした上で負例とする Bolt(ログ結合) Bolt(ログ結合) Spout(クリックログ) Spout(配信ログ) Bolt(ログ結合) ユニークIDでシャッフル
17.
ログ処理 - 正例・負例の排出
- 課題 Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 17 1. 広告配信の有効期間=24時間のログ保持 – 有効ログを保持するとTBオーダーのメモリが必要 2. 負例の生成タイミング – クリックされないと確定するまで24時間かかる
18.
ログ処理 - 正例を排出するための調査 Copyright
(C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 18 • 累積クリック数の遷移 • 配信後10分待てば95%を捕捉でき十分
19.
学習データの生成 - 正例・負例の排出
- 課題への対応 Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 19 1. 広告配信の有効期間=24時間のログ保持 – 有効ログを保持するとTBオーダーのメモリが必要 – → 10分程度の配信ログを保持すれば十分 2. 負例の生成タイミング – クリックされないと確定するまで24時間かかる – → 上記の保持期間を過ぎたものを負例候補とする
20.
目次 • 今日話すこと • 背景・動機・問題設定 •
ストリーム処理 • ログ処理 • 機械学習 • 結果 • まとめ Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 20
21.
機械学習 - バッチとの比較 バッチ学習
ストリーム モデル Logistic Regression 学習手法 Linear SVM SGD ハイパーパラメータ調整 Grid Search AdaDelta等 Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 21 • ストリーム処理は逐次処理 • → 精度検証に課題
22.
目次 • 今日話すこと • 背景・動機・問題設定 •
ストリーム処理 • ログ処理 • 機械学習 • 結果 • まとめ Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 22
23.
試験結果: KPI変化 Copyright (C)
2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 23 • 一部配信面・一部トラフィックでA/Bテスト • iCTR向上 = ユーザに合った広告の配信ができた • CPC低下 = 広告主視点ではコスト削減 • RPR向上 = 売上向上 KPI 意味 KPIリフト iCTR ≒クリック率 4.1% CPC クリック単価 -2.5% RPR 1リクエストの売上 1.5%
24.
• 配布直後のKPIが増加傾向 Copyright (C)
2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 24 試験結果: モデル配布後のKPI変化 RPR 配布後の経過時間
25.
目次 • 今日話すこと • 背景・動機・問題設定 •
ストリーム処理 • ログ処理 • 機械学習 • 結果 • まとめ Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 25
26.
まとめ • CTR予測モデルの更新をリアルタイムに • ストリーム処理ならではの課題 •
ログ結合、ハイパーパラメータ調整 • 試験結果としてはCTRが4%向上 • 更新間隔を短くすることでさらなる向上の可能性 Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 26
27.
質疑応答 Copyright (C) 2016
Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 27
28.
Appendix Copyright (C) 2016
Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 28
29.
機械学習 - 素性とモデル •
Logistic Regression Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 29 Web ページ ユーザ 配信 サーバ 広告配信 リクエスト • 性別: 男性 • 年代: 30代 • 興味カテゴリ: 車、料理 • ドメイン: yahoo.co.jp • 配信面ID: 12345 AD1 • 広告主ID: 123 • 広告ID: 1234567 • 過去実績: 0.1 𝑓 男性, 30代, 車, 料理, … = 𝑠𝑖𝑔𝑚𝑜𝑖𝑑 𝑤 𝑎 ∙ 男性 + 𝑤 𝑏 ∙ 30代 + 𝑤𝑐 ∙ 車 + ⋯
30.
機械学習 - 学習手法 Copyright
(C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 30 • SGD(確率的勾配降下法) • オンライン機会学習の学習手法 While(! 収束条件): 𝑓𝑜𝑟 𝑦𝑖, 𝑥𝑖 𝑖𝑛 𝑑𝑎𝑡𝑎: 𝑤𝑡+1 = 𝑤𝑡 − 𝜂 𝑡 𝛻𝑙 𝑦𝑖, 𝑤𝑡, 𝑥𝑖 学習率: 1回の勾配移動量を調整 基本は順次小さくする 例) 𝜂 𝑡+1 = 0.9 ∗ 𝜂 𝑡 勾配: wnの修正値
31.
機械学習 - ハイパーパラメータの調整 Copyright
(C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 31 While(! 収束条件): 𝑓𝑜𝑟 𝑦𝑖, 𝑥𝑖 𝑖𝑛 𝑑𝑎𝑡𝑎: 𝑤𝑡+1 = 𝑤𝑡 − 𝜂 𝑡 𝛻𝑙 𝑦𝑖, 𝑤𝑡, 𝑥𝑖 学習率: 1回の勾配移動量を調整 基本は順次小さくする 例) 𝜂 𝑡+1 = 0.9 ∗ 𝜂 𝑡 勾配: wnの修正値 終わらない • not オンライン、but ストリーム 学習率の自動調整 → AdaDelta等
Download