Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

ヤフートップページでの機械学習#yjdsw1

2,095 views

Published on

http://yahoo-ds-event.connpass.com/event/21903/

Published in: Technology

ヤフートップページでの機械学習#yjdsw1

  1. 1. 公開 ヤフートップページでの 機械学習 ヤフー株式会社 D&S統括本部サイエンス本部サイエンス1部コマースサイエンス2 深澤 良介
  2. 2. 公開 自己紹介 深澤良介 • 2009年新卒入社 • 自然言語処理と機械学習のバックグラウンド • 情報検索とレコメンデーションのプロジェクト を渡り歩いてきました Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 2
  3. 3. 公開 スマホのトップページは 今年生まれ変わりました! Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 3
  4. 4. 公開 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 4
  5. 5. 公開 サービスの規模 • デイリーユニークブラウザ数: 5000万 UB※1 (下記含めスマホブラウザ+アプリ合算の値) • ピーク時リクエスト数: 数千 req/s • 推薦対象の記事数: 数万 documents ※1:決算説明会 - 決算説明会資料 - IRアーカイブス - IR情報 - ヤフー株式会社 http://ir.yahoo.co.jp/jp/archives/present/2015q2/index.html Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 5
  6. 6. 公開 機械学習はどこに活かされている? Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 6
  7. 7. 公開 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 7
  8. 8. 公開 “あなたへのおすすめ” として 影響力の大きい記事 パーソナライズされた記事 を推薦 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 8
  9. 9. 公開 機械学習の応用先 • 推薦する記事のパーソナライズ • 影響力の大きい記事の推定 • 記事のPV予測 • 重複記事判定 • 画像クロッピング Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 9
  10. 10. 公開 推薦する記事のパーソナライズ • ユーザの行動ログを利用 • ヤフーニュース閲覧履歴 • 検索キーワード • etc. • ユーザの興味に合致する記事を選び、 CTR を最適化するよう学習 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 10 ゲーム情報で一杯に!
  11. 11. 公開 影響力の大きい記事の推定 • 過去ヤフートピックスで選ばれた記事データを 元に、今入稿された記事が選ばれるかどうかを 推定 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 11
  12. 12. 公開 記事のPV予測 • 記事情報を元にPVの推定を行い、 PVの入稿後実績を利用して修正が入るように RNN を構築 • 推定が難しい外部要因などにも上手く追従 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 12 ※ 縦軸: pvの自然対数値 横軸: 入稿後経過時間(hour)
  13. 13. 公開 重複記事判定 • 当初は記事タイトルのコサイン類似度での判定 • 言い換え表現なども多く、表層表現では限界 • AutoEncoder を使った NN を構築、 予め付与されている記事カテゴリを判別できる よう学習し、文書ベクトルを獲得 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 13
  14. 14. 公開 画像クロッピング • トップページのUIに合わせた サムネイル切り出し • 顔検出、顕著性の検出を行っている Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 14 (C) Aflo
  15. 15. 公開 まとめ • 大きなUI変更に伴い、トップページは サイエンス部の技術力を活用したサービスに! • 国際学会で取り上げられているような先端技術 も追いつつ、実サービスへの応用も進んでます (進行中、国際学会発表を目指すものも) Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 15
  16. 16. 公開 詳細はこのあとの懇親会で! Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 16

×