Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

【Ltech#1】LIFULL HOME’Sでの機械学習活用

448 views

Published on

2018/07/02(月)開催
Ltech#1 LIFULL HOME'S 機械学習Night講演スライド
登壇者:株式会社LIFULL データサイエンティスト 椎橋怜史

機械学習を用いた事例についてお話します。
・広告費予算の最適化(広告マーケティングチーム)
・画像種類の判別モデル(App, 流通チーム)

Published in: Data & Analytics
  • Be the first to comment

【Ltech#1】LIFULL HOME’Sでの機械学習活用

  1. 1. 株式会社LIFULL LIFULL HOME‘S事業本部 新UX開発部 AI推進ユニット 椎橋怜史 2018/07/02 LIFULL HOME’Sでの機械学習活用 (広告費最適化・画像判別)
  2. 2. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 自己紹介 • 椎橋 怜史 • 2016年4月 LIFULL 新卒入社 • データサイエンティスト • データ分析系の仕事を担当 Qiita: @shiibass Twitter: @shiibass 興味ある分野 • 量子計算 • 数理最適化 • 強化学習 • ゲーム理論
  3. 3. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 AI推進ユニット 「+AI」の方針で既存サービスにAI機能を追加、新規AIサービスの開発 AI技術に限らずテクノロジーで想像を超えるようなサービスを目指す 他部署と協力・分担してAIサービスをリリース イメージ AI推進U LIFULL HOME’S APPチーム 広告マーケ ティング チーム 流通事業部 チーム 営業チーム
  4. 4. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 自分が意識していること 計算精度 シンプルさ(説明力) 線形回帰とか ディープラーニングとか • 計算精度の高さ、シンプルさは トレードオフのケースがある • 精度が高いからプロジェクトが うまくいくというわけではない • 案件ごとに必要なもの・求められる ものは異なるからヒアリングして推 察、アルゴリズム選定 •
  5. 5. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 今までやってきたこと ()は協力した他チーム • 広告費予算の最適化(広告マーケティングチーム) • Androidアプリの物件レコメンド(App開発チーム) • 物件問い合わせ予測(営業チーム) • 画像種類の判別モデル(App, 流通チーム) • その他いくつか
  6. 6. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 今までやってきたこと ()は協力した他チーム • 広告費予算の最適化(広告マーケティングチーム) • Androidアプリの物件レコメンド(App開発チーム) • 物件問い合わせ予測(営業チーム) • 画像種類の判別モデル(App, 流通チーム) • その他いくつか
  7. 7. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 広告費予算の最適化
  8. 8. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 広告費予算の最適化 • 数十の広告媒体にいくら予算を投下するのが最適かを計算する • 各媒体に広告グループが設けられていて、最小粒度にすると数百万ある (数百万のポートフォリオ最適化問題) • 検索広告やディスプレイ広告など広告媒体ごとの特徴 • 自動化したい • 売上上げたい ↓検索キーワードに対して広告を設定可能
  9. 9. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 可視化できるようなシンプルな予測モデル 効果値 コスト 現在の予算 最適値 抑制 強化 各広告媒体に対して予算を追加すべきか削減すべきか可視化 運用者の予算配分の考え方を踏襲しつつ、 徐々に理論的なアルゴリズムに変更 ↓ 最終的には完全自動化を目指す 抑制
  10. 10. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 最適化アルゴリズム アルゴリズム • シンプルな凸最適化 • 予算運用者が解釈可能(可視化可能)なように • データが増えても計算量増えすぎないように • 一意な結果を返すように 効果 コスト 微分f_i’(x_i) 微分 アルゴリズムイメージ 効率いい広告を探して予算追加 していく 𝑑: small budget while 𝑏𝑢𝑑𝑔𝑒𝑡 𝑠𝑢𝑚 > 0 calc 𝑓𝑖′(𝑏𝑢𝑑𝑔𝑒𝑡𝑖) for any 𝑎𝑑𝑖 calc 𝑎𝑟𝑔𝑚𝑎𝑥𝑖 𝑓′(𝑏𝑢𝑑𝑔𝑒𝑡𝑖) 𝑏𝑢𝑑𝑔𝑒𝑡𝑖 += 𝑑 return array 𝑏𝑢𝑑𝑔𝑒𝑡𝑖
  11. 11. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 画像種類の判別モデル
  12. 12. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 画像種別を自動で判別してタグ付け • 情報精度向上 • 入稿処理自動化
  13. 13. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 ディープラーニングで画像の特徴を学習 ・・・ 巨大&複雑 Inception v3(学習済みモデル) 自前実装 • 学習済みモデルを活用することで計算量を抑えられ、 用意できないデータに対しても間接的に学習したことになる 画像判別モデル (tf.nn.fully_connected tf.nn.dropout) * 2 tf.nn.softmax
  14. 14. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 実行環境はクラウドに任せて、精度向上に集中した開発 • GCP cloud machine learning engine上で学習・デプロイ • 教師データはCloud Storageに保管 • モデルのネットワークやパラメータの設定に注力できる • 実用可能な精度のデプロイまで3日で開発 (教師データ) 画像データ参照
  15. 15. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 その他
  16. 16. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 その他施策いろいろやってます レコメンド 物件の問い合わせ予測 入力:物件情報 出力:問い合わせ発生確率 Amazon S3 Amazon Athena AWS Data Pipeline Amazon DynamoDB AWS Data Pipeline AWS Lambda Amazon CloudWatch Amazon API Gateway* AWS Elastic Beanstalk
  17. 17. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 最後に • 社内データすべてがサイエンスの対象 (広告データ、ユーザーログ、物件データ、画像など) • クラウドサービスを利用したスピーディーな開発 • やろうと思えばいろいろできる環境 • 仲間募集してます • なにかあったらtwitter(@shiibass)とかで

×