SlideShare a Scribd company logo
1 of 12
Download to read offline
POG: Personalized Outfit Generation for Fashion
Recommendation at Alibaba iFashion


 Ryosuke Goto (ZOZO Research)



書誌情報
● 著者: Wen Chen, Pipei Huang, Jiaming Xu, Xin Guo, Cheng Guo, Fei Sun,
Chao Li, Andreas Pfadler, Huan Zhao, Binqiang Zhao
● 所属: Alibaba Group
● 選定理由
○ Transformerをコーディネート生成と推薦タスクにうまく活用している点
○ Webサービスとしてデプロイして活用している実績
概要
● 調和のとれたファッションコーディネートを個人の嗜好に合わせて生成する Encoder-Decoder,POGを提案
● Fill in the blank,Compatibility Predictionのタスクにおいて,過去の研究と比較して高い性能を示した.
● webサービスとしてデプロイし,協調フィルタリングと比べ, CTRが70%向上することを示した.
● 100万を超えるコーディネート,その関連商品,ユーザーのクリックアクションを含むデータセットを構築した
(https://github.com/wenyuer/P0G)
背景
● 中国のアリババグループが運営する ECサイト タオバオにはAIによるコーディネート提案機能がある.
○ 商品をより魅力的に見せるために,コーディネートとして提案する
○ 商品の組み合わせとして見せることで,追加の商品購入を狙う
○ クオリティの高い商品の組み合わせを個人の趣味・趣向に合わせて提案することがビジネスと直結
https://hackernoon.com/finding-the-perfect-outfit-with-alibabas-dida-ai-assistant-71ba7c9e8cfa
過去のOutfit Generationの研究
● メトリックによるOutfitの学習
○ コーディネートや同時購入のデータからペアをサンプルして,距離を近づけるように学習
○ ペアに注目し,全体を一度に考慮できない問題
Song et al. 2018
過去のOutfit Generationの研究
● LSTMによるモデリング
○ CNNによってembedした商品をLSTMに入力
○ 商品カテゴリによる入力順序の固定
○ 入力順序固定にはどんな意味がある?
Han et al. 2017 Nakamura & Goto 2018
提案手法: FOM (Fashion Outfit Model)
・マクスした商品を当てる Fill in the blankを学習する
・インプットには,画像,タイトル,協調フィルタリングによる関係を embedした特徴を合わせて使う
・Transformer部分はMulti-head self-attentionとPosition-wise Feed-forwardを利用
・入力の順序は関係ないので position embeddingは使わない
提案手法: FOM (Fashion Outfit Model)
・マスクした商品と,対象コーデ以外からサンプルした商品 3つの中から,マクスした商品を当てる
・このタスクを解くことで, Compatibilityを評価できるモデルを得ることができる
提案手法: POG (Personalized Outfit Generation)
・POGはPer NetworkとGen Networkの二つのネットワークで構成される
・encoder(Per Network)のインプットはユーザーの商品クリックのデータを利用
・decoder(Gen Network)にはユーザーがクリックしたコーディネートを予測させる
・Gen Networkの初期値はFOMの重みを利用
定量評価(FOM)
Fill in the blank(FITB)
4つの商品からコーディネートの組み合わせに適した商
品を選ぶタスク
Compatibility Prediction (CP)
本当のコーディネートか,ランダムにアイテムを集めた
偽物のコーディネートかを当てるタスク
異なる入力モダリティのうち,商品タイトルの情報は
FITB, CPを解くのに重要であることがわかる.画像と
CFの特徴を加えると性能が微増する. CFの特徴はセ
マンティクスが含まれないので単体ではワークしないら
しい.
過去のLSTMを使った研究では商品カテゴリにより入力
を固定していた(Ordered).LSTM系のモデルは順序固
定の方がパフォーマンスが良い一方で, FOMは順序に
依存しない.
定量評価(POG)
生成方法 + 提供方法別にオンラインでテストした結果
POG, POG+FOM
ユーザーの商品クリックを受けて,パーソナライズしたコーデ
生成結果を返す.もっとも高い CTRとなったのはPOG+FOM
(Genの初期化にpre-trained FOMを利用)
F-LSTM+CF, Bi-LSTM+CF, Gen+CF
コーデ生成結果を協調フィルタリングで推薦する .
Gen, Bi-LSTM, F-LSTMの順にCTRが高いように見える
F-LSTM+RR, Bi-LSTM+RR, Gen+RR
コーデ生成結果をランダムに表示させる.
性能が悪い.
まとめと感想
● 調和のとれたOutfitを個人の趣味に合わせて生成する Encoder-Decoder,POGを提案
○ Per Networkで個人の趣味の情報を抽出し,自然な形で Outfit Generationに活かしている
○ FITBやCPのタスクでLSTM系のモデルを大きく上回る結果
○ オンラインテストでも他のモデルを大きく上回る高い CTR
● 感想
○ webサービスの内側の人しかアクセスできないユーザーのクリック情報を含んだ大規模コーディ
ネートデータセットを提供しているため, webサービスを持っていなくても,レコメンドの性能を測れる
ようになったのが大きいと思います.
○ このような優れたデータセットの提供を, ZOZOが最初にやれなかったのが悔しいです.

More Related Content

Similar to [DL輪読会]POG: Personalized Outfit Generation for Fashion Recommendation at Alibaba iFashion

イマドキの改善!データ分析SDK導入のポイントとAI活用最新事例 / GTMF2019
イマドキの改善!データ分析SDK導入のポイントとAI活用最新事例 / GTMF2019イマドキの改善!データ分析SDK導入のポイントとAI活用最新事例 / GTMF2019
イマドキの改善!データ分析SDK導入のポイントとAI活用最新事例 / GTMF2019Game Tools & Middleware Forum
 
saleshub_AiDeal LP202210.pdf
saleshub_AiDeal LP202210.pdfsaleshub_AiDeal LP202210.pdf
saleshub_AiDeal LP202210.pdfssuser8de8212
 
ネット広告講義資料 at 東京大学 2017/07/11
ネット広告講義資料 at 東京大学 2017/07/11ネット広告講義資料 at 東京大学 2017/07/11
ネット広告講義資料 at 東京大学 2017/07/11Takehiko Yoshida
 
サイトサーチアナリティクスとは
サイトサーチアナリティクスとはサイトサーチアナリティクスとは
サイトサーチアナリティクスとはMakoto Shimizu
 
集客ROI 最大化セミナー
集客ROI 最大化セミナー集客ROI 最大化セミナー
集客ROI 最大化セミナーIMJ Corporation
 
ビザスクを支える技術 2017
ビザスクを支える技術 2017ビザスクを支える技術 2017
ビザスクを支える技術 2017創史 花村
 
近年のWeb動向と今からできるコーポレートブランディング
近年のWeb動向と今からできるコーポレートブランディング近年のWeb動向と今からできるコーポレートブランディング
近年のWeb動向と今からできるコーポレートブランディング優幸 樋渡
 
U iscope 事業会社様向け_概要資料
U iscope 事業会社様向け_概要資料U iscope 事業会社様向け_概要資料
U iscope 事業会社様向け_概要資料Daisuke Hiraishi
 
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐Rakuten Group, Inc.
 
20141003 webマーケティングエンジニアリング
20141003 webマーケティングエンジニアリング20141003 webマーケティングエンジニアリング
20141003 webマーケティングエンジニアリングInnova Inc.
 
プロトタイピングの目的・範囲・ツール
プロトタイピングの目的・範囲・ツールプロトタイピングの目的・範囲・ツール
プロトタイピングの目的・範囲・ツールtheguild
 
業務効率をあげる便利ツールのご紹介
業務効率をあげる便利ツールのご紹介業務効率をあげる便利ツールのご紹介
業務効率をあげる便利ツールのご紹介lolipopjp
 
シックス・アパート製品のコンセプトと新パートナープログラムの紹介
シックス・アパート製品のコンセプトと新パートナープログラムの紹介シックス・アパート製品のコンセプトと新パートナープログラムの紹介
シックス・アパート製品のコンセプトと新パートナープログラムの紹介Six Apart KK
 
データフィード広告の市場動向と環境変化
データフィード広告の市場動向と環境変化データフィード広告の市場動向と環境変化
データフィード広告の市場動向と環境変化Yoshihiro Okada
 
個客とIAとアクセス解析
個客とIAとアクセス解析個客とIAとアクセス解析
個客とIAとアクセス解析Makoto Shimizu
 
ShibuyaUX - UX and Analytics
ShibuyaUX - UX and AnalyticsShibuyaUX - UX and Analytics
ShibuyaUX - UX and AnalyticsMakoto Shimizu
 
ユーザテストと定量分析ツールの併用方法
ユーザテストと定量分析ツールの併用方法ユーザテストと定量分析ツールの併用方法
ユーザテストと定量分析ツールの併用方法Ryota Ono
 
アクセス解析による サイト改善の進め方
アクセス解析による サイト改善の進め方アクセス解析による サイト改善の進め方
アクセス解析による サイト改善の進め方ニフティ株式会社
 

Similar to [DL輪読会]POG: Personalized Outfit Generation for Fashion Recommendation at Alibaba iFashion (20)

イマドキの改善!データ分析SDK導入のポイントとAI活用最新事例 / GTMF2019
イマドキの改善!データ分析SDK導入のポイントとAI活用最新事例 / GTMF2019イマドキの改善!データ分析SDK導入のポイントとAI活用最新事例 / GTMF2019
イマドキの改善!データ分析SDK導入のポイントとAI活用最新事例 / GTMF2019
 
saleshub_AiDeal LP202210.pdf
saleshub_AiDeal LP202210.pdfsaleshub_AiDeal LP202210.pdf
saleshub_AiDeal LP202210.pdf
 
ネット広告講義資料 at 東京大学 2017/07/11
ネット広告講義資料 at 東京大学 2017/07/11ネット広告講義資料 at 東京大学 2017/07/11
ネット広告講義資料 at 東京大学 2017/07/11
 
サイトサーチアナリティクスとは
サイトサーチアナリティクスとはサイトサーチアナリティクスとは
サイトサーチアナリティクスとは
 
集客ROI 最大化セミナー
集客ROI 最大化セミナー集客ROI 最大化セミナー
集客ROI 最大化セミナー
 
ビザスクを支える技術 2017
ビザスクを支える技術 2017ビザスクを支える技術 2017
ビザスクを支える技術 2017
 
近年のWeb動向と今からできるコーポレートブランディング
近年のWeb動向と今からできるコーポレートブランディング近年のWeb動向と今からできるコーポレートブランディング
近年のWeb動向と今からできるコーポレートブランディング
 
U iscope 事業会社様向け_概要資料
U iscope 事業会社様向け_概要資料U iscope 事業会社様向け_概要資料
U iscope 事業会社様向け_概要資料
 
事業企画
事業企画事業企画
事業企画
 
IABネイティブアド・プレイブック概要
IABネイティブアド・プレイブック概要IABネイティブアド・プレイブック概要
IABネイティブアド・プレイブック概要
 
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
 
20141003 webマーケティングエンジニアリング
20141003 webマーケティングエンジニアリング20141003 webマーケティングエンジニアリング
20141003 webマーケティングエンジニアリング
 
プロトタイピングの目的・範囲・ツール
プロトタイピングの目的・範囲・ツールプロトタイピングの目的・範囲・ツール
プロトタイピングの目的・範囲・ツール
 
業務効率をあげる便利ツールのご紹介
業務効率をあげる便利ツールのご紹介業務効率をあげる便利ツールのご紹介
業務効率をあげる便利ツールのご紹介
 
シックス・アパート製品のコンセプトと新パートナープログラムの紹介
シックス・アパート製品のコンセプトと新パートナープログラムの紹介シックス・アパート製品のコンセプトと新パートナープログラムの紹介
シックス・アパート製品のコンセプトと新パートナープログラムの紹介
 
データフィード広告の市場動向と環境変化
データフィード広告の市場動向と環境変化データフィード広告の市場動向と環境変化
データフィード広告の市場動向と環境変化
 
個客とIAとアクセス解析
個客とIAとアクセス解析個客とIAとアクセス解析
個客とIAとアクセス解析
 
ShibuyaUX - UX and Analytics
ShibuyaUX - UX and AnalyticsShibuyaUX - UX and Analytics
ShibuyaUX - UX and Analytics
 
ユーザテストと定量分析ツールの併用方法
ユーザテストと定量分析ツールの併用方法ユーザテストと定量分析ツールの併用方法
ユーザテストと定量分析ツールの併用方法
 
アクセス解析による サイト改善の進め方
アクセス解析による サイト改善の進め方アクセス解析による サイト改善の進め方
アクセス解析による サイト改善の進め方
 

More from Deep Learning JP

【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving PlannersDeep Learning JP
 
【DL輪読会】事前学習用データセットについて
【DL輪読会】事前学習用データセットについて【DL輪読会】事前学習用データセットについて
【DL輪読会】事前学習用データセットについてDeep Learning JP
 
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...Deep Learning JP
 
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】Zero-Shot Dual-Lens Super-ResolutionDeep Learning JP
 
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxivDeep Learning JP
 
【DL輪読会】マルチモーダル LLM
【DL輪読会】マルチモーダル LLM【DL輪読会】マルチモーダル LLM
【DL輪読会】マルチモーダル LLMDeep Learning JP
 
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
 【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo... 【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...Deep Learning JP
 
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】AnyLoc: Towards Universal Visual Place RecognitionDeep Learning JP
 
【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Can Neural Network Memorization Be Localized?【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Can Neural Network Memorization Be Localized?Deep Learning JP
 
【DL輪読会】Hopfield network 関連研究について
【DL輪読会】Hopfield network 関連研究について【DL輪読会】Hopfield network 関連研究について
【DL輪読会】Hopfield network 関連研究についてDeep Learning JP
 
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )Deep Learning JP
 
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...Deep Learning JP
 
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"Deep Learning JP
 
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
【DL輪読会】"Language Instructed Reinforcement Learning  for Human-AI Coordination "【DL輪読会】"Language Instructed Reinforcement Learning  for Human-AI Coordination "
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "Deep Learning JP
 
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat ModelsDeep Learning JP
 
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"Deep Learning JP
 
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...Deep Learning JP
 
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...Deep Learning JP
 
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...Deep Learning JP
 
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...Deep Learning JP
 

More from Deep Learning JP (20)

【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
 
【DL輪読会】事前学習用データセットについて
【DL輪読会】事前学習用データセットについて【DL輪読会】事前学習用データセットについて
【DL輪読会】事前学習用データセットについて
 
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
 
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
 
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
 
【DL輪読会】マルチモーダル LLM
【DL輪読会】マルチモーダル LLM【DL輪読会】マルチモーダル LLM
【DL輪読会】マルチモーダル LLM
 
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
 【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo... 【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
 
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
 
【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Can Neural Network Memorization Be Localized?【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Can Neural Network Memorization Be Localized?
 
【DL輪読会】Hopfield network 関連研究について
【DL輪読会】Hopfield network 関連研究について【DL輪読会】Hopfield network 関連研究について
【DL輪読会】Hopfield network 関連研究について
 
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
 
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
 
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
 
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
【DL輪読会】"Language Instructed Reinforcement Learning  for Human-AI Coordination "【DL輪読会】"Language Instructed Reinforcement Learning  for Human-AI Coordination "
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
 
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
 
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
 
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
 
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
 
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
 
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
 

Recently uploaded

論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイルLoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイルCRI Japan, Inc.
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアルLoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアルCRI Japan, Inc.
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 

Recently uploaded (11)

論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイルLoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアルLoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 

[DL輪読会]POG: Personalized Outfit Generation for Fashion Recommendation at Alibaba iFashion

  • 1. POG: Personalized Outfit Generation for Fashion Recommendation at Alibaba iFashion
 
 Ryosuke Goto (ZOZO Research)
 

  • 2. 書誌情報 ● 著者: Wen Chen, Pipei Huang, Jiaming Xu, Xin Guo, Cheng Guo, Fei Sun, Chao Li, Andreas Pfadler, Huan Zhao, Binqiang Zhao ● 所属: Alibaba Group ● 選定理由 ○ Transformerをコーディネート生成と推薦タスクにうまく活用している点 ○ Webサービスとしてデプロイして活用している実績
  • 3. 概要 ● 調和のとれたファッションコーディネートを個人の嗜好に合わせて生成する Encoder-Decoder,POGを提案 ● Fill in the blank,Compatibility Predictionのタスクにおいて,過去の研究と比較して高い性能を示した. ● webサービスとしてデプロイし,協調フィルタリングと比べ, CTRが70%向上することを示した. ● 100万を超えるコーディネート,その関連商品,ユーザーのクリックアクションを含むデータセットを構築した (https://github.com/wenyuer/P0G)
  • 4. 背景 ● 中国のアリババグループが運営する ECサイト タオバオにはAIによるコーディネート提案機能がある. ○ 商品をより魅力的に見せるために,コーディネートとして提案する ○ 商品の組み合わせとして見せることで,追加の商品購入を狙う ○ クオリティの高い商品の組み合わせを個人の趣味・趣向に合わせて提案することがビジネスと直結 https://hackernoon.com/finding-the-perfect-outfit-with-alibabas-dida-ai-assistant-71ba7c9e8cfa
  • 5. 過去のOutfit Generationの研究 ● メトリックによるOutfitの学習 ○ コーディネートや同時購入のデータからペアをサンプルして,距離を近づけるように学習 ○ ペアに注目し,全体を一度に考慮できない問題 Song et al. 2018
  • 6. 過去のOutfit Generationの研究 ● LSTMによるモデリング ○ CNNによってembedした商品をLSTMに入力 ○ 商品カテゴリによる入力順序の固定 ○ 入力順序固定にはどんな意味がある? Han et al. 2017 Nakamura & Goto 2018
  • 7. 提案手法: FOM (Fashion Outfit Model) ・マクスした商品を当てる Fill in the blankを学習する ・インプットには,画像,タイトル,協調フィルタリングによる関係を embedした特徴を合わせて使う ・Transformer部分はMulti-head self-attentionとPosition-wise Feed-forwardを利用 ・入力の順序は関係ないので position embeddingは使わない
  • 8. 提案手法: FOM (Fashion Outfit Model) ・マスクした商品と,対象コーデ以外からサンプルした商品 3つの中から,マクスした商品を当てる ・このタスクを解くことで, Compatibilityを評価できるモデルを得ることができる
  • 9. 提案手法: POG (Personalized Outfit Generation) ・POGはPer NetworkとGen Networkの二つのネットワークで構成される ・encoder(Per Network)のインプットはユーザーの商品クリックのデータを利用 ・decoder(Gen Network)にはユーザーがクリックしたコーディネートを予測させる ・Gen Networkの初期値はFOMの重みを利用
  • 10. 定量評価(FOM) Fill in the blank(FITB) 4つの商品からコーディネートの組み合わせに適した商 品を選ぶタスク Compatibility Prediction (CP) 本当のコーディネートか,ランダムにアイテムを集めた 偽物のコーディネートかを当てるタスク 異なる入力モダリティのうち,商品タイトルの情報は FITB, CPを解くのに重要であることがわかる.画像と CFの特徴を加えると性能が微増する. CFの特徴はセ マンティクスが含まれないので単体ではワークしないら しい. 過去のLSTMを使った研究では商品カテゴリにより入力 を固定していた(Ordered).LSTM系のモデルは順序固 定の方がパフォーマンスが良い一方で, FOMは順序に 依存しない.
  • 11. 定量評価(POG) 生成方法 + 提供方法別にオンラインでテストした結果 POG, POG+FOM ユーザーの商品クリックを受けて,パーソナライズしたコーデ 生成結果を返す.もっとも高い CTRとなったのはPOG+FOM (Genの初期化にpre-trained FOMを利用) F-LSTM+CF, Bi-LSTM+CF, Gen+CF コーデ生成結果を協調フィルタリングで推薦する . Gen, Bi-LSTM, F-LSTMの順にCTRが高いように見える F-LSTM+RR, Bi-LSTM+RR, Gen+RR コーデ生成結果をランダムに表示させる. 性能が悪い.
  • 12. まとめと感想 ● 調和のとれたOutfitを個人の趣味に合わせて生成する Encoder-Decoder,POGを提案 ○ Per Networkで個人の趣味の情報を抽出し,自然な形で Outfit Generationに活かしている ○ FITBやCPのタスクでLSTM系のモデルを大きく上回る結果 ○ オンラインテストでも他のモデルを大きく上回る高い CTR ● 感想 ○ webサービスの内側の人しかアクセスできないユーザーのクリック情報を含んだ大規模コーディ ネートデータセットを提供しているため, webサービスを持っていなくても,レコメンドの性能を測れる ようになったのが大きいと思います. ○ このような優れたデータセットの提供を, ZOZOが最初にやれなかったのが悔しいです.