SlideShare a Scribd company logo
Upgrade UX
with Data
クラシルを抽象化してみる
料理する人
↕
↕
レシピ
Users
↕
Media
↕
Items
⇠ マッチングロジック
Users
↕
Media
↕
Items
⇠ ユーザー素性
⇠ アイテム素性
とあるアパレルECの事例
レシピサービスの場合
⇠ マッチングロジック
Users
↕
Media
↕
Items
⇠ ユーザー素性
⇠ アイテム素性
パーソナライズにおける課題
素性をどう整備するか?
⇠ マッチングロジック
Users
↕
Media
↕
Items
⇠ ユーザー素性
⇠ アイテム素性
⾏動ログでクラスタリング
⇠ マッチングロジック
Users
↕
Media
↕
Items
⇠ ユーザー素性
⇠ アイテム素性
こっちをどうするか?
レシピ素性のデータ整備は
⼈⼒⼊⼒で綺麗なデータを⽤意
↓
機械でやることに固執しない
レシピの素性データ⼊⼒は
⼈間が得意なタスク
機械と⼈間の得意分野は異なる
Task 1: Task 2:
機械と⼈間の得意分野は異なる
Task 1: Task 2:
3の倍数だけを⾜した値は?
機械と⼈間の得意分野は異なる
Task 1: Task 2:
3の倍数だけを⾜した値は?
21
87
100
86
14
54
276
70
60
機械と⼈間の得意分野は異なる
Task 1: Task 2:
3の倍数だけを⾜した値は?
21
87
100
86
14
54
276
70
60
この⼈は話を聞いているか?
機械と⼈間の得意分野は異なる
Task 1: Task 2:
3の倍数だけを⾜した値は?
21
87
100
86
14
54
276
70
60
この⼈は話を聞いているか?
フィードバックデータを
効率良く取得する
⾏動ログでユーザークラスタリング
調理⼈の“⼈⼒データ⼊⼒”
フィードバックデータの取得
クラシルの裏側
世界のメディア企業は全て
同じ⼟俵での戦いになっている
⇠ マッチングロジック
Users
↕
Media
↕
Items
⇠ ユーザー素性
⇠ アイテム素性
⇠ マッチングロジック
Users
↕
Media
↕
Video
⇠ ユーザー素性
⇠ アイテム素性
クラシルもメディアの⼟俵
Upgrade UX with Data
は⽣き残るための必要条件
今⽇お話したいこと
•Personalization
•Data-Driven
•ETL Eco System
•EDA Scrum
今⽇お話したいこと
•Personalization
•Data-Driven
•ETL Eco System
•EDA Scrum
Personalization
ユーザのライフスタイルに寄り添う
時短
難易度低
和・洋多め
塩分多い
⽢め
低カロリー
難易度中
和・中多め
塩分量多め
⾟め
⾼カロリー
難易度⾼
和・洋・中多め
塩分量少め
⽢め
ログイン時間⻑
スキル低
平⽇の利⽤多い
⼣⽅の量多い
お気に⼊り少ない
ログイン時間短
スキル中
休⽇の利⽤多い
カロリー⾼め
お気に⼊り多い
ログイン時間⻑
スキル⾼い
休⽇の利⽤多い
カロリー低め
お気に⼊り多い
直近お気に⼊り
直近視聴状況
ユーザ素性レシピ素性
オンライン調整
週末によく調理して
いる
ヘルシー志向
和⾷と中華が好き
⾟いものが好み
和⾵パスタ
カロリー低め
⾟め
時短
R1
R2
R3
理由
U1
U2
U3
UserRecipe
Personalization
ユーザのライフスタイルに寄り添う
時短
難易度低
和・洋多め
塩分多い
⽢め
低カロリー
難易度中
和・中多め
塩分量多め
⾟め
⾼カロリー
難易度⾼
和・洋・中多め
塩分量少め
⽢め
ログイン時間⻑
スキル低
平⽇の利⽤多い
⼣⽅の量多い
お気に⼊り少ない
ログイン時間短
スキル中
休⽇の利⽤多い
カロリー⾼め
お気に⼊り多い
ログイン時間⻑
スキル⾼い
休⽇の利⽤多い
カロリー低め
お気に⼊り多い
直近お気に⼊り
直近視聴状況
ユーザ素性レシピ素性
オンライン調整
週末によく調理して
いる
ヘルシー志向
和⾷と中華が好き
⾟いものが好み
和⾵パスタ
カロリー低め
⾟め
時短
R1
R2
R3
理由
U1
U2
U3
UserRecipe
1. レ シ ピ 素 性 抽 出
• ⼈海戦術
• ルールベース
• 推論
Personalization
レシピ素性抽出
• ⼈海戦術
• クラシルシェフ
• 管理栄養⼠
Personalization
レシピ素性抽出
• ルールベース
• クラシルシェフ
• 管理栄養⼠
Personalization
レシピ素性抽出
• 推論
• HPO活⽤
Personalization
レシピ素性抽出
• 推論
• HPO活⽤
Personalization
レシピ素性抽出
• 推論
• Search活⽤
複数のアルゴリズム
でトレーニングした
い場合タグを付与す
る
Personalization
ユーザのライフスタイルに寄り添う
時短
難易度低
和・洋多め
塩分多い
⽢め
低カロリー
難易度中
和・中多め
塩分量多め
⾟め
⾼カロリー
難易度⾼
和・洋・中多め
塩分量少め
⽢め
ログイン時間⻑
スキル低
平⽇の利⽤多い
⼣⽅の量多い
お気に⼊り少ない
ログイン時間短
スキル中
休⽇の利⽤多い
カロリー⾼め
お気に⼊り多い
ログイン時間⻑
スキル⾼い
休⽇の利⽤多い
カロリー低め
お気に⼊り多い
直近お気に⼊り
直近視聴状況
ユーザ素性レシピ素性
オンライン調整
週末によく調理して
いる
ヘルシー志向
和⾷と中華が好き
⾟いものが好み
和⾵パスタ
カロリー低め
⾟め
時短
R1
R2
R3
理由
U1
U2
U3
UserRecipe
2. ユ ー ザ 素 性 抽 出
• ユーザ⾏動
• ルールベース
• 推論
Personalization
ユーザ素性抽出
• ユーザ⾏動
• レシピとの接触状況
• 推論
Personalization
ユーザ素性抽出
• ユーザ⾏動
ID DL⽇時 起動回数 お気⼊り数 プレミアム
100 2018/11/30 16:10:22
1200 15 無
200 2019/01/30 12:43:12
3000 400 有
300 2019/04/12 21:20:42
250 25 有
Personalization
ユーザ素性抽出
• レシピとの接触状況
ID 時短 和⾷ 低カロリー ⾁多め
100 30 1000 50 300
200 210 2200 400 320
300 71 125 3 101
Personalization
ユーザ素性抽出
• クラスタリング
• 協調フィルタリング
• バッチ推論
Personalization
ユーザ素性抽出
• バッチ推論
Personalization
ユーザ素性抽出
• バッチ推論
Personalization
ユーザ素性抽出
• オンライン調整
時間経過や繰り返し視聴によりコ ン テ ン ツ
は 磨 耗 し て い く
↓
同じクラスタ内の未 視 聴レシピに⼊ れ 替 え て 、
コ ン テ ン ツ プ ー ル を リ フ レ ッ シ ュ
Personalization
献⽴機能の強化への取り組み
週末によく調理して
いる
ヘルシー志向
和⾷と中華が好き
⾟いものが好み
提案 フィードバックを反映
献⽴ 買い物リスト
提案
+先週の残り物
週末によく調理して
いる
ヘルシー志向
和⾷と中華が好き
⾟いものが好み
家族構成
嫌いな⾷材
低価格
時短
曜⽇
User
理由
理由
今⽇お話したいこと
•Personalization
•Data-Driven
•ETL Eco System
•EDA Scrum
Data-Driven
データの活⽤ ≠ 集計 ≠ 可視化
• 集計して、増えた↑減った↓に⼀喜⼀憂しない
• ダッシュボードを作って達成した気にならない
• データから未来の価値を⽣み出す
データの活⽤ = 未来の価値
Data-Driven
未来の価値とは?
• 分布を知る
• 課題の局所化
• 相関を知る
• 因⼦を知る
現状の把握 未来の価値
転換
• ユーザビリティ向上
• プロダクト向上
• コンテンツ向上
• ビジネスサポート
機械学習は⼿段
イベントデザイン・ファースト
イベント設計
ファンネル・チェック
代表ファンネルの
トラフィックバランス
を分析
開発前にイベントと施策の
評価指標を決める
Data-Driven
今⽇お話したいこと
•Personalization
•Data-Driven
•ETL Eco System
•EDA Scrum
機械学習
Deep Learning
⺠主化
データ・エンジニアリング
インフラ・ストラクチャ
AutoML
サービス・アーキテクチャ
今までのMLエンジニア これからのMLエンジニア
統計
エンジニアリング
細分化
ETL Eco System
柔軟性の⾼い設計とは?
クラスタリング結果が⾮決定的 推論結果が⾮決定的クロスプラットフォーム 複数リソースのマージ
モデルのリビジョン管理データセットのリビジョン管理
アルゴリズムの変更
トレーニング・インスタンス
の最適化
ソース管理
ETL Eco System
不確実性
柔軟性の⾼い設計=代替提案が可能
ETL Eco System
ワークフローの循環を優先する
とにかくデータは
貯める
最初はとにかくSQL
を叩きまくる
S3に⽇付フォルダなどで
とりあえず管理
精度は出なくても
とにかくトレーニング
分析・分類・推論結
果をとりあえず返す
最初はシンプルなスクリプトで実装
最初にイベントを
設計
ETL Eco System
リソースコストの低減
インフラ EDA分析 ML サービス 運⽤ フィードバック
インフラ EDA分析 ML サービス 運⽤ フィードバック圧縮コスト
• ETL Eco Systemを活⽤して全体コストを圧縮
• 圧縮コストを次の施策に向けたEDA分析に充てる
ETL Eco System
EDA分析拡⼤
今⽇お話したいこと
•Personalization
•Data-Driven
•ETL Eco System
•EDA Scrum
成果の⾒える化
• EDA分析には終わりがなく進む⽅⾓を⾒失いがち
• 周囲からも何をやっているのかわかりづらい
EDA Scrum
レポートのライブラリ化
- 他の⼈が過去に⾏った同じ分析を
再びしなくて済む
- 多部署から分析依頼を受けた時に
過去の調査結果を参照できる
部署横断の報告会
- 分析の結果有⽤な情報は部署を横断
して報告する
- 得られた気づきを次のEDAに活かす
2週間スプリント
具体的なスクラムでの取り組み(⼀部)
• サムネイル評価(再⽣数、お気に⼊り数)
• 代替⾷材判定
• ⼿順のクラシルらしさ判定
EDA Scrum
サムネイル評価(再⽣数、お気に⼊り数)
EDA Scrum
サムネイル評価(再⽣数、お気に⼊り数)
EDA Scrum
代替⾷材判定
EDA Scrum
⼿順のクラシルらしさ判定
EDA Scrum
ETL x EDAサイクル
EDA Scrum
Extract Transform Load
EDA
SQL アドホック分析
変換 可視化
パイプライン化 レポート・報告
オンライン ストリーミング プロダクション
lv.1
lv.2
lv.3
lv.4
ユーザ・フィードバック
バッチ
バッチ
まとめ
• Personalization
ユーザからのフィードバックにより、レシピとユーザの素性を相互的に追加
• Data-Driven
データ活⽤の本当の価値は、現状を把握して未来の価値を⽣み出すこと
• ETL Eco System
設計の不確実性には、SageMakerなど代替可能なサービスで対応
• EDA Scrum
EDAの価値を⾒える化し、無駄のないETLとEDAの循環を効率よく回す

More Related Content

Similar to Startupday dely aws_follow

Google のクラウド サービスを利用する前に 注意すべきこと
Google のクラウド サービスを利用する前に 注意すべきことGoogle のクラウド サービスを利用する前に 注意すべきこと
Google のクラウド サービスを利用する前に 注意すべきこと
Compare GW
 
SpotBugs(FindBugs)による 大規模ERPのコード品質改善
SpotBugs(FindBugs)による 大規模ERPのコード品質改善SpotBugs(FindBugs)による 大規模ERPのコード品質改善
SpotBugs(FindBugs)による 大規模ERPのコード品質改善
Works Applications
 
Dyna traceによるuxマネジメント
Dyna traceによるuxマネジメントDyna traceによるuxマネジメント
Dyna traceによるuxマネジメント伸夫 森本
 
介護医療業界におけるマイクロソフトテクノロジー動向
介護医療業界におけるマイクロソフトテクノロジー動向介護医療業界におけるマイクロソフトテクノロジー動向
介護医療業界におけるマイクロソフトテクノロジー動向
Daisuke Masubuchi
 
ビジネスとデザイン ~ビジネスは悪くない~
ビジネスとデザイン ~ビジネスは悪くない~ビジネスとデザイン ~ビジネスは悪くない~
ビジネスとデザイン ~ビジネスは悪くない~
Ken Azuma
 
X dev 20121106
X dev 20121106X dev 20121106
X dev 20121106Ken Azuma
 

Similar to Startupday dely aws_follow (6)

Google のクラウド サービスを利用する前に 注意すべきこと
Google のクラウド サービスを利用する前に 注意すべきことGoogle のクラウド サービスを利用する前に 注意すべきこと
Google のクラウド サービスを利用する前に 注意すべきこと
 
SpotBugs(FindBugs)による 大規模ERPのコード品質改善
SpotBugs(FindBugs)による 大規模ERPのコード品質改善SpotBugs(FindBugs)による 大規模ERPのコード品質改善
SpotBugs(FindBugs)による 大規模ERPのコード品質改善
 
Dyna traceによるuxマネジメント
Dyna traceによるuxマネジメントDyna traceによるuxマネジメント
Dyna traceによるuxマネジメント
 
介護医療業界におけるマイクロソフトテクノロジー動向
介護医療業界におけるマイクロソフトテクノロジー動向介護医療業界におけるマイクロソフトテクノロジー動向
介護医療業界におけるマイクロソフトテクノロジー動向
 
ビジネスとデザイン ~ビジネスは悪くない~
ビジネスとデザイン ~ビジネスは悪くない~ビジネスとデザイン ~ビジネスは悪くない~
ビジネスとデザイン ~ビジネスは悪くない~
 
X dev 20121106
X dev 20121106X dev 20121106
X dev 20121106
 

Startupday dely aws_follow