Webマーケティングを通じた
データサイエンティストの価値発揮方法
滋賀大学 データサイエンスセミナー
2020年9月29日
代表
五十嵐康伸、博士(理学)
概要
• 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善
が近年期待されている。
• 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発
揮方法を概説する。
特に
1. PJ(プロジェクト)の目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方
法
2. データの利用方法
3. 社外<社内のコラボレーション方法 ← を分からないと、恐怖
について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
本セミナーのスコープ
• 開発=売るものを作る
• セールス=売る仕組みを作って実行
• マーケ=売れる仕組みを作って実行
要件定
義
設計 構築 運用 監視 保守
本セミナーのスコープ
2. 既存事業
Idea
Verification
CPF:
customer
problem fit
PSF:
problem
solution fit
PMF:
product
market fit
Transition to
Scale
1. 新規事業
課題の一覧化 課題の絞り込み
具体化
プロトタイプの作成 MVPの作成
メトリクスの測定
ユニットエコノミクス
の健全化
[起業の科学]
• Webマーケ(ティング)の話と聞くと
UU、PV、CV、CVR、ROI、CTR、CPA、CPC
と横文字の単語の説明を想像されたり
• データサイエンティストと聞くと
統計、機械学習の理論や実装方法の説明を想像されたり
する方が多いかもしれませんが
概要
• 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善
が近年期待されている。
• 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発
揮方法を概説する。
特に
1. PJ(プロジェクト)の目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方
法
2. データの利用方法
3. 社外<社内のコラボレーション方法 ← を分からないと、恐怖
について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
恐怖のロールプレイ
• あなたは事業会社(例えば、EC)のWebマーケ部に新
人データサイエンティストとして配属されました
*EC:五十嵐が経験したことがない業種です
• (DSの実務経験はない)上司から「まー、自分で色々
調べて、何をしたいか自分で考えてみて。困ったことが
出てきたら何でも相談してね」と(自由だけど何も具
体的ではない)指示を受けました
2. データの利用方法の問題
テーブル定義書・ER図がない、作れていない
変数名とコメントから中身を推測
→
できるか!
2. データの利用方法の問題
テーブル定義書が複数ある
チームメンバー毎に持っているversionが皆違う
あの人が最新版を持っているよ
→
そんな助言はいらん
version管理してくれ!
2. データの利用方法の問題
異なるDBに、同じテーブル名がある、でも中身は違う
異なるtableに、同じコラム名がある、でも中身は違う
→
命名規則を決めてくれ!
→
頭を下げて同じ部署の先輩に聞きに行く
2-3回は教えてくれるけど、その後は「DB担当に聞いて」と言われる
→
頭を下げてDB担当に聞きに行く
2-3回は教えてくれるけど、その後は「別のDB担当に聞いて」と言われる
→
いつまで経ってもデータの全体像はすっきり分らない
2. データの利用方法の問題
• 2000年のITバブルから、20年増築を行った九龍城砦
• 誰も全体を理解できない
1. プロジェクトの目標設定方法の問題
今ある古いリコメンドエンジンよりも性能の良い
新しいリコメンドエンジンを開発しようよ
→
社内の先輩が作った古いリコメンドツールが性能が悪い
と証明したら、先輩を否定することになる
なので、開発できない
→
人の評価と性能の評価は分けてくれ
1. プロジェクトの目標設定方法の問題
"最新のpythonライブラリーを使って"
今ある古いリコメンドエンジンよりも性能の良い
新しいリコメンドエンジンを開発しようよ
→
AWS上で動かないよ、速度でないよ
PySparkで動くライブラリーだけを使って
→
それはわかる
でも、それは部署共通の開発ルールとして、新人には先に
教えてくれ
1. プロジェクトの目標設定方法の問題
"自作のpythonライブラリーを作って"
今ある古いリコメンドエンジンよりも性能の良い
新しいリコメンドエンジンを開発しようよ
→
別のPJ用に買った市販のリコメンドエンジンで十分じゃな
い?
→
それはわかる
でも、それなら部署共通の開発ルールとして、新人には先に
教えてくれ
概要
• 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善
が近年期待されている。
• 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発
揮方法を概説する。
特に
1. PJの目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方法
2. データの利用方法
3. 社外<社内のコラボレーション方法 ← を分からないと、誰も協力・動いてくれない
について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
大学の授業「体系的、歴史的、客観的」:15コマ x n
回
<
企業の現場「単発的、現代的、主観的」:1コマ x 1回
セミナーの想定:新入社員向けの研修
年齢 エキスパート職 マネージメント職 役割 Commit to the
22-27 エンジニア 与えられた仕事をこなす Process
27-34 シニアエンジニア チームリーダー 二人仕事の責任者
資格を取る
(他の業界・別の職種への転
職も考える)
Result
35-42 チーフエンジニア、 グループリーダー
マネージャー
難しい仕事が回ってくる
人をまとめるのに特化
Result
ResultにCommit(価値発揮)できるようになって欲しい
Resultとは何か?を自分で考えられるようになって欲しい
by 先輩
概要
• 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善
が近年期待されている。
• 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発
揮方法を概説する。
特に
1. PJの目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方法
2. データの利用方法
3. 社外<社内のコラボレーション方法 ← を分からないと、誰も協力・動いてくれない
について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
目標設定がなぜ重要か?
段取り八分、仕事二分
準備8割、実行2割
評価関数が決まったら、制御工学の問題は8割終わってい
る
目的変数(と説明変数)を決めれたら、DSの問題は8割終
わっている
What > How
(本セミナーで証明はしません、お許しください)
概要
• 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善
が近年期待されている。
• 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発
揮方法を概説する。
特に
1. PJの目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方法
2. データの利用方法
3. 社外<社内のコラボレーション方法 ← を分からないと、誰も協力・動いてくれない
について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
目標設定の階層
1. 世界
2. 国、政府、自治体
3. 企業
4. 組織
5. PJ
PJとは何か?
• 独自の成果物、またはサービスを創出するための期
限のある活動
• 本セミナーでは、仕事と理解してください
PMBOK(Project Management Body of Knowledg)
プロジェクトマネジメント知識体系ガイド
by プロジェクトマネジメント協会
目標設定の階層
1. 世界
2. 国、政府、自治体
3. 企業
4. 組織
5. PJ
PJの目標を、企業の目標と、組織の目標に重ね合わせるこ
とが大事
相手にwinが有ると、相手は動いてくれやすい
相手にwinが無いと、相手は動いてくれにくい
企業の目標設定方法
1. 経営理念(企業理念)
2. Vision-Mission-Value
3. 中期(5年)経営計画
一マーケ社員はだと決定に関わるのは難しい
経営理念に書かれていること
1. なぜ、われわれは働いているのか?
2. なぜ、この仕事をするのか?
3. なぜ、ここまでやるのか?
の哲学
• 絶対的に正しい、絶対的に間違っているはない
• 自分達で考えて決めるもの
[坂上 仁志、経営理念の考え方・つくり方]
企業の最大の課題
社会的な正当性の確立
1. Vision (将来像)
2. Mission(使命)
3. Value(価値観)
「儲かる!」は重要
「儲かる!」だけでは人はついてこない
「儲かる!」は手段
[P・F・ドラッガー、ネクスト・ソサエティ]
企業倫理
(の構成要素、骨格)
= 経営理念
Value = How
会社のが持つ/大切にする価値
Product / Service
の作成する
Mission = What
会社の使命・任務
Vision = Why
会社の目指す姿
As is
Will-1:したいこと
Can-1:できること
Must-1:すべきこと
Resource:経営資源(人・物・金・情報)を
自社内 or 他社 or 個人と
交換することで再生産する(増やす)
To be:作りたい未来の世界
を実現したい
Gap:現在と未来の差を埋めたい
課題(problem)を解決したい
As is:現在の世界
物
情報
金
人
人
物
情報
金
「経営目標を一緒に達成しましょうよ。どんどんやり方提案して、
手を動かして、周りと調整して、結果出していきますよ」
と言って結果を出す=価値発揮に必須
仕組みを回す or
仕組みを作ること = 仕事
企業活動とあなたの関係
To be
Will-2
Can-2
Must-2
企業B 企業A
人
物
情報
金
あなた
Gap
Career Path を考えるということ
会社というResourceはGapを埋めてくれるのか?
Yes = 会社楽しい、No = 会社楽しくない
目標設定の階層
1. 世界
2. 国、政府、自治体
3. 企業
4. 組織
5. PJ
PJの目標を、企業の目標と、組織の目標に重ね合わせるこ
とが大事
相手にwinが有ると、相手は動いてくれやすい
相手にwinが無いと、相手は動いてくれにくい
組織、個人の目標設定方法
• OKR
• MBO
• KGI-KSF-KPI
OKR:Objectives and Key Results
目標と主要な結果
図表削除
https://note.com/kengomori/n/ncaf88a5a94dc
目標設定方法の違い
図表削除
https://note.com/kengomori/n/ncaf88a5a94dc
https://www.hito-link.jp/media/column/okr/kpi_kgi
目標設定の階層
1. 世界
2. 国、政府、自治体
3. 企業 経営理念:Vision-Mission-Value、中期(5年)経営計画
4. 組織:OKR、KGI-KSF-KPI、MBO
5. PJ
PJの目標を、企業の目標と、組織の目標に重ね合わせることができたら
社内のメンバーが協力してくれる=相手を動かせる
その他の方法で設定してPJを始めようとしても
「It‘s not my business」 「It‘s not your business」
事業会社における
DS業務のイメージ
<機械学習クエスト〜ドラゴンクエスト>
• 竜王(機械学習)にたどり着くまで 80%
• 竜王(機械学習)を倒す 20%
• 機械学習の(Kaggle的な)問題を作ること 80%
• 機械学習の(Kaggle的な)問題を解くこと 20%
概要
• 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善
が近年期待されている。
• 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発
揮方法を概説する。
特に
1. PJの目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方法
2. データの利用方法
3. 社外<社内のコラボレーション方法 ← を分からないと、誰も協力・動いてくれない
について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
Result = 価値
<経営層がやりたいこと>
• 「不確実な情報」の中で、「資源をどのような施策(アクション)に使う
か/使わないか」を意思決定したい
• 「意思決定の確度を高めるための情報」をデータから作って欲しい欲
しい
<分析の成果物>
• 実行してほしい/欲しく無い 施策を3行のStoryで提案
• 図表、数値は提案の根拠、必須で見せるのは最小、その他は聞か
れたら出す
• 図表、数値から話すと「so what?結論から言って」と返事が返ってく
る
0:意思決定したいことの明確化
経営視点を忘れちゃダメよ
<意思決定表、チェックリスト>
事業の課題 Webマーケ の役割
事業拡大 新商品開発 本セミナーのスコープ外
事業拡大 新規顧客の獲得 ・コンセプト把握(顧客像、商品ベネフィット)→クラスタリング分析、因
子分析、主成分分析、コレスポンデンス分析
・流入経路改善→アトリビューション分析(主にオンライン)
事業安定化 既存顧客のランクアップ ・クロスセル・アップセル→併買分析、価格帯分析
・販促効率アップ→回帰分析、協調フィルタリング
既存顧客のランクダウンの防止 ・離脱防止→チャーン分析
Step by Step のすり合わせを忘れちゃダメよ
<分析フレームワーク>
3.問題としている現象・事実の明確化
4. 必要な情報・データ・ロジックの明確化
5. 現象の把握
6. ビジネス全体における課題の特定
7. 施策につながる分析結果
8.報告と合意形成
9. 施策の意思決定
2:分析手順の明確化
3:問題としている現象・事実の明確化
言われたのをぼんやりうけとっちゃダメよ
前提知識・バックグラウンドに違いがあることを忘れちゃダメよ
<問題候補表>
比較対象
(ベンチマーク)
比 差
対 前年
対 前月
対 都道府県
対 計画
対 競合
対~
4:現象・事実をとらえるのに必要な
情報・データ・ロジックの明確化
手持ちのデータから考えちゃダメよ
データから分析しちゃダメよ
どんなデータでも使えると思っちゃダメよ
<必要材料表>
現象 必要な情報 データ ロジック
前月比 前月情報
前年比 前年情報
計画比 計画値&計画値のロジッ
ク情報
他エリア比 他エリア情報
競合比 競合IR情報
5:現象の把握
現象 必要な情報 データ ロジック
前月比 前月情報
前年比 前年情報
計画比 計画値&計画値のロジッ
ク情報
他エリア比 他エリア情報
競合比 競合IR情報
6.ビジネス全体における課題の特定
点から始めてはダメよ、木を見て森を見ずはダメよ
丸ごと飲み込んじゃダメよ
ブレイクダウンしないとだめよのシーン
<ビジネスプロセス図>
例)売上の減少
売り上げが下がった要因に行く前に、まずはビジネスの構造把握
課題は複層的(多層的、階層的)で注目点の前後にあるかも
ボトルネックの洗い出し、制御可能 or 不可能変数の列挙
図表削除
https://www.netyear.net/idea/dt20181108.html
7: 施策につながる分析結果
分かる・発見だけじゃダメよ。打ち手・施策につながらなきゃダメよ。
<施策比較表>
例)施策が販促
施策対象の種類 制御可能な変数 施策内容 コスト リターン
Who 販促ターゲット顧客
What モノ、コト 商品
When 実施タイミング 冬にアイスは受け入れられづらい
Where タッチポイント CM、交通広告、Web広告、メル
マガ、DM、新聞、チラシ、電話、
Why 訴求内容、ベネフィ
ット
キャッチコピー、クリエイティブ
How インセンティブ
How many
分析例
1. 売上予測
・入力データ形式:時系列x予測対象(売上、伝票数、ユニークユーザ数他)
・手法:ARIMAとか
・アウトプット:予測曲線
2. who ざっくりどんな人たちがお客?
・入力データ形式:ヒトx商品
・手法:因子分析?主成分分析?⇒クラスタリング
・アウトプット:顧客(ニーズ)のラベル(クラスタリング結果に名前を付けたもの)
3. what よく似た(よく一緒に買われる)商品って何?
・入力データ形式:併買マトリクス(商品x商品)とか? リサーチデータで商品の要素データ見つけてくる感じ?
・手法:相関分析
・アウトプット:商品(ベネフィットや用途)のラベル(クラスタリング結果に名前を付けたもの)
4. who x what 販促反応予測(退職者予想、新規登録予測、ランクアップ、ランクダウン予測)
・入力データ形式:ヒトx予測対象(反応@特定のwhat)
・手法:ロジスティック回帰、決定木
・アウトプット:予測スコア、高反応セグメント条件式
5. who x when チャーン予測
・入力データ形式:ヒトxチャーン
・手法:ロジスティック回帰、決定木
・アウトプット:予測スコア、チャーンリスクセグメント条件式
8:報告と合意形成
<報告書、エグゼクティブサマリ>
事実の指摘:Aがどれくらいの規模で起きている。
施策の主旨:Bに対してCを投下することでDという規模の効果を期待
する。
根拠:なぜなら、Eという構造になっているから。
例)施策が販促施策の場合
F月の売上額はG円。
対前年比H%(対前年差△I円)、前月比J%(前月差K円)
増加(減少)の内訳としては、
提案施策による売上増(減)がL%
8:報告と合意形成
<報告書の粒度>
経営資源の意思決定、何が起きていて、打開策はどう
である、の数行の文章、形式を作るのが大事
図表は証拠
文章に違和感がなければ、意思決定者は、図表みな
い
概要
• 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善
が近年期待されている。
• 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発
揮方法を概説する。
特に
1. PJの目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方法
2. データの利用方法
3. 社外<社内のコラボレーション方法 ← を分からないと、誰も協力・動いてくれない
について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
KPI一覧
https://markezine.jp/word/
図表削除
マーケ x DSの勉強につかえるデータセット
• E-Commerce Data
Actual transactions from UK retailer
https://www.kaggle.com/carrie1/ecommerce-data
1. InvoiceNo: Invoice number. Nominal, a 6-digit integral number uniquely assigned to each transaction. If
this code starts with letter 'c', it indicates a cancellation.
2. StockCode: Product (item) code. Nominal, a 5-digit integral number uniquely assigned to each distinct
product.
3. Description: Product (item) name. Nominal.
4. Quantity: The quantities of each product (item) per transaction. Numeric.
5. InvoiceDate: Invice Date and time. Numeric, the day and time when each transaction was generated.
6. UnitPrice: Unit price. Numeric, Product price per unit in sterling.
7. CustomerID: Customer number. Nominal, a 5-digit integral number uniquely assigned to each customer.
Country: Country name. Nominal, the name of the country where each customer resides.
8. Descriptionが途中で変わったり、カードの支払いが入っていたりして面白い
マーケ x DSの勉強につかえるデータセット
• E-Commerce Data
Actual transactions from UK retailer
https://www.kaggle.com/carrie1/ecommerce-data
• Anime Recommendations Database
Recommendation data from 76,000 users at myanimelist.net
https://www.kaggle.com/CooperUnion/anime-recommendations-database
• Innerwear Data from Victoria's Secret and Others
600,000+ innerwear product data extracted from popular retail sites
https://www.kaggle.com/PromptCloudHQ/innerwear-data-from-victorias-
secret-and-others
マーケ x DSの勉強につかえるデータセット
• Hotel booking demand
From the paper: hotel booking demand datasets
https://www.kaggle.com/jessemostipak/hotel-booking-demand
• New York City Airbnb Open Data
Airbnb listings and metrics in NYC, NY, USA (2019)
https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data
• E-commerce - Users of a French C2C fashion store
Explore user behaviour of 98K users of a successful website
https://www.kaggle.com/jmmvutu/ecommerce-users-of-a-french-c2c-
fashion-store
マーケ x DSの勉強につかえるデータセット
• Amazon sales rank data for print and kindle books
61,000 unique ASINs and 200,000,000 salesrank data points (JSON / CSV)
https://www.kaggle.com/ucffool/amazon-sales-rank-data-for-print-and-
kindle-books
• Instacart Market Basket Analysis
Which products will an Instacart consumer purchase again?
https://www.kaggle.com/c/instacart-market-basket-analysis/data
• Zillow Prize: Zillow’s Home Value Prediction (Zestimate)
Can you improve the algorithm that changed the world of real estate?
https://www.kaggle.com/c/zillow-prize-1/overview
まとめ
1. PJの目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方法
2. データの利用方法
3. 社外<社内のコラボレーション方法 ← を分からないと、誰も協力・動いてくれない
について、民間企業における具体例を紹介する。
困ったことがでてきたらいつでもメール、SNS等で気軽に相談してください
代表
五十嵐康伸、博士(理学)

Webマーケティングを通じたデータサイエンティストの価値発揮方法