分析手法のご紹介
赤塚:自己紹介
あかつか さとし
赤塚 諭
リクルートテクノロジーズ
ITソリューション統括部
ビッグデータ部 ビッグデータ1グループ
経歴
前職で、レポーティング業務及びBIツール導入業務を経験(4年)
・POSデータや注文データから基礎分析やバスケット分析、
クラスタによる顧客管理(施策ターゲットの抽出)
・BIツールでは、QlikViewの代理店としてツール導入だけでなく
導入時の分析画面の設計や使い方のアフターフォロー
所属
2014年11月より株式会社リクルートテクノロジーズにて、
リクルートグループに対して、データ面での意思決定支援業務に従事
現在
クラスタリングのアウトプットイメージ
[課題] UI・UX改善が評価がしづらい
■アウトプットイメージ
・ユーザーの質は変わっているのではないか
Conversion
(仮)詳細閲覧頻度
多い
一見
(仮)一覧ばかり
(仮)長期利用
CVなし
ユーザーの質
Conversion
(仮)詳細閲覧頻度
多い
一見
(仮)一覧ばかり
(仮)長期利用
CVなし
ユーザーの質をどうやって探るか
▶クラスター分析によってペルソナを定義して
セグメンテーションを行う
旧 新
ユーザーの質
アクセスデータからケース分類
それぞれの層には、
どういった人がいるのか
訪問のあったユーザー
初回訪問 or 再訪問 の構成
1日の訪問ユーザーの内で初回訪問のユーザーと再訪問(訪問日2日以上)
のユーザーで約半分ほど分かれている
満足度の高いユーザーはリピートするだろうという仮説の上で
初回訪問と再訪問を最初に切り分ける軸にした
行動データを基に
クラスタリング分析を実施
(k-means法)
クラスタリング結果を基に
初回訪問と再訪問
それぞれでペルソナ像を
定義していく
※グラフはダミーです
クラスタリング結果
※グラフ・表はダミーです
クラスタリング分析の結果、初回訪問は3クラスター、
再訪問は4クラスターが良さそうとわかった
各クラスターの構成比をみたり、行動データを平均
で集計することで、各ペルソナ像を理解する
クラスター ユーザー数 PV 検索回数 滞在時間 職種検索回数 エリア検索回数
クラスター-1 **** **** **** **** **** ****
クラスター-2 **** **** **** **** **** ****
クラスター-3 **** **** **** **** **** ****
総計 **** **** **** **** **** ****
初回訪問のクラスター構成
初回訪問の各クラスターの確認
初回訪問の各クラスターの箱ひげ
再訪問のクラスター構成
ユーザー行動を分ける閾値を探す
クラスター
1
クラスター
2
クラスター
3
特徴の合ったデータ項目 x クラスターの割合(縦) クラスター1 クラスター2 クラスター3
特徴の合ったデータをクラスターの
構成で確認することで、
閾値を決定していく
最終的には右図のような
条件分岐図を作成する
分類条件
PV数(例)
※グラフ・表はダミーです
クラスターの確定
過去30日の
各クラスターが想定していたクラスターになっているかを確認し、
行動特性からクラスターに名称をつけ管理していく
クラスターごとの集計
クラスター ユーザー数 PV 検索回数 滞在時間 職種検索回数 エリア検索回数
クラスター1 **** **** **** **** **** ****
クラスター2 **** **** **** **** **** ****
クラスター3 **** **** **** **** **** ****
クラスター4 **** **** **** **** **** ****
クラスター5
**** **** **** **** **** ****
総計 **** **** **** **** **** ****
クラスタ比率の推移
日別 クラスター構成の推移
日別のクラスター構成の推移を追うことで、
質の変化を可視化することが可能となった
Tableauでダッシュボード化
●施策後のクラスタ移動をモニタリング
●施策後の各クラスタのアクション変化をモニタリング
施策日
例えば7日後に入念訪問
層から毎日訪問層へ●%
変化した
という変遷を確認可能
施策後に伸びてきた層か
ら、施策が良かったのか
悪かったのかを判断可能
Tableauレポートとすることでモニタリング環境を整えた
全体図(ダッシュボード)
クラスター別データ集計
クラスタリング初めの一歩
クラスタリング手法
クラスターとは、「集落。ある特定のデータの集まり」のこと
クラスタリングによって別れたクラスターから、ユーザーがどのようなタイプに別れる
のかを把握することができる。 → ペルソナ把握
これによってユーザーを切り分ける時の参考となるデータやユーザー像が分かる。
今回の
分析手法
K-means法
クラスタ作成において、最もポピュラーな手法
①ランダムに任意のクラスタを割り振る
②クラスタの重心を計算する
③点のクラスタを、一番近い重心のクラスタへ変更する
①:点の色がクラスタ数 ②:重心を計算 ③:重心が近いクラスタへ変更
変化がなく
なるまで
繰り返す
ツールの紹介
12
●今回はSPSS modelerを使用 ▶ Pythonで実装可能
●Python
数表および時系列データを操作するためのデータ構造と演算
データの読み込み
K-meansの設定
K-meansの実行
値を元のデータに返す
オープンソースの機械学習ライブラリで、分類や回帰、クラスタリングなどの機能
が実装されています
参考書籍
13
 クラスタリングの基礎を知りたい
 Pythonは結構ネット上で検索をすると出てきます
http://www.mwsoft.jp/programming/numpy/kmeans.html
やさしいマーケティングのための多変量解析
クラスタリングと言わず、多変量解析の基礎が
わかりやすく解説されています
クラスター分析入門 POD版
―ファジィクラスタリングの理論と応用
クラスタリングに特化してわかりやすく解説さ
れています

分析手法のご紹介