xica adelie サンプルデータ分析
“レストランの売上”
はじめに	
 2	
ユーザー	
シチュエーション	
データの内容	
※ 上記内容は類似業種へのヒアリング情報に基づいたXICAによる創作です
※ 現実に同様の結果を保証する物ではありません
はじめに	
 3	
ユーザー	
シチュエーション	
データの内容	
※ 上記内容は類似業種へのヒアリング情報に基づいたXICAによる創作です
※ 現実に同様の結果を保証する物ではありません	
• レストランのオーナー
はじめに	
 4	
ユーザー	
 • レストランのオーナー	
シチュエーション	
• プロモーション施策(特にDMの送付)が、	
  
本当に効果があるのかを確認したい。	
  
• 気温、曜日、天候などの操作不能な外部要因
の影響は除きたい。	
  
データの内容	
※ 上記内容は類似業種へのヒアリング情報に基づいたXICAによる創作です
※ 現実に同様の結果を保証する物ではありません
はじめに	
 5	
ユーザー	
シチュエーション	
• プロモーション施策(特にDMの送付)が、	
  
本当に効果があるのかを確認したい。	
  
• 気温、曜日、天候などの操作不能な外部要因
の影響は除きたい。	
  
データの内容	
【成果】	
  
	
  -­‐	
  レストランの売上	
  
	
  
	
  
	
  
	
  
	
  
	
  
【要素】	
  
	
  -­‐	
  サイトG:総PV数	
  
	
  -­‐	
  サイトH:総PV数	
  
	
  -­‐	
  サイトT:総PV数	
  
	
  -­‐	
  最高気温	
  
	
  -­‐	
  雨天	
  
	
  -­‐	
  DM送信	
  
	
  -­‐	
  土日祝前日	
  
※ 上記内容は類似業種へのヒアリング情報に基づいたXICAによる創作です
※ 現実に同様の結果を保証する物ではありません	
• レストランのオーナー
分析の流れ	
 6
分析の流れ	
 7	
1.データを	
  
用意する	
p データを登録する
p データの概略を
把握する
分析の流れ	
 8	
1.データを	
  
用意する	
2.データを	
  
読み解く	
p データを登録する
p データの概略を
把握する	
p 分析機能を使っ
てモデルの精度
を上げる
p 違ったアプローチ
の分析を試す
分析の流れ	
 9	
1.データを	
  
用意する	
2.データを	
  
読み解く	
3.結果を	
  
比べる	
p データを登録する
p データの概略を
把握する	
p 分析機能を使っ
てモデルの精度
を上げる
p 違ったアプローチ
の分析を試す	
p 保存したモデル
を比べる
分析の流れ	
 10	
1.データを	
  
用意する	
2.データを	
  
読み解く	
3.結果を	
  
比べる	
p データを登録する
p データの概略を
把握する	
p 分析機能を使っ
てモデルの精度
を上げる
p 違ったアプローチ
の分析を試す	
p 保存したモデル
を比べる
1.	
  データを用意する	
まずはデータの全体像を	
  
ざっくり把握する	
11
1.	
  データを用意する	
p データセット一覧からデータを開く	
  
	
12
1.	
  データを用意する	
p データセット一覧からデータを開く	
  
	
13	
使用するデータを選
択する	
※ 新規登録の方法はヘルプを参照下さい
1.	
  データを用意する	
p 分析モデルの編集画面を開く	
  
14
1.	
  データを用意する	
p 分析モデルの編集画面を開く	
  
15	
分析モデルを選択する
1.	
  データを用意する	
p 分析モデルの概要を把握する	
16
1.	
  データを用意する	
p 分析モデルの概要を把握する	
17
1.	
  データを用意する	
p 分析モデルの概要を把握する	
18	
モデルの精度 ・・・ 60.32%
1.	
  データを用意する	
p 分析モデルの概要を把握する	
19	
モデルの精度 ・・・ 60.32%	
分析モデルによる「予測値」
がどの程度「実測値」を表わ
しているかを示す。
(0% ~ 100%)
1.	
  データを用意する	
p 分析モデルの概要を把握する	
20	
モデルの精度 ・・・ 60.32%	
分析モデルによる「予測値」
がどの程度「実測値」を表わ
しているかを示す。
(0% ~ 100%)
1.	
  データを用意する	
p 分析モデルの概要を把握する	
21	
モデルの精度 ・・・ 60.32%	
結果に影響する要素 ・・・ 3つ
分析モデルによる「予測値」
がどの程度「実測値」を表わ
しているかを示す。
(0% ~ 100%)
1.	
  データを用意する	
p 分析モデルの概要を把握する	
22	
モデルの精度 ・・・ 60.32%	
結果に影響する要素 ・・・ 3つ
95%以上の確率で相関して
いる要素は「影響がある」と
判断をする。	
分析モデルによる「予測値」
がどの程度「実測値」を表わ
しているかを示す。
(0% ~ 100%)
1.	
  データを用意する	
p 分析モデルの概要を把握する	
23	
モデルの精度 ・・・ 60.32%	
結果に影響する要素 ・・・ 3つ
95%以上の確率で相関して
いる要素は「影響がある」と
判断をする。	
分析モデルによる「予測値」
がどの程度「実測値」を表わ
しているかを示す。
(0% ~ 100%)	
※ 初期の分析モデルでは、影響する要素3つのうち2つは外部要因(天候、曜日)であり、	
  
DMの送付は影響がないという結果になっている
分析の流れ	
 24	
1.データを	
  
用意する	
2.データを	
  
読み解く	
3.結果を	
  
比べる	
p データを登録する
p データの概略を
把握する	
p 分析機能を使っ
てモデルの精度
を上げる
p 違ったアプローチ
の分析を試す	
p 保存したモデル
を比べる
2.	
  データを読み解く	
初期のモデルでは「DMによる影響はない」・・・。	
  
25
2.	
  データを読み解く	
初期のモデルでは「DMによる影響はない」・・・。	
  
	
  
しかし、本当に「全くない」のか?	
  
26
2.	
  データを読み解く	
初期のモデルでは「DMによる影響はない」・・・。	
  
	
  
しかし、本当に「全くない」のか?	
  
	
  
そもそも	
  
「DM送付と売上げ上がる日が同じ」	
  
であるワケがないのでは?	
  
27
2.	
  データを読み解く	
p DMによる影響が「時間差」で表れていないかを確認する	
  
28
2.	
  データを読み解く	
p DMによる影響が「時間差」で表れていないかを確認する	
  
29
2.	
  データを読み解く	
p DMによる影響が「時間差」で表れていないかを確認する	
  
30	
ここにチェックを入れる
2.	
  データを読み解く	
p DMによる影響が「時間差」で表れていないかを確認する	
  
31	
ここにチェックを入れる	
チェックを入れた後に
「自動」をクリックする
2.	
  データを読み解く	
p DMによる影響が「時間差」で表れていないかを確認する	
  
32	
※ ここでは「時間差」の最適な組み合わせを選ぶ「自動選択機能」を使う	
  
ここにチェックを入れる	
チェックを入れた後に
「自動」をクリックする
2.	
  データを読み解く	
p 結果を確認する	
33
2.	
  データを読み解く	
p 結果を確認する	
34
2.	
  データを読み解く	
p 結果を確認する	
35
2.	
  データを読み解く	
p 結果を確認する	
36	
DMは時間差(2日後、5日
後、6日後)でプラスの影
響がある。
(送付した当日は影響は
ない)
2.	
  データを読み解く	
p 結果を確認する	
37	
モデルの精度 ・・・ 66.90%	
DMは時間差(2日後、5日
後、6日後)でプラスの影
響がある。
(送付した当日は影響は
ない)
2.	
  データを読み解く	
p 結果を確認する	
38	
モデルの精度 ・・・ 66.90%	
DMは時間差(2日後、5日
後、6日後)でプラスの影
響がある。
(送付した当日は影響は
ない)
※ 時間差の自動選択機能を使ったことで、「DM送付はプラスの影響」という仮説が立った	
  
※ かつ、その方がモデルの精度も	
  [60.32%	
  →	
  66.90%]	
  へと向上している	
  
2.	
  データを読み解く	
p これまで手を加えてきた分析モデルを保存する	
39
2.	
  データを読み解く	
p これまで手を加えてきた分析モデルを保存する	
40
2.	
  データを読み解く	
p これまで手を加えてきた分析モデルを保存する	
41	
「保存」を押して現在の分析
モデルを保存する
2.	
  データを読み解く	
p これまで手を加えてきた分析モデルを保存する	
42	
「保存」を押して現在の分析
モデルを保存する
※ この後、さらに他の要素にも分析の手を加えるが、今の状態を一つの「仮説」として保存し
ておく	
  
2.	
  データを読み解く	
DM送付は	
  
時間差で影響があるらしい	
  
43
2.	
  データを読み解く	
DM送付は	
  
時間差で影響があるらしい	
  
	
  
では他の要素でも	
  
時間差の影響があるのか?	
  
44
2.	
  データを読み解く	
DM送付は	
  
時間差で影響があるらしい	
  
	
  
では他の要素でも	
  
時間差の影響があるのか?	
  
	
  
(ただし一つ一つ試すのは面倒くさい・・)	
  
45
2.	
  データを読み解く	
p 時間差による影響を「複数の要素」で一度に検証する	
  
46
2.	
  データを読み解く	
p 時間差による影響を「複数の要素」で一度に検証する	
  
47
2.	
  データを読み解く	
p 時間差による影響を「複数の要素」で一度に検証する	
  
48	
時間差による影響を見た
い全ての要素にチェックを
入れる
2.	
  データを読み解く	
p 時間差による影響を「複数の要素」で一度に検証する	
  
49	
時間差による影響を見た
い全ての要素にチェックを
入れる	
チェックを入れた後に
「自動」をクリックする
2.	
  データを読み解く	
p 時間差による影響を「複数の要素」で一度に検証する	
  
50	
※ 今回は時間差の影響を考える必要のない気温、雨天、曜日、の3つについてはチェックを
入れない	
  
時間差による影響を見た
い全ての要素にチェックを
入れる	
チェックを入れた後に
「自動」をクリックする
2.	
  データを読み解く	
p 結果を確認する	
51
2.	
  データを読み解く	
p 結果を確認する	
52
2.	
  データを読み解く	
p 結果を確認する	
53	
ü  サイトGは1日後にプラス、
6日後にマイナス
ü  サイトHは当日にプラス
ü  サイトTは時間差を考慮
しても関係がない
2.	
  データを読み解く	
p 結果を確認する	
54	
モデルの精度 ・・・ 69.78%	
ü  サイトGは1日後にプラス、
6日後にマイナス
ü  サイトHは当日にプラス
ü  サイトTは時間差を考慮
しても関係がない
2.	
  データを読み解く	
p 結果を確認する	
55	
モデルの精度 ・・・ 69.78%	
ü  サイトGは1日後にプラス、
6日後にマイナス
ü  サイトHは当日にプラス
ü  サイトTは時間差を考慮
しても関係がない
※ 時間差を考慮するとサイトごとに影響している時間軸が違う、という仮説が立つ	
  
※ モデルの精度は先ほどよりさらに向上している(66.90%	
  →	
  69.78%)	
  
2.	
  データを読み解く	
p 今回の分析モデルをまた保存する	
56
2.	
  データを読み解く	
p 今回の分析モデルをまた保存する	
57	
「保存」を押して現在の分析
モデルを保存する
※ モデル(=仮説)の比較をし易くするため、今回のバージョンをまた保存する	
  
2.	
  データを読み解く	
それぞれの要素ごとの関係が	
  
大体見えてきた。	
  
58
2.	
  データを読み解く	
それぞれの要素ごとの関係が	
  
大体見えてきた。	
  
	
  
ただし、いま持っている	
  
データでは表わせない要素によって	
  
売上が影響されていることはないのか?	
  
59
2.	
  データを読み解く	
p 現在のモデルの中で特殊な要素が影響していそうな箇所を	
  
見つけ出す	
60
2.	
  データを読み解く	
p 現在のモデルの中で特殊な要素が影響していそうな箇所を	
  
見つけ出す	
61
2.	
  データを読み解く	
p 現在のモデルの中で特殊な要素が影響していそうな箇所を	
  
見つけ出す	
62	
スライドバーを操作して
特殊な要素を検出する
2.	
  データを読み解く	
p 現在のモデルの中で特殊な要素が影響していそうな箇所を	
  
見つけ出す	
63	
※ ここでは特殊な要素の検出をする機能を使う	
  
※ ズレが大きいところがオレンジ色になって表れる	
  
スライドバーを操作して
特殊な要素を検出する
2.	
  データを読み解く	
p ズレが大きいところに「特殊な要素」を追加する	
64
2.	
  データを読み解く	
p ズレが大きいところに「特殊な要素」を追加する	
65	
「特殊な要素」を追加したい
箇所を選択する
2.	
  データを読み解く	
p ズレが大きいところに「特殊な要素」を追加する	
66	
「特殊な要素」を追加したい
箇所を選択する
「特殊な要素の追加」を押す
2.	
  データを読み解く	
p ズレが大きいところに「特殊な要素」を追加する	
67	
「特殊な要素」を追加したい
箇所を選択する
「特殊な要素の追加」を押す
「特殊な要素」が追加される
2.	
  データを読み解く	
p ズレが大きいところに「特殊な要素」を追加する	
68	
こちらも同様に追加する
2.	
  データを読み解く	
p ズレが大きいところに「特殊な要素」を追加する	
69	
こちらも同様に追加する
※ 同じ要因の影響だと思う箇所は同時に、別の影響だと思う箇所は個別に追加した方が	
  
精度が上がり易く、またモデルの解釈もし易い	
  
2.	
  データを読み解く	
p 結果を確認する	
70
2.	
  データを読み解く	
p 結果を確認する	
71
2.	
  データを読み解く	
p 結果を確認する	
72
2.	
  データを読み解く	
p 結果を確認する	
73	
ü  追加した2箇所の「特殊
な要素」は確かに売上に
影響を与えていることが
分かる
2.	
  データを読み解く	
p 結果を確認する	
74	
モデルの精度 ・・・ 75.56%	
ü  追加した2箇所の「特殊
な要素」は確かに売上に
影響を与えていることが
分かる
2.	
  データを読み解く	
p 結果を確認する	
75	
モデルの精度 ・・・ 75.56%	
ü  追加した2箇所の「特殊
な要素」は確かに売上に
影響を与えていることが
分かる
※ 2012/06/15-­‐16の2日間は「何らかの影響で売上が14.6万円下がった」、	
  
かつ2012/06/29は「何らかの影響で売上が16.7万円上がった」ということが読み取れる	
  
2.	
  データを読み解く	
p 今回の分析モデルをまた保存する	
76
2.	
  データを読み解く	
p 今回の分析モデルをまた保存する	
77	
「保存」を押して現在の分析
モデルを保存する
※ モデル(=仮説)の比較をし易くするため、今回のバージョンをまた保存する	
  
分析の流れ	
 78	
2.データを	
  
読み解く	
3.結果を	
  
比べる	
p データを登録する
p データの概略を
把握する	
p 分析機能を使っ
てモデルの精度
を上げる
p 違ったアプローチ
の分析を試す	
p 保存したモデル
を比べる	
1.データを	
  
用意する
3.	
  結果を比べる	
試行錯誤したことで	
  
色々なモデル(=仮説)が出来た	
  
79
3.	
  結果を比べる	
試行錯誤したことで	
  
色々なモデル(=仮説)が出来た	
  
	
  
これを踏まえると、	
  
「どの要素が」、「どの程度」、	
  
売上に影響しているのか?	
  
80
3.	
  結果を比べる	
p 保存したモデルを一覧で比較する	
81
3.	
  結果を比べる	
p 保存したモデルを一覧で比較する	
82
3.	
  結果を比べる	
p 保存したモデルを一覧で比較する	
83	
それぞれのモデルを
一覧で比較する
3.	
  結果を比べる	
p 保存したモデルを一覧で比較する	
84	
それぞれのモデルを
一覧で比較する
※ 分析モデルの一覧比較は、それぞれ以下の内容を表わしている	
  
10.00	
- 10.00	
- 10.00	
・・・ 成果にプラスの影響がある	
・・・ 成果にマイナスの影響がある	
・・・ 統計的に影響はない	
・・・ モデルに使われていない
分析結果から得られる示唆	
 85	
i)	
  外部の要因からの影響
分析結果から得られる示唆	
 86	
どの分析モデルも共通して	
  
土日祝前日はプラス(18.158〜20.267)、	
  
雨天はマイナス(-­‐7.996〜-­‐6.855)	
  
の影響がある。	
  
これは今後の施策の前提条件として	
  
認識しておく必要がある。	
i)	
  外部の要因からの影響
分析結果から得られる示唆	
 87	
ii)	
  プロモーション施策による影響
分析結果から得られる示唆	
 88	
DM送信は時間差でプラスの影響がある。	
  
2日後(6.195〜7.620)、6日後(7.719〜8.451)という	
  
効果が出ている。	
  
	
また、3つのグルメサイトのうち	
  
サイトHのみプラスの影響(0.172〜0.204)だった	
  
ii)	
  プロモーション施策による影響
分析結果から得られる示唆	
 89	
iii)	
  特殊な影響
分析結果から得られる示唆	
 90	
この3ヶ月間では、	
  
2012/06/15-­‐16	
  (-­‐14.6万円)と、	
  
2012/06/29	
  (+16.7万円)という	
  
2回の特殊な売上増減のタイミングがあった	
  
可能性が高い。	
  
iii)	
  特殊な影響

レストランの売上