SlideShare a Scribd company logo
1 of 41
なぜ統計学がビジネスの
意思決定において大事なのか?
株式会社リクルートコミュニケーションズ
ICTソリューション局 アドテクノロジーサービス開発部
尾崎 隆
まずは自己紹介を…
2
CodeSCOREチームのデータ分析プロダクトの
技術的コンサルティングを担当しております
まずは自己紹介を…
3
ブログを書いております
まずは自己紹介を…
4
最近本も出しました
5
※本日はエントリーレベルのお話のみさせていただきます
(ガチ勢向けのコンテンツはございません悪しからず)
6
ところで…
7
ビジネスの意思決定に
統計学を使うと
何が嬉しいんでしょうか?
8
…?
9
うちは毎月ちゃんと数字集
計して、月末の振り返りで
確認してるし、それを全員
で共有して課題点も確認し
てるし、統計学とか小難し
いもの要らないですよ?
※よくある反応
10
でも皆さん、こんな経験を
されたことはありませんか?
ある月末のこと
11
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
1 2
今月の採用決定率(CVR)は先月
の数字を下回りました。。。来
月は巻き返します!○○と××に
テコ入れして盛り返そう!
その翌月末のこと
12
今月のCVRは先月の数字を上回
りました!(パチパチパチ)来
月もこの調子で頑張ろう!
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
1 2 3
そのまたさらに翌月末のこと
13
今月のCVRは惜しくも先月の数
字を下回りました。。。来月は
巻き返します!△△と□□にテ
コ入れして盛り返そう!
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
1 2 3 4
14
翌年度末
翌年度末振り返ってみたら…
15
おっかしいなぁ…毎月前月の反
省をもとに、営業方針スピー
ディーに変えていたはずなんだ
がなぁ…何故横這い???
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
※よくある話
16
このような現象を
「平均への回帰」
と呼びます
「平均への回帰」とは?
17
「あるスポーツ選手が、何かの技を練習している途中であるとしよう。
何回も練習していると選手はだんだんうまく技ができるようになるが、
時としていつもの技の水準よりずっとうまくできることがある。
逆に、たまたま技がうまくできないときもある。たまたまうまくいった
ときは、その時の実力よりもうまく行ったのだから、次にその技を行う
ときは、いつもの水準に戻ると予測するのが、統計学的には正しい。
逆に、たまたま技を失敗したときには、次の回にはいつもの技の水準に
戻ってよりよい技を発揮できると予測するのが正しいのである。
誉めなくても、叱らなくても、いつもよりよかった際は、次の回は平均
的には前よりも悪くなり、いつもより悪かった際は、次の回には平均的
には前よりもよくなるのだ。これは、指導の成果でもなんでもなくて、
純粋に統計的な現象だ」
(原文ママ・改行&太字筆者)
出典:大竹文雄の経済脳を鍛える - 2013年2月13日 体罰の有効性の錯覚は「平均への回帰」が理由
http://www.jcer.or.jp/column/otake/index449.html
そもそも世の中の大半の物事は「平均回帰的」
18
平均(位置の)
世の中の大半の物事は基本的には
「振り子」と同じように、ある平均
を持っていて、何もしなければ勝手
に平均に「戻る」(回帰する)性質
がある
つまり、ちょっと値が変わったとし
てもそれはその場その場の例えば
「風で揺れた」「周りの物がたまた
ま当たった」というような偶然で
あって(「ばらつき」)、長い目で
見れば同じ平均のまま
この状態を変えるには、「振り子」
そのもの位置を変える必要がある…
なので、こういうことも起き得る
19
気付いたら…
20
右肩下がりで、もはや風前の灯…
21
22
どうしたらこの
「平均への回帰」の呪い
から逃れられる?
平均的「位置」は振り子の状態を表す「真の値」
23
平均(位置の)
=振り子を表現する真の値
どれほど風に吹かれようと、物が当
たろうと、振り子は同じところから
吊り下げられている限り、必ず同じ
平均的「位置」に戻る
言い換えると、これは振り子の状態
を表す「真の値」だということ
例えば、吊り下げる支点を動かせば
この「真の値」は必ず動くわけで、
その時ようやく振り子の状態が変
わったと言える
では、事業におけるそのような
「真の値」を動かすにはどのように
データと向き合うべきなのか?
24
統計的な現象には、
統計学で対応する
のが一番!
データサイエンティスト
処方箋たち
1. ベースラインが上がっているかどうかを
統計学的に見定める
2. 統計モデリングで最適解を直接狙う
25
26
1. ベースラインが
上がっているかどうかを
統計学的に見定める
ベースラインを引き上げるとは、こういうこと
27
実際にはこんな感じで「ばらつき」がある
28
施策を打った
タイミング
例えば、統計学的検定で白黒つけることもできる
29
> t.test(d[1:15],d[16:30])
Welch Two Sample t-test data: d[1:15] and d[16:30]
t = -2.6278, df = 27.8, p-value = 0.01383
alternative hypothesis: true difference in means is
not equal to 0 95 percent confidence interval: -
0.17645650 -0.02183668 sample estimates: mean of x
mean of y 0.4788178 0.5779644
実験してみて確かめるという取り組みも必要
30
施策を打った
タイミング
施策に効果あり
(t = -2.6278, df = 27.8,
p-value = 0.01383)
施策に効果なし
(t = -0.8967, df = 27.917,
p-value = 0.3775)
うまくいけばこのように右肩上がりになるはず
31
32
※実際にはもっと複雑かつ統計学的に厳密に扱います
(特にA/Bテストや時系列データの場合)
33
2. 統計モデリングで
最適解を直接狙う
こんなCVRのデータがあったとする
34
見た感じでは、ただの平均回帰的なデータ
ところが実は施策実施の詳細なデータも同時にあるとする
35
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
ad1 0 1 1 1 0 0 1 0 1 0 1 0 1 1 0 0 1 0 1 1 0 0 1 0 0 1 1 1 1 0 0 0 0 1 1 0 0 0 1 1
ad2 0 1 0 0 1 1 1 0 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1 0 0 1 0 1 1 1 0 0 0 1 0 1 1 1 0
ad3 0 1 1 0 0 1 0 1 1 1 0 0 1 0 0 1 0 0 0 1 0 1 1 1 0 0 1 1 0 0 1 1 0 0 0 1 1 0 1 1
ad4 0 1 0 1 1 0 0 1 0 1 0 1 1 1 0 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 0 1 0 1 0 1 0 1 1 0
ad5 0 0 0 1 0 1 1 1 0 1 1 0 0 1 0 1 1 0 1 0 0 1 0 1 0 1 0 0 1 0 1 1 0 1 1 1 1 0 0 0
施策は5種類
一般化線形モデルで、施策ごとの影響度の大小関係を見る
36
𝑦𝑖~
1
1 + 𝑒−(𝛽0+𝛽1 𝑥1𝑖+𝛽2 𝑥2𝑖+𝛽3 𝑥3𝑖+𝛽4 𝑥4𝑖+𝛽5 𝑥5𝑖)
一般化線形モデルで、施策ごとの影響度の大小関係を見る
37
𝑦𝑖~
1
1 + 𝑒−(𝛽0+𝛽1 𝑥1𝑖+𝛽2 𝑥2𝑖+𝛽3 𝑥3𝑖+𝛽4 𝑥4𝑖+𝛽5 𝑥5𝑖)
優先すべき施策
やるべきではない施策
38
※実際にはもっと複雑かつ統計学的に厳密に扱います
39
ということで、
40
ビジネスの意思決定に
統計学を使うことには
大きな意義があります!
データサイエンティスト
※slideshareで閲覧されている方のために
41
この資料は「第2回CodeSCOREによる、エンジニアの
実務スキルの可視化と、その周辺の知見共有セミナー」
での講演内容です
https://codescore.codeiq.jp/seminar

More Related Content

What's hot

ベイズ統計入門
ベイズ統計入門ベイズ統計入門
ベイズ統計入門
Miyoshi Yuya
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
takehikoihayashi
 

What's hot (20)

数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro
数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro
数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro
 
潜在クラス分析
潜在クラス分析潜在クラス分析
潜在クラス分析
 
ベイズ統計入門
ベイズ統計入門ベイズ統計入門
ベイズ統計入門
 
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
 
アンサンブル木モデル解釈のためのモデル簡略化法
アンサンブル木モデル解釈のためのモデル簡略化法アンサンブル木モデル解釈のためのモデル簡略化法
アンサンブル木モデル解釈のためのモデル簡略化法
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
 
最適化超入門
最適化超入門最適化超入門
最適化超入門
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
Nagoya.R #12 非線形の相関関係を検出する指標の算出
Nagoya.R #12 非線形の相関関係を検出する指標の算出Nagoya.R #12 非線形の相関関係を検出する指標の算出
Nagoya.R #12 非線形の相関関係を検出する指標の算出
 
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)
 
再現性問題は若手研究者の突破口
再現性問題は若手研究者の突破口再現性問題は若手研究者の突破口
再現性問題は若手研究者の突破口
 
PRML上巻勉強会 at 東京大学 資料 第1章後半
PRML上巻勉強会 at 東京大学 資料 第1章後半PRML上巻勉強会 at 東京大学 資料 第1章後半
PRML上巻勉強会 at 東京大学 資料 第1章後半
 
[DL輪読会]"Dynamical Isometry and a Mean Field Theory of CNNs: How to Train 10,0...
[DL輪読会]"Dynamical Isometry and a Mean Field Theory of CNNs: How to Train 10,0...[DL輪読会]"Dynamical Isometry and a Mean Field Theory of CNNs: How to Train 10,0...
[DL輪読会]"Dynamical Isometry and a Mean Field Theory of CNNs: How to Train 10,0...
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
 
傾向スコアの概念とその実践
傾向スコアの概念とその実践傾向スコアの概念とその実践
傾向スコアの概念とその実践
 
星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章
 
【論文調査】XAI技術の効能を ユーザ実験で評価する研究
【論文調査】XAI技術の効能を ユーザ実験で評価する研究【論文調査】XAI技術の効能を ユーザ実験で評価する研究
【論文調査】XAI技術の効能を ユーザ実験で評価する研究
 
因果推論の基礎
因果推論の基礎因果推論の基礎
因果推論の基礎
 
NumPy闇入門
NumPy闇入門NumPy闇入門
NumPy闇入門
 
PRMLの線形回帰モデル(線形基底関数モデル)
PRMLの線形回帰モデル(線形基底関数モデル)PRMLの線形回帰モデル(線形基底関数モデル)
PRMLの線形回帰モデル(線形基底関数モデル)
 

Viewers also liked

「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
Takashi J OZAKI
 

Viewers also liked (20)

直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
 
『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの
『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの
『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの
 
Taste of Wine vs. Data Science
Taste of Wine vs. Data ScienceTaste of Wine vs. Data Science
Taste of Wine vs. Data Science
 
データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)
 
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
 
Deep Learningと他の分類器をRで比べてみよう in Japan.R 2014
Deep Learningと他の分類器をRで比べてみよう in Japan.R 2014Deep Learningと他の分類器をRで比べてみよう in Japan.R 2014
Deep Learningと他の分類器をRで比べてみよう in Japan.R 2014
 
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
 
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
 
Granger因果による 時系列データの因果推定(因果フェス2015)
Granger因果による時系列データの因果推定(因果フェス2015)Granger因果による時系列データの因果推定(因果フェス2015)
Granger因果による 時系列データの因果推定(因果フェス2015)
 
Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~ Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~
 
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてエクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについて
 
最新業界事情から見るデータサイエンティストの「実像」
最新業界事情から見るデータサイエンティストの「実像」最新業界事情から見るデータサイエンティストの「実像」
最新業界事情から見るデータサイエンティストの「実像」
 
Jc 20141003 tjo
Jc 20141003 tjoJc 20141003 tjo
Jc 20141003 tjo
 
Visualization of Supervised Learning with {arules} + {arulesViz}
Visualization of Supervised Learning with {arules} + {arulesViz}Visualization of Supervised Learning with {arules} + {arulesViz}
Visualization of Supervised Learning with {arules} + {arulesViz}
 
Tech Lab Paak講演会 20150601
Tech Lab Paak講演会 20150601Tech Lab Paak講演会 20150601
Tech Lab Paak講演会 20150601
 
有意性と効果量について しっかり考えてみよう
有意性と効果量について しっかり考えてみよう有意性と効果量について しっかり考えてみよう
有意性と効果量について しっかり考えてみよう
 
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
 
ビジネスの現場のデータ分析における理想と現実
ビジネスの現場のデータ分析における理想と現実ビジネスの現場のデータ分析における理想と現実
ビジネスの現場のデータ分析における理想と現実
 
はじめての「R」
はじめての「R」はじめての「R」
はじめての「R」
 
統計学の基礎の基礎
統計学の基礎の基礎統計学の基礎の基礎
統計学の基礎の基礎
 

Similar to なぜ統計学がビジネスの 意思決定において大事なのか?

Jmrx講演資料0723(配布用)[1]
Jmrx講演資料0723(配布用)[1]Jmrx講演資料0723(配布用)[1]
Jmrx講演資料0723(配布用)[1]
Shigeru Kishikawa
 
Web解析と意思決定20130311 太田
Web解析と意思決定20130311 太田Web解析と意思決定20130311 太田
Web解析と意思決定20130311 太田
博三 太田
 
エクセルで学ぶビジネスシミュレーション②: 実践編
エクセルで学ぶビジネスシミュレーション②: 実践編エクセルで学ぶビジネスシミュレーション②: 実践編
エクセルで学ぶビジネスシミュレーション②: 実践編
Hitoshi Kumano
 

Similar to なぜ統計学がビジネスの 意思決定において大事なのか? (20)

#東洋大学産業組織論 (16/30) オリエンテーション
#東洋大学産業組織論 (16/30) オリエンテーション#東洋大学産業組織論 (16/30) オリエンテーション
#東洋大学産業組織論 (16/30) オリエンテーション
 
20140213 web×マス広告の統合分析第1部_公開用
20140213 web×マス広告の統合分析第1部_公開用20140213 web×マス広告の統合分析第1部_公開用
20140213 web×マス広告の統合分析第1部_公開用
 
Jmrx講演資料0723(配布用)[1]
Jmrx講演資料0723(配布用)[1]Jmrx講演資料0723(配布用)[1]
Jmrx講演資料0723(配布用)[1]
 
企業と連携した情報システム企画の実践的教育取り組み、改善とその評価
企業と連携した情報システム企画の実践的教育取り組み、改善とその評価企業と連携した情報システム企画の実践的教育取り組み、改善とその評価
企業と連携した情報システム企画の実践的教育取り組み、改善とその評価
 
【Halo】スマホアプリ3つの法則 ボケてをアプリ化するときにやったこと121210
【Halo】スマホアプリ3つの法則 ボケてをアプリ化するときにやったこと121210【Halo】スマホアプリ3つの法則 ボケてをアプリ化するときにやったこと121210
【Halo】スマホアプリ3つの法則 ボケてをアプリ化するときにやったこと121210
 
順序データでもベイズモデリング
順序データでもベイズモデリング順序データでもベイズモデリング
順序データでもベイズモデリング
 
Distribution naite19
Distribution naite19 Distribution naite19
Distribution naite19
 
Web解析と意思決定20130311 太田
Web解析と意思決定20130311 太田Web解析と意思決定20130311 太田
Web解析と意思決定20130311 太田
 
Rで学ぶ観察データでの因果推定
Rで学ぶ観察データでの因果推定Rで学ぶ観察データでの因果推定
Rで学ぶ観察データでの因果推定
 
バグなんて見逃しちゃえ
バグなんて見逃しちゃえバグなんて見逃しちゃえ
バグなんて見逃しちゃえ
 
Rdra in 東京
Rdra in 東京Rdra in 東京
Rdra in 東京
 
Oss20131019
Oss20131019Oss20131019
Oss20131019
 
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
 
Rによるノンパラメトリック検定と効果量の出し方
Rによるノンパラメトリック検定と効果量の出し方Rによるノンパラメトリック検定と効果量の出し方
Rによるノンパラメトリック検定と効果量の出し方
 
消費者データに基づく、トレンド予測マーケティング
消費者データに基づく、トレンド予測マーケティング消費者データに基づく、トレンド予測マーケティング
消費者データに基づく、トレンド予測マーケティング
 
消費者データに基づく、トレンド予測マーケティング 先生:大久保 惠司
消費者データに基づく、トレンド予測マーケティング 先生:大久保 惠司消費者データに基づく、トレンド予測マーケティング 先生:大久保 惠司
消費者データに基づく、トレンド予測マーケティング 先生:大久保 惠司
 
何故あなたの機械学習はビジネスを改善出来ないのか?
何故あなたの機械学習はビジネスを改善出来ないのか?何故あなたの機械学習はビジネスを改善出来ないのか?
何故あなたの機械学習はビジネスを改善出来ないのか?
 
アタックス・パワーインタラクティブ共催セミナー(5月20日)発表資料(全編)
アタックス・パワーインタラクティブ共催セミナー(5月20日)発表資料(全編)アタックス・パワーインタラクティブ共催セミナー(5月20日)発表資料(全編)
アタックス・パワーインタラクティブ共催セミナー(5月20日)発表資料(全編)
 
エクセルで学ぶビジネスシミュレーション②: 実践編
エクセルで学ぶビジネスシミュレーション②: 実践編エクセルで学ぶビジネスシミュレーション②: 実践編
エクセルで学ぶビジネスシミュレーション②: 実践編
 
中小企業におけるSDGsの活用方法~国内外の動向と活用に向けたステップ・活用事例紹介~
中小企業におけるSDGsの活用方法~国内外の動向と活用に向けたステップ・活用事例紹介~中小企業におけるSDGsの活用方法~国内外の動向と活用に向けたステップ・活用事例紹介~
中小企業におけるSDGsの活用方法~国内外の動向と活用に向けたステップ・活用事例紹介~
 

なぜ統計学がビジネスの 意思決定において大事なのか?