SlideShare a Scribd company logo
Rで売上予測のデモ
第⼋回 雑談会 2015/12/22
成⽥裕美
2
あんただれ︖
• いわゆる統計&分析屋
– 専⾨統計調査⼠
– SAS認定プロフェッショナル ビジネスアナリスト
– R, SAS, SPSSなんでもやります
• ⼈事・組織系コンサルファーム出⾝
• 三沢市出⾝&在住/2016年1⽉ 開業予定
‒ ⼦連れ出戻りUターンです♡
成⽥ 裕美(なりた ひろみ)
3
データ分析の⽬的
• データを要約する(記述統計、可視化)
• 仮説を検証する(統計的仮説検定)
• 仮説を創造する(データマイニング)
• 未来を予測する(回帰分析、機械学習)
↑今回はコレ
4
売上予測の重要性
• 売れ残る ⇒ ロスの発⽣
• 売れすぎる ⇒ 機会の損失
過去の実績から未来の売上を予測
経営資源の最適化
根拠(データ)に基づく販売戦略
売れ残っても
売れすぎても
致命傷
5
統計解析⽤⾔語 R
• なんてったってタダ♡
• 世界3⼤統計ソフトウェアの1つ   
(R, SAS, SPSS)
• オープンソースなので⽇々進化する
Rってスゴイんだぜ︕︕︕
昔は⼤⾦払わないと出来なかった分析がタダで出来ます
6
Rのデモ
ごぼうビールの消費量を予測する
月 平均気温 消費量 百ℓ
1 5.7 2.41
2 6.4 3.91
3 7.9 4.32
4 13.9 5.55
5 19.7 5.63
6 21.6 6.23
7 27.9 8.34
8 29.1 8.39
9 28.1 7.33
12 8.9 4.77
11 13.2 4.95
10 18.5 5.51
7
散布図&相関係数
相関係数
=0.95
気温が上がるほど
消費量も増える
気温と消費量の
間には強い正の
相関がある
8
これが回帰分析
すべてのデータからの距離が
最も短くなる予測式を求める
9
消費量 = 0.19(百ℓ)× 気温(℃) + 2.4
気温が1℃上昇すると、平均消費量が19ℓ増える
回帰分析の結果(1)
10
回帰分析の結果(2)
切⽚と気温が消費量を予測する上で意味が
あるのかを、検定という⼿法で検証
2つとも最⾼ランクの★3つなので、予測の上で
ほぼほぼ有効だということがいえる。
11
回帰分析の結果(3)
決定係数R²は予測式の当てはまりの良さを
表す。(0に近いほど当てはまりが悪く、
1に近いほど当てはまりが良い)
今回0.9なので、だいぶ当てはまりが良い、
つまり精度の⾼い予測式だといえる。
12
信頼区間と予測区間
⾚︓信頼区間
予測式の信頼幅
を表します
緑︓予測区間
予測値の取りう
る幅を表します
データを取り直して同じ分析を
繰り返したとしたら、100回の
うち95回はこの範囲内に予測
式・予測値が収まると考えられ
ますよ、という意味
⿊︓予測式
13
でもね。。。
• たった1つの変数から精度の⾼い予測式が
出来ることは、⾮常にまれ
• 実際は、消費量に影響する様々な変数を複
数使って予測するケースがほとんど(重回
帰分析)
14
最⼤電⼒ (千kw) = 16770.6                
+(181.1 × 最⾼気温)+(125.0 × 最低気温)             
- 123.7 (晴)
+ 101.1 (⾬)    
+
6384.6 (⽉)
6269.2 (⽕)
6276.4 (⽔)
6156.9 (⽊)
5942.3 (⾦)
2427.8 (⼟)
- 1674.7(⽇祝)- 5614.5 (年末年始)       
重回帰分析ってこんな感じ〜
15
重回帰分析の注意点
• 予測するための変数をたくさん投⼊すれば
するほど、理論上は予測精度が⾼くなる
• でも変数が増えすぎると、予測式が安定し
なくなってヘンテコな係数が出たりする
(多重共線性に気をつけろ︕)
• いかに少数精鋭の変数を選び出してシンプ
ルで美しいモデルを作れるか、ここはまさ
にアナリストの腕の⾒せどころ
16
重回帰分析の発展形
• 今回お話したのは、⼀番単純な線形モデル
• 曲線関係を表したり、もっと複雑な関係
(交互作⽤とか)をモデルに組み込んだり、
⼈⼯知能の⼿法を取り⼊れたりして、デー
タ分析の世界はどんどん進化
• でも基本的な原理や考え⽅は共通している
17
参考︓デモに使⽤したRのコード
#---ごぼうビールの売上データ
⽉ <- c(1:12)
気温 <- c(5.7,6.4,7.9,13.9,19.7,21.6,27.9,29.1,28.1,18.5,13.2,8.9)
消費量 <- c(2.41,3.91,4.32,5.55,5.63,6.23,8.34,8.39,7.33,5.51,4.95,4.77)
beer <- data.frame(⽉,気温,消費量); beer
#---これを散布図にしてみると
p1 <- ggplot (beer, aes(x = 気温, y = 消費量))
p1 + geom_point(size = 5)+ labs(title = "気温とごぼうビール消費量の散布図")
#---相関係数を算出する
round(cor(beer$消費量 , beer$気温),2)
#---回帰分析を実⾏してみよう
beer.lm <- lm (消費量 ~ 気温, data = beer);summary(beer.lm)
#---実測値と予測値を⽐べてみる
実測値 <- beer[,3] ; 予測値 <- round(predict(beer.lm),2);(data.frame(実測値, 予測値))
#---予測値を計算しよう
new <- data.frame (気温 = 20) #来⽉の平均気温が20度という予報が出たと仮定
predict(beer.lm, newdata = data.frame(気温 = 20))
#---信頼区間と予測区間
#(conf <- predict(beer.lm, new_dat, interval="confidence")) #信頼区間
#(pred <- predict(beer.lm, new_dat, interval="prediction")) #予測区間
#---信頼区間と予測区間のグラフ
new1 <- data.frame("気温"=seq(5,30,0.2))
conf <- predict(beer.lm, new1, interval="confidence")
pred <- predict(beer.lm, new1, interval="prediction")
matplot(new1$気温, cbind(conf), lty=c(1,2,2), col=c(1,2,2), type="l", xlim=c(5,30), ylim=c(2,10), xlab="気温", ylab="消費量")
par(new=T)
matplot(new1$気温, cbind(pred), lty=c(1,2,2), col=c(1,3,3), type="l", xlim=c(5,30), ylim=c(2,10), xlab="気温", ylab="消費量")
18
Fin
ご清聴ありがとうございました。
(*´ω`)

More Related Content

What's hot

Prophet入門【R編】Facebookの時系列予測ツール
Prophet入門【R編】Facebookの時系列予測ツールProphet入門【R編】Facebookの時系列予測ツール
Prophet入門【R編】Facebookの時系列予測ツール
hoxo_m
 
Tokyo r53
Tokyo r53Tokyo r53
Tokyo r53
Hiroshi Shimizu
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編
Hiroshi Shimizu
 
Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説
Hiroshi Shimizu
 
MCMCでマルチレベルモデル
MCMCでマルチレベルモデルMCMCでマルチレベルモデル
MCMCでマルチレベルモデル
Hiroshi Shimizu
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数
daiki hojo
 
Mplusの使い方 初級編
Mplusの使い方 初級編Mplusの使い方 初級編
Mplusの使い方 初級編
Hiroshi Shimizu
 
離散時間ロジスティック回帰モデル解説
離散時間ロジスティック回帰モデル解説離散時間ロジスティック回帰モデル解説
離散時間ロジスティック回帰モデル解説
akira_11
 
文献調査をどのように行うべきか?
文献調査をどのように行うべきか?文献調査をどのように行うべきか?
文献調査をどのように行うべきか?
Yuichi Goto
 
合成変量とアンサンブル:回帰森と加法モデルの要点
合成変量とアンサンブル:回帰森と加法モデルの要点合成変量とアンサンブル:回帰森と加法モデルの要点
合成変量とアンサンブル:回帰森と加法モデルの要点
Ichigaku Takigawa
 
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
Masashi Komori
 
心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する
Hiroshi Shimizu
 
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
nocchi_airport
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
 
自己紹介スライドショー201606
自己紹介スライドショー201606自己紹介スライドショー201606
自己紹介スライドショー201606
LEFT HAND RULE
 
RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05
RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05 RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05
RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05
Masaru Tokuoka
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
Hiroshi Shimizu
 
2 3.GLMの基礎
2 3.GLMの基礎2 3.GLMの基礎
2 3.GLMの基礎
logics-of-blue
 
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Koichiro Gibo
 
StanとRでベイズ統計モデリング読書会Ch.9
StanとRでベイズ統計モデリング読書会Ch.9StanとRでベイズ統計モデリング読書会Ch.9
StanとRでベイズ統計モデリング読書会Ch.9
考司 小杉
 

What's hot (20)

Prophet入門【R編】Facebookの時系列予測ツール
Prophet入門【R編】Facebookの時系列予測ツールProphet入門【R編】Facebookの時系列予測ツール
Prophet入門【R編】Facebookの時系列予測ツール
 
Tokyo r53
Tokyo r53Tokyo r53
Tokyo r53
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編
 
Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説
 
MCMCでマルチレベルモデル
MCMCでマルチレベルモデルMCMCでマルチレベルモデル
MCMCでマルチレベルモデル
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数
 
Mplusの使い方 初級編
Mplusの使い方 初級編Mplusの使い方 初級編
Mplusの使い方 初級編
 
離散時間ロジスティック回帰モデル解説
離散時間ロジスティック回帰モデル解説離散時間ロジスティック回帰モデル解説
離散時間ロジスティック回帰モデル解説
 
文献調査をどのように行うべきか?
文献調査をどのように行うべきか?文献調査をどのように行うべきか?
文献調査をどのように行うべきか?
 
合成変量とアンサンブル:回帰森と加法モデルの要点
合成変量とアンサンブル:回帰森と加法モデルの要点合成変量とアンサンブル:回帰森と加法モデルの要点
合成変量とアンサンブル:回帰森と加法モデルの要点
 
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
 
心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する
 
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
自己紹介スライドショー201606
自己紹介スライドショー201606自己紹介スライドショー201606
自己紹介スライドショー201606
 
RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05
RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05 RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05
RでMplusがもっと便利にーmplusAutomationパッケージー #Hiroshimar05
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
 
2 3.GLMの基礎
2 3.GLMの基礎2 3.GLMの基礎
2 3.GLMの基礎
 
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
 
StanとRでベイズ統計モデリング読書会Ch.9
StanとRでベイズ統計モデリング読書会Ch.9StanとRでベイズ統計モデリング読書会Ch.9
StanとRでベイズ統計モデリング読書会Ch.9
 

Similar to Rで売上予測のデモ(回帰分析)

20190512 subscription meetup kamata
20190512 subscription meetup kamata20190512 subscription meetup kamata
20190512 subscription meetup kamata
真太郎 鎌田
 
ビジネスフレームワーク<経営戦略>
ビジネスフレームワーク<経営戦略>ビジネスフレームワーク<経営戦略>
ビジネスフレームワーク<経営戦略>
Courslide
 
rstanで個人のパラメーターを推定した話
rstanで個人のパラメーターを推定した話rstanで個人のパラメーターを推定した話
rstanで個人のパラメーターを推定した話
Yuya Matsumura
 
Webマーケティングを通じたデータサイエンティストの価値発揮方法
Webマーケティングを通じたデータサイエンティストの価値発揮方法Webマーケティングを通じたデータサイエンティストの価値発揮方法
Webマーケティングを通じたデータサイエンティストの価値発揮方法
E2D3.org
 
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
predictori
 
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjugXP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
Ryota Inaba
 
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
松本健太郎
 
杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2
junji kumooka
 
IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門
陽一 滝川
 
データサイエンティストの今
データサイエンティストの今データサイエンティストの今
データサイエンティストの今
Suzuki Shinji
 
価値を見せる技術 #DevLOVE ベースボールからみる技術
価値を見せる技術 #DevLOVE ベースボールからみる技術価値を見せる技術 #DevLOVE ベースボールからみる技術
価値を見せる技術 #DevLOVE ベースボールからみる技術
Shinichi Nakagawa
 
本を読んでもわからないリアルなアンケート実践法
本を読んでもわからないリアルなアンケート実践法本を読んでもわからないリアルなアンケート実践法
本を読んでもわからないリアルなアンケート実践法
takashi sasaki
 
データサイエンス業務と「ツール」
データサイエンス業務と「ツール」データサイエンス業務と「ツール」
データサイエンス業務と「ツール」
The Japan DataScientist Society
 
少しの工夫で成果に直結!アンケート調査To Do リスト
少しの工夫で成果に直結!アンケート調査To Do リスト少しの工夫で成果に直結!アンケート調査To Do リスト
少しの工夫で成果に直結!アンケート調査To Do リスト
SPIRAL Inc.
 
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
Satoru Ishikawa
 
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
schoowebcampus
 

Similar to Rで売上予測のデモ(回帰分析) (18)

20190512 subscription meetup kamata
20190512 subscription meetup kamata20190512 subscription meetup kamata
20190512 subscription meetup kamata
 
ビジネスフレームワーク<経営戦略>
ビジネスフレームワーク<経営戦略>ビジネスフレームワーク<経営戦略>
ビジネスフレームワーク<経営戦略>
 
rstanで個人のパラメーターを推定した話
rstanで個人のパラメーターを推定した話rstanで個人のパラメーターを推定した話
rstanで個人のパラメーターを推定した話
 
Webマーケティングを通じたデータサイエンティストの価値発揮方法
Webマーケティングを通じたデータサイエンティストの価値発揮方法Webマーケティングを通じたデータサイエンティストの価値発揮方法
Webマーケティングを通じたデータサイエンティストの価値発揮方法
 
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
 
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjugXP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
 
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
 
Tdc 20181121
Tdc 20181121Tdc 20181121
Tdc 20181121
 
杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2
 
IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門
 
データサイエンティストの今
データサイエンティストの今データサイエンティストの今
データサイエンティストの今
 
価値を見せる技術 #DevLOVE ベースボールからみる技術
価値を見せる技術 #DevLOVE ベースボールからみる技術価値を見せる技術 #DevLOVE ベースボールからみる技術
価値を見せる技術 #DevLOVE ベースボールからみる技術
 
本を読んでもわからないリアルなアンケート実践法
本を読んでもわからないリアルなアンケート実践法本を読んでもわからないリアルなアンケート実践法
本を読んでもわからないリアルなアンケート実践法
 
データサイエンス業務と「ツール」
データサイエンス業務と「ツール」データサイエンス業務と「ツール」
データサイエンス業務と「ツール」
 
少しの工夫で成果に直結!アンケート調査To Do リスト
少しの工夫で成果に直結!アンケート調査To Do リスト少しの工夫で成果に直結!アンケート調査To Do リスト
少しの工夫で成果に直結!アンケート調査To Do リスト
 
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
 
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
 
120801発会式概要
120801発会式概要120801発会式概要
120801発会式概要
 

Rで売上予測のデモ(回帰分析)