SlideShare a Scribd company logo
セイバーメトリクス
Tokyo.R
2013.2.23
自己紹介
2
twitter @argyle320
勤務先 IT分野のリサーチ会社
データ分析歴 約18年
R歴 2年
Twitterの写真
(円空仏)
参考書籍
3
ワイン方程式 (前回LT)
セイバーメトリクスとは?
• SABRmetrics
「SABR」=Society for American Baseball Research(アメリカ野球学会)
• 統計学の視点で選手の評価指標や戦略を洗いなおす
• 1970年代にビル・ジェイムスが自主出版で提唱
• 当初はMLB+メディアからは冷淡な扱い
• アスレチックス(マネーボール)やレッドソックスの成功
でMLBでも広がりつつある
• 日本でも千葉ロッテマリーンズが導入
4
データ分析による経営改善の事例
使われている統計手法
• 平均・標準偏差
• 直線回帰 (決定係数なし)
• 二乗平均平方根誤差 (相関係数なし)
• 確率、期待値、条件付き確率 (場合分け、樹形図)
• 打率の移動平均
• 散布図、ヒストグラム、箱ひげ図
5
そんなに高度な手法を使っているわけではない
なにがすごいか
• 野球の評価指標の再定義
• 細かい場合分け
6
野球の評価指標の再定義
• 旧来の指標はチームと選手の力を正しく評価してい
ない
– 打率、打点、自責点、防御率、エラー、・・・
– 運と能力が混在している
• ジェイムスによるチーム得点予測式
7
得点数=(安打数+四球数)×塁打数÷(打数+四球数)
野球の評価指標の再定義
• 攻撃力は出塁率と長打率がカギ。安打より四球
• 投手の評価指標・・・DIPS
– 本塁打、四球、死球、三振だけが投手の能力を純粋に表す指標
– 安定している+翌年の成績との相関が高い
8
OPS 出塁率+長打率
NOI (出塁率+長打率÷3)×1000
GPA (出塁率×1.8+長打率)÷4
SecA (塁打-安打+四球+盗塁- 盗塁死)÷打数
細かい場合分け
9
アウト数は非常に貴重
送りバント 低打率の打者なら有効(投手など)
盗塁 成功確率が0.6以上でないと得点見込みは減少
敬遠
強打者のボンズが相手だとしても、敬遠が有効な場面は
限られる (2アウトで一塁が空いている場合のみ)
セイバーメトリクスから学ぶ点
• 基本的な統計手法でも有用な分析はできる
• Big dataでなくても有用な分析はできる
• 対象とデータを深く見ることが重要
• 素人が統計分析だけで切り込んでも受けが悪い
10
MLBの10年間の全試合の投球データ数は?
30球団×162試合×150球×10年=729万レコード
オマケ
• 2012のパ・リーグの打率王はロッテの角中勝也
• 受賞コメント「出塁率を上げたい」
• 打率で表彰されておいて「出塁率」か???
• セイバーメトリクスらしいコメント
• きっと査定で使われているんだ
11
ご清聴ありがとうございました
12

More Related Content

Viewers also liked

Tokyo r30 anova
Tokyo r30 anovaTokyo r30 anova
Tokyo r30 anova
Takashi Minoda
 
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
Nagi Teramo
 
Tokyo r12 - R言語による回帰分析入門
Tokyo r12 - R言語による回帰分析入門Tokyo r12 - R言語による回帰分析入門
Tokyo r12 - R言語による回帰分析入門Yohei Sato
 
R-3.0.0でGLM
R-3.0.0でGLMR-3.0.0でGLM
R-3.0.0でGLM
Kazuya Wada
 
Doradora09 lt tokyo_r33
Doradora09 lt tokyo_r33Doradora09 lt tokyo_r33
Doradora09 lt tokyo_r33Nobuaki Oshiro
 
ニコニコ動画タグネットワーク
ニコニコ動画タグネットワークニコニコ動画タグネットワーク
ニコニコ動画タグネットワーク
Teruki Shinohara
 
偽相関と偏相関係数
偽相関と偏相関係数偽相関と偏相関係数
偽相関と偏相関係数
Teruki Shinohara
 
Rで実験計画法 後編
Rで実験計画法 後編Rで実験計画法 後編
Rで実験計画法 後編
itoyan110
 
rzmq
rzmqrzmq
第31回TokyoR LT資料
第31回TokyoR LT資料第31回TokyoR LT資料
第31回TokyoR LT資料tetsuro ito
 
Extend R with Rcpp!!!
Extend R with Rcpp!!!Extend R with Rcpp!!!
Extend R with Rcpp!!!mickey24
 
中の人が語る seekR.jp の裏側
中の人が語る seekR.jp の裏側中の人が語る seekR.jp の裏側
中の人が語る seekR.jp の裏側
Takekatsu Hiramura
 
Tokyo r30 anova_part2
Tokyo r30 anova_part2Tokyo r30 anova_part2
Tokyo r30 anova_part2
Takashi Minoda
 
第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション
宏喜 佐野
 
R+pythonでKAGGLEの2値予測に挑戦!
R+pythonでKAGGLEの2値予測に挑戦! R+pythonでKAGGLEの2値予測に挑戦!
R+pythonでKAGGLEの2値予測に挑戦!
Yurie Oka
 
Abテストと検定
Abテストと検定Abテストと検定
Abテストと検定
Teruki Shinohara
 
Rから利用するオープンデータAPI
Rから利用するオープンデータAPIRから利用するオープンデータAPI
Rから利用するオープンデータAPI
s3works
 
相関係数と決定係数~回帰係数とその不偏性も
相関係数と決定係数~回帰係数とその不偏性も相関係数と決定係数~回帰係数とその不偏性も
相関係数と決定係数~回帰係数とその不偏性もT T
 

Viewers also liked (20)

外れ値
外れ値外れ値
外れ値
 
Tokyo r30 anova
Tokyo r30 anovaTokyo r30 anova
Tokyo r30 anova
 
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
 
Tokyo r12 - R言語による回帰分析入門
Tokyo r12 - R言語による回帰分析入門Tokyo r12 - R言語による回帰分析入門
Tokyo r12 - R言語による回帰分析入門
 
R-3.0.0でGLM
R-3.0.0でGLMR-3.0.0でGLM
R-3.0.0でGLM
 
ESS
ESSESS
ESS
 
Doradora09 lt tokyo_r33
Doradora09 lt tokyo_r33Doradora09 lt tokyo_r33
Doradora09 lt tokyo_r33
 
ニコニコ動画タグネットワーク
ニコニコ動画タグネットワークニコニコ動画タグネットワーク
ニコニコ動画タグネットワーク
 
偽相関と偏相関係数
偽相関と偏相関係数偽相関と偏相関係数
偽相関と偏相関係数
 
Rで実験計画法 後編
Rで実験計画法 後編Rで実験計画法 後編
Rで実験計画法 後編
 
rzmq
rzmqrzmq
rzmq
 
第31回TokyoR LT資料
第31回TokyoR LT資料第31回TokyoR LT資料
第31回TokyoR LT資料
 
Extend R with Rcpp!!!
Extend R with Rcpp!!!Extend R with Rcpp!!!
Extend R with Rcpp!!!
 
中の人が語る seekR.jp の裏側
中の人が語る seekR.jp の裏側中の人が語る seekR.jp の裏側
中の人が語る seekR.jp の裏側
 
Tokyo r30 anova_part2
Tokyo r30 anova_part2Tokyo r30 anova_part2
Tokyo r30 anova_part2
 
第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション
 
R+pythonでKAGGLEの2値予測に挑戦!
R+pythonでKAGGLEの2値予測に挑戦! R+pythonでKAGGLEの2値予測に挑戦!
R+pythonでKAGGLEの2値予測に挑戦!
 
Abテストと検定
Abテストと検定Abテストと検定
Abテストと検定
 
Rから利用するオープンデータAPI
Rから利用するオープンデータAPIRから利用するオープンデータAPI
Rから利用するオープンデータAPI
 
相関係数と決定係数~回帰係数とその不偏性も
相関係数と決定係数~回帰係数とその不偏性も相関係数と決定係数~回帰係数とその不偏性も
相関係数と決定係数~回帰係数とその不偏性も
 

More from Mitsuo Shimohata

ハイブリッド型樹木法
ハイブリッド型樹木法ハイブリッド型樹木法
ハイブリッド型樹木法Mitsuo Shimohata
 
相関係数は傾きに影響される
相関係数は傾きに影響される相関係数は傾きに影響される
相関係数は傾きに影響される
Mitsuo Shimohata
 
因子分析
因子分析因子分析
因子分析
Mitsuo Shimohata
 
ワイン方程式
ワイン方程式ワイン方程式
ワイン方程式
Mitsuo Shimohata
 
質的変数の相関・因子分析
質的変数の相関・因子分析質的変数の相関・因子分析
質的変数の相関・因子分析
Mitsuo Shimohata
 

More from Mitsuo Shimohata (6)

決定木学習
決定木学習決定木学習
決定木学習
 
ハイブリッド型樹木法
ハイブリッド型樹木法ハイブリッド型樹木法
ハイブリッド型樹木法
 
相関係数は傾きに影響される
相関係数は傾きに影響される相関係数は傾きに影響される
相関係数は傾きに影響される
 
因子分析
因子分析因子分析
因子分析
 
ワイン方程式
ワイン方程式ワイン方程式
ワイン方程式
 
質的変数の相関・因子分析
質的変数の相関・因子分析質的変数の相関・因子分析
質的変数の相関・因子分析
 

セイバーメトリクス