More Related Content
More from Shinichi Nakagawa (19)
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
- 2. Who am I ?
• Shinichi Nakagawa(@shinyorke)
• Recruit Sumai Company, Ltd.
• Pythonista/Agile/Baseball Scientist
• 贔屓チーム
• 北海道日本ハムファイターズ(NPB)
• オークランド・アスレチックス(MLB)
• “野生の野球アナリスト”活動
- 4. • PyCon JP 2014 Talk Session(去年のやつ)
• MLBオープンデータ分析&可視化サービスをPythonで構築
• はてブ200超え、PV 14,000以上(slideshare)
- 5. • PyCon JP 2014 Lightning Talk(去年のやつ)
• Agileプロセス活用、アダム・ダン率の紹介
• アダム・ダンさん、Python界隈で有名になる
- 22. Retrosheet is 何?
• メジャーリーグのスコアデータ集
• 1887~2014(昨シーズン)までのデータをCSVで配布
※1989以前は欠損有り
• スコアブックで得られる情報(得点、失点、スタメン、打席
結果etc…)と選手情報(名前、ポジションなど)がひと目
でわかる
• http://retrosheet.org/
- 23. やったこと
• Vagrant + AnsibleでMySQL Server構築
• SQLAlchemy + py-retrosheetでmigration
• Jupyter(IPython notebook)とpandasで分析
• matplotlibで可視化
- 27. PY-RETROSHEET - やきうScript
• Retrosheet専用Download&migration script
git@github.com:wellsoliver/py-retrosheet.git
• データ取得からDB(MySQLなど)へのmigrationを一気通貫に行える神ライブラリ
- 48. アダム・ダン率ランキング(P)
順位
選手名
(チーム)
ダン
率
HR 四球 三振 コメント
1 中村剛也(西) 46.2 37 68 172 三振王かつ本塁打王
2 メヒア(西) 42.9 27 45 153 去年の本塁打王
3 ペーニャ(楽) 40.2 17 70 111 典型的な地蔵タイプ
4 森友哉(西) 38.4 17 44 143 お若いのに三振多すぎぃ
5 松田宣浩(ソ) 38.1 35 60 135 テラス席の申し子
※2015シーズン終了時
- 49. アダム・ダン率ランキング(C)
順位
選手名
(チーム)
ダン
率
HR 四球 三振 コメント
1 丸佳浩(広) 40.4 19 94 143 三振と四球で二冠達成
2 ゴメス(神) 37.1 17 72 134 キャラ通りの成績
3 山田哲人(ヤ) 35.6 38 81 111 思ったより三振多い
4 梶谷隆幸(D) 34.4 13 54 132 役割的に三振の数は深刻
5 筒香嘉智(D) 33.5 24 68 98 まあまあ合格点
※2015シーズン終了時
- 51. 被アダム・ダン率ランキング(P)
順位
選手名
(チーム)
ダン
率
HR 四球 三振 コメント
1 大谷翔平(日) 40.6 7 46 196 本格派すぎる
2 則本昂大(楽) 35.3 14 48 215 奪三振王&やや飛翔
3 武田翔太(ソ) 34.8 14 59 163 やや飛翔癖あり
4 中田賢一(ソ) 33 17 61 130 飛翔しすぎぃ
5 西勇輝(オ) 31 11 43 143 本格派になりつつある
※2015シーズン終了時
- 52. 被アダム・ダン率ランキング(C)
順位
選手名
(チーム)
ダン
率
HR 四球 三振 コメント
1 藤浪晋太郎(神) 38.5 9 82 221 三振と四球で二冠達成
2 メッセンジャー(神) 33.5 10 60 194 三振&四球2位
3 高木勇人(巨) 29.8 16 47 131 ルーキー
4 ジョンソン(広) 29 5 67 150 同僚の黒田は21.9ダン
5 小川泰弘(ヤ) 28.3 18 48 128 成瀬の代わりに飛翔
※2015シーズン終了時
- 56. Python + Baseball
• 「野球Hackで迷ったらPython!」
• データ分析&検証、プロトタイプ作りといった、
「不確定要素が多いproject」でのPythonは強い
→スタートアップとか(野球関係ないけど…w)
• とはいえ向き・不向きや好みもあるので他の言語
やFWもいい感じに柔軟に使うといいでしょう