Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Shinichi Nakagawa
PDF, PPTX
103,480 views
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
PyCon JP 2015 Talk Session発表資料
Software
◦
Read more
75
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 66
2
/ 66
3
/ 66
4
/ 66
5
/ 66
6
/ 66
7
/ 66
8
/ 66
9
/ 66
10
/ 66
11
/ 66
12
/ 66
13
/ 66
14
/ 66
15
/ 66
16
/ 66
17
/ 66
18
/ 66
19
/ 66
20
/ 66
21
/ 66
22
/ 66
23
/ 66
24
/ 66
25
/ 66
26
/ 66
27
/ 66
28
/ 66
29
/ 66
30
/ 66
31
/ 66
32
/ 66
33
/ 66
34
/ 66
35
/ 66
36
/ 66
37
/ 66
38
/ 66
39
/ 66
40
/ 66
41
/ 66
42
/ 66
43
/ 66
44
/ 66
45
/ 66
46
/ 66
47
/ 66
48
/ 66
49
/ 66
50
/ 66
51
/ 66
52
/ 66
53
/ 66
54
/ 66
55
/ 66
56
/ 66
57
/ 66
58
/ 66
59
/ 66
60
/ 66
61
/ 66
62
/ 66
63
/ 66
64
/ 66
65
/ 66
66
/ 66
More Related Content
PDF
[R勉強会][データマイニング] R言語による時系列分析
by
Koichi Hamada
PPTX
CatBoost on GPU のひみつ
by
Takuji Tahara
PDF
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
by
Recruit Technologies
PPTX
博士課程の誤解と真実 ー進学に向けて、両親を説得した資料をもとにー
by
Atsuto ONODA
PDF
協調フィルタリング入門
by
hoxo_m
PDF
レコメンドエンジン作成コンテストの勝ち方
by
Shun Nukui
PPTX
パワポ版の落合先生流論文要旨のテンプレートを作ったので配布する
by
森 哲也
PDF
tf,tf2完全理解
by
Koji Terada
[R勉強会][データマイニング] R言語による時系列分析
by
Koichi Hamada
CatBoost on GPU のひみつ
by
Takuji Tahara
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
by
Recruit Technologies
博士課程の誤解と真実 ー進学に向けて、両親を説得した資料をもとにー
by
Atsuto ONODA
協調フィルタリング入門
by
hoxo_m
レコメンドエンジン作成コンテストの勝ち方
by
Shun Nukui
パワポ版の落合先生流論文要旨のテンプレートを作ったので配布する
by
森 哲也
tf,tf2完全理解
by
Koji Terada
What's hot
PDF
SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)
by
SSII
PDF
ゼロから始める転移学習
by
Yahoo!デベロッパーネットワーク
PDF
先端技術とメディア表現1 #FTMA15
by
Yoichi Ochiai
PDF
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
by
Ken'ichi Matsui
PDF
【メタサーベイ】Video Transformer
by
cvpaper. challenge
PDF
研究発表のためのプレゼンテーション技術
by
Shinnosuke Takamichi
PPTX
ゲームの中の人工知能
by
Youichiro Miyake
PPT
色彩センスのいらない配色講座
by
Mariko Yamaguchi
PPTX
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
by
Nobukazu Yoshioka
KEY
ノンデザイナーのための配色理論
by
tsukasa obara
PPTX
マルチモーダル深層学習の研究動向
by
Koichiro Mori
PDF
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
by
諒介 荒木
PDF
【CVPR 2020 メタサーベイ】Neural Generative Models
by
cvpaper. challenge
PDF
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
by
Koichi Hamada
PDF
Statistical Semantic入門 ~分布仮説からword2vecまで~
by
Yuya Unno
PDF
強化学習その4
by
nishio
PDF
推薦アルゴリズムの今までとこれから
by
cyberagent
PPTX
これからの Vision & Language ~ Acadexit した4つの理由
by
Yoshitaka Ushiku
PDF
JDLA主催「CVPR2023技術報告会」発表資料
by
Morpho, Inc.
PDF
外れ値
by
Shintaro Fukushima
SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)
by
SSII
ゼロから始める転移学習
by
Yahoo!デベロッパーネットワーク
先端技術とメディア表現1 #FTMA15
by
Yoichi Ochiai
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
by
Ken'ichi Matsui
【メタサーベイ】Video Transformer
by
cvpaper. challenge
研究発表のためのプレゼンテーション技術
by
Shinnosuke Takamichi
ゲームの中の人工知能
by
Youichiro Miyake
色彩センスのいらない配色講座
by
Mariko Yamaguchi
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
by
Nobukazu Yoshioka
ノンデザイナーのための配色理論
by
tsukasa obara
マルチモーダル深層学習の研究動向
by
Koichiro Mori
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
by
諒介 荒木
【CVPR 2020 メタサーベイ】Neural Generative Models
by
cvpaper. challenge
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
by
Koichi Hamada
Statistical Semantic入門 ~分布仮説からword2vecまで~
by
Yuya Unno
強化学習その4
by
nishio
推薦アルゴリズムの今までとこれから
by
cyberagent
これからの Vision & Language ~ Acadexit した4つの理由
by
Yoshitaka Ushiku
JDLA主催「CVPR2023技術報告会」発表資料
by
Morpho, Inc.
外れ値
by
Shintaro Fukushima
Viewers also liked
PDF
Python入門 : 4日間コース社内トレーニング
by
Yuichi Ito
PDF
Scikit learnで学ぶ機械学習入門
by
Takami Sato
PDF
Gensim
by
saireya _
PDF
scikit-learnを用いた機械学習チュートリアル
by
敦志 金谷
PPTX
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
by
Katsuhiro Morishita
PDF
Python 機械学習プログラミング データ分析ライブラリー解説編
by
Etsuji Nakai
PDF
Python Professional Baseball Programming Open Data Edition #bpstudy 91(2015/3...
by
Shinichi Nakagawa
PDF
価値を見せる技術 #DevLOVE ベースボールからみる技術
by
Shinichi Nakagawa
PDF
Pythonで動かして学ぶ機械学習入門_予測モデルを作ってみよう
by
洋資 堅田
PDF
数字から読む好不調の波
by
Jun Sasaki
PDF
Djangoエンジニアの観点から見たHue
by
Shinya Okano
PDF
Pythonで簡単ネットワーク分析
by
antibayesian 俺がS式だ
PPTX
2014年NPBたらいまわされ十傑
by
Taichi Watanabe
PDF
タイムラインでポジろう!
by
Yokohama Yuushou
PDF
「Python言語」はじめの一歩 / First step of Python
by
Takanori Suzuki
PDF
RとPythonによるデータ解析入門
by
Atsushi Hayakawa
PDF
python-twitterを用いたTwitterデータ収集
by
Hikaru Takemura
PDF
10分でわかるPythonの開発環境
by
Hisao Soyama
PDF
PythonによるWebスクレイピング入門
by
Hironori Sekine
PDF
Python東海Vol.5 IPythonをマスターしよう
by
Hiroshi Funai
Python入門 : 4日間コース社内トレーニング
by
Yuichi Ito
Scikit learnで学ぶ機械学習入門
by
Takami Sato
Gensim
by
saireya _
scikit-learnを用いた機械学習チュートリアル
by
敦志 金谷
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
by
Katsuhiro Morishita
Python 機械学習プログラミング データ分析ライブラリー解説編
by
Etsuji Nakai
Python Professional Baseball Programming Open Data Edition #bpstudy 91(2015/3...
by
Shinichi Nakagawa
価値を見せる技術 #DevLOVE ベースボールからみる技術
by
Shinichi Nakagawa
Pythonで動かして学ぶ機械学習入門_予測モデルを作ってみよう
by
洋資 堅田
数字から読む好不調の波
by
Jun Sasaki
Djangoエンジニアの観点から見たHue
by
Shinya Okano
Pythonで簡単ネットワーク分析
by
antibayesian 俺がS式だ
2014年NPBたらいまわされ十傑
by
Taichi Watanabe
タイムラインでポジろう!
by
Yokohama Yuushou
「Python言語」はじめの一歩 / First step of Python
by
Takanori Suzuki
RとPythonによるデータ解析入門
by
Atsushi Hayakawa
python-twitterを用いたTwitterデータ収集
by
Hikaru Takemura
10分でわかるPythonの開発環境
by
Hisao Soyama
PythonによるWebスクレイピング入門
by
Hironori Sekine
Python東海Vol.5 IPythonをマスターしよう
by
Hiroshi Funai
Similar to 野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
PDF
Rでセイバーメトリクス (イチローと松井 どっちが凄い?)
by
Takuma Hatano
PDF
Agile Baseball Science - アジャイル脳によく効く野球のハナシ
by
Shinichi Nakagawa
PDF
Pythonではじめる野球プログラミング(続き)PyCon JP 2014 LT
by
Shinichi Nakagawa
PDF
データ分析に使える野球データまとめ #PyDataTokyo meetup 2015/10/23
by
Shinichi Nakagawa
PDF
セイバーメトリクスの古典指標を整理してみた(打者編)
by
KeitoHirotsuru1
PDF
野球データを可視化してみた ニコニコ学会
by
Shinichi Nakagawa
PDF
Rで野球データ解析がしたい ( pitchRxを使う )
by
Takuma Hatano
PDF
ファンタジーベースボールの数値分析
by
Jun Ogawa
PDF
野球Hack!~Pythonを用いたデータ分析と可視化 #kwskrb #28 2015/9/30
by
Shinichi Nakagawa
PDF
Agile Baseball Science - はじめてのセイバーメトリクス
by
Shinichi Nakagawa
PDF
野球Hack!(続き)~Pythonを用いた野球サービス構築 #bpstudy
by
Shinichi Nakagawa
PDF
采配の心理学-盗塁企図に潜むバイアス- Risk-averse judgement in baseball, steals
by
Taku Imaizumi (nowism)
Rでセイバーメトリクス (イチローと松井 どっちが凄い?)
by
Takuma Hatano
Agile Baseball Science - アジャイル脳によく効く野球のハナシ
by
Shinichi Nakagawa
Pythonではじめる野球プログラミング(続き)PyCon JP 2014 LT
by
Shinichi Nakagawa
データ分析に使える野球データまとめ #PyDataTokyo meetup 2015/10/23
by
Shinichi Nakagawa
セイバーメトリクスの古典指標を整理してみた(打者編)
by
KeitoHirotsuru1
野球データを可視化してみた ニコニコ学会
by
Shinichi Nakagawa
Rで野球データ解析がしたい ( pitchRxを使う )
by
Takuma Hatano
ファンタジーベースボールの数値分析
by
Jun Ogawa
野球Hack!~Pythonを用いたデータ分析と可視化 #kwskrb #28 2015/9/30
by
Shinichi Nakagawa
Agile Baseball Science - はじめてのセイバーメトリクス
by
Shinichi Nakagawa
野球Hack!(続き)~Pythonを用いた野球サービス構築 #bpstudy
by
Shinichi Nakagawa
采配の心理学-盗塁企図に潜むバイアス- Risk-averse judgement in baseball, steals
by
Taku Imaizumi (nowism)
More from Shinichi Nakagawa
PDF
Py "Baseball" Data入門 - 広島東洋カープ編 #pyconhiro
by
Shinichi Nakagawa
PDF
こんなゴールデン・グラブ賞は嫌だ~2015 #bpstudy 100回目記念LT
by
Shinichi Nakagawa
PDF
ビックデータとPythonではじめる野球の統計分析 #pyconjp
by
Shinichi Nakagawa
PDF
ビックデータとPythonではじめる野球の統計分析(α)
by
Shinichi Nakagawa
PDF
Py "Baseball" Data入門〜サービス(と野球)を支えるデータ分析基盤 #monotarotech
by
Shinichi Nakagawa
PDF
User Happyをささえるアジャイルのココロとスクラムのキホン
by
Shinichi Nakagawa
PDF
はじめてのLean Canvas〜最初のアイディアを言語化してみよう #bpstudy
by
Shinichi Nakagawa
PDF
PyData入門(超初心者編)~野球のデータをカジュアルに可視化
by
Shinichi Nakagawa
PDF
やきうデータLT「ホームラン」 #pyconjp
by
Shinichi Nakagawa
PDF
Baseball Play Study 2016冬〜Replacement!(ありがとう陽岱鋼!)
by
Shinichi Nakagawa
PDF
アジャイルサムライ~Pythonista道場 #PyLadiesTokyo 1周年記念パーティー 2015/10/24
by
Shinichi Nakagawa
PDF
Python野球クラスタの紹介
by
Shinichi Nakagawa
PDF
Pythonistaな私がChefからAnsibleに乗り換えた話(ひたすらゆるくプレゼンする会 2015/4/9)
by
Shinichi Nakagawa
PDF
XPな俺達に贈るPyCon JP 2016レポート #xpjug
by
Shinichi Nakagawa
PDF
A Tour of やきう&Go - やきう民の私とGoの半年(実質3日間)
by
Shinichi Nakagawa
PDF
Big Data Baseball with Python - Ichiro Suzuki hacks! #kwsk01
by
Shinichi Nakagawa
PDF
【Inception-Deck】野球Hack! - Pythonを用いたデータ分析と可視化
by
Shinichi Nakagawa
PDF
たった数行のPythonコードで打者大谷翔平がどれだけ凄いのかを見てみる #ABPro
by
Shinichi Nakagawa
PDF
Pythonistaデビュー #PyNyumon 2016/5/31
by
Shinichi Nakagawa
PDF
Python + Raspberry Piでスマートハウスを手作りする(計画) Python mini Hack-a-thon #49 成果発表 2014...
by
Shinichi Nakagawa
Py "Baseball" Data入門 - 広島東洋カープ編 #pyconhiro
by
Shinichi Nakagawa
こんなゴールデン・グラブ賞は嫌だ~2015 #bpstudy 100回目記念LT
by
Shinichi Nakagawa
ビックデータとPythonではじめる野球の統計分析 #pyconjp
by
Shinichi Nakagawa
ビックデータとPythonではじめる野球の統計分析(α)
by
Shinichi Nakagawa
Py "Baseball" Data入門〜サービス(と野球)を支えるデータ分析基盤 #monotarotech
by
Shinichi Nakagawa
User Happyをささえるアジャイルのココロとスクラムのキホン
by
Shinichi Nakagawa
はじめてのLean Canvas〜最初のアイディアを言語化してみよう #bpstudy
by
Shinichi Nakagawa
PyData入門(超初心者編)~野球のデータをカジュアルに可視化
by
Shinichi Nakagawa
やきうデータLT「ホームラン」 #pyconjp
by
Shinichi Nakagawa
Baseball Play Study 2016冬〜Replacement!(ありがとう陽岱鋼!)
by
Shinichi Nakagawa
アジャイルサムライ~Pythonista道場 #PyLadiesTokyo 1周年記念パーティー 2015/10/24
by
Shinichi Nakagawa
Python野球クラスタの紹介
by
Shinichi Nakagawa
Pythonistaな私がChefからAnsibleに乗り換えた話(ひたすらゆるくプレゼンする会 2015/4/9)
by
Shinichi Nakagawa
XPな俺達に贈るPyCon JP 2016レポート #xpjug
by
Shinichi Nakagawa
A Tour of やきう&Go - やきう民の私とGoの半年(実質3日間)
by
Shinichi Nakagawa
Big Data Baseball with Python - Ichiro Suzuki hacks! #kwsk01
by
Shinichi Nakagawa
【Inception-Deck】野球Hack! - Pythonを用いたデータ分析と可視化
by
Shinichi Nakagawa
たった数行のPythonコードで打者大谷翔平がどれだけ凄いのかを見てみる #ABPro
by
Shinichi Nakagawa
Pythonistaデビュー #PyNyumon 2016/5/31
by
Shinichi Nakagawa
Python + Raspberry Piでスマートハウスを手作りする(計画) Python mini Hack-a-thon #49 成果発表 2014...
by
Shinichi Nakagawa
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
1.
野球Hack!~Pythonを用いたデータ分析と可視化 - The Art
Of Programming A Baseball Game! - Shinichi Nakagawa@shinyorke PyCon JP 2015 Talk Session(2015/10/11)
2.
Who am I
? • Shinichi Nakagawa(@shinyorke) • Recruit Sumai Company, Ltd. • Pythonista/Agile/Baseball Scientist • 贔屓チーム • 北海道日本ハムファイターズ(NPB) • オークランド・アスレチックス(MLB) • “野生の野球アナリスト”活動
3.
“野生の野球アナリスト” 活動
4.
• PyCon JP
2014 Talk Session(去年のやつ) • MLBオープンデータ分析&可視化サービスをPythonで構築 • はてブ200超え、PV 14,000以上(slideshare)
5.
• PyCon JP
2014 Lightning Talk(去年のやつ) • Agileプロセス活用、アダム・ダン率の紹介 • アダム・ダンさん、Python界隈で有名になる
6.
Other… • ブログで野球Hackの成果および考察を披露(不定期) • MLBオープンデータの紹介と活用例紹介 •
野球データの分析&解析用のライブラリを Githubで公開(ほぼPython製) • データドリブン野球解説 ※後ほど解説
7.
最終目標(40歳までに) • エンジニア×ビジネスマンとして、 日本プロ野球orMLBの仕事をやる! ※NPB12球団+MLB30球団のオファー待ってます • 野球データとエンジニアの知見を活かし、 2020年東京五輪でメダル獲得のサポート ※エンジニアとして(選手にはならないw)
8.
Today’s Starting Member •
Pythonと野球 • MLBオープンデータ活用とPython • Pythonで「俺々野球分析基盤」 • まとめ - これからの野球Hack
9.
Pythonと野球
10.
なぜ野球×Pythonなのか? • 野球データと野球Hack • Pythonと野球Hack
11.
野球データ(嬉) • ボックス・スコアによる正規化済みのデータが存在 • 打撃・投球・試合の成績がボックス・スコアで読みやすい・書きや すいフォーマットでまとまっている •
使えるデータが存在 • メジャーリーグはオープンなライセンスで使えるデータが存在 (利用制限ほぼなし) • 日本プロ野球はデータをぶっこ抜く自動的に取得する仕組みを自作 することにより入手可能(当然、利用は制限される)
12.
ボックス・スコア ※Sportsnaviより
13.
野球データ(辛) • データの解釈 • ボックス・スコア自体は読みやすいが、解釈そのものはルールや規約を 正確に読む必要がある 例)振り逃げはどう記録される? インフィールドフライの条件とは? •
ボックス・スコアには乗らないデータの存在 • 投手の球速、変化球の種類、打球の速度や着地点etc… ボックス・スコアに乗らないデータが存在 &独自のフォーマットでの記載が多く読み書きが難しい
14.
野球Hackの掟 • スクラップアンドビルド • データを読む→仮説を立てる→コードを書く→可視化する→検証→ またデータを読む …の繰り返し、コードを書いては壊すを繰り返す作業が大半 •
データの読み書きとルールの勉強 • 野球の記録の読み方、記録がつく理由を把握する為にルールを勉強 →ルールを正確に把握するため、公認野球規則&審判の知識が必要 ※実際本を買って勉強してます(実話)
15.
Pythonと野球Hack • インフラ管理・構成 Ansibleおよびdocker compose(というよりDocker)を活用、 すぐ作れる&壊せるインフラで思う存分スクラップアンドビルドを! •
バージョン&パッケージ管理 pyenv + virtualenvでバージョン&パッケージ管理をプロジェクト単位で切り替え. →特定のPythonバージョン&パッケージに依存しない作り. • データ分析・可視化 IPython notebook + pandas + matplotlibでカジュアルに分析&可視化. 面倒くさいQUERYなどはSQLAlchemyなどで型化. • Webアプリ構築 サクッと作る目的でFlask/bottle、しっかり作る目的でDjangoを使う.
16.
なんでや!Pythonじゃなくてもできるやろ!! ※ボールの判定に不服なバルフォアさん、ではありません 元画像:http://www.sbs.com.au/
17.
はい、Pythonじゃなくできます • インフラ管理・構成 部分的にVagrantを使用、ちなみにChefはやめた. • バージョン&パッケージ管理 Rubyのrenv/rbenv-gemsetなど、他の言語にも当然ながら存在. •
データ分析・可視化 得意な人はR・Juliaでいいと思う、野球HackをRでやってる方もいます. (他の言語は、、、どうなんだろう?) • Webアプリ構築 APIやバッチならGolang, サイトならRuby On Rails他選択肢がたくさん有り 目的(と好み)に合わせて手段を柔軟に変えましょう
18.
好きな言語でHackしようぜ! ※キャプテン・ジーター、本当にお疲れ様でした 元画像:http://www.playbuzz.com/
19.
MLBオープンデータとPython
20.
元ネタ(過去ブログより) http://shinyorke.hatenablog.com/entry/ 2015/04/06/190243
21.
やりたかったこと • 野球ゲーム「Fantasy Baseball」に勝つため、 選手の詳細な情報(主に成績)が必要に •
MLBのオープンデータ「Retrosheet」に それらが詰められてるらしい ワイ「データベースつくればいいじゃん!」
22.
Retrosheet is 何? •
メジャーリーグのスコアデータ集 • 1887~2014(昨シーズン)までのデータをCSVで配布 ※1989以前は欠損有り • スコアブックで得られる情報(得点、失点、スタメン、打席 結果etc…)と選手情報(名前、ポジションなど)がひと目 でわかる • http://retrosheet.org/
23.
やったこと • Vagrant +
AnsibleでMySQL Server構築 • SQLAlchemy + py-retrosheetでmigration • Jupyter(IPython notebook)とpandasで分析 • matplotlibで可視化
24.
構成 Simple is Best?
25.
構成 Simple is Best!!! →構成を型化してイケてる感じに
26.
サーバー構築とmigration $ vagrant up $
ansible-playbook -i hosts retrosheet_server.yml この2行でサーバーを作れるようにしました! ※VagrantとAnsibleを導入している前提です
27.
PY-RETROSHEET - やきうScript •
Retrosheet専用Download&migration script git@github.com:wellsoliver/py-retrosheet.git • データ取得からDB(MySQLなど)へのmigrationを一気通貫に行える神ライブラリ
28.
IPython notebook+pandas • 平たく言えば、「ブラウザ上で使えるPythonその他のSandbox環境」 •
データやLibraryが不確実( 使いこなせていない)時の試し打ちとして最高すぎる環境 • pandasで前処理、matplotlibでお絵かき(グラフ描画など)
29.
分析と可視化 • レスターは何月に一番勝っているのか? • ボットのマルチ四球(=1試合2四球)の回数 Jon
Lester Joey Votto
30.
Jon Lester(ジョン・レスター) • メジャー屈指の先発左腕、優勝請負人 ※世界一経験二回 •
プレーオフ(10/9)に先発、なお負け投手 • レッドソックス(2006-2014)→アスレチックス(2014)→カブス(2015)
31.
レスターさんの月別勝利数 • 調子いい時は4,5月で稼いでいる、8,9月も良さげだがそんなに極端ではない • 残りの月はなんか微妙だけど傾向がアレ ちなみに7月はオールスターの為登板が少ない(レスターにかぎらず)
32.
Joey Votto(ジョーイ・ボット) • レッズ一筋(2007-2015)、強打の一塁手 •
選球眼が良すぎて散歩(四球)が多い、通算アダム・ダン率は38% • 内野フライが異常に少ない。とある統計によると、2009-2012の4年間で3本(ファ!?)
33.
塁間さんぽ(イッチVSボット) • 月別の四球数、凡例の数字はシーズン通算 • 圧倒的にボットさんが散歩好き、特に8,9月やばい •
神イチローはとにかく打って走るスタイル、春先はまあまあ歩いてる イチロー ボット
34.
マルチさんぽ(イッチVSボット) • 1試合で2個以上四球を選んだ試合を月別にカウント • ボットさんの回数がやばい •
神イチローはある意味予想通り、流石天才バッター イチロー ボット
35.
コードは後日公開!!!
36.
Pythonで 「俺々野球分析基盤」 を作ったハナシ
37.
キッカケはコチラ
38.
http://www.slideshare.net/shinyorke/agile-baseball-science-52692504
39.
やりたかったこと • 日本プロ野球データを元に野球統計学の話を するネタを思いつく • だがしかし、MLBのようにオープン化された データなんぞない •
そうだ、データをぶっこ抜く自動的に取得し て計算してレポート出せばいいじゃん!
40.
どうやって解決したか • スポーツのデータサイト(Y⃝hoo等)から、 順位表と選手成績を取得 • 取得したデータを元にセイバーメトリクス指標 を算出 •
一日に一回、取得&算出を行い、Excelシートに 計算結果出力&AWS S3に転送
41.
構成(development)
42.
構成(Provisioning)
43.
• ぶっちゃけ当初の要件でDockerは不要だった • しかし、将来的に「俺々野球基盤」としてService を立ち上げる構想があり、今のうちに試せること はためそう!と思いDockerを本番投入 •
docker compose(旧名fig)でアプリとDBを 一気通貫にService立ちあげする下地を作った
44.
crontab(parse-crontab) • DockerのPython container(Debian)、 デフォルトでcrontabが使えない事が判明 •
いちいち設定するのもアレだ…と思った矢先に、 いい感じのライブラリーを発見!!! parse-crontab: https://github.com/josiahcarlson/parse-crontab example : http://gaujin.jp/index.php?itemid=27 ※ @gaujin_jp さんありがとうございます! • ピュアなPython環境でcrontab環境実現&自動実行が可能に!!!
45.
分析と可視化 • アダム・ダン率 三振・四球・ホームランでアダム・ダンらしさ を評価 • 被アダム・ダン率 アダム・ダンな打者を量産する可能性がある 投手を見つける
46.
Wikipedia「三振」 ※1年ぶり2回目の登場 https://ja.wikipedia.org/wiki/三振 アダム・ダン
47.
アダム・ダン率 = (ダンらしさ)
/ 打数 * 100 ※ダンらしさ = 本塁打 + 四球+ 三振
48.
アダム・ダン率ランキング(P) 順位 選手名 (チーム) ダン 率 HR 四球 三振
コメント 1 中村剛也(西) 46.2 37 68 172 三振王かつ本塁打王 2 メヒア(西) 42.9 27 45 153 去年の本塁打王 3 ペーニャ(楽) 40.2 17 70 111 典型的な地蔵タイプ 4 森友哉(西) 38.4 17 44 143 お若いのに三振多すぎぃ 5 松田宣浩(ソ) 38.1 35 60 135 テラス席の申し子 ※2015シーズン終了時
49.
アダム・ダン率ランキング(C) 順位 選手名 (チーム) ダン 率 HR 四球 三振
コメント 1 丸佳浩(広) 40.4 19 94 143 三振と四球で二冠達成 2 ゴメス(神) 37.1 17 72 134 キャラ通りの成績 3 山田哲人(ヤ) 35.6 38 81 111 思ったより三振多い 4 梶谷隆幸(D) 34.4 13 54 132 役割的に三振の数は深刻 5 筒香嘉智(D) 33.5 24 68 98 まあまあ合格点 ※2015シーズン終了時
50.
被アダム・ダン率 = (ダンらしさ)
/ 打者数 * 100 ※ダンらしさ = 被本塁打 + 与四死球 + 三振
51.
被アダム・ダン率ランキング(P) 順位 選手名 (チーム) ダン 率 HR 四球 三振
コメント 1 大谷翔平(日) 40.6 7 46 196 本格派すぎる 2 則本昂大(楽) 35.3 14 48 215 奪三振王&やや飛翔 3 武田翔太(ソ) 34.8 14 59 163 やや飛翔癖あり 4 中田賢一(ソ) 33 17 61 130 飛翔しすぎぃ 5 西勇輝(オ) 31 11 43 143 本格派になりつつある ※2015シーズン終了時
52.
被アダム・ダン率ランキング(C) 順位 選手名 (チーム) ダン 率 HR 四球 三振
コメント 1 藤浪晋太郎(神) 38.5 9 82 221 三振と四球で二冠達成 2 メッセンジャー(神) 33.5 10 60 194 三振&四球2位 3 高木勇人(巨) 29.8 16 47 131 ルーキー 4 ジョンソン(広) 29 5 67 150 同僚の黒田は21.9ダン 5 小川泰弘(ヤ) 28.3 18 48 128 成瀬の代わりに飛翔 ※2015シーズン終了時
53.
コードは後日公開…
54.
しません!!! (察してください…w)
55.
まとめ シモンズの守備ってまとめに相応しいよね 元画像: http://a.espncdn.com/photo/2013/1028/mlb_nl-gloves_06.jpg
56.
Python + Baseball •
「野球Hackで迷ったらPython!」 • データ分析&検証、プロトタイプ作りといった、 「不確定要素が多いproject」でのPythonは強い →スタートアップとか(野球関係ないけど…w) • とはいえ向き・不向きや好みもあるので他の言語 やFWもいい感じに柔軟に使うといいでしょう
57.
好きな言語でHackしようぜ! ※大切なので二回いいました 元画像:http://www.playbuzz.com/
58.
Possibilities of Python
59.
これからの野球Hack • 個人として • みんなで(コミュニティ的な意味で) •
大切にしたいこと
60.
これからの野球Hack(願望) • 「データドリブン野球解説」を通じて新しい野球とスポーツの可能性を説いて生きたい!! →やきうをオープンな情報基盤に! • 東京五輪に向けて、新しい野球・スポーツの楽しみ方を模索&リードしていきたい!!!
61.
みんなで野球Hack!!! • 本日の発表などを通じ、 「面白い!」 「俺も(私も)やりたい!!」 と思った方!是非一緒にやりましょう!!! • 明日(10/12)のPyCon
JP 2015 Sprintsで 一緒に野球をHackしましょう!!!
62.
大切にしたいこと
63.
ビル・ジェームズ -野球統計学「セイバーメトリクス」の生みの親- 元画像: http://sportsworld.nbcsports.com/bill-james-statistical-revolution/
64.
“”” わたしの関心事は、野球だけ。 いったいなぜだろう? それは,ほかの分野の数字と 違って,野球のデータには 言葉と同じ力があるからだ。 “”” - 書籍「マネー・ボール」第四章より
65.
Possibilities of 野球Hack!
66.
ゲームセット!!! ご清聴ありがとうございました. Shinichi Nakagawa(Twitter/Facebook/hatena:@shinyorke)
Download