Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Shinichi Nakagawa
4,039 views
野球Hack!~Pythonを用いたデータ分析と可視化 #kwskrb #28 2015/9/30
Kawasaki.rb #28 (2015/9/30)発表資料. Pythonを用いた野球プログラミングについて
Software
◦
Read more
12
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 42
2
/ 42
3
/ 42
4
/ 42
5
/ 42
6
/ 42
7
/ 42
8
/ 42
9
/ 42
10
/ 42
11
/ 42
12
/ 42
13
/ 42
14
/ 42
15
/ 42
16
/ 42
17
/ 42
18
/ 42
19
/ 42
20
/ 42
21
/ 42
22
/ 42
23
/ 42
24
/ 42
25
/ 42
26
/ 42
27
/ 42
28
/ 42
29
/ 42
30
/ 42
31
/ 42
32
/ 42
33
/ 42
34
/ 42
35
/ 42
36
/ 42
37
/ 42
38
/ 42
39
/ 42
40
/ 42
41
/ 42
42
/ 42
More Related Content
PDF
【Inception-Deck】野球Hack! - Pythonを用いたデータ分析と可視化
by
Shinichi Nakagawa
PDF
Railsではじめる野球プログラミング
by
Shinichi Nakagawa
PDF
Pythonではじめる野球プログラミング(続き)PyCon JP 2014 LT
by
Shinichi Nakagawa
PDF
Python野球クラスタの紹介
by
Shinichi Nakagawa
PDF
Python Professional Baseball Programming Open Data Edition #bpstudy 91(2015/3...
by
Shinichi Nakagawa
PDF
Pythonistaな私がChefからAnsibleに乗り換えた話(ひたすらゆるくプレゼンする会 2015/4/9)
by
Shinichi Nakagawa
PDF
野球Hack!(続き)~Pythonを用いた野球サービス構築 #bpstudy
by
Shinichi Nakagawa
PDF
アジャイルサムライ~Pythonista道場 #PyLadiesTokyo 1周年記念パーティー 2015/10/24
by
Shinichi Nakagawa
【Inception-Deck】野球Hack! - Pythonを用いたデータ分析と可視化
by
Shinichi Nakagawa
Railsではじめる野球プログラミング
by
Shinichi Nakagawa
Pythonではじめる野球プログラミング(続き)PyCon JP 2014 LT
by
Shinichi Nakagawa
Python野球クラスタの紹介
by
Shinichi Nakagawa
Python Professional Baseball Programming Open Data Edition #bpstudy 91(2015/3...
by
Shinichi Nakagawa
Pythonistaな私がChefからAnsibleに乗り換えた話(ひたすらゆるくプレゼンする会 2015/4/9)
by
Shinichi Nakagawa
野球Hack!(続き)~Pythonを用いた野球サービス構築 #bpstudy
by
Shinichi Nakagawa
アジャイルサムライ~Pythonista道場 #PyLadiesTokyo 1周年記念パーティー 2015/10/24
by
Shinichi Nakagawa
What's hot
PDF
Pythonではじめる野球プログラミング - kawasaki.rb #15 2014/8/27
by
Shinichi Nakagawa
PDF
データ分析に使える野球データまとめ #PyDataTokyo meetup 2015/10/23
by
Shinichi Nakagawa
PDF
PyData入門(超初心者編)~野球のデータをカジュアルに可視化
by
Shinichi Nakagawa
PDF
Pythonではじめる野球プログラミング PyCon JP 2014 9/14 Talk Session
by
Shinichi Nakagawa
PDF
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
by
Shinichi Nakagawa
PDF
A Tour of やきう&Go - やきう民の私とGoの半年(実質3日間)
by
Shinichi Nakagawa
PDF
価値を見せる技術 #DevLOVE ベースボールからみる技術
by
Shinichi Nakagawa
PDF
Rで野球のデータ解析がしたい (データが欲しい)
by
Takuma Hatano
PDF
User Happyをささえるアジャイルのココロとスクラムのキホン
by
Shinichi Nakagawa
PPTX
Django learning Part2
by
Yusuke Muraoka
PPTX
Jpsps #27 modern page provisioning
by
裕康 井上
Pythonではじめる野球プログラミング - kawasaki.rb #15 2014/8/27
by
Shinichi Nakagawa
データ分析に使える野球データまとめ #PyDataTokyo meetup 2015/10/23
by
Shinichi Nakagawa
PyData入門(超初心者編)~野球のデータをカジュアルに可視化
by
Shinichi Nakagawa
Pythonではじめる野球プログラミング PyCon JP 2014 9/14 Talk Session
by
Shinichi Nakagawa
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
by
Shinichi Nakagawa
A Tour of やきう&Go - やきう民の私とGoの半年(実質3日間)
by
Shinichi Nakagawa
価値を見せる技術 #DevLOVE ベースボールからみる技術
by
Shinichi Nakagawa
Rで野球のデータ解析がしたい (データが欲しい)
by
Takuma Hatano
User Happyをささえるアジャイルのココロとスクラムのキホン
by
Shinichi Nakagawa
Django learning Part2
by
Yusuke Muraoka
Jpsps #27 modern page provisioning
by
裕康 井上
Viewers also liked
PDF
やきうデータLT「ホームラン」 #pyconjp
by
Shinichi Nakagawa
PPTX
PyLadies Tokyo #3: ゼロからはじめたPyData
by
Katayanagi Nobuko
PDF
Agile Baseball Science - アジャイル脳によく効く野球のハナシ
by
Shinichi Nakagawa
PPTX
Python/Bottle for Kubo Semi 2014
by
Toshiki NOGUCHI
PDF
bottleで始めるWEBアプリの最初の一歩
by
Satoshi Yamada
PPTX
Pyladies Tokyo meet up #6
by
Katayanagi Nobuko
PDF
あなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LT
by
Hiroaki Kudo
PDF
最近遊んだ Wii Uの 3つのソフトの感想
by
teapipin
PPTX
これからの時代に! パソコン離れの中のパソコン選び
by
teapipin
PDF
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack
by
teapipin
PDF
XP lives, XP dies, XP lives again !!
by
Masanori Kado
PPTX
アイドルソング制作の工程管理
by
Motokazu Sekine
PDF
Redmineによるwebサポート窓口の実装と運用
by
Go Maeda
PDF
「Redmineの運用パターン集~私に聞くな、チケットシステムに聞け」
by
akipii Oga
PDF
情報システム部門のタスク管理とIT全般統制 ~ Excel管理からの脱却 ~ (ITS Redmine #RxTstudy #5)
by
Kuniharu(州晴) AKAHANE(赤羽根)
PDF
Redmineによるメール対応管理の運用事例
by
Go Maeda
PDF
俺も!「老害」 公開版
by
ESM SEC
PDF
"総務も!!"アジャイルプラクティス!
by
pupupopo88
PDF
Redmineチケットによるプロジェクト火消し戦略!
by
TrinityT _
PDF
運用業務でのRedmine
by
Tomohisa Kusukawa
やきうデータLT「ホームラン」 #pyconjp
by
Shinichi Nakagawa
PyLadies Tokyo #3: ゼロからはじめたPyData
by
Katayanagi Nobuko
Agile Baseball Science - アジャイル脳によく効く野球のハナシ
by
Shinichi Nakagawa
Python/Bottle for Kubo Semi 2014
by
Toshiki NOGUCHI
bottleで始めるWEBアプリの最初の一歩
by
Satoshi Yamada
Pyladies Tokyo meet up #6
by
Katayanagi Nobuko
あなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LT
by
Hiroaki Kudo
最近遊んだ Wii Uの 3つのソフトの感想
by
teapipin
これからの時代に! パソコン離れの中のパソコン選び
by
teapipin
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack
by
teapipin
XP lives, XP dies, XP lives again !!
by
Masanori Kado
アイドルソング制作の工程管理
by
Motokazu Sekine
Redmineによるwebサポート窓口の実装と運用
by
Go Maeda
「Redmineの運用パターン集~私に聞くな、チケットシステムに聞け」
by
akipii Oga
情報システム部門のタスク管理とIT全般統制 ~ Excel管理からの脱却 ~ (ITS Redmine #RxTstudy #5)
by
Kuniharu(州晴) AKAHANE(赤羽根)
Redmineによるメール対応管理の運用事例
by
Go Maeda
俺も!「老害」 公開版
by
ESM SEC
"総務も!!"アジャイルプラクティス!
by
pupupopo88
Redmineチケットによるプロジェクト火消し戦略!
by
TrinityT _
運用業務でのRedmine
by
Tomohisa Kusukawa
More from Shinichi Nakagawa
PDF
Baseball Play Study 2016冬〜Replacement!(ありがとう陽岱鋼!)
by
Shinichi Nakagawa
PDF
Py "Baseball" Data入門〜サービス(と野球)を支えるデータ分析基盤 #monotarotech
by
Shinichi Nakagawa
PDF
Py "Baseball" Data入門 - 広島東洋カープ編 #pyconhiro
by
Shinichi Nakagawa
PDF
XPな俺達に贈るPyCon JP 2016レポート #xpjug
by
Shinichi Nakagawa
PDF
たった数行のPythonコードで打者大谷翔平がどれだけ凄いのかを見てみる #ABPro
by
Shinichi Nakagawa
PDF
ビックデータとPythonではじめる野球の統計分析 #pyconjp
by
Shinichi Nakagawa
PDF
Big Data Baseball with Python - Ichiro Suzuki hacks! #kwsk01
by
Shinichi Nakagawa
PDF
ビックデータとPythonではじめる野球の統計分析(α)
by
Shinichi Nakagawa
PDF
Pythonistaデビュー #PyNyumon 2016/5/31
by
Shinichi Nakagawa
PDF
こんなゴールデン・グラブ賞は嫌だ~2015 #bpstudy 100回目記念LT
by
Shinichi Nakagawa
PDF
Agile Baseball Science - はじめてのセイバーメトリクス
by
Shinichi Nakagawa
PDF
はじめてのLean Canvas〜最初のアイディアを言語化してみよう #bpstudy
by
Shinichi Nakagawa
PDF
Python + Raspberry Piでスマートハウスを手作りする(計画) Python mini Hack-a-thon #49 成果発表 2014...
by
Shinichi Nakagawa
Baseball Play Study 2016冬〜Replacement!(ありがとう陽岱鋼!)
by
Shinichi Nakagawa
Py "Baseball" Data入門〜サービス(と野球)を支えるデータ分析基盤 #monotarotech
by
Shinichi Nakagawa
Py "Baseball" Data入門 - 広島東洋カープ編 #pyconhiro
by
Shinichi Nakagawa
XPな俺達に贈るPyCon JP 2016レポート #xpjug
by
Shinichi Nakagawa
たった数行のPythonコードで打者大谷翔平がどれだけ凄いのかを見てみる #ABPro
by
Shinichi Nakagawa
ビックデータとPythonではじめる野球の統計分析 #pyconjp
by
Shinichi Nakagawa
Big Data Baseball with Python - Ichiro Suzuki hacks! #kwsk01
by
Shinichi Nakagawa
ビックデータとPythonではじめる野球の統計分析(α)
by
Shinichi Nakagawa
Pythonistaデビュー #PyNyumon 2016/5/31
by
Shinichi Nakagawa
こんなゴールデン・グラブ賞は嫌だ~2015 #bpstudy 100回目記念LT
by
Shinichi Nakagawa
Agile Baseball Science - はじめてのセイバーメトリクス
by
Shinichi Nakagawa
はじめてのLean Canvas〜最初のアイディアを言語化してみよう #bpstudy
by
Shinichi Nakagawa
Python + Raspberry Piでスマートハウスを手作りする(計画) Python mini Hack-a-thon #49 成果発表 2014...
by
Shinichi Nakagawa
野球Hack!~Pythonを用いたデータ分析と可視化 #kwskrb #28 2015/9/30
1.
The Art Of Programming A
Baseball Game!!! 野球Hack!~Pythonを用いたデータ分析と可視化 Shinichi Nakagawa@shinyorke Kawasaki.rb #28 2015/9/30
2.
お前だれよ • Shinichi Nakagawa(36) •
Recruit Sumai Company, Ltd.(入社1年) • Web Application Engineer(メインはServer Side) • Agile/Python/Infrastructure as a codeが大好き • 北海道日本ハムファイターズ &オークランド・アスレチックスの大ファン • 中島卓也(日)、ソニー・グレイ(OAK)、ココ・クリスプ(OAK)推し • “野生の野球アナリスト”活動とかいう伝導活動
3.
“野生の野球アナリスト” 活動
4.
• PyCon JP
2014 Talk Session(去年のやつ) • MLBオープンデータ分析&可視化サービスをPythonで構築 • はてブ200超え、PV 14,000以上(slideshare)
5.
• PyCon JP
2014 Lightning Talk(去年のやつ) • Agileプロセス活用、アダム・ダン率の紹介 • アダム・ダン氏、Python界隈で一番有名なMLB選手に
6.
• XP祭り2015「俺も!!」登壇資料 • ITな仕事をしている人たちに伝えるセイバーメトリクス •
データ収集&レポートの仕組みをPython + Dockerで構築
7.
Other… • ブログで野球Hackの成果および考察を披露(不定期) • MLBオープンデータの紹介と活用例紹介 •
野球データの分析&解析用のライブラリを Githubで公開(ほぼPython製) • データドリブン野球解説 ※後ほど解説
8.
最終目標(40歳までに) • エンジニア×ビジネスマンとして、 日本プロ野球orMLBの仕事をやる! ※日本12球団+MLB30球団のオファー待ちw • 野球データとエンジニアの知見を活かし、 2020年東京五輪でメダル獲得のサポート ※選手じゃないですw、エンジニアとして、ね。
9.
本題
10.
Today’s Starting Member •
Pythonと野球 • MLBオープンデータ活用とPython • まとめ - これからの野球Hack
11.
Pythonと野球
12.
なぜ野球×Pythonなのか? • プロトタイピングが楽 • ライブラリ •
仮想環境
13.
プロトタイピングが楽 • 野球Hackは整形されたデータ(スコアブック)と、 整形されていないデータ(スコアブック以外のデー タ)の解釈と前処理がメイン →使いこなすまで、プロトタイピングが続く • 前処理・分析・可視化がオールインワンで出来る Pythonが楽でいい →Jupyter,
pandas, matplotlib, この3つでほぼイケる Python is 全部載せ
14.
ライブラリ • インフラ構築・管理 Ansible, docker-compose,
boto3, etc… • データ分析・可視化 Jupyter, pandas, matplotlib, etc… • Webアプリ構築 Django, Flask, bottle etc… Pythonはユーティリティープレイヤー( ー`дー´)キリッ
15.
仮想環境 • pyenvで実行環境切り替え OSのPythonに縛られない開発. Python3.4.3→3.5.0移行がすんなり行けた • virtualenvでパッケージ管理 アプリのプロジェクトと分析のプロジェクトで パッケージ管理を別々に扱う •
docker-compose(旧名fig)でServer丸ごとスクラップ&ビルド 実行環境をDockerで管理、大胆に「作る」→「壊す」を行う環境を実現 「作る」→「壊す」→「作る」→「壊す」(以下略)
16.
なんでや!Pythonじゃなくてもできるやろ!! ※ボールの判定に不服なバルフォアさん、ではありません 元画像:http://www.sbs.com.au/
17.
はい、Pythonじゃなくできます • インフラ管理・構成 部分的にVagrantを使用、ちなみにChefはやめた. • データ分析・可視化 得意な人はR・Juliaでいいと思う、野球HackをRでやってる方もいます. (他の言語は、、、どうなんだろう?) •
Webアプリ構築 APIやバッチならGolang, サイトならRuby On Rails他選択肢がたくさん有り • 仮想化 Rubyのrenv/rbenv-gemsetも素敵ですよね☆ 目的(と好み)に合わせて手段を柔軟に変えましょう
18.
好きな言語でHackしようぜ! ※キャプテン・ジーター、本当にお疲れ様でした 元画像:http://www.playbuzz.com/
19.
俺々開発ルール(やきう版) • スクラップアンドビルドしやすい環境で作る • 野球は仮説検証・技術リスクが高いネタが多い(特に前者) •
Sandbox環境で仮説・技術リスクを検証,いらないものは捨てる • シンプルに作る(疎結合・環境非依存) • 豊富なライブラリおよび仮想環境活用で実装と環境をシンプルに • 特にホストOSには依存しない作りにする(Macだけ、Linuxだけルールはナシ) • 繰り返し作業は自動化 • データベース作成、前処理まではある程度決まった作業なので自動化 Pythonが一番やりやすいってことです
20.
MLBオープンデータとPython
21.
元ネタ(過去ブログより) http://shinyorke.hatenablog.com/entry/ 2015/04/06/190243
22.
やりたかったこと • やきうゲーム「Fantasy Baseball」に勝つため、 選手の詳細な情報(打席、投球など)が欲しい •
「Retrosheet」というデータにそれらが詰めら れてるらしい • よし!Retrosheetデータベースを作ろうじゃな いか!
23.
Retrosheet is 何? •
メジャーリーグのスコアデータ集 • 1887~2014(昨シーズン)までのデータをCSVで配布 ※ 1989以前は欠損有り • スコアブックで得られる情報(得点、失点、スタメン、打席 結果etc…)と選手情報(名前、ポジションなど)がひと目 でわかる • http://retrosheet.org/
24.
やったこと • Vagrant +
AnsibleでMySQL Server構築 • SQLAlchemy + py-retrosheetでmigration • Jupyter(IPython notebook)とpandasで分析 • matplotlibで可視化
25.
構成 Simple is Best?
26.
構成 Simple is Best!!! (自動化頑張りました)
27.
サーバー構築とmigration $ vagrant up $
ansible-playbook -i hosts retrosheet_server.yml この2行でサーバーを作れるようにしました! ※VagrantとAnsibleを導入している前提です
28.
PY-RETROSHEET - やきうScript •
Retrosheet専用Download&migration script git@github.com:wellsoliver/py-retrosheet.git • データ取得からDB(MySQLなど)へのmigrationを一気通貫に行う • 細々と開発が続いてる(っぽい)
29.
Jupyter+pandas+matplotlib • 平たく言えば、「ブラウザ上で使えるPythonその他のSandbox環境」 • データやLibraryが不確実(
使いこなせていない)時の試し打ちとして最高すぎる環境 • pip install コマンドでちょいちょいとインストールしたらアッサリ環境が出来ます
30.
分析と可視化 • Hideki Matsui(#55)の全盛期と黄昏時 •
Jon Lester(Cubs)は何月に多く勝つのか? Hideki Matsui Jon Lester
31.
松井(2004) VS 松井(2011) •
外野に飛んだヒットを分類&可視化 • 2004・2011共にセンター~ライトへの打球が多い(センター返しor引っ張り) • 2011年、本塁打と三塁打が恐ろしく少ないあっ(察し 2004(ヤンキース) 2011(アスレチックス)
32.
ジョン・レスター(月別勝利) • 何故か5月に無双してる&いい年は9月に強い • オールスター(7月)前後は微妙に勝てない
33.
コードは後日公開!!!
34.
まとめ シモンズの守備ってまとめに相応しいよね 元画像: http://a.espncdn.com/photo/2013/1028/mlb_nl-gloves_06.jpg
35.
Python + Baseball •
「野球Hackで迷ったらPython!」 • とはいえ、目的や好みに合わせて言語やFWを選ぶの 大切! →効率化&自分の武器が増えるという意味で • 好きなデータを好きな言語でHackすると楽しいよ (^O^) ※2年連続2回目
36.
好きな言語でHackしようぜ! ※キャプテン・ジーター使い回し 元画像:http://www.playbuzz.com/
37.
これからの野球Hack(1年後) • 「データドリブン野球解説」を通じて新しい野球とスポーツの可能性を説いて生きたい!! • “これが、新しい野球.
既存の野球を軽く飛び越え,私たちは新しいスポーツの楽しみを知る” • 質が高い解説をするための情報収集&分析と基盤の整備
38.
これからの野球Hack(2年後) • 「データで知る野球・スポーツ」が「アタリマエ」になる世界へ!!! • 2年後そして5年後の「スポーツ・野球のアタリマエ」を作る自分でありたい!!!
39.
Possibilities of Python
40.
“”” わたしの関心事は、野球だけ。 いったいなぜだろう? それは、ほかの分野の数字と違っ て、野球のデータには言葉と同 じ力があるからだ。 “”” - ビル・ジェームズ(セイバーメトリクスの父) 書籍「マネー・ボール」第四章より
41.
Possibilities of SABRmetrics
42.
ゲームセット!!! ご清聴ありがとうございました. Shinichi Nakagawa(Twitter/Facebook/hatena:@shinyorke)
Download