野球Hack!
Pythonを用いた
データ分析と可視化
PyCon JP 2015
我われはなぜここにいるのか
• Infrastrucure as codeとPyDataを学ぶ

(発表を通じてフィードバックを貰う)
• Python界隈の野球クラスタを増やす
• 10/11の発表を楽しむ!!!
Pythonと野球で仕事をやるための
試金石なんだぞ!!!
エレベーターピッチ
• 野球の「なぜ」や「俺の好み」を可視化 したい
• 野球ファン、特にITエンジニア向けの、
• Hatteberg というプロダクトは、
• 野球データを自らの手で収集・分析するサービス です。
• これは 野球の「なぜ」「好み」を客観的に分析・可視化 ができ、
• ネットやTVやラジオや新聞とは違って、
• 自分自身で創造的に野球を可視化する機能が備わっている。
パッケージデザイン
Hatteberg
あなたの野球解説者
TV・新聞に無い視点での分析
興味あるデータを自動的に収集
分析・可視化をカスタマイズ
やらないことリスト
やる やらない
データベース作成の自動化 実サービスの構築と運用
分析サーバーの構築 守備系指標の分析・可視化
打撃・投球系指標の分析・可視化 Vagrant/Chef
Docker/Ansibleの導入 Docker系のクラウドサービス
デモを見せる オリジナルの指標作成
あとで决める
クラウドサービス(AWS EC2/S3、Circle CI)
Web Application構築(Django or bottle)
採用する技術:
* Python3.5.0
* IPython notebook/pandas/matplotlib
* Docker/Ansible/Docker compose
* MySQL5.7
* AWS Elastic Beanstalk/ECS
技術的な解決策の概要
Web App
(Django)
IPython
notebook
MLB
Opendata
NPB
data
Macbook Pro内に構築
俺
※5.6でもOK(5.7は努力目標)
※サービス公開はしない
夜も眠れなくなるような問題は何だろう?
• デモが動かない
• Docker composeが使えない
• アダム・ダン率以外のネタがない
俺たちの Aチーム
人数 役割 強みや期待すること
1 ワイ ・プログラミング! - Python大好き
・データ分析!! - 野球はもっと好き
・インフラ自動化!!! - 来年には楽してプログラミング&分析
トレードオフ・スライダー
典型的なフォース
機能をぜんぶ える(スコープ)
予算内に収める(予算)
期日を死守する(時間)
高い品質、少ない欠陥(品質)
MAX MIN
MAX MIN
MAX MIN
MAX MIN
上記以外で重要なこと
簡単に使える
考えさせない!
詳細な証跡(なんでもログを取る)
いつまでも変わらぬ野球愛
MAX MIN
MAX MIN
MAX MIN
MAX MIN
初回のリリースに必要なもの
1名、7人日(週末)
PyCon!
(10/11)
構築 壁打ち 微調整
5人日 9/30 kwsk.rb 2人日

【Inception-Deck】野球Hack! - Pythonを用いたデータ分析と可視化