Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
https://www.pai-hr.com/
2016年12月23日
株式会社Predictor AI
今村友彦
PAI競馬予測が1番人気に挑む!
PAI競馬予測「中長期の目標」
『2020年までに、データサイエンスとインチュイション
(直感)を活用して、1番人気(集合知)の的中率を超す』
Copyright(c) 2016 Predictor AI, Inc.
2
1番人気の的中率を超え...
本発表の狙い
Copyright(c) 2016 Predictor AI, Inc.
3
①どんな仕組み?
②当たるのか?
③儲かるのか?
④直感をどう使うの?
⑤どこで手に入るの?
PAI競馬予測『データサイエンス
×インチュイション(直感...
本発表の流れ
• 会社概要と自己紹介
• PAI競馬予測のアプローチと仕組み、実験環境
• 単勝の的中率と回収率
• PAIレーダー式チャートで有馬記念を直感予想
• まとめ
Copyright(c) 2016 Predictor AI, In...
• 会社名:株式会社Predictor AI
• Web:http://www.predictor-ai.com/
• 設立:2016年3月14日
(2012年10月 個人事業主として小さなアパートの一室から屋号Predictor AIが始まっ...
自己紹介
Copyright(c) 2016 Predictor AI, Inc.
6
• 氏名:今村友彦(twitter:@konsonsan)
• 出身地:名古屋市
• 在住:川崎市
• 最初に所有したPC:MZ-700(CPU:Z-80 ...
PAI競馬予測のアプローチ
Copyright(c) 2016 Predictor AI, Inc.
7
左脳(論理的) 右脳(直感的)
コンピュータ予測 人の直感
コンピュータ予測(順位予測、確信度)の至らぬ部分は、「人の直感をAIに置
き換...
PAI競馬予測システムの構想(将来イメージ)
Copyright(c) 2016 Predictor AI, Inc.
8
PAI予測エンジン群
予測
エンジン1
PAI可視化チャート群
左脳:データサイエンス 右脳:インチュイション(直感)
...
PAI競馬予測システムの構想(現状)
Copyright(c) 2016 Predictor AI, Inc.
9
PAI予測エンジン群
PA予測
エンジン
(独自方式)
PAI可視化チャート群
左脳:データサイエンス 右脳:インチュイション(...
PAI競馬予測システムの構想(現状)
Copyright(c) 2016 Predictor AI, Inc.
10
PAI予測エンジン群
PA予測
エンジン
(独自方式)
PAI可視化チャート群
左脳:データサイエンス 右脳:インチュイション...
PI予測エンジンのシステム構成
Copyright(c) 2016 Predictor AI, Inc.
11
元データ
説明変数
説明変数
説明変数
目的変数
(学習時)
予測器
予測結果
上位着順:’1’
それ以外:’0’
32個生成
(9...
データ条件
• 学習データ
• 期間:過去3年間
• 説明変数:馬の勝率、 騎手の勝率、走破タイム、上り3Fタイム、
距離、レース間隔など(計9個)
• 目的変数:上位着順「1」、それ以外「0」
• テストデータ
• 期間:2016年1月~12...
予測モデルの条件
Copyright(c) 2016 Predictor AI, Inc.
13
• 予測器:ロジスティック回帰
• モデル分割
• レース条件で約15個のモデルに分割
• 評価方法:単勝の的中率と回収率
予測器1
予測器2
・...
結果(単勝:的中率)
Copyright(c) 2016 Predictor AI, Inc.
14
月ごとの平均では1番人気と相関が見られるものの
通年で8.4%差
PI予測
平均的中率:22.2%
1番人気
平均的中率:30.6%<
1 2...
結果(単勝:回収率)
Copyright(c) 2016 Predictor AI, Inc.
15
PI予測
平均回収率:76.5%
1番人気
平均回収率:83.9%<
月ごとの平均では1番人気と相関は見られるが通年で7.4%差
11月はPI...
結果(PI予測と1番人気:1着のベン図)
Copyright(c) 2016 Predictor AI, Inc.
16
44 4319
178
PI予測
的中率:22.2%
1番人気
的中率:30.6%
(n=284レース)
1番人気が的中し...
結果(的中オッズの分布)
Copyright(c) 2016 Predictor AI, Inc.
17
1番人気よりもPI予測は的中オッズの分散が大きく、中には単勝高配当も含まれる
高配当
1 2 3 4 5
よくある質問
結果(単勝:高配当の例)
Copyright(c) 2016 Predictor AI, Inc.
18
• 2016年7月31日(日)札幌11R
マコトブリジャール( 9番人気20.2倍)
• 2016年11月13日(日)東京11R
ナックビ...
PAI競馬予測システムの構想(現状)
Copyright(c) 2016 Predictor AI, Inc.
19
PAI予測エンジン群
PA予測
エンジン
(独自方式)
PAI可視化チャート群
左脳:データサイエンス 右脳:インチュイション...
可視化(PAIレーダー式チャート)
Copyright(c) 2016 Predictor AI, Inc.
20
PI予測で至らない点を『直感』で補う支援ツールを考案
・各馬の戦績を直感的に判断できるよう可視化
・レースクラスごとに着順をプロ...
可視化(PAIレーダー式チャート例)
Copyright(c) 2016 Predictor AI, Inc.
21
9 7 5 3 1 1 3 5 7 9
GI
86%
GII
100%
GIII
--%
オープン特別
--%
1600万下
...
PAI競馬予測情報の購入方法
Copyright(c) 2016 Predictor AI, Inc.
22
・eプリントサービスで購入可能
全国コンビニ(ローソン、ファミリーマート、サークルK、サンクス)の複合機
・弊社Webサイト(ビットキ...
(補足)PA、PI、PAI予測のバックテスト
Copyright(c) 2016 Predictor AI, Inc.
23
PAI予測(対象レースの絞込みあり)は、4年間の平均的中率と回収率で1番人気を超えた
1 2 3 4 5
よくある質問
まとめ
『2020年までに、AI技術などデータサイエンスを活用して1番人気
(集合知)の的中率を超える』ことを目指して挑み続けます!
Copyright(c) 2016 Predictor AI, Inc.
24
PAI競馬予測:よくある質問
...
(補足1)参考書籍|文献
Copyright(c) 2016 Predictor AI, Inc.
25
• EFFICIENCY OF RACETRACK BETTING MARKETS 2008 Edition:William T Ziem...
(補足2)1番人気とデータ数
Copyright(c) 2016 Predictor AI, Inc.
26
年
全レース
レース 的中率 回収率
2013 3,324 31.9% 78.2%
2014 3,326 32.3% 79.2%
20...
Upcoming SlideShare
Loading in …5
×

ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』

3,133 views

Published on

PAI競馬予測『データサイエンス×インチュイション(直感)』について、勉強会イベントでご紹介しました。

Published in: Data & Analytics

ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』

  1. 1. https://www.pai-hr.com/ 2016年12月23日 株式会社Predictor AI 今村友彦 PAI競馬予測が1番人気に挑む!
  2. 2. PAI競馬予測「中長期の目標」 『2020年までに、データサイエンスとインチュイション (直感)を活用して、1番人気(集合知)の的中率を超す』 Copyright(c) 2016 Predictor AI, Inc. 2 1番人気の的中率を超えることは難題かもしれないが・・・
  3. 3. 本発表の狙い Copyright(c) 2016 Predictor AI, Inc. 3 ①どんな仕組み? ②当たるのか? ③儲かるのか? ④直感をどう使うの? ⑤どこで手に入るの? PAI競馬予測『データサイエンス ×インチュイション(直感)』 の取組みをご紹介 PAI競馬予測:よくある質問 よくあるご質問に対して事例とともにお答えします 1 2 3 4 5 よくある質問
  4. 4. 本発表の流れ • 会社概要と自己紹介 • PAI競馬予測のアプローチと仕組み、実験環境 • 単勝の的中率と回収率 • PAIレーダー式チャートで有馬記念を直感予想 • まとめ Copyright(c) 2016 Predictor AI, Inc. 41 2 3 4 5 よくある質問
  5. 5. • 会社名:株式会社Predictor AI • Web:http://www.predictor-ai.com/ • 設立:2016年3月14日 (2012年10月 個人事業主として小さなアパートの一室から屋号Predictor AIが始まった) • 代表取締役:今村友彦 • 事業内容 • ①企業団体内データ分析サービス • 通販系:購買データの分析とシステム化(決定木、t検定、クラマーV係数、線形計画法) • 出版系:テキストマイニング(形態素解析、t検定) • 医療系:レセプトデータの分析(集計、t検定) • 通信系:購買データの分析(重回帰、生存時間分析) • セキュリティ系:大規模統合ログ分析システム(NoSQL、Splunk要件定義・設計・構築) • その他:WebフレームワークDjango(Python系)を用いたシステム構築 など計13件 • ②B2B、B2C向けサービス • 第一弾:PAI競馬予測サービス • 第二弾:(仮)ニューラルネットを用いた画像認識サービス(開発中) 会社紹介 5 データサイエンス&インチュイション(直感)の活用でデータから未来を見つめる 多様な業務ドメインの迅速なデータ分析とそこで得られた知見を活用するためのシステム開発が得意 Copyright(c) 2016 Predictor AI, Inc. 1 2 3 4 5 よくある質問
  6. 6. 自己紹介 Copyright(c) 2016 Predictor AI, Inc. 6 • 氏名:今村友彦(twitter:@konsonsan) • 出身地:名古屋市 • 在住:川崎市 • 最初に所有したPC:MZ-700(CPU:Z-80 3.5MHz・8bit、メモリ:64KB) • 趣味:ミュージアム・名所史跡巡り、ピクニック、釣り(船舶免許1級)、B.LEAGUE観戦 • 学生時代:中部大学工学部電子工学科博士前期課程修了 • ニューラルネットの第2次ブーム到来 • 電子情報通信学会論文誌「ニューラルネットワークによるナンバープレートの位置検出」 http://ci.nii.ac.jp/naid/110003228671 • 就職時代:就職とともに上京。大手SIer会社(10年間)、マザーズ上場の認証ソリューション 会社(6年間) • 独立起業時代:ビッグデータやAIブームを追い風に独立起業(現在5年目に突入) 大小様々な規模(5,000名>60名>1名)、様々なフェーズの会社で多様な業務を経験。 IT関連事業の現場から経営領域までを自らの頭と身体で理解することを心掛け、フルスタック型 のデータサイエンティストを目指す もしも勝馬が レース前に 分かったら… 1 2 3 4 5 よくある質問
  7. 7. PAI競馬予測のアプローチ Copyright(c) 2016 Predictor AI, Inc. 7 左脳(論理的) 右脳(直感的) コンピュータ予測 人の直感 コンピュータ予測(順位予測、確信度)の至らぬ部分は、「人の直感をAIに置 き換える」ことにより的中率を高める2段構えのアプローチ 買い目(確信度、オッズ、期待値):次フェーズ以降 統合処理(「人の直感」をAIに置き換える:次フェーズ以降) 1 2 3 4 5 よくある質問
  8. 8. PAI競馬予測システムの構想(将来イメージ) Copyright(c) 2016 Predictor AI, Inc. 8 PAI予測エンジン群 予測 エンジン1 PAI可視化チャート群 左脳:データサイエンス 右脳:インチュイション(直感) 可視化 チャート1予測 エンジン1予測 エンジンMj 可視化 チャート1可視化 チャートVk ロジスティック回帰 正則化ロジスティック回帰 サポートベクターマシン ニューラルネット ランダムフォレスト BTモデル 独自方式など レーダー式チャート 散布図 時系列グラフ ヒートマップなど 説明変数Xn 説明変数Xn 説明変数Xi 買い目(確信度、オッズ、期待値):次フェーズ以降 統合処理(「人の直感」をAIに置き換える:次フェーズ以降)
  9. 9. PAI競馬予測システムの構想(現状) Copyright(c) 2016 Predictor AI, Inc. 9 PAI予測エンジン群 PA予測 エンジン (独自方式) PAI可視化チャート群 左脳:データサイエンス 右脳:インチュイション(直感) PAIレーダ式 チャート PI予測 エンジン (ロジスティック 回帰) 説明変数Xn 説明変数Xn 説明変数32 説明変数32種、PAI予測エンジン2種、およびPAI可視化チャート1種を実装
  10. 10. PAI競馬予測システムの構想(現状) Copyright(c) 2016 Predictor AI, Inc. 10 PAI予測エンジン群 PA予測 エンジン (独自方式) PAI可視化チャート群 左脳:データサイエンス 右脳:インチュイション(直感) PI予測 エンジン (ロジスティック 回帰) 説明変数Xn 説明変数Xn 説明変数32 PAIレーダ式 チャート 以降でPI予測エンジンとPAIレーダー式チャートについて説明
  11. 11. PI予測エンジンのシステム構成 Copyright(c) 2016 Predictor AI, Inc. 11 元データ 説明変数 説明変数 説明変数 目的変数 (学習時) 予測器 予測結果 上位着順:’1’ それ以外:’0’ 32個生成 (9個を使用) ロジスティック回帰
  12. 12. データ条件 • 学習データ • 期間:過去3年間 • 説明変数:馬の勝率、 騎手の勝率、走破タイム、上り3Fタイム、 距離、レース間隔など(計9個) • 目的変数:上位着順「1」、それ以外「0」 • テストデータ • 期間:2016年1月~12月22日 • 対象:メイン11Rと重賞 • レース数:計284レース 12 Copyright(c) 2016 Predictor AI, Inc. 区分 新馬 未勝利 500 万下 1000 万下 1600 万下 OPEN 重賞 計 - GIII GII GI 全体 285 1,118 1,038 413 174 113 1 69 34 21 3,257 テスト 0 0 1 34 57 67 1 69 34 21 284 テストデータは「11R+重賞レース」とするため、全レース数の8.7%(284/3,257レース) テストデータ数 1 2 3 4 5 よくある質問
  13. 13. 予測モデルの条件 Copyright(c) 2016 Predictor AI, Inc. 13 • 予測器:ロジスティック回帰 • モデル分割 • レース条件で約15個のモデルに分割 • 評価方法:単勝の的中率と回収率 予測器1 予測器2 ・・・ 予測器15 1 2 3 4 5 よくある質問
  14. 14. 結果(単勝:的中率) Copyright(c) 2016 Predictor AI, Inc. 14 月ごとの平均では1番人気と相関が見られるものの 通年で8.4%差 PI予測 平均的中率:22.2% 1番人気 平均的中率:30.6%< 1 2 3 4 5 よくある質問
  15. 15. 結果(単勝:回収率) Copyright(c) 2016 Predictor AI, Inc. 15 PI予測 平均回収率:76.5% 1番人気 平均回収率:83.9%< 月ごとの平均では1番人気と相関は見られるが通年で7.4%差 11月はPI予測が150%を超えた 1 2 3 4 5 よくある質問
  16. 16. 結果(PI予測と1番人気:1着のベン図) Copyright(c) 2016 Predictor AI, Inc. 16 44 4319 178 PI予測 的中率:22.2% 1番人気 的中率:30.6% (n=284レース) 1番人気が的中した87レース中の約半分(44レース)はPI予測と共通でありオッズは低い
  17. 17. 結果(的中オッズの分布) Copyright(c) 2016 Predictor AI, Inc. 17 1番人気よりもPI予測は的中オッズの分散が大きく、中には単勝高配当も含まれる 高配当 1 2 3 4 5 よくある質問
  18. 18. 結果(単勝:高配当の例) Copyright(c) 2016 Predictor AI, Inc. 18 • 2016年7月31日(日)札幌11R マコトブリジャール( 9番人気20.2倍) • 2016年11月13日(日)東京11R ナックビーナス(7番人気15.2倍) 1 2 3 4 5 よくある質問
  19. 19. PAI競馬予測システムの構想(現状) Copyright(c) 2016 Predictor AI, Inc. 19 PAI予測エンジン群 PA予測 エンジン (独自方式) PAI可視化チャート群 左脳:データサイエンス 右脳:インチュイション(直感) PI予測 エンジン (ロジスティック 回帰) 説明変数Xn 説明変数Xn 説明変数32 PAIレーダ式 チャート 以降でPAIレーダー式チャートについて説明 1 2 3 4 5 よくある質問
  20. 20. 可視化(PAIレーダー式チャート) Copyright(c) 2016 Predictor AI, Inc. 20 PI予測で至らない点を『直感』で補う支援ツールを考案 ・各馬の戦績を直感的に判断できるよう可視化 ・レースクラスごとに着順をプロット ・中心付近に印が多いほど強い馬 9 7 5 3 1 1 3 5 7 9 GI 67% GII 50% GIII 100% オープン特別 0% 1600万下 100% 1000万下 80% 500万下 100% 新・未勝利 100% マリアライト 年月日 レースクラス 着順 16/11/13 GI (未定) 16/09/25 GII 5 16/06/26 GI 1 16/05/29 GII 2 16/03/26 GII 3 15/12/27 GI 4 15/11/15 GI 1 15/09/27 GII 5 15/06/14 GIII 2 15/05/09 1600万下 1 15/03/08 1000万下 1 15/02/14 1000万下 3 14/11/16 1000万下 5 14/10/11 1000万下 3 14/08/03 1000万下 3 14/06/29 500万下 1 14/05/04 OPEN 6 14/03/02 500万下 3 14/01/11 新馬 1 <凡例> ●:本日~1年前 ▲:1~2年前 □:2年前~ (赤色:前走) 1 2 3 4 5 よくある質問
  21. 21. 可視化(PAIレーダー式チャート例) Copyright(c) 2016 Predictor AI, Inc. 21 9 7 5 3 1 1 3 5 7 9 GI 86% GII 100% GIII --% オープン特別 --% 1600万下 --% 1000万下 --% 500万下 100% 新・未勝利 100% キタサンブラック 9 7 5 3 1 1 3 5 7 9 GI 50% GII 75% GIII --% オープン特別 --% 1600万下 100% 1000万下 100% 500万下 100% 新・未勝利 33% ゴールドアクター 9 7 5 3 1 1 3 5 7 9 GI 43% GII 67% GIII --% オープン特別 100% 1600万下 --% 1000万下 --% 500万下 100% 新・未勝利 50% サウンズオブアース 9 7 5 3 1 1 3 5 7 9 GI 100% GII 100% GIII 100% オープン特別 --% 1600万下 --% 1000万下 --% 500万下 100% 新・未勝利 100% サトノダイヤモンド 9 7 5 3 1 1 3 5 7 9 GI 67% GII 75% GIII 50% オープン特別 --% 1600万下 100% 1000万下 100% 500万下 100% 新・未勝利 100% シュヴァルグラン 9 7 5 3 1 1 3 5 7 9 GI 50% GII 50% GIII 100% オープン特別 0% 1600万下 100% 1000万下 80% 500万下 100% 新・未勝利 100% マリアライト 直感的に見て『中心付近に黒い点が最も集まっている馬』が1着にくる可能性が高い 1 2 3 4 5 よくある質問
  22. 22. PAI競馬予測情報の購入方法 Copyright(c) 2016 Predictor AI, Inc. 22 ・eプリントサービスで購入可能 全国コンビニ(ローソン、ファミリーマート、サークルK、サンクス)の複合機 ・弊社Webサイト(ビットキャッシュ決済) https://www.pai-hr.com/ 無料情報(単勝のみ)、有料情報(複勝情報) ※会員登録が必要 2016年 単勝予測(実績) 予測エンジン 的中率 回収率 PA (購入284レース) 26.8% 98.6% PI (購入284レース) 22.2% 76.5% PAI (購入104レース) 33.7% 91.3% 独自開発したアルゴリズムで予測 回帰モデルで予測 ← 本資料でご紹介 2つ(PAとPI)の予測エンジンが同じ馬を 本命にしたとき:超本命 PAI 1 2 3 4 5 よくある質問
  23. 23. (補足)PA、PI、PAI予測のバックテスト Copyright(c) 2016 Predictor AI, Inc. 23 PAI予測(対象レースの絞込みあり)は、4年間の平均的中率と回収率で1番人気を超えた 1 2 3 4 5 よくある質問
  24. 24. まとめ 『2020年までに、AI技術などデータサイエンスを活用して1番人気 (集合知)の的中率を超える』ことを目指して挑み続けます! Copyright(c) 2016 Predictor AI, Inc. 24 PAI競馬予測:よくある質問 コンビニの複合機、又は弊社Webサイト 1 2 3 4 5 よくある質問 ⑤どこで手に入るの? ①どんな仕組み? PIエンジン:ロジスティック回帰モデル ②当たるのか? 的中率(PI vs 1番人気):22.2% vs 30.6% ※但し、PAI予測(PAエンジンとの組合せ)→33.7% ③儲かるのか? 回収率(PI vs 1番人気):76.5% vs 83.9% ※20倍超の高配当も含む ※但し、PAI予測(PAエンジンとの組合せ)→91.3% ④直感をどう使うの? PAIレーダー式チャート:直感的に判断
  25. 25. (補足1)参考書籍|文献 Copyright(c) 2016 Predictor AI, Inc. 25 • EFFICIENCY OF RACETRACK BETTING MARKETS 2008 Edition:William T Ziemba/World Scientific • 競馬予想とは何か(競馬ファンの集団知と機械学習による予想の間に横たわるもの ):守真太郎、 久門正人著/JWEIN10 • ANDREW BEYER'S PICKING WINNERS 勝馬を探せ!:アンドリュー・ベイヤー著/メタモル出版 • 革命理論 西田式スピード指数:西田和彦著/KKベストセラーズ • 勝馬がわかる競馬の教科書:鈴木和幸著/池田書店 • BLUE BACKS 競争馬の科学:JRA競走馬総合研究所編/講談社 • 騎手の一分:藤田信二著/講談社現代新書 • 一番人気取捨の極意:奥野憲一著/白夜書房競馬王新書 • BLUE BACKS 確率・統計であばくギャンブルのからくり:谷岡一郎著/講談社 • なぜ競馬学校には「茶道教室」があるのか:原千代江著/小学館 • 勝負師の極意:武豊著/双葉社 • 馬券裁判:卍著/メタモル出版 • 天才数学者はこう賭ける:ウィリアム・パウンドストーン著/青土社 • 直感力:羽生善治著/PHP新書
  26. 26. (補足2)1番人気とデータ数 Copyright(c) 2016 Predictor AI, Inc. 26 年 全レース レース 的中率 回収率 2013 3,324 31.9% 78.2% 2014 3,326 32.3% 79.2% 2015 3,326 30.4% 76.5% 2016 3,257 32.9% 78.6% 「全レース」と「メイン11Rと重賞」の的中率と回収率 年 メイン11R+重賞 レース 的中率 回収率 2013 290 27.2% 72.8% 2014 291 31.3% 84.4% 2015 292 20.5% 57.8% 2016 284 30.6% 83.9% 全レースの的中率:約32%、回収率:約78%となるが、 「メイン11R+重賞」に絞込むと変動はやや大きい 0% 25% 50% 75% 100% 2013 2014 2015 2016 的中率 回収率 0% 25% 50% 75% 100% 2013 2014 2015 2016 的中率 回収率

×