SlideShare a Scribd company logo

ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』

P
predictori

PAI競馬予測『データサイエンス×インチュイション(直感)』について、勉強会イベントでご紹介しました。

1 of 26
Download to read offline
https://www.pai-hr.com/
2016年12月23日
株式会社Predictor AI
今村友彦
PAI競馬予測が1番人気に挑む!
PAI競馬予測「中長期の目標」
『2020年までに、データサイエンスとインチュイション
(直感)を活用して、1番人気(集合知)の的中率を超す』
Copyright(c) 2016 Predictor AI, Inc.
2
1番人気の的中率を超えることは難題かもしれないが・・・
本発表の狙い
Copyright(c) 2016 Predictor AI, Inc.
3
①どんな仕組み?
②当たるのか?
③儲かるのか?
④直感をどう使うの?
⑤どこで手に入るの?
PAI競馬予測『データサイエンス
×インチュイション(直感)』
の取組みをご紹介
PAI競馬予測:よくある質問
よくあるご質問に対して事例とともにお答えします
1 2 3 4 5
よくある質問
本発表の流れ
• 会社概要と自己紹介
• PAI競馬予測のアプローチと仕組み、実験環境
• 単勝の的中率と回収率
• PAIレーダー式チャートで有馬記念を直感予想
• まとめ
Copyright(c) 2016 Predictor AI, Inc.
41 2 3 4 5
よくある質問
• 会社名:株式会社Predictor AI
• Web:http://www.predictor-ai.com/
• 設立:2016年3月14日
(2012年10月 個人事業主として小さなアパートの一室から屋号Predictor AIが始まった)
• 代表取締役:今村友彦
• 事業内容
• ①企業団体内データ分析サービス
• 通販系:購買データの分析とシステム化(決定木、t検定、クラマーV係数、線形計画法)
• 出版系:テキストマイニング(形態素解析、t検定)
• 医療系:レセプトデータの分析(集計、t検定)
• 通信系:購買データの分析(重回帰、生存時間分析)
• セキュリティ系:大規模統合ログ分析システム(NoSQL、Splunk要件定義・設計・構築)
• その他:WebフレームワークDjango(Python系)を用いたシステム構築
など計13件
• ②B2B、B2C向けサービス
• 第一弾:PAI競馬予測サービス
• 第二弾:(仮)ニューラルネットを用いた画像認識サービス(開発中)
会社紹介 5
データサイエンス&インチュイション(直感)の活用でデータから未来を見つめる
多様な業務ドメインの迅速なデータ分析とそこで得られた知見を活用するためのシステム開発が得意
Copyright(c) 2016 Predictor AI, Inc.
1 2 3 4 5
よくある質問
自己紹介
Copyright(c) 2016 Predictor AI, Inc.
6
• 氏名:今村友彦(twitter:@konsonsan)
• 出身地:名古屋市
• 在住:川崎市
• 最初に所有したPC:MZ-700(CPU:Z-80 3.5MHz・8bit、メモリ:64KB)
• 趣味:ミュージアム・名所史跡巡り、ピクニック、釣り(船舶免許1級)、B.LEAGUE観戦
• 学生時代:中部大学工学部電子工学科博士前期課程修了
• ニューラルネットの第2次ブーム到来
• 電子情報通信学会論文誌「ニューラルネットワークによるナンバープレートの位置検出」
http://ci.nii.ac.jp/naid/110003228671
• 就職時代:就職とともに上京。大手SIer会社(10年間)、マザーズ上場の認証ソリューション
会社(6年間)
• 独立起業時代:ビッグデータやAIブームを追い風に独立起業(現在5年目に突入)
大小様々な規模(5,000名>60名>1名)、様々なフェーズの会社で多様な業務を経験。
IT関連事業の現場から経営領域までを自らの頭と身体で理解することを心掛け、フルスタック型
のデータサイエンティストを目指す
もしも勝馬が
レース前に
分かったら…
1 2 3 4 5
よくある質問

Recommended

ビズリーチの機械学習基盤
ビズリーチの機械学習基盤ビズリーチの機械学習基盤
ビズリーチの機械学習基盤Naoto Migita
 
WSL2+docker+JupyterとVS Codeリモート環境の構築
WSL2+docker+JupyterとVS Codeリモート環境の構築WSL2+docker+JupyterとVS Codeリモート環境の構築
WSL2+docker+JupyterとVS Codeリモート環境の構築Saito5656
 
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話cyberagent
 
地理院地図を手軽に使える オープンソースソフトウェア (FOSS4G) のご紹介
地理院地図を手軽に使えるオープンソースソフトウェア (FOSS4G)のご紹介地理院地図を手軽に使えるオープンソースソフトウェア (FOSS4G)のご紹介
地理院地図を手軽に使える オープンソースソフトウェア (FOSS4G) のご紹介IWASAKI NOBUSUKE
 
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所Recruit Technologies
 
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイントリクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイントRecruit Technologies
 
eiicon company/採用ピッチ資料
eiicon company/採用ピッチ資料eiicon company/採用ピッチ資料
eiicon company/採用ピッチ資料ATARU TOMITA
 

More Related Content

What's hot

SlideShareの使い方 登録編
SlideShareの使い方 登録編SlideShareの使い方 登録編
SlideShareの使い方 登録編itno
 
KJ法のW型問題解決モデルとU理論、それぞれの問題意識 加筆版
KJ法のW型問題解決モデルとU理論、それぞれの問題意識 加筆版KJ法のW型問題解決モデルとU理論、それぞれの問題意識 加筆版
KJ法のW型問題解決モデルとU理論、それぞれの問題意識 加筆版nishio
 
Quick Guide to ISO/IEC 27701 - The Newest Privacy Information Standard
Quick Guide to ISO/IEC 27701 - The Newest Privacy Information StandardQuick Guide to ISO/IEC 27701 - The Newest Privacy Information Standard
Quick Guide to ISO/IEC 27701 - The Newest Privacy Information StandardPECB
 
アジャイル開発やってみた
アジャイル開発やってみたアジャイル開発やってみた
アジャイル開発やってみたArata Fujimura
 
Splunk機械学習を使ったアンケートコメント分析
Splunk機械学習を使ったアンケートコメント分析Splunk機械学習を使ったアンケートコメント分析
Splunk機械学習を使ったアンケートコメント分析Maruyama Junichi
 
KKBOX BeatMatch Sales Kit
KKBOX BeatMatch Sales KitKKBOX BeatMatch Sales Kit
KKBOX BeatMatch Sales KitNorika
 
DXの推進において企業内に求められる人材やデジタル人材の育て方
DXの推進において企業内に求められる人材やデジタル人材の育て方DXの推進において企業内に求められる人材やデジタル人材の育て方
DXの推進において企業内に求められる人材やデジタル人材の育て方Hironori Washizaki
 
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計Hironori Washizaki
 
失敗から学ぶ データ分析グループの チームマネジメント変遷
失敗から学ぶデータ分析グループのチームマネジメント変遷失敗から学ぶデータ分析グループのチームマネジメント変遷
失敗から学ぶ データ分析グループの チームマネジメント変遷Tokoroten Nakayama
 
Visual StudioやAzureからAzure DevOpsを使う
Visual StudioやAzureからAzure DevOpsを使うVisual StudioやAzureからAzure DevOpsを使う
Visual StudioやAzureからAzure DevOpsを使うTakeshi Fukuhara
 
AbemaTVにおける推薦システム
AbemaTVにおける推薦システムAbemaTVにおける推薦システム
AbemaTVにおける推薦システムcyberagent
 
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...joisino
 
IT業界におけるコミュニティ活動の大切さ
IT業界におけるコミュニティ活動の大切さIT業界におけるコミュニティ活動の大切さ
IT業界におけるコミュニティ活動の大切さ法林浩之
 
システム思考概要(前編)
システム思考概要(前編)システム思考概要(前編)
システム思考概要(前編)yukke0704
 
SharePoint はグループウェアか?
SharePoint はグループウェアか?SharePoint はグループウェアか?
SharePoint はグループウェアか?Hirofumi Ota
 
Planning for-and implementing ISO 27001
Planning for-and implementing ISO 27001Planning for-and implementing ISO 27001
Planning for-and implementing ISO 27001Yerlin Sturdivant
 
Information Security Strategic Management
Information Security Strategic ManagementInformation Security Strategic Management
Information Security Strategic ManagementMarcelo Martins
 
【ポップインサイト】スタートアップのためのユーザテスト入門(ユーザ行動観察入門)
【ポップインサイト】スタートアップのためのユーザテスト入門(ユーザ行動観察入門)【ポップインサイト】スタートアップのためのユーザテスト入門(ユーザ行動観察入門)
【ポップインサイト】スタートアップのためのユーザテスト入門(ユーザ行動観察入門)いけとも
 
PyConAPAC2023 ワークフローエンジン Apache Airflowを用いた 大規模データパイプライン構築と改善
PyConAPAC2023 ワークフローエンジン  Apache Airflowを用いた 大規模データパイプライン構築と改善PyConAPAC2023 ワークフローエンジン  Apache Airflowを用いた 大規模データパイプライン構築と改善
PyConAPAC2023 ワークフローエンジン Apache Airflowを用いた 大規模データパイプライン構築と改善株式会社MonotaRO Tech Team
 

What's hot (20)

SlideShareの使い方 登録編
SlideShareの使い方 登録編SlideShareの使い方 登録編
SlideShareの使い方 登録編
 
KJ法のW型問題解決モデルとU理論、それぞれの問題意識 加筆版
KJ法のW型問題解決モデルとU理論、それぞれの問題意識 加筆版KJ法のW型問題解決モデルとU理論、それぞれの問題意識 加筆版
KJ法のW型問題解決モデルとU理論、それぞれの問題意識 加筆版
 
Quick Guide to ISO/IEC 27701 - The Newest Privacy Information Standard
Quick Guide to ISO/IEC 27701 - The Newest Privacy Information StandardQuick Guide to ISO/IEC 27701 - The Newest Privacy Information Standard
Quick Guide to ISO/IEC 27701 - The Newest Privacy Information Standard
 
アジャイル開発やってみた
アジャイル開発やってみたアジャイル開発やってみた
アジャイル開発やってみた
 
Splunk機械学習を使ったアンケートコメント分析
Splunk機械学習を使ったアンケートコメント分析Splunk機械学習を使ったアンケートコメント分析
Splunk機械学習を使ったアンケートコメント分析
 
KKBOX BeatMatch Sales Kit
KKBOX BeatMatch Sales KitKKBOX BeatMatch Sales Kit
KKBOX BeatMatch Sales Kit
 
DXの推進において企業内に求められる人材やデジタル人材の育て方
DXの推進において企業内に求められる人材やデジタル人材の育て方DXの推進において企業内に求められる人材やデジタル人材の育て方
DXの推進において企業内に求められる人材やデジタル人材の育て方
 
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
 
失敗から学ぶ データ分析グループの チームマネジメント変遷
失敗から学ぶデータ分析グループのチームマネジメント変遷失敗から学ぶデータ分析グループのチームマネジメント変遷
失敗から学ぶ データ分析グループの チームマネジメント変遷
 
Visual StudioやAzureからAzure DevOpsを使う
Visual StudioやAzureからAzure DevOpsを使うVisual StudioやAzureからAzure DevOpsを使う
Visual StudioやAzureからAzure DevOpsを使う
 
AbemaTVにおける推薦システム
AbemaTVにおける推薦システムAbemaTVにおける推薦システム
AbemaTVにおける推薦システム
 
Slideshare Japanese
Slideshare JapaneseSlideshare Japanese
Slideshare Japanese
 
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
 
IT業界におけるコミュニティ活動の大切さ
IT業界におけるコミュニティ活動の大切さIT業界におけるコミュニティ活動の大切さ
IT業界におけるコミュニティ活動の大切さ
 
システム思考概要(前編)
システム思考概要(前編)システム思考概要(前編)
システム思考概要(前編)
 
SharePoint はグループウェアか?
SharePoint はグループウェアか?SharePoint はグループウェアか?
SharePoint はグループウェアか?
 
Planning for-and implementing ISO 27001
Planning for-and implementing ISO 27001Planning for-and implementing ISO 27001
Planning for-and implementing ISO 27001
 
Information Security Strategic Management
Information Security Strategic ManagementInformation Security Strategic Management
Information Security Strategic Management
 
【ポップインサイト】スタートアップのためのユーザテスト入門(ユーザ行動観察入門)
【ポップインサイト】スタートアップのためのユーザテスト入門(ユーザ行動観察入門)【ポップインサイト】スタートアップのためのユーザテスト入門(ユーザ行動観察入門)
【ポップインサイト】スタートアップのためのユーザテスト入門(ユーザ行動観察入門)
 
PyConAPAC2023 ワークフローエンジン Apache Airflowを用いた 大規模データパイプライン構築と改善
PyConAPAC2023 ワークフローエンジン  Apache Airflowを用いた 大規模データパイプライン構築と改善PyConAPAC2023 ワークフローエンジン  Apache Airflowを用いた 大規模データパイプライン構築と改善
PyConAPAC2023 ワークフローエンジン Apache Airflowを用いた 大規模データパイプライン構築と改善
 

Similar to ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』

映像解析における周辺要素
映像解析における周辺要素映像解析における周辺要素
映像解析における周辺要素Takashi Kaneda
 
20141126 wab月例セミナー 資料
20141126 wab月例セミナー 資料20141126 wab月例セミナー 資料
20141126 wab月例セミナー 資料Dennis Sugahara
 
Forecast flow seminar_20190125
Forecast flow seminar_20190125Forecast flow seminar_20190125
Forecast flow seminar_20190125Masabumi Furuhata
 
20161206 12月7日メディシノバir基調講演セミナーレジュメ
20161206 12月7日メディシノバir基調講演セミナーレジュメ20161206 12月7日メディシノバir基調講演セミナーレジュメ
20161206 12月7日メディシノバir基調講演セミナーレジュメgenta clubs
 
ビッグデータ+ソーシャルで始まる次世代マーケティング
ビッグデータ+ソーシャルで始まる次世代マーケティングビッグデータ+ソーシャルで始まる次世代マーケティング
ビッグデータ+ソーシャルで始まる次世代マーケティングHottolink
 
Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Kenji Noguchi
 
Inside Sales Seminar_ビズリーチ/RevComm共催セミナー【中級編】
Inside Sales Seminar_ビズリーチ/RevComm共催セミナー【中級編】Inside Sales Seminar_ビズリーチ/RevComm共催セミナー【中級編】
Inside Sales Seminar_ビズリーチ/RevComm共催セミナー【中級編】Takeshi Aida
 
マーケティング領域におけるデータの活用と情報共有 201501
マーケティング領域におけるデータの活用と情報共有 201501マーケティング領域におけるデータの活用と情報共有 201501
マーケティング領域におけるデータの活用と情報共有 201501Noriko Hashimoto
 
ソーシャルスマートの7つの秘訣 - シリコンバレーの最新スキル (in Japanese)
ソーシャルスマートの7つの秘訣 - シリコンバレーの最新スキル (in Japanese)ソーシャルスマートの7つの秘訣 - シリコンバレーの最新スキル (in Japanese)
ソーシャルスマートの7つの秘訣 - シリコンバレーの最新スキル (in Japanese)Toshihiko Yamakami
 
海外・国内SaaS企業のPSRマルチプル&時価総額と財務指標との相関調査
海外・国内SaaS企業のPSRマルチプル&時価総額と財務指標との相関調査海外・国内SaaS企業のPSRマルチプル&時価総額と財務指標との相関調査
海外・国内SaaS企業のPSRマルチプル&時価総額と財務指標との相関調査poco-c
 
20150810_ウェブ広報勉強会使用資料
20150810_ウェブ広報勉強会使用資料20150810_ウェブ広報勉強会使用資料
20150810_ウェブ広報勉強会使用資料Untext Methods
 
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~株式会社Consumer first
 
JMRAアニュアルカンファレンスの発表資料(2016)
JMRAアニュアルカンファレンスの発表資料(2016)JMRAアニュアルカンファレンスの発表資料(2016)
JMRAアニュアルカンファレンスの発表資料(2016)晴生(作成中) 山崎
 
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)松本健太郎
 
20160909やわらかBizキックオフイベント冒頭説明
20160909やわらかBizキックオフイベント冒頭説明20160909やわらかBizキックオフイベント冒頭説明
20160909やわらかBizキックオフイベント冒頭説明KazuhitoKitamura
 
Icon imj conference2013 session1 リアルタイムでの意思決定によるマーケティング最適化
Icon imj conference2013 session1 リアルタイムでの意思決定によるマーケティング最適化Icon imj conference2013 session1 リアルタイムでの意思決定によるマーケティング最適化
Icon imj conference2013 session1 リアルタイムでの意思決定によるマーケティング最適化IMJ Corporation
 

Similar to ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』 (20)

映像解析における周辺要素
映像解析における周辺要素映像解析における周辺要素
映像解析における周辺要素
 
20141126 wab月例セミナー 資料
20141126 wab月例セミナー 資料20141126 wab月例セミナー 資料
20141126 wab月例セミナー 資料
 
Forecast flow seminar_20190125
Forecast flow seminar_20190125Forecast flow seminar_20190125
Forecast flow seminar_20190125
 
20161206 12月7日メディシノバir基調講演セミナーレジュメ
20161206 12月7日メディシノバir基調講演セミナーレジュメ20161206 12月7日メディシノバir基調講演セミナーレジュメ
20161206 12月7日メディシノバir基調講演セミナーレジュメ
 
ICO-PRの基本戦略
ICO-PRの基本戦略ICO-PRの基本戦略
ICO-PRの基本戦略
 
Jsae 2018 sum
Jsae 2018 sumJsae 2018 sum
Jsae 2018 sum
 
ビッグデータ+ソーシャルで始まる次世代マーケティング
ビッグデータ+ソーシャルで始まる次世代マーケティングビッグデータ+ソーシャルで始まる次世代マーケティング
ビッグデータ+ソーシャルで始まる次世代マーケティング
 
Tdc 20181121
Tdc 20181121Tdc 20181121
Tdc 20181121
 
Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ
 
Inside Sales Seminar_ビズリーチ/RevComm共催セミナー【中級編】
Inside Sales Seminar_ビズリーチ/RevComm共催セミナー【中級編】Inside Sales Seminar_ビズリーチ/RevComm共催セミナー【中級編】
Inside Sales Seminar_ビズリーチ/RevComm共催セミナー【中級編】
 
マーケティング領域におけるデータの活用と情報共有 201501
マーケティング領域におけるデータの活用と情報共有 201501マーケティング領域におけるデータの活用と情報共有 201501
マーケティング領域におけるデータの活用と情報共有 201501
 
ソーシャルスマートの7つの秘訣 - シリコンバレーの最新スキル (in Japanese)
ソーシャルスマートの7つの秘訣 - シリコンバレーの最新スキル (in Japanese)ソーシャルスマートの7つの秘訣 - シリコンバレーの最新スキル (in Japanese)
ソーシャルスマートの7つの秘訣 - シリコンバレーの最新スキル (in Japanese)
 
海外・国内SaaS企業のPSRマルチプル&時価総額と財務指標との相関調査
海外・国内SaaS企業のPSRマルチプル&時価総額と財務指標との相関調査海外・国内SaaS企業のPSRマルチプル&時価総額と財務指標との相関調査
海外・国内SaaS企業のPSRマルチプル&時価総額と財務指標との相関調査
 
データサイエンス業務と「ツール」
データサイエンス業務と「ツール」データサイエンス業務と「ツール」
データサイエンス業務と「ツール」
 
20150810_ウェブ広報勉強会使用資料
20150810_ウェブ広報勉強会使用資料20150810_ウェブ広報勉強会使用資料
20150810_ウェブ広報勉強会使用資料
 
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
 
JMRAアニュアルカンファレンスの発表資料(2016)
JMRAアニュアルカンファレンスの発表資料(2016)JMRAアニュアルカンファレンスの発表資料(2016)
JMRAアニュアルカンファレンスの発表資料(2016)
 
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
 
20160909やわらかBizキックオフイベント冒頭説明
20160909やわらかBizキックオフイベント冒頭説明20160909やわらかBizキックオフイベント冒頭説明
20160909やわらかBizキックオフイベント冒頭説明
 
Icon imj conference2013 session1 リアルタイムでの意思決定によるマーケティング最適化
Icon imj conference2013 session1 リアルタイムでの意思決定によるマーケティング最適化Icon imj conference2013 session1 リアルタイムでの意思決定によるマーケティング最適化
Icon imj conference2013 session1 リアルタイムでの意思決定によるマーケティング最適化
 

ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』

  • 3. 本発表の狙い Copyright(c) 2016 Predictor AI, Inc. 3 ①どんな仕組み? ②当たるのか? ③儲かるのか? ④直感をどう使うの? ⑤どこで手に入るの? PAI競馬予測『データサイエンス ×インチュイション(直感)』 の取組みをご紹介 PAI競馬予測:よくある質問 よくあるご質問に対して事例とともにお答えします 1 2 3 4 5 よくある質問
  • 4. 本発表の流れ • 会社概要と自己紹介 • PAI競馬予測のアプローチと仕組み、実験環境 • 単勝の的中率と回収率 • PAIレーダー式チャートで有馬記念を直感予想 • まとめ Copyright(c) 2016 Predictor AI, Inc. 41 2 3 4 5 よくある質問
  • 5. • 会社名:株式会社Predictor AI • Web:http://www.predictor-ai.com/ • 設立:2016年3月14日 (2012年10月 個人事業主として小さなアパートの一室から屋号Predictor AIが始まった) • 代表取締役:今村友彦 • 事業内容 • ①企業団体内データ分析サービス • 通販系:購買データの分析とシステム化(決定木、t検定、クラマーV係数、線形計画法) • 出版系:テキストマイニング(形態素解析、t検定) • 医療系:レセプトデータの分析(集計、t検定) • 通信系:購買データの分析(重回帰、生存時間分析) • セキュリティ系:大規模統合ログ分析システム(NoSQL、Splunk要件定義・設計・構築) • その他:WebフレームワークDjango(Python系)を用いたシステム構築 など計13件 • ②B2B、B2C向けサービス • 第一弾:PAI競馬予測サービス • 第二弾:(仮)ニューラルネットを用いた画像認識サービス(開発中) 会社紹介 5 データサイエンス&インチュイション(直感)の活用でデータから未来を見つめる 多様な業務ドメインの迅速なデータ分析とそこで得られた知見を活用するためのシステム開発が得意 Copyright(c) 2016 Predictor AI, Inc. 1 2 3 4 5 よくある質問
  • 6. 自己紹介 Copyright(c) 2016 Predictor AI, Inc. 6 • 氏名:今村友彦(twitter:@konsonsan) • 出身地:名古屋市 • 在住:川崎市 • 最初に所有したPC:MZ-700(CPU:Z-80 3.5MHz・8bit、メモリ:64KB) • 趣味:ミュージアム・名所史跡巡り、ピクニック、釣り(船舶免許1級)、B.LEAGUE観戦 • 学生時代:中部大学工学部電子工学科博士前期課程修了 • ニューラルネットの第2次ブーム到来 • 電子情報通信学会論文誌「ニューラルネットワークによるナンバープレートの位置検出」 http://ci.nii.ac.jp/naid/110003228671 • 就職時代:就職とともに上京。大手SIer会社(10年間)、マザーズ上場の認証ソリューション 会社(6年間) • 独立起業時代:ビッグデータやAIブームを追い風に独立起業(現在5年目に突入) 大小様々な規模(5,000名>60名>1名)、様々なフェーズの会社で多様な業務を経験。 IT関連事業の現場から経営領域までを自らの頭と身体で理解することを心掛け、フルスタック型 のデータサイエンティストを目指す もしも勝馬が レース前に 分かったら… 1 2 3 4 5 よくある質問
  • 7. PAI競馬予測のアプローチ Copyright(c) 2016 Predictor AI, Inc. 7 左脳(論理的) 右脳(直感的) コンピュータ予測 人の直感 コンピュータ予測(順位予測、確信度)の至らぬ部分は、「人の直感をAIに置 き換える」ことにより的中率を高める2段構えのアプローチ 買い目(確信度、オッズ、期待値):次フェーズ以降 統合処理(「人の直感」をAIに置き換える:次フェーズ以降) 1 2 3 4 5 よくある質問
  • 8. PAI競馬予測システムの構想(将来イメージ) Copyright(c) 2016 Predictor AI, Inc. 8 PAI予測エンジン群 予測 エンジン1 PAI可視化チャート群 左脳:データサイエンス 右脳:インチュイション(直感) 可視化 チャート1予測 エンジン1予測 エンジンMj 可視化 チャート1可視化 チャートVk ロジスティック回帰 正則化ロジスティック回帰 サポートベクターマシン ニューラルネット ランダムフォレスト BTモデル 独自方式など レーダー式チャート 散布図 時系列グラフ ヒートマップなど 説明変数Xn 説明変数Xn 説明変数Xi 買い目(確信度、オッズ、期待値):次フェーズ以降 統合処理(「人の直感」をAIに置き換える:次フェーズ以降)
  • 9. PAI競馬予測システムの構想(現状) Copyright(c) 2016 Predictor AI, Inc. 9 PAI予測エンジン群 PA予測 エンジン (独自方式) PAI可視化チャート群 左脳:データサイエンス 右脳:インチュイション(直感) PAIレーダ式 チャート PI予測 エンジン (ロジスティック 回帰) 説明変数Xn 説明変数Xn 説明変数32 説明変数32種、PAI予測エンジン2種、およびPAI可視化チャート1種を実装
  • 10. PAI競馬予測システムの構想(現状) Copyright(c) 2016 Predictor AI, Inc. 10 PAI予測エンジン群 PA予測 エンジン (独自方式) PAI可視化チャート群 左脳:データサイエンス 右脳:インチュイション(直感) PI予測 エンジン (ロジスティック 回帰) 説明変数Xn 説明変数Xn 説明変数32 PAIレーダ式 チャート 以降でPI予測エンジンとPAIレーダー式チャートについて説明
  • 11. PI予測エンジンのシステム構成 Copyright(c) 2016 Predictor AI, Inc. 11 元データ 説明変数 説明変数 説明変数 目的変数 (学習時) 予測器 予測結果 上位着順:’1’ それ以外:’0’ 32個生成 (9個を使用) ロジスティック回帰
  • 12. データ条件 • 学習データ • 期間:過去3年間 • 説明変数:馬の勝率、 騎手の勝率、走破タイム、上り3Fタイム、 距離、レース間隔など(計9個) • 目的変数:上位着順「1」、それ以外「0」 • テストデータ • 期間:2016年1月~12月22日 • 対象:メイン11Rと重賞 • レース数:計284レース 12 Copyright(c) 2016 Predictor AI, Inc. 区分 新馬 未勝利 500 万下 1000 万下 1600 万下 OPEN 重賞 計 - GIII GII GI 全体 285 1,118 1,038 413 174 113 1 69 34 21 3,257 テスト 0 0 1 34 57 67 1 69 34 21 284 テストデータは「11R+重賞レース」とするため、全レース数の8.7%(284/3,257レース) テストデータ数 1 2 3 4 5 よくある質問
  • 13. 予測モデルの条件 Copyright(c) 2016 Predictor AI, Inc. 13 • 予測器:ロジスティック回帰 • モデル分割 • レース条件で約15個のモデルに分割 • 評価方法:単勝の的中率と回収率 予測器1 予測器2 ・・・ 予測器15 1 2 3 4 5 よくある質問
  • 14. 結果(単勝:的中率) Copyright(c) 2016 Predictor AI, Inc. 14 月ごとの平均では1番人気と相関が見られるものの 通年で8.4%差 PI予測 平均的中率:22.2% 1番人気 平均的中率:30.6%< 1 2 3 4 5 よくある質問
  • 15. 結果(単勝:回収率) Copyright(c) 2016 Predictor AI, Inc. 15 PI予測 平均回収率:76.5% 1番人気 平均回収率:83.9%< 月ごとの平均では1番人気と相関は見られるが通年で7.4%差 11月はPI予測が150%を超えた 1 2 3 4 5 よくある質問
  • 16. 結果(PI予測と1番人気:1着のベン図) Copyright(c) 2016 Predictor AI, Inc. 16 44 4319 178 PI予測 的中率:22.2% 1番人気 的中率:30.6% (n=284レース) 1番人気が的中した87レース中の約半分(44レース)はPI予測と共通でありオッズは低い
  • 17. 結果(的中オッズの分布) Copyright(c) 2016 Predictor AI, Inc. 17 1番人気よりもPI予測は的中オッズの分散が大きく、中には単勝高配当も含まれる 高配当 1 2 3 4 5 よくある質問
  • 18. 結果(単勝:高配当の例) Copyright(c) 2016 Predictor AI, Inc. 18 • 2016年7月31日(日)札幌11R マコトブリジャール( 9番人気20.2倍) • 2016年11月13日(日)東京11R ナックビーナス(7番人気15.2倍) 1 2 3 4 5 よくある質問
  • 19. PAI競馬予測システムの構想(現状) Copyright(c) 2016 Predictor AI, Inc. 19 PAI予測エンジン群 PA予測 エンジン (独自方式) PAI可視化チャート群 左脳:データサイエンス 右脳:インチュイション(直感) PI予測 エンジン (ロジスティック 回帰) 説明変数Xn 説明変数Xn 説明変数32 PAIレーダ式 チャート 以降でPAIレーダー式チャートについて説明 1 2 3 4 5 よくある質問
  • 20. 可視化(PAIレーダー式チャート) Copyright(c) 2016 Predictor AI, Inc. 20 PI予測で至らない点を『直感』で補う支援ツールを考案 ・各馬の戦績を直感的に判断できるよう可視化 ・レースクラスごとに着順をプロット ・中心付近に印が多いほど強い馬 9 7 5 3 1 1 3 5 7 9 GI 67% GII 50% GIII 100% オープン特別 0% 1600万下 100% 1000万下 80% 500万下 100% 新・未勝利 100% マリアライト 年月日 レースクラス 着順 16/11/13 GI (未定) 16/09/25 GII 5 16/06/26 GI 1 16/05/29 GII 2 16/03/26 GII 3 15/12/27 GI 4 15/11/15 GI 1 15/09/27 GII 5 15/06/14 GIII 2 15/05/09 1600万下 1 15/03/08 1000万下 1 15/02/14 1000万下 3 14/11/16 1000万下 5 14/10/11 1000万下 3 14/08/03 1000万下 3 14/06/29 500万下 1 14/05/04 OPEN 6 14/03/02 500万下 3 14/01/11 新馬 1 <凡例> ●:本日~1年前 ▲:1~2年前 □:2年前~ (赤色:前走) 1 2 3 4 5 よくある質問
  • 21. 可視化(PAIレーダー式チャート例) Copyright(c) 2016 Predictor AI, Inc. 21 9 7 5 3 1 1 3 5 7 9 GI 86% GII 100% GIII --% オープン特別 --% 1600万下 --% 1000万下 --% 500万下 100% 新・未勝利 100% キタサンブラック 9 7 5 3 1 1 3 5 7 9 GI 50% GII 75% GIII --% オープン特別 --% 1600万下 100% 1000万下 100% 500万下 100% 新・未勝利 33% ゴールドアクター 9 7 5 3 1 1 3 5 7 9 GI 43% GII 67% GIII --% オープン特別 100% 1600万下 --% 1000万下 --% 500万下 100% 新・未勝利 50% サウンズオブアース 9 7 5 3 1 1 3 5 7 9 GI 100% GII 100% GIII 100% オープン特別 --% 1600万下 --% 1000万下 --% 500万下 100% 新・未勝利 100% サトノダイヤモンド 9 7 5 3 1 1 3 5 7 9 GI 67% GII 75% GIII 50% オープン特別 --% 1600万下 100% 1000万下 100% 500万下 100% 新・未勝利 100% シュヴァルグラン 9 7 5 3 1 1 3 5 7 9 GI 50% GII 50% GIII 100% オープン特別 0% 1600万下 100% 1000万下 80% 500万下 100% 新・未勝利 100% マリアライト 直感的に見て『中心付近に黒い点が最も集まっている馬』が1着にくる可能性が高い 1 2 3 4 5 よくある質問
  • 22. PAI競馬予測情報の購入方法 Copyright(c) 2016 Predictor AI, Inc. 22 ・eプリントサービスで購入可能 全国コンビニ(ローソン、ファミリーマート、サークルK、サンクス)の複合機 ・弊社Webサイト(ビットキャッシュ決済) https://www.pai-hr.com/ 無料情報(単勝のみ)、有料情報(複勝情報) ※会員登録が必要 2016年 単勝予測(実績) 予測エンジン 的中率 回収率 PA (購入284レース) 26.8% 98.6% PI (購入284レース) 22.2% 76.5% PAI (購入104レース) 33.7% 91.3% 独自開発したアルゴリズムで予測 回帰モデルで予測 ← 本資料でご紹介 2つ(PAとPI)の予測エンジンが同じ馬を 本命にしたとき:超本命 PAI 1 2 3 4 5 よくある質問
  • 23. (補足)PA、PI、PAI予測のバックテスト Copyright(c) 2016 Predictor AI, Inc. 23 PAI予測(対象レースの絞込みあり)は、4年間の平均的中率と回収率で1番人気を超えた 1 2 3 4 5 よくある質問
  • 24. まとめ 『2020年までに、AI技術などデータサイエンスを活用して1番人気 (集合知)の的中率を超える』ことを目指して挑み続けます! Copyright(c) 2016 Predictor AI, Inc. 24 PAI競馬予測:よくある質問 コンビニの複合機、又は弊社Webサイト 1 2 3 4 5 よくある質問 ⑤どこで手に入るの? ①どんな仕組み? PIエンジン:ロジスティック回帰モデル ②当たるのか? 的中率(PI vs 1番人気):22.2% vs 30.6% ※但し、PAI予測(PAエンジンとの組合せ)→33.7% ③儲かるのか? 回収率(PI vs 1番人気):76.5% vs 83.9% ※20倍超の高配当も含む ※但し、PAI予測(PAエンジンとの組合せ)→91.3% ④直感をどう使うの? PAIレーダー式チャート:直感的に判断
  • 25. (補足1)参考書籍|文献 Copyright(c) 2016 Predictor AI, Inc. 25 • EFFICIENCY OF RACETRACK BETTING MARKETS 2008 Edition:William T Ziemba/World Scientific • 競馬予想とは何か(競馬ファンの集団知と機械学習による予想の間に横たわるもの ):守真太郎、 久門正人著/JWEIN10 • ANDREW BEYER'S PICKING WINNERS 勝馬を探せ!:アンドリュー・ベイヤー著/メタモル出版 • 革命理論 西田式スピード指数:西田和彦著/KKベストセラーズ • 勝馬がわかる競馬の教科書:鈴木和幸著/池田書店 • BLUE BACKS 競争馬の科学:JRA競走馬総合研究所編/講談社 • 騎手の一分:藤田信二著/講談社現代新書 • 一番人気取捨の極意:奥野憲一著/白夜書房競馬王新書 • BLUE BACKS 確率・統計であばくギャンブルのからくり:谷岡一郎著/講談社 • なぜ競馬学校には「茶道教室」があるのか:原千代江著/小学館 • 勝負師の極意:武豊著/双葉社 • 馬券裁判:卍著/メタモル出版 • 天才数学者はこう賭ける:ウィリアム・パウンドストーン著/青土社 • 直感力:羽生善治著/PHP新書
  • 26. (補足2)1番人気とデータ数 Copyright(c) 2016 Predictor AI, Inc. 26 年 全レース レース 的中率 回収率 2013 3,324 31.9% 78.2% 2014 3,326 32.3% 79.2% 2015 3,326 30.4% 76.5% 2016 3,257 32.9% 78.6% 「全レース」と「メイン11Rと重賞」の的中率と回収率 年 メイン11R+重賞 レース 的中率 回収率 2013 290 27.2% 72.8% 2014 291 31.3% 84.4% 2015 292 20.5% 57.8% 2016 284 30.6% 83.9% 全レースの的中率:約32%、回収率:約78%となるが、 「メイン11R+重賞」に絞込むと変動はやや大きい 0% 25% 50% 75% 100% 2013 2014 2015 2016 的中率 回収率 0% 25% 50% 75% 100% 2013 2014 2015 2016 的中率 回収率