Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Maruyama Tetsutaro
PDF, PPTX
1,962 views
業務に活かすデータサイエンスとは?
DataScience, Classification, Prediction
Data & Analytics
◦
Read more
4
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 17
2
/ 17
3
/ 17
4
/ 17
5
/ 17
6
/ 17
7
/ 17
8
/ 17
9
/ 17
10
/ 17
11
/ 17
12
/ 17
13
/ 17
14
/ 17
15
/ 17
16
/ 17
17
/ 17
More Related Content
PDF
スキルチェックリスト 2017年版
by
The Japan DataScientist Society
PDF
リクルートの利用事例から考える AWSの各サービスとセキュリティ
by
Recruit Technologies
PDF
Eddystoneで始まるPhysical Webの世界
by
Recruit Technologies
PDF
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
by
Recruit Technologies
PDF
リクルート式サービス開発カスタマーの本音×人工知能
by
Recruit Technologies
PDF
リクルート式ビッグデータ活用術
by
Recruit Technologies
PDF
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
by
Recruit Technologies
PDF
全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
スキルチェックリスト 2017年版
by
The Japan DataScientist Society
リクルートの利用事例から考える AWSの各サービスとセキュリティ
by
Recruit Technologies
Eddystoneで始まるPhysical Webの世界
by
Recruit Technologies
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
by
Recruit Technologies
リクルート式サービス開発カスタマーの本音×人工知能
by
Recruit Technologies
リクルート式ビッグデータ活用術
by
Recruit Technologies
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
by
Recruit Technologies
全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
Similar to 業務に活かすデータサイエンスとは?
PDF
20180807_全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
PPTX
事業会社が開催する人材育成プログラム ”Data Science BOOTCAMP”とは?
by
Norihiko Nakabayashi
PDF
データサイエンティスト養成勉強会 こんな僕がデータサイエンティストになれた秘密
by
Ryo Matsuura
PDF
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V k-1
by
Shunsuke Nakamura
PDF
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
by
BrainPad Inc.
PDF
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
by
Takashi J OZAKI
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで
by
Shunsuke Nakamura
PPTX
20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方
by
Shunsuke Nakamura
PPTX
Nttr study 20130206_share
by
Noriyuki Futatsugi
PDF
『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの
by
Takashi J OZAKI
PPTX
Career path from system engineer to data scientist
by
Masaharu Adachi
PDF
(道具としての)データサイエンティストのつかい方
by
Shohei Hido
PPTX
20190212 supporterz
by
Shunsuke Nakamura
PDF
データサイエンティスト スキルチェックリスト
by
The Japan DataScientist Society
PDF
データサイエンティスト スキルチェックシート(抜粋版)
by
The Japan DataScientist Society
PDF
データ分析というお仕事のこれまでとこれから(HCMPL2014)
by
Takashi J OZAKI
PDF
Toward Research that Matters
by
Ryohei Fujimaki
PPTX
「ビジネス活用事例で学ぶ データサイエンス入門」輪読会#7資料
by
Shintaro Nomura
PDF
おしゃスタ@リクルート
by
Issei Kurahashi
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
by
Shunsuke Nakamura
20180807_全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
事業会社が開催する人材育成プログラム ”Data Science BOOTCAMP”とは?
by
Norihiko Nakabayashi
データサイエンティスト養成勉強会 こんな僕がデータサイエンティストになれた秘密
by
Ryo Matsuura
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V k-1
by
Shunsuke Nakamura
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
by
BrainPad Inc.
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
by
Takashi J OZAKI
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで
by
Shunsuke Nakamura
20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方
by
Shunsuke Nakamura
Nttr study 20130206_share
by
Noriyuki Futatsugi
『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの
by
Takashi J OZAKI
Career path from system engineer to data scientist
by
Masaharu Adachi
(道具としての)データサイエンティストのつかい方
by
Shohei Hido
20190212 supporterz
by
Shunsuke Nakamura
データサイエンティスト スキルチェックリスト
by
The Japan DataScientist Society
データサイエンティスト スキルチェックシート(抜粋版)
by
The Japan DataScientist Society
データ分析というお仕事のこれまでとこれから(HCMPL2014)
by
Takashi J OZAKI
Toward Research that Matters
by
Ryohei Fujimaki
「ビジネス活用事例で学ぶ データサイエンス入門」輪読会#7資料
by
Shintaro Nomura
おしゃスタ@リクルート
by
Issei Kurahashi
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
by
Shunsuke Nakamura
More from Maruyama Tetsutaro
PDF
Online Matching and Ad Allocaton 8章&9章半分
by
Maruyama Tetsutaro
PDF
shot note で手書き資料作成
by
Maruyama Tetsutaro
PDF
ユークリッド距離以外の距離で教師無しクラスタリング
by
Maruyama Tetsutaro
PDF
機械学習向けプログラミング言語の使い分け - RCO の場合
by
Maruyama Tetsutaro
PDF
keynoteでslideshare
by
Maruyama Tetsutaro
PDF
Lambda and rundeck
by
Maruyama Tetsutaro
PDF
Mining of massive datasets chapter3
by
Maruyama Tetsutaro
PDF
日本の伝統色
by
Maruyama Tetsutaro
PDF
Gnuplotあれこれ
by
Maruyama Tetsutaro
PDF
Ubuntuで最新パッケージを導入
by
Maruyama Tetsutaro
PDF
Zshでデキるプロンプト
by
Maruyama Tetsutaro
PDF
配列数式
by
Maruyama Tetsutaro
PDF
ランダム・シャッフル
by
Maruyama Tetsutaro
PDF
Zipf分布に従う乱数の生成方法
by
Maruyama Tetsutaro
PDF
円錐曲線の極座標表示
by
Maruyama Tetsutaro
Online Matching and Ad Allocaton 8章&9章半分
by
Maruyama Tetsutaro
shot note で手書き資料作成
by
Maruyama Tetsutaro
ユークリッド距離以外の距離で教師無しクラスタリング
by
Maruyama Tetsutaro
機械学習向けプログラミング言語の使い分け - RCO の場合
by
Maruyama Tetsutaro
keynoteでslideshare
by
Maruyama Tetsutaro
Lambda and rundeck
by
Maruyama Tetsutaro
Mining of massive datasets chapter3
by
Maruyama Tetsutaro
日本の伝統色
by
Maruyama Tetsutaro
Gnuplotあれこれ
by
Maruyama Tetsutaro
Ubuntuで最新パッケージを導入
by
Maruyama Tetsutaro
Zshでデキるプロンプト
by
Maruyama Tetsutaro
配列数式
by
Maruyama Tetsutaro
ランダム・シャッフル
by
Maruyama Tetsutaro
Zipf分布に従う乱数の生成方法
by
Maruyama Tetsutaro
円錐曲線の極座標表示
by
Maruyama Tetsutaro
業務に活かすデータサイエンスとは?
1.
業務に活かすデータサイエンスとは? 株式会社リクルートコミュニケーションズ アドテクノロジー開発部 丸山
哲太郎 2015年10月14日
2.
自己紹介� 2(C) Recruit Communications
Co.,Ltd. All rights reserved. � • 2014年4月〜��リクルートコミュニケーションズ – デブサミサイト上の自己紹介が無いのは 本当に新参者だからです • 業務:データ分析関連 – インフラ系:DB設計・ETL・DB運用管理 – コンサル系:機械学習を用いたソリューション提案 – 開発系:アプリケーションの分析バックエンド開発 • 「でーたさいえんてぃすと」・・・ • 主務:Jリーグ川崎フロンターレの応援 – 10年以上続けてます • 「さぽーたー」・・・
3.
リクルートコミュニケーションズとデータサイエンス� 3(C) Recruit Communications
Co.,Ltd. All rights reserved. � • 前提となる真面目なお話・・・ • は、時間が無いから省略! このいい笑顔の人が 昼飯ついでに 話してくれているはず
4.
さて、「機械学習してます」と言うと・・・� 4(C) Recruit Communications
Co.,Ltd. All rights reserved. � よく分からないんだけど 一体なにが出来るの? 何でも自動で完璧に 予測してくれるんでしょ? 機械学習に馴染みが無い方のリアクション(例)
5.
・・・� 5(C) Recruit Communications
Co.,Ltd. All rights reserved. � アルパカさんの怒りを鎮めるためにも 「実際の分析」を見せつけてやらなければなりません
6.
コンプライアンス 何をするのか� 6(C) Recruit Communications
Co.,Ltd. All rights reserved. � リクルートのリアルなデータを使った分析
7.
自分を思い出す� 7(C) Recruit Communications
Co.,Ltd. All rights reserved. � • 2014年4月〜��リクルートコミュニケーションズ – デブサミサイト上の自己紹介が無いのは 本当に新参者だからです • 業務:データ分析関連 – インフラ系:DB設計・ETL・DB運用管理 – コンサル系:機械学習を用いたソリューション提案 – 開発系:アプリケーションの分析バックエンド開発 • 「でーたさいえんてぃすと」・・・ • 主務:Jリーグ川崎フロンターレの応援 – 10年以上続けてます • 「さぽーたー」・・・
8.
何をするのか� 8(C) Recruit Communications
Co.,Ltd. All rights reserved. � 機械学習でtotoを予測して5億円ゲット!! (どうやら楽しいらしい) 知らない方へ:サッカーJリーグの結果を当てる 政府公認のギャンブル(語弊) 出典:http://www.toto-dream.com
9.
お世話になったサイト� • J.LEAGUE Data�Site – https://data.j-league.or.jp/ – もちろんJリーグオフィシャルの公開データ – 感謝感謝 9(C)
Recruit Communications Co.,Ltd. All rights reserved. �
10.
やるからには明日から本気出す� • 前処理 – データが有る1999年から16年間分のデータを BeautifulSoup
でスクレイピング – AWS Redshift にぶっ込んで、 ひたすら SQL 投げて特徴量抽出 – 特徴量は長年の知識と経験と勘と独断と偏見で • 120個程度 – 丸2日かかってしまい、自分の存在意義を疑う • モデル – 勝ち・負け・引き分けを予測する Classification – 正則化項付きSVM と RandomForest しか使わず – 全60チーム毎にCrossValidationしながら ハイパーパラメータ調整� 10(C) Recruit Communications Co.,Ltd. All rights reserved. �
11.
特徴量のimportance� 1� 相手がCKをあまり狙わない� 2� 相手の短期的な失点力がうちの得点力を上回る� 3�
うちの長期的な得点力が相手の失点力を上回る� 4� 観客数が多い� 5� 最近、失点が少ない� 11(C) Recruit Communications Co.,Ltd. All rights reserved. � 川崎フロンターレが勝つための特徴量トップ5 フロンターレが攻撃ばっかりで守備が全然(泣) という特徴が出てて、悪くない・・・気がする・・・
12.
予想��(うちの試合が無いことに後で気付く)� ホームチーム� 機械� 丸山�
アウェイチーム� 鹿島� 1� 1� 神戸� G大阪� 1� 1� 新潟� 東京V� 0� 0� 岡山� C大阪� 1� 1� 北九州� 福岡� 0� 1 千葉� 札幌� 0� 1� 金沢� 栃木� 0� 0� 大分� 京都� 0� 1� 岐阜� 愛媛� 0� 0� 長崎� 熊本� 2� 2� 大宮� 讃岐� 1� 0� 横浜FC� 水戸� 2� 2� 磐田� 徳島� 0� 0� 群馬� 12(C) Recruit Communications Co.,Ltd. All rights reserved. � ホーム勝:1 アウェイ勝:2 引き分け:0
13.
結果� ホームチーム� 機械� 丸山�
アウェイチーム� 鹿島� 1� 1� 神戸� G大阪� 1� 1� 新潟� 東京V� 0� 0� 岡山� C大阪� 1� 1� 北九州� 福岡� 0� 1 千葉� 札幌� 0� 1� 金沢� 栃木� 0� 0� 大分� 京都� 0� 1� 岐阜� 愛媛� 0� 0� 長崎� 熊本� 2� 2� 大宮� 讃岐� 1� 0� 横浜FC� 水戸� 2� 2� 磐田� 徳島� 0� 0� 群馬� 13(C) Recruit Communications Co.,Ltd. All rights reserved. � ホーム勝:1 アウェイ勝:2 引き分け:0
14.
結果� ホームチーム� 機械� 丸山�
アウェイチーム� 鹿島� 1� 1� 神戸� G大阪� 1� 1� 新潟� 東京V� 0� 0� 岡山� C大阪� 1� 1� 北九州� 福岡� 0� 1 千葉� 札幌� 0� 1� 金沢� 栃木� 0� 0� 大分� 京都� 0� 1� 岐阜� 愛媛� 0� 0� 長崎� 熊本� 2� 2� 大宮� 讃岐� 1� 0� 横浜FC� 水戸� 2� 2� 磐田� 徳島� 0� 0� 群馬� 14(C) Recruit Communications Co.,Ltd. All rights reserved. � ホーム勝:1 アウェイ勝:2 引き分け:0 !!! 私の勝ち !!! やった〜 と素直に喜べない・・・
15.
言いたかったこと� • 「何ができるか」じゃない�「何をしたいか」だ!! – 「totoで5億円稼ぎたい」 –
機械学習はあくまで手段であり、重要なのは目的 • 機械学習は銀の弾丸じゃない!! – 知見や経験という抽象的な概念を統計学的に裏打ち – 地道な試行錯誤の連続 • 仮説の見直し・データの追加・特徴量の見直し • モデルの選択・ハイパーパラメータの調整 • 分析を実際の業務に活かすには 周りの人(エンジニア・プランナー・営業)に これらを理解してもらうことがとても重要 – 引き続き5億円をエサにした啓蒙活動を続けたい 15(C) Recruit Communications Co.,Ltd. All rights reserved. �
16.
最後に� 16(C) Recruit Communications
Co.,Ltd. All rights reserved. � ttoottoo の購入�費用は どの経費で落とせばいいですか? > マネージャー
17.
17(C) Recruit Communications
Co.,Ltd. All rights reserved. � ご清聴ありがとうございました
Download