SlideShare a Scribd company logo
第16回 Machine Learning 15minutes!
「ちょっと今からデータサイエンティスト目指して
きます」
株式会社データミックス
三好大悟
2017年9月30日
Copyright 2017 DataMix Inc. All rights reserved.
今日伝えたいこと
● 自己紹介
● 会社紹介
● データサイエンティストと ?
● 実務で大変だったこと5選!
アジェンダ
2
Copyright 2017 DataMix Inc. All rights reserved.
<名前> 三好大悟
<所属>
会社:株式会社データミックス
役職:データ分析コンサルタント
<略歴>
● 慶應義塾大学理工学部
● 慶應義塾大学大学院理工学研究科
<専攻>
● 金融工学(主にバイサイド側 研究:ポートフォリオ理論)
● Python、Rを主に使っています。
自己紹介|バックグラウンド
3
Copyright 2017 DataMix Inc. All rights reserved.
自己紹介|正社員としてジョイン
4
みよっしー、今 インターンだけど、これからどうす
ん ?
どうしましょう?笑
データサイエンティストを目指したいんです けど!
じゃあうちで働きなよ ^_^
あ、 い!
正社員になっちゃいました。
Copyright 2017 DataMix Inc. All rights reserved. 5
データミックスってどんな会社!?
Copyright 2017 DataMix Inc. All rights reserved.
会社紹介|データミックスについて
<会社名> 株式会社データミックス(DATAMIX CO., LTD.)
<設立> 2017年2月
<事業内容>
● ビッグデータ、人工知能、機械学習を じめとするデータ  サイエ
ンスに関わる教育・研修事業
● データサイエンティスト育成プログラム 運営
● 有料職業紹介
● ビッグデータ、人工知能、機械学習に関する法人向け研修
● ビッグデータ、人工知能、機械学習に関するコンサルティング
6
Copyright 2017 DataMix Inc. All rights reserved.
会社紹介|教育・研修事業
7
未経験からデータサイエ
ンティストを育成 する
よ!
ゆるキャラ
「ミックス君」
Copyright 2017 DataMix Inc. All rights reserved.
会社紹介|法人向け分析コンサルティング
8
企業 課題をデータ 分
析で解決するよ!
ゆるキャラ
「ミックス君」
Copyright 2017 DataMix Inc. All rights reserved.
データサイエンティストと ?
9
Copyright 2017 DataMix Inc. All rights reserved.
⇒ データ分析 専門家?
⇒ 数学者?科学者?機械学習エンジニア?
「データサイエンティスト」に明確な定義 ない…
データサイエンティストと ?|弊社 定義
10
高度なデータ分析技術を用いてビジネス課題を解決する専門職
「データサイエンティストって一体どんな職業な ?」
弊社 定義するデータサイエンティスト 、
Copyright 2017 DataMix Inc. All rights reserved.
データサイエンティストと ?|イメージと現実 ギャップ
11
プログラミングや数学を解く かりで ない…!
? イメージ ? 現実
Copyright 2017 DataMix Inc. All rights reserved.
データサイエンティストと ?|データ分析プロジェクト 流れ
12
分析目的
明確化
データ
準備
分析
• 説明要因 洗い出し
• データ収集
• データ蓄積
• クレンジング
• 統合
1
2
3
主な実施項目
• データ抽出
• 可視化
• クラスタリング
• 予測モデリング
• モデル 性能評価
運用
ビジネス
インパクト
評価
• A/Bテスト
• バックテスト
• What-If分析
4
5
主な実施項目
• ビジネスプロセスへ 組み込
み
• PDCAサイクル 設計・運用
• ビジネス課題 再確認
• 分析 目的
• ターゲット KPI 合意
• アウトプット
ビジネス課題を洗い出し、課題
解決 ためにデータを分析す
る!
Copyright 2017 DataMix Inc. All rights reserved.
実際にデータサイエンティストとして働いてみて
〜 大変だったこと、5選 〜
13
Copyright 2017 DataMix Inc. All rights reserved. 14
~ 実際に実務で応用できた事例 ~
(視聴)ログデータ
JSONファイルを
パースしてDB
テーブルへ格納
(厳秘扱い)
大変だったこと①|ログデータを綺麗にテーブル化する
「研究で使ってたデータと全然違う。(´;ω;`)」
「説明書ない、定義書ない、ログ取れてないんじゃない?…」
「パース難しい、寝れない。(´・ω・`)」
ID
Copyright 2017 DataMix Inc. All rights reserved.
「テーブルから如何にカスタマージャーニーを描き出すか?」
「ロジカルシンキングだ。」
「機械学習 やってくれない ? (´・ω・`)」
大変だったこと②|ロジカルシンキングによるデータ 解釈
15
~ 実際に実務で応用できた事例 ~
(厳秘扱い)
ID
ど ように視聴
する か?
視聴ログデータ
ど くらい ペースで 
視聴する か?
ちゃんと視聴したか?
Copyright 2017 DataMix Inc. All rights reserved. 16
~ 実際に実務で応用できた事例 ~
リッジ回帰やk-means
に基いてクラスタリング
(厳秘扱い)
大変だったこと③|アルゴリズム 使い所と組み合わせ
「各アルゴリズムやモデル自体 それほど難しいも ない」
「試行錯誤しながら、良さそうな組み合わせ技で勝負!」
「機械学習 やってくれない ? (´・ω・`)」
Copyright 2017 DataMix Inc. All rights reserved.
裏付け ある
モデリングにより
クラスタリング
をしました
大変だったこと④|スライドライティング、大切
17
りっじかいき?
けーみーんず?
~ 実際に実務で応用できた事例 ~
「顧客に対して、アルゴリズムを説明しても、何 意味もない」
「お客さんに分かりやすく、資料を作らないと…!」
「機械学習 やってくれない ? (´・ω・`)」
分析 結果、
・オレンジ どんな人達?
・赤 どんな人達?
・黒 どんな人達?
をうまく伝わるように説明
(厳秘扱い)
Copyright 2017 DataMix Inc. All rights reserved.
大変だったこと⑤|初学者 疑問
18
弊社 導入している制度や新たなチャレンジ
・少人数ならで 、TA制や講義時間外で 質問チャット
・家庭教師風、個人レッスン制度
「なんで微分係数使うんですか?」
「中心極限定理って何ですか?」
「さぽーとべくたーましん?」
「エラーデバッグできません!」
「pythonエラーです。」
「Rがエラーです。」
Copyright 2017 DataMix Inc. All rights reserved.
データやモデルが
してくれること
結論:データサイエンティスト 楽しい!
19
データサイエンティストって大変!だけど楽しい!
人がやらなきゃい
けないこと
Copyright 2017 DataMix Inc. All rights reserved.
ご清聴ありがとうございました!
20

More Related Content

What's hot

BtoBマーケティングにおけるML/NLPの活用
BtoBマーケティングにおけるML/NLPの活用BtoBマーケティングにおけるML/NLPの活用
BtoBマーケティングにおけるML/NLPの活用
Akira Kitauchi
 
AIによる経済情報の活用
AIによる経済情報の活用AIによる経済情報の活用
AIによる経済情報の活用
Akira Kitauchi
 
事業会社が開催する人材育成プログラム ”Data Science BOOTCAMP”とは?
事業会社が開催する人材育成プログラム ”Data Science BOOTCAMP”とは?事業会社が開催する人材育成プログラム ”Data Science BOOTCAMP”とは?
事業会社が開催する人材育成プログラム ”Data Science BOOTCAMP”とは?
Norihiko Nakabayashi
 
2016年度コーポレートフェローシップ活動報告(伊東さん)
2016年度コーポレートフェローシップ活動報告(伊東さん)2016年度コーポレートフェローシップ活動報告(伊東さん)
2016年度コーポレートフェローシップ活動報告(伊東さん)
Code for Japan
 
Bluemixで実現する高速CMS環境と活用方法
Bluemixで実現する高速CMS環境と活用方法Bluemixで実現する高速CMS環境と活用方法
Bluemixで実現する高速CMS環境と活用方法
BMXUG
 
2016年度コーポレートフェローシップ活動報告(飯田さん)
2016年度コーポレートフェローシップ活動報告(飯田さん)2016年度コーポレートフェローシップ活動報告(飯田さん)
2016年度コーポレートフェローシップ活動報告(飯田さん)
Code for Japan
 
20211019 rpa勉強会!「自動化ネタ・rpaネタ・itネタ」ライトニングトーク大会! vol.31
20211019 rpa勉強会!「自動化ネタ・rpaネタ・itネタ」ライトニングトーク大会! vol.3120211019 rpa勉強会!「自動化ネタ・rpaネタ・itネタ」ライトニングトーク大会! vol.31
20211019 rpa勉強会!「自動化ネタ・rpaネタ・itネタ」ライトニングトーク大会! vol.31
TakutoIde
 
2016年度コーポレートフェローシップ活動報告(葛城さん)
2016年度コーポレートフェローシップ活動報告(葛城さん)2016年度コーポレートフェローシップ活動報告(葛城さん)
2016年度コーポレートフェローシップ活動報告(葛城さん)
Code for Japan
 
面倒臭がりでもキャッチアップしたい- RE:Bot から始めるものぐさ生活 -
面倒臭がりでもキャッチアップしたい- RE:Bot から始めるものぐさ生活 -面倒臭がりでもキャッチアップしたい- RE:Bot から始めるものぐさ生活 -
面倒臭がりでもキャッチアップしたい- RE:Bot から始めるものぐさ生活 -
MinoruIto3
 
20201130 rpal tvol26
20201130 rpal tvol2620201130 rpal tvol26
20201130 rpal tvol26
KEI INOUE
 
#SaaSTokyo: IPO後も高成長を続けるSaaSプロダクトと組織
#SaaSTokyo: IPO後も高成長を続けるSaaSプロダクトと組織#SaaSTokyo: IPO後も高成長を続けるSaaSプロダクトと組織
#SaaSTokyo: IPO後も高成長を続けるSaaSプロダクトと組織
Hiro Maeda
 
第6回 Machine Learning 15minutes!
第6回 Machine Learning 15minutes!第6回 Machine Learning 15minutes!
第6回 Machine Learning 15minutes!
Shigeyuki Kameda
 
11月 Machine Learning15 「確証バイアスによる仮説生成に注意するとAI開発は上手くいく」
11月 Machine Learning15 「確証バイアスによる仮説生成に注意するとAI開発は上手くいく」11月 Machine Learning15 「確証バイアスによる仮説生成に注意するとAI開発は上手くいく」
11月 Machine Learning15 「確証バイアスによる仮説生成に注意するとAI開発は上手くいく」
Shigeyuki Kameda
 
5年前の自分たちに伝えておきたいこと モニタリング
5年前の自分たちに伝えておきたいこと   モニタリング 5年前の自分たちに伝えておきたいこと   モニタリング
5年前の自分たちに伝えておきたいこと モニタリング
Motohiro Ueki
 
DX Suite & UiPath さっくり読み取りさっくり連携
DX Suite & UiPath さっくり読み取りさっくり連携DX Suite & UiPath さっくり読み取りさっくり連携
DX Suite & UiPath さっくり読み取りさっくり連携
Chuki ちゅき
 
2016年度コーポレートフェローシップ活動報告(今西さん)
2016年度コーポレートフェローシップ活動報告(今西さん)2016年度コーポレートフェローシップ活動報告(今西さん)
2016年度コーポレートフェローシップ活動報告(今西さん)
Code for Japan
 
20170731 ワークショップ
20170731  ワークショップ20170731  ワークショップ
20170731 ワークショップ
openrtm
 
ビザスクを支える技術 2017
ビザスクを支える技術 2017ビザスクを支える技術 2017
ビザスクを支える技術 2017
創史 花村
 
20170731 nedoつくば(油井)
20170731 nedoつくば(油井)20170731 nedoつくば(油井)
20170731 nedoつくば(油井)
openrtm
 
ビープラウドの紹介と渋谷区千駄ヶ谷5-32-7に漂着するまでの道のり
ビープラウドの紹介と渋谷区千駄ヶ谷5-32-7に漂着するまでの道のりビープラウドの紹介と渋谷区千駄ヶ谷5-32-7に漂着するまでの道のり
ビープラウドの紹介と渋谷区千駄ヶ谷5-32-7に漂着するまでの道のり
Haruo Sato
 

What's hot (20)

BtoBマーケティングにおけるML/NLPの活用
BtoBマーケティングにおけるML/NLPの活用BtoBマーケティングにおけるML/NLPの活用
BtoBマーケティングにおけるML/NLPの活用
 
AIによる経済情報の活用
AIによる経済情報の活用AIによる経済情報の活用
AIによる経済情報の活用
 
事業会社が開催する人材育成プログラム ”Data Science BOOTCAMP”とは?
事業会社が開催する人材育成プログラム ”Data Science BOOTCAMP”とは?事業会社が開催する人材育成プログラム ”Data Science BOOTCAMP”とは?
事業会社が開催する人材育成プログラム ”Data Science BOOTCAMP”とは?
 
2016年度コーポレートフェローシップ活動報告(伊東さん)
2016年度コーポレートフェローシップ活動報告(伊東さん)2016年度コーポレートフェローシップ活動報告(伊東さん)
2016年度コーポレートフェローシップ活動報告(伊東さん)
 
Bluemixで実現する高速CMS環境と活用方法
Bluemixで実現する高速CMS環境と活用方法Bluemixで実現する高速CMS環境と活用方法
Bluemixで実現する高速CMS環境と活用方法
 
2016年度コーポレートフェローシップ活動報告(飯田さん)
2016年度コーポレートフェローシップ活動報告(飯田さん)2016年度コーポレートフェローシップ活動報告(飯田さん)
2016年度コーポレートフェローシップ活動報告(飯田さん)
 
20211019 rpa勉強会!「自動化ネタ・rpaネタ・itネタ」ライトニングトーク大会! vol.31
20211019 rpa勉強会!「自動化ネタ・rpaネタ・itネタ」ライトニングトーク大会! vol.3120211019 rpa勉強会!「自動化ネタ・rpaネタ・itネタ」ライトニングトーク大会! vol.31
20211019 rpa勉強会!「自動化ネタ・rpaネタ・itネタ」ライトニングトーク大会! vol.31
 
2016年度コーポレートフェローシップ活動報告(葛城さん)
2016年度コーポレートフェローシップ活動報告(葛城さん)2016年度コーポレートフェローシップ活動報告(葛城さん)
2016年度コーポレートフェローシップ活動報告(葛城さん)
 
面倒臭がりでもキャッチアップしたい- RE:Bot から始めるものぐさ生活 -
面倒臭がりでもキャッチアップしたい- RE:Bot から始めるものぐさ生活 -面倒臭がりでもキャッチアップしたい- RE:Bot から始めるものぐさ生活 -
面倒臭がりでもキャッチアップしたい- RE:Bot から始めるものぐさ生活 -
 
20201130 rpal tvol26
20201130 rpal tvol2620201130 rpal tvol26
20201130 rpal tvol26
 
#SaaSTokyo: IPO後も高成長を続けるSaaSプロダクトと組織
#SaaSTokyo: IPO後も高成長を続けるSaaSプロダクトと組織#SaaSTokyo: IPO後も高成長を続けるSaaSプロダクトと組織
#SaaSTokyo: IPO後も高成長を続けるSaaSプロダクトと組織
 
第6回 Machine Learning 15minutes!
第6回 Machine Learning 15minutes!第6回 Machine Learning 15minutes!
第6回 Machine Learning 15minutes!
 
11月 Machine Learning15 「確証バイアスによる仮説生成に注意するとAI開発は上手くいく」
11月 Machine Learning15 「確証バイアスによる仮説生成に注意するとAI開発は上手くいく」11月 Machine Learning15 「確証バイアスによる仮説生成に注意するとAI開発は上手くいく」
11月 Machine Learning15 「確証バイアスによる仮説生成に注意するとAI開発は上手くいく」
 
5年前の自分たちに伝えておきたいこと モニタリング
5年前の自分たちに伝えておきたいこと   モニタリング 5年前の自分たちに伝えておきたいこと   モニタリング
5年前の自分たちに伝えておきたいこと モニタリング
 
DX Suite & UiPath さっくり読み取りさっくり連携
DX Suite & UiPath さっくり読み取りさっくり連携DX Suite & UiPath さっくり読み取りさっくり連携
DX Suite & UiPath さっくり読み取りさっくり連携
 
2016年度コーポレートフェローシップ活動報告(今西さん)
2016年度コーポレートフェローシップ活動報告(今西さん)2016年度コーポレートフェローシップ活動報告(今西さん)
2016年度コーポレートフェローシップ活動報告(今西さん)
 
20170731 ワークショップ
20170731  ワークショップ20170731  ワークショップ
20170731 ワークショップ
 
ビザスクを支える技術 2017
ビザスクを支える技術 2017ビザスクを支える技術 2017
ビザスクを支える技術 2017
 
20170731 nedoつくば(油井)
20170731 nedoつくば(油井)20170731 nedoつくば(油井)
20170731 nedoつくば(油井)
 
ビープラウドの紹介と渋谷区千駄ヶ谷5-32-7に漂着するまでの道のり
ビープラウドの紹介と渋谷区千駄ヶ谷5-32-7に漂着するまでの道のりビープラウドの紹介と渋谷区千駄ヶ谷5-32-7に漂着するまでの道のり
ビープラウドの紹介と渋谷区千駄ヶ谷5-32-7に漂着するまでの道のり
 

Similar to 第16回 ml15 三好

データサイエンティストってどこへ行ったのか???
データサイエンティストってどこへ行ったのか???データサイエンティストってどこへ行ったのか???
データサイエンティストってどこへ行ったのか???
Izumi Akiyama
 
Ip for data scientist
Ip for data scientistIp for data scientist
Ip for data scientist
Urushibata Mitsuru
 
データサイエンス業務と「ツール」
データサイエンス業務と「ツール」データサイエンス業務と「ツール」
データサイエンス業務と「ツール」
The Japan DataScientist Society
 
JapanTaxiが保有するデータとデータ分析について
JapanTaxiが保有するデータとデータ分析についてJapanTaxiが保有するデータとデータ分析について
JapanTaxiが保有するデータとデータ分析について
Masatoshi Ida
 
データサイエンティスト協会 会員制度説明資料
データサイエンティスト協会 会員制度説明資料データサイエンティスト協会 会員制度説明資料
データサイエンティスト協会 会員制度説明資料
The Japan DataScientist Society
 
みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様
Takeshi Akutsu
 
DLL #3 株式会社standard
DLL #3 株式会社standardDLL #3 株式会社standard
DLL #3 株式会社standard
Hirono Jumpei
 
DLL#3 プレゼン資料株式会社standard
DLL#3 プレゼン資料株式会社standardDLL#3 プレゼン資料株式会社standard
DLL#3 プレゼン資料株式会社standard
Hirono Jumpei
 
人材不足を抜け出す企業の2つの戦略【株式会社STANDARD|DLL #3】
人材不足を抜け出す企業の2つの戦略【株式会社STANDARD|DLL #3】人材不足を抜け出す企業の2つの戦略【株式会社STANDARD|DLL #3】
人材不足を抜け出す企業の2つの戦略【株式会社STANDARD|DLL #3】
daichiishii0528
 
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
Ridge-i
 
新卒採用を、まっとうに ー面接者への通信簿ー
新卒採用を、まっとうに ー面接者への通信簿ー新卒採用を、まっとうに ー面接者への通信簿ー
新卒採用を、まっとうに ー面接者への通信簿ー
慧悟 岩本
 
企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル
Rakuten Group, Inc.
 
プログラミングを学ぶと何が良いのか
プログラミングを学ぶと何が良いのかプログラミングを学ぶと何が良いのか
プログラミングを学ぶと何が良いのか
Haruo Sato
 
ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2
ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2
ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2
Sei Kato (加藤 整)
 
学習経済モデルに基づくブロックチェーンを利用して非集中型学習支援システムの構築
学習経済モデルに基づくブロックチェーンを利用して非集中型学習支援システムの構築学習経済モデルに基づくブロックチェーンを利用して非集中型学習支援システムの構築
学習経済モデルに基づくブロックチェーンを利用して非集中型学習支援システムの構築
Hori Masumi
 
「企業のデジタルトランスフォーメーション ビッグデータ利活用に関する活動と課題」
「企業のデジタルトランスフォーメーション   ビッグデータ利活用に関する活動と課題」「企業のデジタルトランスフォーメーション   ビッグデータ利活用に関する活動と課題」
「企業のデジタルトランスフォーメーション ビッグデータ利活用に関する活動と課題」
scirexcenter
 
Startup Science ②
Startup Science ②Startup Science ②
Startup Science ②
Masa Tadokoro
 
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
Noriaki Takahashi
 
Tableau data science_20190627_distribute
Tableau data science_20190627_distributeTableau data science_20190627_distribute
Tableau data science_20190627_distribute
Masabumi Furuhata
 
【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】
【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】
【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】
Shunsuke Nakamura
 

Similar to 第16回 ml15 三好 (20)

データサイエンティストってどこへ行ったのか???
データサイエンティストってどこへ行ったのか???データサイエンティストってどこへ行ったのか???
データサイエンティストってどこへ行ったのか???
 
Ip for data scientist
Ip for data scientistIp for data scientist
Ip for data scientist
 
データサイエンス業務と「ツール」
データサイエンス業務と「ツール」データサイエンス業務と「ツール」
データサイエンス業務と「ツール」
 
JapanTaxiが保有するデータとデータ分析について
JapanTaxiが保有するデータとデータ分析についてJapanTaxiが保有するデータとデータ分析について
JapanTaxiが保有するデータとデータ分析について
 
データサイエンティスト協会 会員制度説明資料
データサイエンティスト協会 会員制度説明資料データサイエンティスト協会 会員制度説明資料
データサイエンティスト協会 会員制度説明資料
 
みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様
 
DLL #3 株式会社standard
DLL #3 株式会社standardDLL #3 株式会社standard
DLL #3 株式会社standard
 
DLL#3 プレゼン資料株式会社standard
DLL#3 プレゼン資料株式会社standardDLL#3 プレゼン資料株式会社standard
DLL#3 プレゼン資料株式会社standard
 
人材不足を抜け出す企業の2つの戦略【株式会社STANDARD|DLL #3】
人材不足を抜け出す企業の2つの戦略【株式会社STANDARD|DLL #3】人材不足を抜け出す企業の2つの戦略【株式会社STANDARD|DLL #3】
人材不足を抜け出す企業の2つの戦略【株式会社STANDARD|DLL #3】
 
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
 
新卒採用を、まっとうに ー面接者への通信簿ー
新卒採用を、まっとうに ー面接者への通信簿ー新卒採用を、まっとうに ー面接者への通信簿ー
新卒採用を、まっとうに ー面接者への通信簿ー
 
企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル
 
プログラミングを学ぶと何が良いのか
プログラミングを学ぶと何が良いのかプログラミングを学ぶと何が良いのか
プログラミングを学ぶと何が良いのか
 
ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2
ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2
ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2
 
学習経済モデルに基づくブロックチェーンを利用して非集中型学習支援システムの構築
学習経済モデルに基づくブロックチェーンを利用して非集中型学習支援システムの構築学習経済モデルに基づくブロックチェーンを利用して非集中型学習支援システムの構築
学習経済モデルに基づくブロックチェーンを利用して非集中型学習支援システムの構築
 
「企業のデジタルトランスフォーメーション ビッグデータ利活用に関する活動と課題」
「企業のデジタルトランスフォーメーション   ビッグデータ利活用に関する活動と課題」「企業のデジタルトランスフォーメーション   ビッグデータ利活用に関する活動と課題」
「企業のデジタルトランスフォーメーション ビッグデータ利活用に関する活動と課題」
 
Startup Science ②
Startup Science ②Startup Science ②
Startup Science ②
 
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
 
Tableau data science_20190627_distribute
Tableau data science_20190627_distributeTableau data science_20190627_distribute
Tableau data science_20190627_distribute
 
【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】
【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】
【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】
 

More from Ozawa Kensuke

20171125クラウドソーシングによる教師データ作成
20171125クラウドソーシングによる教師データ作成20171125クラウドソーシングによる教師データ作成
20171125クラウドソーシングによる教師データ作成
Ozawa Kensuke
 
15min nov25
15min nov2515min nov25
15min nov25
Ozawa Kensuke
 
Ai受託プロダクト開発アンチパターン (1)
Ai受託プロダクト開発アンチパターン (1)Ai受託プロダクト開発アンチパターン (1)
Ai受託プロダクト開発アンチパターン (1)
Ozawa Kensuke
 
15min発表資料株式会社standard
15min発表資料株式会社standard15min発表資料株式会社standard
15min発表資料株式会社standard
Ozawa Kensuke
 
Ai受託プロダクト開発アンチパターン
Ai受託プロダクト開発アンチパターンAi受託プロダクト開発アンチパターン
Ai受託プロダクト開発アンチパターン
Ozawa Kensuke
 
20170624yamada
20170624yamada20170624yamada
20170624yamada
Ozawa Kensuke
 
20170624 発表資料-ml
20170624 発表資料-ml20170624 発表資料-ml
20170624 発表資料-ml
Ozawa Kensuke
 
20170624yamada
20170624yamada20170624yamada
20170624yamada
Ozawa Kensuke
 
ぼくのかんがえたさいきょうの機械学習プロダクトの作り方
ぼくのかんがえたさいきょうの機械学習プロダクトの作り方ぼくのかんがえたさいきょうの機械学習プロダクトの作り方
ぼくのかんがえたさいきょうの機械学習プロダクトの作り方
Ozawa Kensuke
 

More from Ozawa Kensuke (9)

20171125クラウドソーシングによる教師データ作成
20171125クラウドソーシングによる教師データ作成20171125クラウドソーシングによる教師データ作成
20171125クラウドソーシングによる教師データ作成
 
15min nov25
15min nov2515min nov25
15min nov25
 
Ai受託プロダクト開発アンチパターン (1)
Ai受託プロダクト開発アンチパターン (1)Ai受託プロダクト開発アンチパターン (1)
Ai受託プロダクト開発アンチパターン (1)
 
15min発表資料株式会社standard
15min発表資料株式会社standard15min発表資料株式会社standard
15min発表資料株式会社standard
 
Ai受託プロダクト開発アンチパターン
Ai受託プロダクト開発アンチパターンAi受託プロダクト開発アンチパターン
Ai受託プロダクト開発アンチパターン
 
20170624yamada
20170624yamada20170624yamada
20170624yamada
 
20170624 発表資料-ml
20170624 発表資料-ml20170624 発表資料-ml
20170624 発表資料-ml
 
20170624yamada
20170624yamada20170624yamada
20170624yamada
 
ぼくのかんがえたさいきょうの機械学習プロダクトの作り方
ぼくのかんがえたさいきょうの機械学習プロダクトの作り方ぼくのかんがえたさいきょうの機械学習プロダクトの作り方
ぼくのかんがえたさいきょうの機械学習プロダクトの作り方
 

第16回 ml15 三好

  • 1. 第16回 Machine Learning 15minutes! 「ちょっと今からデータサイエンティスト目指して きます」 株式会社データミックス 三好大悟 2017年9月30日
  • 2. Copyright 2017 DataMix Inc. All rights reserved. 今日伝えたいこと ● 自己紹介 ● 会社紹介 ● データサイエンティストと ? ● 実務で大変だったこと5選! アジェンダ 2
  • 3. Copyright 2017 DataMix Inc. All rights reserved. <名前> 三好大悟 <所属> 会社:株式会社データミックス 役職:データ分析コンサルタント <略歴> ● 慶應義塾大学理工学部 ● 慶應義塾大学大学院理工学研究科 <専攻> ● 金融工学(主にバイサイド側 研究:ポートフォリオ理論) ● Python、Rを主に使っています。 自己紹介|バックグラウンド 3
  • 4. Copyright 2017 DataMix Inc. All rights reserved. 自己紹介|正社員としてジョイン 4 みよっしー、今 インターンだけど、これからどうす ん ? どうしましょう?笑 データサイエンティストを目指したいんです けど! じゃあうちで働きなよ ^_^ あ、 い! 正社員になっちゃいました。
  • 5. Copyright 2017 DataMix Inc. All rights reserved. 5 データミックスってどんな会社!?
  • 6. Copyright 2017 DataMix Inc. All rights reserved. 会社紹介|データミックスについて <会社名> 株式会社データミックス(DATAMIX CO., LTD.) <設立> 2017年2月 <事業内容> ● ビッグデータ、人工知能、機械学習を じめとするデータ  サイエ ンスに関わる教育・研修事業 ● データサイエンティスト育成プログラム 運営 ● 有料職業紹介 ● ビッグデータ、人工知能、機械学習に関する法人向け研修 ● ビッグデータ、人工知能、機械学習に関するコンサルティング 6
  • 7. Copyright 2017 DataMix Inc. All rights reserved. 会社紹介|教育・研修事業 7 未経験からデータサイエ ンティストを育成 する よ! ゆるキャラ 「ミックス君」
  • 8. Copyright 2017 DataMix Inc. All rights reserved. 会社紹介|法人向け分析コンサルティング 8 企業 課題をデータ 分 析で解決するよ! ゆるキャラ 「ミックス君」
  • 9. Copyright 2017 DataMix Inc. All rights reserved. データサイエンティストと ? 9
  • 10. Copyright 2017 DataMix Inc. All rights reserved. ⇒ データ分析 専門家? ⇒ 数学者?科学者?機械学習エンジニア? 「データサイエンティスト」に明確な定義 ない… データサイエンティストと ?|弊社 定義 10 高度なデータ分析技術を用いてビジネス課題を解決する専門職 「データサイエンティストって一体どんな職業な ?」 弊社 定義するデータサイエンティスト 、
  • 11. Copyright 2017 DataMix Inc. All rights reserved. データサイエンティストと ?|イメージと現実 ギャップ 11 プログラミングや数学を解く かりで ない…! ? イメージ ? 現実
  • 12. Copyright 2017 DataMix Inc. All rights reserved. データサイエンティストと ?|データ分析プロジェクト 流れ 12 分析目的 明確化 データ 準備 分析 • 説明要因 洗い出し • データ収集 • データ蓄積 • クレンジング • 統合 1 2 3 主な実施項目 • データ抽出 • 可視化 • クラスタリング • 予測モデリング • モデル 性能評価 運用 ビジネス インパクト 評価 • A/Bテスト • バックテスト • What-If分析 4 5 主な実施項目 • ビジネスプロセスへ 組み込 み • PDCAサイクル 設計・運用 • ビジネス課題 再確認 • 分析 目的 • ターゲット KPI 合意 • アウトプット ビジネス課題を洗い出し、課題 解決 ためにデータを分析す る!
  • 13. Copyright 2017 DataMix Inc. All rights reserved. 実際にデータサイエンティストとして働いてみて 〜 大変だったこと、5選 〜 13
  • 14. Copyright 2017 DataMix Inc. All rights reserved. 14 ~ 実際に実務で応用できた事例 ~ (視聴)ログデータ JSONファイルを パースしてDB テーブルへ格納 (厳秘扱い) 大変だったこと①|ログデータを綺麗にテーブル化する 「研究で使ってたデータと全然違う。(´;ω;`)」 「説明書ない、定義書ない、ログ取れてないんじゃない?…」 「パース難しい、寝れない。(´・ω・`)」 ID
  • 15. Copyright 2017 DataMix Inc. All rights reserved. 「テーブルから如何にカスタマージャーニーを描き出すか?」 「ロジカルシンキングだ。」 「機械学習 やってくれない ? (´・ω・`)」 大変だったこと②|ロジカルシンキングによるデータ 解釈 15 ~ 実際に実務で応用できた事例 ~ (厳秘扱い) ID ど ように視聴 する か? 視聴ログデータ ど くらい ペースで  視聴する か? ちゃんと視聴したか?
  • 16. Copyright 2017 DataMix Inc. All rights reserved. 16 ~ 実際に実務で応用できた事例 ~ リッジ回帰やk-means に基いてクラスタリング (厳秘扱い) 大変だったこと③|アルゴリズム 使い所と組み合わせ 「各アルゴリズムやモデル自体 それほど難しいも ない」 「試行錯誤しながら、良さそうな組み合わせ技で勝負!」 「機械学習 やってくれない ? (´・ω・`)」
  • 17. Copyright 2017 DataMix Inc. All rights reserved. 裏付け ある モデリングにより クラスタリング をしました 大変だったこと④|スライドライティング、大切 17 りっじかいき? けーみーんず? ~ 実際に実務で応用できた事例 ~ 「顧客に対して、アルゴリズムを説明しても、何 意味もない」 「お客さんに分かりやすく、資料を作らないと…!」 「機械学習 やってくれない ? (´・ω・`)」 分析 結果、 ・オレンジ どんな人達? ・赤 どんな人達? ・黒 どんな人達? をうまく伝わるように説明 (厳秘扱い)
  • 18. Copyright 2017 DataMix Inc. All rights reserved. 大変だったこと⑤|初学者 疑問 18 弊社 導入している制度や新たなチャレンジ ・少人数ならで 、TA制や講義時間外で 質問チャット ・家庭教師風、個人レッスン制度 「なんで微分係数使うんですか?」 「中心極限定理って何ですか?」 「さぽーとべくたーましん?」 「エラーデバッグできません!」 「pythonエラーです。」 「Rがエラーです。」
  • 19. Copyright 2017 DataMix Inc. All rights reserved. データやモデルが してくれること 結論:データサイエンティスト 楽しい! 19 データサイエンティストって大変!だけど楽しい! 人がやらなきゃい けないこと
  • 20. Copyright 2017 DataMix Inc. All rights reserved. ご清聴ありがとうございました! 20