SlideShare a Scribd company logo
1 of 12
データサイエンティストの
憂鬱と退屈
@shoe116
今日の予定
1. 自己紹介
2. データサイエンティストの憂鬱
1. 顧客が本当に必要だったもの
2. 顧客と価値の進捗
3. 日本人と確率と統計
3. データサイエンティストの退屈
4. まとめ
1. 自己紹介
• なまえ:しゅう (@shoe116)
• お仕事:黄色いゾウさんと愉快な仲間たちのお世話
• これまで:広告システム→ データサイエンティスト屋
• 言語:Python, Java > JavaScript > Scala, C++
• 興味:No music, no life. No idol, no life.
• 課外活動:お歌を歌ったり、戯言を並べたり
• https://shoe116.tumblr.com/
ストレングスファインダー
@shoe116最上もがさん ニセモノの恋
2. データサイエンティストの憂鬱
1. 顧客が本当に必要だったもの
2. 価値の進捗の話
3. 日本人と確立と統計
データ分析を生業にする人」
2.1 顧客が本当に必要だったもの
2.1 顧客が本当に必要だったもの
- 要件定義は基本的に必ず失敗する
- できる限り手早く片付けて、致命的でない失敗をしたい
- データサイエンティストに与えられる「要件」
- 売上(もしくはそれに類するKPI)を上げたい
- PDCAサイクルを回したい
- データを見て何か提案して欲しい(最悪かつ最頻)
2.2 顧客と価値の進捗
「データ分析を生業にする人」
2.2 顧客と価値の進捗
-顧客は待たされるのが嫌い
-「速い」ことにはそれだけで価値がある
-お通し的な、とりあえずの価値を見せるのが困難
-「データ収集とデータ加工」がつらい
-家計簿、つけられますか?
-レシートをなくす、もらえない、数値がずれる
-家計簿をつけただけではお金はたまらない
2.3日本人は確率と統計に疎い
-完全に教育課程の問題
-普通の人にとって、ほとんどのサイコロの出る目は
「同様に確からしい」
-理系しかやらない、しかも高校後半まで習わない
-理系の学生ですら、センター試験で捨てて良い
-分析結果の説明が難しい
-ベン図が伝わったら相当ラッキー
-簡潔に言うと、数値の見方から説明するハメにな
る
3. データサイエンティストの退屈
-分析自体の価値を知ることは非常に困難
1. データ分析の価値 = 意思決定が生む価値
2. その意味で、データサイエンスは占いに近い
-データ分析が役立つ主なシーン
1. 自分じゃ答えを出せない、もしくは出したくない
2. 自分の判断の正しさを客観的に示したい
3. その意思決定が、それほど重大でない
4. まとめ
1. データサイエンティストが憂鬱なのも退屈なのも、
あなたのせいではないし、僕のせいでもない
2. 根本的な問題は、データサイエンティストのお仕事
内容と、たぶん日本の教育課程
3. みなさん、明日も頑張りましょう

More Related Content

Viewers also liked

データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性BrainPad Inc.
 
5年後のデータサイエンティスト
5年後のデータサイエンティスト5年後のデータサイエンティスト
5年後のデータサイエンティストDrecom Co., Ltd.
 
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探るTakashi J OZAKI
 
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測するTakashi J OZAKI
 
Base DDD(ドメイン駆動設計) 参考文献を巡る旅
Base DDD(ドメイン駆動設計) 参考文献を巡る旅Base DDD(ドメイン駆動設計) 参考文献を巡る旅
Base DDD(ドメイン駆動設計) 参考文献を巡る旅Takuya Kawabe
 
10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP
10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP
10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVPKazuhito Miura
 
さらば!データサイエンティスト
さらば!データサイエンティストさらば!データサイエンティスト
さらば!データサイエンティストShohei Hido
 
データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)Takashi J OZAKI
 
Python for R Users
Python for R UsersPython for R Users
Python for R UsersAjay Ohri
 
最新業界事情から見るデータサイエンティストの「実像」
最新業界事情から見るデータサイエンティストの「実像」最新業界事情から見るデータサイエンティストの「実像」
最新業界事情から見るデータサイエンティストの「実像」Takashi J OZAKI
 
統計学の基礎の基礎
統計学の基礎の基礎統計学の基礎の基礎
統計学の基礎の基礎Ken'ichi Matsui
 
20140727_第1回スポーツデータアナリティクス基礎講座
20140727_第1回スポーツデータアナリティクス基礎講座 20140727_第1回スポーツデータアナリティクス基礎講座
20140727_第1回スポーツデータアナリティクス基礎講座 Tomoshige Nakamura
 
動的最適化の今までとこれから
動的最適化の今までとこれから動的最適化の今までとこれから
動的最適化の今までとこれからKazuki Baba
 

Viewers also liked (15)

データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
 
5年後のデータサイエンティスト
5年後のデータサイエンティスト5年後のデータサイエンティスト
5年後のデータサイエンティスト
 
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
 
TDAの概要と適用・有用性
TDAの概要と適用・有用性TDAの概要と適用・有用性
TDAの概要と適用・有用性
 
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
 
Base DDD(ドメイン駆動設計) 参考文献を巡る旅
Base DDD(ドメイン駆動設計) 参考文献を巡る旅Base DDD(ドメイン駆動設計) 参考文献を巡る旅
Base DDD(ドメイン駆動設計) 参考文献を巡る旅
 
10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP
10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP
10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP
 
さらば!データサイエンティスト
さらば!データサイエンティストさらば!データサイエンティスト
さらば!データサイエンティスト
 
データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)
 
Stan超初心者入門
Stan超初心者入門Stan超初心者入門
Stan超初心者入門
 
Python for R Users
Python for R UsersPython for R Users
Python for R Users
 
最新業界事情から見るデータサイエンティストの「実像」
最新業界事情から見るデータサイエンティストの「実像」最新業界事情から見るデータサイエンティストの「実像」
最新業界事情から見るデータサイエンティストの「実像」
 
統計学の基礎の基礎
統計学の基礎の基礎統計学の基礎の基礎
統計学の基礎の基礎
 
20140727_第1回スポーツデータアナリティクス基礎講座
20140727_第1回スポーツデータアナリティクス基礎講座 20140727_第1回スポーツデータアナリティクス基礎講座
20140727_第1回スポーツデータアナリティクス基礎講座
 
動的最適化の今までとこれから
動的最適化の今までとこれから動的最適化の今までとこれから
動的最適化の今までとこれから
 

More from Shu (shoe116)

GCPでStreamなデータパイプライン作った
GCPでStreamなデータパイプライン作ったGCPでStreamなデータパイプライン作った
GCPでStreamなデータパイプライン作ったShu (shoe116)
 
DataProcessingInBuffettCode-20190213
DataProcessingInBuffettCode-20190213DataProcessingInBuffettCode-20190213
DataProcessingInBuffettCode-20190213Shu (shoe116)
 
オープンデータを利用した企業分析ツール"Buffett-Code"について
オープンデータを利用した企業分析ツール"Buffett-Code"についてオープンデータを利用した企業分析ツール"Buffett-Code"について
オープンデータを利用した企業分析ツール"Buffett-Code"についてShu (shoe116)
 
データ分析基盤の憂鬱と退屈
データ分析基盤の憂鬱と退屈データ分析基盤の憂鬱と退屈
データ分析基盤の憂鬱と退屈Shu (shoe116)
 
analists_rating_by_lda_hackday_201702
analists_rating_by_lda_hackday_201702analists_rating_by_lda_hackday_201702
analists_rating_by_lda_hackday_201702Shu (shoe116)
 
idoling_approval_desire
idoling_approval_desireidoling_approval_desire
idoling_approval_desireShu (shoe116)
 
tokyo_webmining_no51
tokyo_webmining_no51tokyo_webmining_no51
tokyo_webmining_no51Shu (shoe116)
 
エンジニアが日々何を考えているのか、ということ
エンジニアが日々何を考えているのか、ということエンジニアが日々何を考えているのか、ということ
エンジニアが日々何を考えているのか、ということShu (shoe116)
 

More from Shu (shoe116) (9)

GCPでStreamなデータパイプライン作った
GCPでStreamなデータパイプライン作ったGCPでStreamなデータパイプライン作った
GCPでStreamなデータパイプライン作った
 
DataProcessingInBuffettCode-20190213
DataProcessingInBuffettCode-20190213DataProcessingInBuffettCode-20190213
DataProcessingInBuffettCode-20190213
 
オープンデータを利用した企業分析ツール"Buffett-Code"について
オープンデータを利用した企業分析ツール"Buffett-Code"についてオープンデータを利用した企業分析ツール"Buffett-Code"について
オープンデータを利用した企業分析ツール"Buffett-Code"について
 
データ分析基盤の憂鬱と退屈
データ分析基盤の憂鬱と退屈データ分析基盤の憂鬱と退屈
データ分析基盤の憂鬱と退屈
 
analists_rating_by_lda_hackday_201702
analists_rating_by_lda_hackday_201702analists_rating_by_lda_hackday_201702
analists_rating_by_lda_hackday_201702
 
idoling_approval_desire
idoling_approval_desireidoling_approval_desire
idoling_approval_desire
 
tokyo_webmining_no51
tokyo_webmining_no51tokyo_webmining_no51
tokyo_webmining_no51
 
Hadoop Ops & Fabric
Hadoop Ops & FabricHadoop Ops & Fabric
Hadoop Ops & Fabric
 
エンジニアが日々何を考えているのか、ということ
エンジニアが日々何を考えているのか、ということエンジニアが日々何を考えているのか、ということ
エンジニアが日々何を考えているのか、ということ
 

データサイエンティストの憂鬱と退屈