CyberAgent, Inc.
21世紀で最もセクシーな職業!?
「データサイエンティスト」の実像に迫る
株式会社サイバーエージェント
アメーバ事業本部 デカグラフ事業部
マーケティンググループ データサイエンティスト
尾崎 隆 (Takashi J. OZAKI, Ph.D.)
一応、自己紹介を…
尾崎 隆 (Takashi J. OZAKI, Ph.D.)
– “J”に深い意味はありません
– 学者だった頃に同業界にT. Ozakiさんがいたので
– と思ってJをつけたら、別業界にT. J. Ozakiさんが…
1CyberAgent, Inc.2013/05/21
一応、自己紹介を…
 前職は「脳科学者」(認知神経科学者)でした
2CyberAgent, Inc.2013/05/21
一応、自己紹介を…
 こういうキャリアをたどっております
– 1997~2001 東京大学工学部計数工学科(※情報工学系)
– 2001~2006 東京大学大学院・新領域創成科学研究科
修士&博士課程(脳科学)
– 2006~2011 理化学研究所脳科学総合研究センター
研究員(脳科学)
– 2011~2012 東京大学教養学部・特任研究員(心理学)
– 2012年4月 慶應義塾大学医学部・特任助教(産学連携)
※30代のうちにポスドク問題を乗り切る
ことは事実上不可能と判断して、キャリア
チェンジに打って出ることを決心
– 2012年6月 サイバーエージェント入社
3CyberAgent, Inc.2013/05/21
一応、自己紹介を…
 こういうことをしていました
– 2003~2006 機能的MRIを用いたヒト脳研究
(有力なノーベル賞候補として知られ、
機能的MRIを発明した小川誠二先生の
研究所にて研修生として共同研究して
いました)
– 2006~2011 脳信号に対する計量時系列
分析を用いたネットワーク解析
– 2011~2012 脳信号に対するネットワーク
解析+SVMを用いた脳活動
分類
4CyberAgent, Inc.2013/05/21
一応、自己紹介を…
 現在は…
5CyberAgent, Inc.2013/05/21
テニス選手です(実業団リーグ代表選手)
一応、自己紹介を…
 現在は…
6CyberAgent, Inc.2013/05/21
ブログ&Twitterやってます
余談
7CyberAgent, Inc.2013/05/21
道玄坂で働くデータサイエンティストのブログ
http://tjo.hatenablog.com/
一応、自己紹介を…
 現在は…
8CyberAgent, Inc.2013/05/21
「スマホでアメーバ」でお馴染み、
スマートフォン向けAmebaプラットフォーム上を回遊する
ユーザー行動分析を担当するデータサイエンティスト
9CyberAgent, Inc.2013/05/21
ところで、
「データサイエンティスト」についての記事、
もうだいぶ前から世間では溢れ返ってますよね。
例えば
 データサイエンティストとは何か
 データサイエンティストのつくり方
 データサイエンティストのつかい方
 データサイエンティストと「分析力」
 データサイエンティストの育成について
 データサイエンティストのスキルセット
 データサイエンティストとビッグデータ
 データサイエンティストの要件とは
 データサイエンティストはどんな企業にいるのか
…などなど挙げればキリがないですね
10CyberAgent, Inc.2013/05/21
11CyberAgent, Inc.2013/05/21
ということで、
今日は「実際のデータ分析の現場から見た」
データサイエンティストの実像についてお話します。
本日のお品書き
 「データサイエンティスト」とはどんな職業?
 「データサイエンティスト」にはどうすればなれるのか?
 サイバーエージェントでの事例
 Facebookが考えるデータサイエンティストの定義
12CyberAgent, Inc.2013/05/21
本日のお品書き
13CyberAgent, Inc.2013/05/21
データサイエンティスト マネージャー
うおおおおおお たのんだよー うおおおおおお
うおおおおおお Yes! Comeoooon!!
※PFI比戸様より承諾を頂いております
本日のお品書き
 「データサイエンティスト」とはどんな職業?
 「データサイエンティスト」にはどうすればなれるのか?
 サイバーエージェントでの事例
 Facebookが考えるデータサイエンティストの定義
14CyberAgent, Inc.2013/05/21
本日のお品書き
15CyberAgent, Inc.2013/05/21
データサイエンティスト マネージャー
うおおおおおお たのんだよー うおおおおおお
うおおおおおお Yes! Comeoooon!!
※PFI比戸様より承諾を頂いております
データサイエンティストとは?
16CyberAgent, Inc.2013/05/21
データサイエンティスト マネージャー
ランダムフォレストの結果から言うとAですね
棒グラフにして時期別にしてみました
分かりました、プレゼンやるので任せて下さい!
どれくらい違うか分かりやすい図にできる?
アプリA, B, C, どれが一番新規UUにウケてる?
他にも色々言えることありそうだね、
統括会議で話してくれる?
※データサイエンティストの日常風景
データサイエンティストとは?
17CyberAgent, Inc.2013/05/21
データサイエンティスト
“Data Scientist: The Sexiest Job of the 21st Century”
- Thomas H. Davenport and D.J. Patil, HBR Oct, 2012
「データサイエンティストは21世紀で最もセクシーな職業」
大変有名な売り文句
データサイエンティストとは?
18CyberAgent, Inc.2013/05/21
データサイエンティスト
データマイニング
アナリティクス・レポーティング
コンサルティング・マーケティング
中でも重要な3つの要件と言われるのが…
データサイエンティストとは?
 「スーパーマン」説(HBRなど)
– コンサルタントorマーケッター
– アナリストorレポーティング
スペシャリスト
– データマイニングスペシャリスト
…を、「同時に兼ねる」
 そんなスーパーマンどこにいるの?
…いたら誰も苦労しない
19CyberAgent, Inc.2013/05/21
データサイエンティスト
へ?スーパーマン?
データサイエンティストとは?
20CyberAgent, Inc.2013/05/21
優秀なデータ・サイエンティストは稀少なので、獲得競争
が熾烈で、離職を食い止めるのも難しい。金銭面の報酬だ
けでなく、自由度のある職務環境を用意し、意思決定者と
データをつなぐ「かけ橋」となって価値あるものをつくり
上げたいというニーズに応え、やりがいのある課題を与え
ることが重要である
データサイエンティスト
ニヤリ
データサイエンティストとは?
 「三位一体」説
(ブレインパッド社草野社長、佐藤氏)
– スーパーマンなんて無理
– 3つの役割を例えば3人で分担
– チームで揃えば「1つの完成したデー
タサイエンティスト像になる」
21CyberAgent, Inc.2013/05/21
データサイエンティスト
・・・三位一体!
データサイエンティストとは?
22CyberAgent, Inc.2013/05/21
データマイニング
スペシャリスト
分析ィィィィィ
アナリストor
レポーティングスペシャリスト
レポートォォォォォ
コンサルタントor
マーケッター
コンサルゥゥゥゥゥ
データサイエンス・チーム
データサイエンティストとは?
23CyberAgent, Inc.2013/05/21
データコンサルファームなら可能かもしれないけど、
データサイエンス業務・部門を立ち上げたばかりの
会社ではそうはいかないかもしれない。
データサイエンティストとは?
24CyberAgent, Inc.2013/05/21
データマイニング
スペシャリスト候補
アナリストorレポーティング
スペシャリスト候補
コンサルタントor
マーケッター候補
マネージャー
・・・・・。
あのさぁ、チームごとにわざわざ
3人も雇ってる余裕なんて、うちの
会社にはないんだけど?
・・・・・。
・・・・・。
※こういうことになりやすい
データサイエンティストとは?
25CyberAgent, Inc.2013/05/21
データサイエンス業務・部門を立ち上げたばかりの
会社ではある程度3つとも出来る人が必要。
データサイエンティストとは?
26CyberAgent, Inc.2013/05/21
データサイエンティスト
ドヤァァァァァッ!
データマイニング
スペシャリスト
コンサルタントor
マーケッター
アナリストor
レポーティング
スペシャリスト
シャキィィィン
※これはこれで難しい
データサイエンティストとは?
27CyberAgent, Inc.2013/05/21
データマイニング
スペシャリスト系
アナリストorレポーティング
スペシャリスト系
コンサルタントor
マーケッター系
※他もそこそこできるけれども、
基本的には一分野のエキスパート
データサイエンティストとは?
28CyberAgent, Inc.2013/05/21
データマイニング
スペシャリスト系
アナリストorレポーティング
スペシャリスト系
コンサルタントor
マーケッター系
ゼロは基本的にはNG
(特にビジネス能力)
× × ○
データサイエンティストとは?
29CyberAgent, Inc.2013/05/21
データサイエンティスト
完璧なデータサイエンティストにこだわる必要は
ないが、3つの構成要件が「最低でも一通り揃って
いる」ことにはこだわるべき
そして、「実際のビジネスにコミットできる」こ
とが不可欠(後でまた詳しく)
本日のお品書き
 「データサイエンティスト」とはどんな職業?
 「データサイエンティスト」にはどうすればなれるのか?
 サイバーエージェントでの事例
 Facebookが考えるデータサイエンティストの定義
30CyberAgent, Inc.2013/05/21
本日のお品書き
31CyberAgent, Inc.2013/05/21
データサイエンティスト マネージャー
うおおおおおお たのんだよー うおおおおおお
うおおおおおお Yes! Comeoooon!!
※PFI比戸様より承諾を頂いております
データサイエンティストになるには?
32CyberAgent, Inc.2013/05/21
今後は、データ・サイエンティストを養成する大学が増え
てくると思われるが、それを待たずに、いまから積極的に
確保していかないと、情報化社会では致命的な遅れにつな
がるおそれがあるデータサイエンティスト
!
データサイエンティストになるには?
33CyberAgent, Inc.2013/05/21
データサイエンティストを育成する方法論は、
今のところ日本ではどこにもない(企業にも大学にも)
データサイエンティストになるには?
34CyberAgent, Inc.2013/05/21
崖から親に落とされ、這い登って
強くなる獅子の子の如く…
自らの力で道なき道を切り拓き、
データサイエンティストになる
ことを目指すしかない!
余談
35CyberAgent, Inc.2013/05/21
※野生のライオンでもちゃんと
親が助けに下りていくそうです
データサイエンティストになるには?
36CyberAgent, Inc.2013/05/21
データサイエンティストにはどんな人が向いている?
データサイエンティストになるには?
37CyberAgent, Inc.2013/05/21
データサイエンティスト
1. データサイエンティストは「科学者」、
よって「科学者になれる人」が大前提
- そもそも”scientist”という語が付いている
- 名前の通り、科学的方法に従ってデータを扱い、
ビジネスに貢献できる人材であることが期待され
ている
- 「科学者」でなければ、おそらくありふれた普通
のコンサルタント・マーケッター・アナリストと
同じになってしまう
データサイエンティストになるには?
38CyberAgent, Inc.2013/05/21
データサイエンティスト
2. 文系理系は関係ない
- 要は科学的方法に従ってデータを扱い、ビジネスに
貢献できる人材であることが重要であり、文系理系
どちらの出身でも問題ない
- ただし、文系分野なら計量経済学や計量社会学・実
験心理学などの統計学の素養のある人の方がおそら
く無難かもしれない
データサイエンティストになるには?
39CyberAgent, Inc.2013/05/21
データサイエンティスト
3. 自分の「主観」よりも、データの「客観」を
優先できる人であること
- そもそも科学的方法に従ってデータを扱い、
ビジネスに貢献することが求められている
- もし、自分の主観に合わないデータだと思って、
勝手に改竄・捏造したら…?
- 万一それが経営に直結するような大事な施策を決
めるような代物だったら、会社が傾いて沢山の同
僚を路頭に迷わせかねない!
- データサイエンティストの仕事はデータの「客
観」を扱うことであり、自分の「主観」を持ち込
むことではない
データサイエンティストになるには?
40CyberAgent, Inc.2013/05/21
データサイエンティストにはどうやってなれば良い?
データサイエンティストになるには?
41CyberAgent, Inc.2013/05/21
データサイエンティスト
A1. ビジネス部門の人は…まず最初に
マーケッター・アナリスト・コンサルタ
ントのいずれかを目指す
- 先に挙げた定義から言えば、これらはデータ
サイエンティストの要件の一部
- ならば、それらの職務に就いてから科学的方
法をマスターすればデータサイエンティスト
に近付けるはず
※有名なデータサイエンティストの方々で言うと…
工藤卓哉氏(アクセンチュア)、草野隆史氏(ブレインパッド社長)、
佐藤洋行氏(ブレインパッド)、井澤正志氏(gloops)
データサイエンティストになるには?
42CyberAgent, Inc.2013/05/21
データサイエンティスト
A2. エンジニア部門の人は…まず最初に
DBエンジニア・データマイニングエンジ
ニアのいずれかを目指す
- 先に挙げた定義から言えば、これらはデータ
サイエンティストの要件の一部
- ならば、それらの職務に就いてから科学的方
法をマスターすればデータサイエンティスト
に近付けるはず
※有名なデータサイエンティストの方々で言うと…
中林紀彦氏(日本IBM)、比戸将平氏(日本IBM→PFI)
データサイエンティストになるには?
43CyberAgent, Inc.2013/05/21
データサイエンティスト
A3. 初めから特殊な人材を探す
- 計算機科学・機械学習・データマイニング及び
定量的研究の研究経験があるスペシャリスト
- 往々にして博士だったり「ポスドク」だった
り
- 稀に大学教員から転じる人もいる
- 初めから科学的方法をマスター済みの人材!
- ただし、そういう人々は大抵の場合企業への
就業経験ゼロなのでそれ相応のビハインドが
あるということを、採用する方はもちろん、当の
本人も自覚する必要がある
※有名なデータサイエンティストの方々で言うと…
浜田晃一氏(DeNA)、倉橋一成氏(iAnalysis)
データサイエンティストになるには?
44CyberAgent, Inc.2013/05/21
データサイエンティスト
B. まずDB基盤技術を覚える
- 嫌でもDB操作はどこかで必要になる
- SQL, Hadoop, Oracle…
- 実際のDB基盤を管理者権限ナシで触り始める
ところからいけると理想的
- ただし、これが受け容れられるにはDBエンジ
ニア or 専門的なマーケッター・コンサルタ
ントなどのポジションでないとキツいかも
(だからA1の大前提が重要になってくる)
データサイエンティストになるには?
45CyberAgent, Inc.2013/05/21
データサイエンティスト
C. データマイニングをマスターする
- データマイニングの研究者のように、自力で
アルゴリズムを全て書き下せるとかいうレベ
ルまでいく必要はない
- 大事なことは「ツールとライブラリ・パッ
ケージさえあれば使いこなせる」レベルであ
ること
- できれば「個々のアルゴリズムの原理の違
い」を知識だけでも良いので知っておくべき
データサイエンティストになるには?
46CyberAgent, Inc.2013/05/21
データサイエンティスト
D. 実際のビジネスの現場に、まずは見習いから
でも入って「ビジネスへの貢献の仕方」を身に
付けていく
- 実際のビジネスにコミットしてこその、データ
サイエンティストたるもの!
- 実際にKPIなどのデータを計測・集計・分析してみ
る
- 現実のデータに触れ、自分たちのアクションに
連動して何が変わり、社会の変化に連動して
何が動き、全てとは無関係に人々の行動が
どう推移していくかを、自分の目で見て経験値
として貯めていく
マネージャー
データサイエンティストになるには?
47CyberAgent, Inc.2013/05/21
データサイエンティスト
1. 「科学者になれる」人材であること
(文系理系不問)
2. データという「客観」を優先できること
3. 予めデータサイエンティストの3要件のうち1
つを満たしていることが望ましい
4. DB基盤技術をマスターする
5. データマイニングのツール利用ができるレベ
ルになる
6. 実際のビジネスにコミットできるように
経験を積む
本日のお品書き
 「データサイエンティスト」とはどんな職業?
 「データサイエンティスト」にはどうすればなれるのか?
 サイバーエージェントでの事例
 Facebookが考えるデータサイエンティストの定義
48CyberAgent, Inc.2013/05/21
本日のお品書き
49CyberAgent, Inc.2013/05/21
データサイエンティスト マネージャー
うおおおおおお たのんだよー うおおおおおお
うおおおおおお Yes! Comeoooon!!
※PFI比戸様より承諾を頂いております
サイバーエージェントでの事例
50CyberAgent, Inc.2013/05/21
データサイエンティスト マネージャー
ランダムフォレストetc.の結果から言うとAですね
棒グラフにして時期別にしてみました
分かりました、資料を用意していきますね!
どれくらい違うか分かりやすい図にできます?
アプリA, B, C, どれが一番新規UUにウケてます?
他にも色々言えることありそうですね、
戦略マーケMTGで話してくれます?
※尾崎の日常風景をだいたい反映しています
サイバーエージェントでの事例
51CyberAgent, Inc.2013/05/21
実際には何をやっているのか?
サイバーエージェントでの事例
52CyberAgent, Inc.2013/05/21
データサイエンティスト
(尾崎) 戦略マーケ会議
データサイエンティスト
(尾崎)
うおおおおおお
数値の共有
検証すべき仮説の設定
分析ゴールの決定
最適な分析手法の選定
仮説を検証した結果の可視化
レポート作成&口頭で報告
このKPIの
貢献度は…
今月の数字
なんだけど…
サイバーエージェントでの事例
53CyberAgent, Inc.2013/05/21
データサイエンティスト
(尾崎)
データ分析環境
- データマイニング
- R, Python, Matlab
- DB基盤
- Hadoop + Hive
データマイニング手法
- 機械学習
- 決定木、ロジスティック回帰、SVM、ラン
ダムフォレスト、アソシエーション分析、
グラフィカルモデルetc.
- 計量時系列分析
- ARIMA、VAR、VECM、SETAR、マルコフ転換
モデルetc.
サイバーエージェントでの事例
54CyberAgent, Inc.2013/05/21
ちなみに、どんなデータマイニングを
やっているのか?
サイバーエージェントでの事例
55CyberAgent, Inc.2013/05/21
ユーザーID ゲーム1 ゲーム2 ゲーム3 SNS 1 SNS 2 PF 1 PF 2 定着or離脱
1001 1 0 1 1 1 1 1 定着
1002 1 0 0 0 0 0 1 離脱
1003 1 0 1 1 0 0 0 離脱
1004 1 1 0 1 1 1 0 定着
... ... ... ... ... ... ... ... ...
ユーザーID+素性(そせい)ベクトル+分類ラベル
ユーザー行動ログをHiveで取ってきて、
前処理をかけて以下のように直す。
サイバーエージェントでの事例
56CyberAgent, Inc.2013/05/21
ユーザーID ゲーム1 ゲーム2 ゲーム3 SNS 1 SNS 2 PF 1 PF 2 定着or離脱
1001 1 0 1 1 1 1 1 定着
素性=学習データ 正解
ラベル
教師あり機械学習で
1)分類&貢献度の高い指標の特定
2)未来データの予測
などの高度な分析が可能!
(※ロジスティック回帰、ランダムフォレス
トなど)
サイバーエージェントでの事例
57CyberAgent, Inc.2013/05/21
サイバーエージェントでの事例
58CyberAgent, Inc.2013/05/21
ヘビー定着
ライト定着
即離脱
アソシエーション分析
+
グラフィカルモデルで可視化
プラットフォーム上での
行動パターン
サイバーエージェントでの事例
他にも、
 Ameba Technology Laboratory
 ゲーム部門・セントラルデータコンサルティング室
 コミュニティ部門・データコンサルティンググループ
 広告部門・ディスプレイ(広告)戦略局
などにデータサイエンティストが在籍し、活躍しております
59CyberAgent, Inc.2013/05/21
本日のお品書き
 「データサイエンティスト」とはどんな職業?
 「データサイエンティスト」にはどうすればなれるのか?
 サイバーエージェントでの事例
 Facebookが考えるデータサイエンティストの定義
60CyberAgent, Inc.2013/05/21
本日のお品書き
61CyberAgent, Inc.2013/05/21
データサイエンティスト マネージャー
うおおおおおお たのんだよー うおおおおおお
うおおおおおお Yes! Comeoooon!!
※PFI比戸様より承諾を頂いております
Facebookのデータサイエンティスト
62CyberAgent, Inc.2013/05/21
一説には、「データサイエンティスト」
という職名を考案したのは
とも言われている
Facebookのデータサイエンティスト
63CyberAgent, Inc.2013/05/21
Facebookのデータサイエンティスト
64CyberAgent, Inc.2013/05/21
Data Scientist
ミッション
- エンジニアサイドの製品開発チームとの
コラボレーション
- 統計分析による課題発見&ソリューション
- 得られた知見のマネージャーやエンジニアへの共
有
- 新規データ収集&既存のデータソースの改良
- A/Bテストなどの結果の分析と解釈
- データ測定&実験手法のベストプラクティスを開
発&エンジニア部門への共有
Sounds sexy?
Facebookのデータサイエンティスト
65CyberAgent, Inc.2013/05/21
Data Scientist
要件
- 関連分野での理系修士号・博士号or関連分野での4年以
上の実務経験
- 定量的アプローチに基づく分析的問題の解決に取り組ん
だ経験
- 非構造データの扱いに習熟
- データに基づくソリューション開発への強い熱意
- コミュニケーション能力
- スキルセット
- PythonもしくはPHPなどのスクリプト言語
- RDBSおよびSQL
- R, Matlab, SASなどの分析ツール
- 大規模データセットや分散処理システムを用いた就
業経験があること(MapReduce, Hadoop, Hive,
etc.)
Sounds sexy?
Facebookのデータサイエンティスト
66CyberAgent, Inc.2013/05/21
Facebookは実は
「データサイエンスの研究者」
も募集しています。
Facebookのデータサイエンティスト
67CyberAgent, Inc.2013/05/21
Facebookのデータサイエンティスト
68CyberAgent, Inc.2013/05/21
Data Scientist
ミッション
- Facebookのデータ資産を育てる:直接のユーザーからの
フィードバックを集めるインフラを拡張する、ユーザー
のPC / スマートフォン / タブレット上における行動
データを測定する、など
- データ分析の枠組みを計画する:Facebookの成長と社会
への関与を広げるために、我々のデータ資産をどの領域
に対して用いるべきかを突き止める
- 問題解決にコミットする:履歴データ(自ら実験するor
必要に
応じて取得方法を模索する)を用いて、ユーザー行動
の・・・
- 因果関係を推定し
- ノイズからシグナルを抽出し
- そのシグナルが何か&そのノイズが何かを説明し
- そのシグナル&ノイズを予測し、
- ともあれ正確で定量的な理解を得て、Facebookという企
業が何を最優先にして取り組むべきかを定義する
Sounds cool?
Facebookのデータサイエンティスト
69CyberAgent, Inc.2013/05/21
Data Scientist
要件
- 定量的研究分野(統計学・コンピューターサイエンス・数
学
・工学・機械学習など)における修士号もしくは博士号、
ないし当該分野での4年以上の職務経験
- R / SAS / Matlab, UNIX, スクリプト言語を用いた
データ操作と分析に習熟していること
- 応用的な(理論的ではない)定量的研究への関心と経験
- 有意義でインパクトのある問題を、解決するのみならず
提案できる能力
- 複雑なデータ分析とその結果をいかなる相手にも伝えられ
る
コミュニケーション能力
- 1TB以上の巨大データセットを扱った経験
Sounds cool?
Facebookのデータサイエンティスト
70CyberAgent, Inc.2013/05/21
Data Scientist
データサイエンティストの「元祖」
Facebookでも、やはり重視されるのは
- データマイニング
- アナリティクス&レポーティング
- コンサルティングorマーケティング
そして「データを科学する」姿勢!
最後に
71CyberAgent, Inc.2013/05/21
データサイエンティスト
データサイエンティストの皆さん、
ともに頑張りましょう!
そしてまだデータサイエンティス
トではないと(ご自分では)考え
ておられる皆さん、今からデータ
サイエンティストになっちゃいま
しょう!

21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る