Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る

46,602 views

Published on

第4回サイバーエージェントMarketing & Analytics勉強会 http://atnd.org/event/camark04 の講演スライドです。未だにslideshareの使い方が分からなくて、アップロードしたら勝手にフォントが明朝体に変わってしまったり位置がずれてしまったり右側が切れてしまったり。。。表示がおかしかったりダサかったりするのはそのせいです。ごめんなさい。

Published in: Business
  • Be the first to comment

21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る

  1. 1. CyberAgent, Inc.21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る株式会社サイバーエージェントアメーバ事業本部 デカグラフ事業部マーケティンググループ データサイエンティスト尾崎 隆 (Takashi J. OZAKI, Ph.D.)
  2. 2. 一応、自己紹介を…尾崎 隆 (Takashi J. OZAKI, Ph.D.)– “J”に深い意味はありません– 学者だった頃に同業界にT. Ozakiさんがいたので– と思ってJをつけたら、別業界にT. J. Ozakiさんが…1CyberAgent, Inc.2013/05/21
  3. 3. 一応、自己紹介を… 前職は「脳科学者」(認知神経科学者)でした2CyberAgent, Inc.2013/05/21
  4. 4. 一応、自己紹介を… こういうキャリアをたどっております– 1997~2001 東京大学工学部計数工学科(※情報工学系)– 2001~2006 東京大学大学院・新領域創成科学研究科修士&博士課程(脳科学)– 2006~2011 理化学研究所脳科学総合研究センター研究員(脳科学)– 2011~2012 東京大学教養学部・特任研究員(心理学)– 2012年4月 慶應義塾大学医学部・特任助教(産学連携)※30代のうちにポスドク問題を乗り切ることは事実上不可能と判断して、キャリアチェンジに打って出ることを決心– 2012年6月 サイバーエージェント入社3CyberAgent, Inc.2013/05/21
  5. 5. 一応、自己紹介を… こういうことをしていました– 2003~2006 機能的MRIを用いたヒト脳研究(有力なノーベル賞候補として知られ、機能的MRIを発明した小川誠二先生の研究所にて研修生として共同研究していました)– 2006~2011 脳信号に対する計量時系列分析を用いたネットワーク解析– 2011~2012 脳信号に対するネットワーク解析+SVMを用いた脳活動分類4CyberAgent, Inc.2013/05/21
  6. 6. 一応、自己紹介を… 現在は…5CyberAgent, Inc.2013/05/21テニス選手です(実業団リーグ代表選手)
  7. 7. 一応、自己紹介を… 現在は…6CyberAgent, Inc.2013/05/21ブログ&Twitterやってます
  8. 8. 余談7CyberAgent, Inc.2013/05/21道玄坂で働くデータサイエンティストのブログhttp://tjo.hatenablog.com/
  9. 9. 一応、自己紹介を… 現在は…8CyberAgent, Inc.2013/05/21「スマホでアメーバ」でお馴染み、スマートフォン向けAmebaプラットフォーム上を回遊するユーザー行動分析を担当するデータサイエンティスト
  10. 10. 9CyberAgent, Inc.2013/05/21ところで、「データサイエンティスト」についての記事、もうだいぶ前から世間では溢れ返ってますよね。
  11. 11. 例えば データサイエンティストとは何か データサイエンティストのつくり方 データサイエンティストのつかい方 データサイエンティストと「分析力」 データサイエンティストの育成について データサイエンティストのスキルセット データサイエンティストとビッグデータ データサイエンティストの要件とは データサイエンティストはどんな企業にいるのか…などなど挙げればキリがないですね10CyberAgent, Inc.2013/05/21
  12. 12. 11CyberAgent, Inc.2013/05/21ということで、今日は「実際のデータ分析の現場から見た」データサイエンティストの実像についてお話します。
  13. 13. 本日のお品書き 「データサイエンティスト」とはどんな職業? 「データサイエンティスト」にはどうすればなれるのか? サイバーエージェントでの事例 Facebookが考えるデータサイエンティストの定義12CyberAgent, Inc.2013/05/21
  14. 14. 本日のお品書き13CyberAgent, Inc.2013/05/21データサイエンティスト マネージャーうおおおおおお たのんだよー うおおおおおおうおおおおおお Yes! Comeoooon!!※PFI比戸様より承諾を頂いております
  15. 15. 本日のお品書き 「データサイエンティスト」とはどんな職業? 「データサイエンティスト」にはどうすればなれるのか? サイバーエージェントでの事例 Facebookが考えるデータサイエンティストの定義14CyberAgent, Inc.2013/05/21
  16. 16. 本日のお品書き15CyberAgent, Inc.2013/05/21データサイエンティスト マネージャーうおおおおおお たのんだよー うおおおおおおうおおおおおお Yes! Comeoooon!!※PFI比戸様より承諾を頂いております
  17. 17. データサイエンティストとは?16CyberAgent, Inc.2013/05/21データサイエンティスト マネージャーランダムフォレストの結果から言うとAですね棒グラフにして時期別にしてみました分かりました、プレゼンやるので任せて下さい!どれくらい違うか分かりやすい図にできる?アプリA, B, C, どれが一番新規UUにウケてる?他にも色々言えることありそうだね、統括会議で話してくれる?※データサイエンティストの日常風景
  18. 18. データサイエンティストとは?17CyberAgent, Inc.2013/05/21データサイエンティスト“Data Scientist: The Sexiest Job of the 21st Century”- Thomas H. Davenport and D.J. Patil, HBR Oct, 2012「データサイエンティストは21世紀で最もセクシーな職業」大変有名な売り文句
  19. 19. データサイエンティストとは?18CyberAgent, Inc.2013/05/21データサイエンティストデータマイニングアナリティクス・レポーティングコンサルティング・マーケティング中でも重要な3つの要件と言われるのが…
  20. 20. データサイエンティストとは? 「スーパーマン」説(HBRなど)– コンサルタントorマーケッター– アナリストorレポーティングスペシャリスト– データマイニングスペシャリスト…を、「同時に兼ねる」 そんなスーパーマンどこにいるの?…いたら誰も苦労しない19CyberAgent, Inc.2013/05/21データサイエンティストへ?スーパーマン?
  21. 21. データサイエンティストとは?20CyberAgent, Inc.2013/05/21優秀なデータ・サイエンティストは稀少なので、獲得競争が熾烈で、離職を食い止めるのも難しい。金銭面の報酬だけでなく、自由度のある職務環境を用意し、意思決定者とデータをつなぐ「かけ橋」となって価値あるものをつくり上げたいというニーズに応え、やりがいのある課題を与えることが重要であるデータサイエンティストニヤリ
  22. 22. データサイエンティストとは? 「三位一体」説(ブレインパッド社草野社長、佐藤氏)– スーパーマンなんて無理– 3つの役割を例えば3人で分担– チームで揃えば「1つの完成したデータサイエンティスト像になる」21CyberAgent, Inc.2013/05/21データサイエンティスト・・・三位一体!
  23. 23. データサイエンティストとは?22CyberAgent, Inc.2013/05/21データマイニングスペシャリスト分析ィィィィィアナリストorレポーティングスペシャリストレポートォォォォォコンサルタントorマーケッターコンサルゥゥゥゥゥデータサイエンス・チーム
  24. 24. データサイエンティストとは?23CyberAgent, Inc.2013/05/21データコンサルファームなら可能かもしれないけど、データサイエンス業務・部門を立ち上げたばかりの会社ではそうはいかないかもしれない。
  25. 25. データサイエンティストとは?24CyberAgent, Inc.2013/05/21データマイニングスペシャリスト候補アナリストorレポーティングスペシャリスト候補コンサルタントorマーケッター候補マネージャー・・・・・。あのさぁ、チームごとにわざわざ3人も雇ってる余裕なんて、うちの会社にはないんだけど?・・・・・。・・・・・。※こういうことになりやすい
  26. 26. データサイエンティストとは?25CyberAgent, Inc.2013/05/21データサイエンス業務・部門を立ち上げたばかりの会社ではある程度3つとも出来る人が必要。
  27. 27. データサイエンティストとは?26CyberAgent, Inc.2013/05/21データサイエンティストドヤァァァァァッ!データマイニングスペシャリストコンサルタントorマーケッターアナリストorレポーティングスペシャリストシャキィィィン※これはこれで難しい
  28. 28. データサイエンティストとは?27CyberAgent, Inc.2013/05/21データマイニングスペシャリスト系アナリストorレポーティングスペシャリスト系コンサルタントorマーケッター系※他もそこそこできるけれども、基本的には一分野のエキスパート
  29. 29. データサイエンティストとは?28CyberAgent, Inc.2013/05/21データマイニングスペシャリスト系アナリストorレポーティングスペシャリスト系コンサルタントorマーケッター系ゼロは基本的にはNG(特にビジネス能力)× × ○
  30. 30. データサイエンティストとは?29CyberAgent, Inc.2013/05/21データサイエンティスト完璧なデータサイエンティストにこだわる必要はないが、3つの構成要件が「最低でも一通り揃っている」ことにはこだわるべきそして、「実際のビジネスにコミットできる」ことが不可欠(後でまた詳しく)
  31. 31. 本日のお品書き 「データサイエンティスト」とはどんな職業? 「データサイエンティスト」にはどうすればなれるのか? サイバーエージェントでの事例 Facebookが考えるデータサイエンティストの定義30CyberAgent, Inc.2013/05/21
  32. 32. 本日のお品書き31CyberAgent, Inc.2013/05/21データサイエンティスト マネージャーうおおおおおお たのんだよー うおおおおおおうおおおおおお Yes! Comeoooon!!※PFI比戸様より承諾を頂いております
  33. 33. データサイエンティストになるには?32CyberAgent, Inc.2013/05/21今後は、データ・サイエンティストを養成する大学が増えてくると思われるが、それを待たずに、いまから積極的に確保していかないと、情報化社会では致命的な遅れにつながるおそれがあるデータサイエンティスト!
  34. 34. データサイエンティストになるには?33CyberAgent, Inc.2013/05/21データサイエンティストを育成する方法論は、今のところ日本ではどこにもない(企業にも大学にも)
  35. 35. データサイエンティストになるには?34CyberAgent, Inc.2013/05/21崖から親に落とされ、這い登って強くなる獅子の子の如く…自らの力で道なき道を切り拓き、データサイエンティストになることを目指すしかない!
  36. 36. 余談35CyberAgent, Inc.2013/05/21※野生のライオンでもちゃんと親が助けに下りていくそうです
  37. 37. データサイエンティストになるには?36CyberAgent, Inc.2013/05/21データサイエンティストにはどんな人が向いている?
  38. 38. データサイエンティストになるには?37CyberAgent, Inc.2013/05/21データサイエンティスト1. データサイエンティストは「科学者」、よって「科学者になれる人」が大前提- そもそも”scientist”という語が付いている- 名前の通り、科学的方法に従ってデータを扱い、ビジネスに貢献できる人材であることが期待されている- 「科学者」でなければ、おそらくありふれた普通のコンサルタント・マーケッター・アナリストと同じになってしまう
  39. 39. データサイエンティストになるには?38CyberAgent, Inc.2013/05/21データサイエンティスト2. 文系理系は関係ない- 要は科学的方法に従ってデータを扱い、ビジネスに貢献できる人材であることが重要であり、文系理系どちらの出身でも問題ない- ただし、文系分野なら計量経済学や計量社会学・実験心理学などの統計学の素養のある人の方がおそらく無難かもしれない
  40. 40. データサイエンティストになるには?39CyberAgent, Inc.2013/05/21データサイエンティスト3. 自分の「主観」よりも、データの「客観」を優先できる人であること- そもそも科学的方法に従ってデータを扱い、ビジネスに貢献することが求められている- もし、自分の主観に合わないデータだと思って、勝手に改竄・捏造したら…?- 万一それが経営に直結するような大事な施策を決めるような代物だったら、会社が傾いて沢山の同僚を路頭に迷わせかねない!- データサイエンティストの仕事はデータの「客観」を扱うことであり、自分の「主観」を持ち込むことではない
  41. 41. データサイエンティストになるには?40CyberAgent, Inc.2013/05/21データサイエンティストにはどうやってなれば良い?
  42. 42. データサイエンティストになるには?41CyberAgent, Inc.2013/05/21データサイエンティストA1. ビジネス部門の人は…まず最初にマーケッター・アナリスト・コンサルタントのいずれかを目指す- 先に挙げた定義から言えば、これらはデータサイエンティストの要件の一部- ならば、それらの職務に就いてから科学的方法をマスターすればデータサイエンティストに近付けるはず※有名なデータサイエンティストの方々で言うと…工藤卓哉氏(アクセンチュア)、草野隆史氏(ブレインパッド社長)、佐藤洋行氏(ブレインパッド)、井澤正志氏(gloops)
  43. 43. データサイエンティストになるには?42CyberAgent, Inc.2013/05/21データサイエンティストA2. エンジニア部門の人は…まず最初にDBエンジニア・データマイニングエンジニアのいずれかを目指す- 先に挙げた定義から言えば、これらはデータサイエンティストの要件の一部- ならば、それらの職務に就いてから科学的方法をマスターすればデータサイエンティストに近付けるはず※有名なデータサイエンティストの方々で言うと…中林紀彦氏(日本IBM)、比戸将平氏(日本IBM→PFI)
  44. 44. データサイエンティストになるには?43CyberAgent, Inc.2013/05/21データサイエンティストA3. 初めから特殊な人材を探す- 計算機科学・機械学習・データマイニング及び定量的研究の研究経験があるスペシャリスト- 往々にして博士だったり「ポスドク」だったり- 稀に大学教員から転じる人もいる- 初めから科学的方法をマスター済みの人材!- ただし、そういう人々は大抵の場合企業への就業経験ゼロなのでそれ相応のビハインドがあるということを、採用する方はもちろん、当の本人も自覚する必要がある※有名なデータサイエンティストの方々で言うと…浜田晃一氏(DeNA)、倉橋一成氏(iAnalysis)
  45. 45. データサイエンティストになるには?44CyberAgent, Inc.2013/05/21データサイエンティストB. まずDB基盤技術を覚える- 嫌でもDB操作はどこかで必要になる- SQL, Hadoop, Oracle…- 実際のDB基盤を管理者権限ナシで触り始めるところからいけると理想的- ただし、これが受け容れられるにはDBエンジニア or 専門的なマーケッター・コンサルタントなどのポジションでないとキツいかも(だからA1の大前提が重要になってくる)
  46. 46. データサイエンティストになるには?45CyberAgent, Inc.2013/05/21データサイエンティストC. データマイニングをマスターする- データマイニングの研究者のように、自力でアルゴリズムを全て書き下せるとかいうレベルまでいく必要はない- 大事なことは「ツールとライブラリ・パッケージさえあれば使いこなせる」レベルであること- できれば「個々のアルゴリズムの原理の違い」を知識だけでも良いので知っておくべき
  47. 47. データサイエンティストになるには?46CyberAgent, Inc.2013/05/21データサイエンティストD. 実際のビジネスの現場に、まずは見習いからでも入って「ビジネスへの貢献の仕方」を身に付けていく- 実際のビジネスにコミットしてこその、データサイエンティストたるもの!- 実際にKPIなどのデータを計測・集計・分析してみる- 現実のデータに触れ、自分たちのアクションに連動して何が変わり、社会の変化に連動して何が動き、全てとは無関係に人々の行動がどう推移していくかを、自分の目で見て経験値として貯めていくマネージャー
  48. 48. データサイエンティストになるには?47CyberAgent, Inc.2013/05/21データサイエンティスト1. 「科学者になれる」人材であること(文系理系不問)2. データという「客観」を優先できること3. 予めデータサイエンティストの3要件のうち1つを満たしていることが望ましい4. DB基盤技術をマスターする5. データマイニングのツール利用ができるレベルになる6. 実際のビジネスにコミットできるように経験を積む
  49. 49. 本日のお品書き 「データサイエンティスト」とはどんな職業? 「データサイエンティスト」にはどうすればなれるのか? サイバーエージェントでの事例 Facebookが考えるデータサイエンティストの定義48CyberAgent, Inc.2013/05/21
  50. 50. 本日のお品書き49CyberAgent, Inc.2013/05/21データサイエンティスト マネージャーうおおおおおお たのんだよー うおおおおおおうおおおおおお Yes! Comeoooon!!※PFI比戸様より承諾を頂いております
  51. 51. サイバーエージェントでの事例50CyberAgent, Inc.2013/05/21データサイエンティスト マネージャーランダムフォレストetc.の結果から言うとAですね棒グラフにして時期別にしてみました分かりました、資料を用意していきますね!どれくらい違うか分かりやすい図にできます?アプリA, B, C, どれが一番新規UUにウケてます?他にも色々言えることありそうですね、戦略マーケMTGで話してくれます?※尾崎の日常風景をだいたい反映しています
  52. 52. サイバーエージェントでの事例51CyberAgent, Inc.2013/05/21実際には何をやっているのか?
  53. 53. サイバーエージェントでの事例52CyberAgent, Inc.2013/05/21データサイエンティスト(尾崎) 戦略マーケ会議データサイエンティスト(尾崎)うおおおおおお数値の共有検証すべき仮説の設定分析ゴールの決定最適な分析手法の選定仮説を検証した結果の可視化レポート作成&口頭で報告このKPIの貢献度は…今月の数字なんだけど…
  54. 54. サイバーエージェントでの事例53CyberAgent, Inc.2013/05/21データサイエンティスト(尾崎)データ分析環境- データマイニング- R, Python, Matlab- DB基盤- Hadoop + Hiveデータマイニング手法- 機械学習- 決定木、ロジスティック回帰、SVM、ランダムフォレスト、アソシエーション分析、グラフィカルモデルetc.- 計量時系列分析- ARIMA、VAR、VECM、SETAR、マルコフ転換モデルetc.
  55. 55. サイバーエージェントでの事例54CyberAgent, Inc.2013/05/21ちなみに、どんなデータマイニングをやっているのか?
  56. 56. サイバーエージェントでの事例55CyberAgent, Inc.2013/05/21ユーザーID ゲーム1 ゲーム2 ゲーム3 SNS 1 SNS 2 PF 1 PF 2 定着or離脱1001 1 0 1 1 1 1 1 定着1002 1 0 0 0 0 0 1 離脱1003 1 0 1 1 0 0 0 離脱1004 1 1 0 1 1 1 0 定着... ... ... ... ... ... ... ... ...ユーザーID+素性(そせい)ベクトル+分類ラベルユーザー行動ログをHiveで取ってきて、前処理をかけて以下のように直す。
  57. 57. サイバーエージェントでの事例56CyberAgent, Inc.2013/05/21ユーザーID ゲーム1 ゲーム2 ゲーム3 SNS 1 SNS 2 PF 1 PF 2 定着or離脱1001 1 0 1 1 1 1 1 定着素性=学習データ 正解ラベル教師あり機械学習で1)分類&貢献度の高い指標の特定2)未来データの予測などの高度な分析が可能!(※ロジスティック回帰、ランダムフォレストなど)
  58. 58. サイバーエージェントでの事例57CyberAgent, Inc.2013/05/21
  59. 59. サイバーエージェントでの事例58CyberAgent, Inc.2013/05/21ヘビー定着ライト定着即離脱アソシエーション分析+グラフィカルモデルで可視化プラットフォーム上での行動パターン
  60. 60. サイバーエージェントでの事例他にも、 Ameba Technology Laboratory ゲーム部門・セントラルデータコンサルティング室 コミュニティ部門・データコンサルティンググループ 広告部門・ディスプレイ(広告)戦略局などにデータサイエンティストが在籍し、活躍しております59CyberAgent, Inc.2013/05/21
  61. 61. 本日のお品書き 「データサイエンティスト」とはどんな職業? 「データサイエンティスト」にはどうすればなれるのか? サイバーエージェントでの事例 Facebookが考えるデータサイエンティストの定義60CyberAgent, Inc.2013/05/21
  62. 62. 本日のお品書き61CyberAgent, Inc.2013/05/21データサイエンティスト マネージャーうおおおおおお たのんだよー うおおおおおおうおおおおおお Yes! Comeoooon!!※PFI比戸様より承諾を頂いております
  63. 63. Facebookのデータサイエンティスト62CyberAgent, Inc.2013/05/21一説には、「データサイエンティスト」という職名を考案したのはとも言われている
  64. 64. Facebookのデータサイエンティスト63CyberAgent, Inc.2013/05/21
  65. 65. Facebookのデータサイエンティスト64CyberAgent, Inc.2013/05/21Data Scientistミッション- エンジニアサイドの製品開発チームとのコラボレーション- 統計分析による課題発見&ソリューション- 得られた知見のマネージャーやエンジニアへの共有- 新規データ収集&既存のデータソースの改良- A/Bテストなどの結果の分析と解釈- データ測定&実験手法のベストプラクティスを開発&エンジニア部門への共有Sounds sexy?
  66. 66. Facebookのデータサイエンティスト65CyberAgent, Inc.2013/05/21Data Scientist要件- 関連分野での理系修士号・博士号or関連分野での4年以上の実務経験- 定量的アプローチに基づく分析的問題の解決に取り組んだ経験- 非構造データの扱いに習熟- データに基づくソリューション開発への強い熱意- コミュニケーション能力- スキルセット- PythonもしくはPHPなどのスクリプト言語- RDBSおよびSQL- R, Matlab, SASなどの分析ツール- 大規模データセットや分散処理システムを用いた就業経験があること(MapReduce, Hadoop, Hive,etc.)Sounds sexy?
  67. 67. Facebookのデータサイエンティスト66CyberAgent, Inc.2013/05/21Facebookは実は「データサイエンスの研究者」も募集しています。
  68. 68. Facebookのデータサイエンティスト67CyberAgent, Inc.2013/05/21
  69. 69. Facebookのデータサイエンティスト68CyberAgent, Inc.2013/05/21Data Scientistミッション- Facebookのデータ資産を育てる:直接のユーザーからのフィードバックを集めるインフラを拡張する、ユーザーのPC / スマートフォン / タブレット上における行動データを測定する、など- データ分析の枠組みを計画する:Facebookの成長と社会への関与を広げるために、我々のデータ資産をどの領域に対して用いるべきかを突き止める- 問題解決にコミットする:履歴データ(自ら実験するor必要に応じて取得方法を模索する)を用いて、ユーザー行動の・・・- 因果関係を推定し- ノイズからシグナルを抽出し- そのシグナルが何か&そのノイズが何かを説明し- そのシグナル&ノイズを予測し、- ともあれ正確で定量的な理解を得て、Facebookという企業が何を最優先にして取り組むべきかを定義するSounds cool?
  70. 70. Facebookのデータサイエンティスト69CyberAgent, Inc.2013/05/21Data Scientist要件- 定量的研究分野(統計学・コンピューターサイエンス・数学・工学・機械学習など)における修士号もしくは博士号、ないし当該分野での4年以上の職務経験- R / SAS / Matlab, UNIX, スクリプト言語を用いたデータ操作と分析に習熟していること- 応用的な(理論的ではない)定量的研究への関心と経験- 有意義でインパクトのある問題を、解決するのみならず提案できる能力- 複雑なデータ分析とその結果をいかなる相手にも伝えられるコミュニケーション能力- 1TB以上の巨大データセットを扱った経験Sounds cool?
  71. 71. Facebookのデータサイエンティスト70CyberAgent, Inc.2013/05/21Data Scientistデータサイエンティストの「元祖」Facebookでも、やはり重視されるのは- データマイニング- アナリティクス&レポーティング- コンサルティングorマーケティングそして「データを科学する」姿勢!
  72. 72. 最後に71CyberAgent, Inc.2013/05/21データサイエンティストデータサイエンティストの皆さん、ともに頑張りましょう!そしてまだデータサイエンティストではないと(ご自分では)考えておられる皆さん、今からデータサイエンティストになっちゃいましょう!

×