Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

データにまつわるWeb業界の仕事について

3,659 views

Published on

阿南高専にて 2015/12/22

Published in: Technology

データにまつわるWeb業界の仕事について

  1. 1. CyberAgent, Inc. データにまつわる Web業界の仕事に ついて 株式会社 サイバーエージェント 技術本部 秋葉原ラボ 高野雅典 1 2015/12/22 阿南高専
  2. 2. CyberAgent, Inc. おことわり •  最初に45分ぐらい話して、その後 15分ぐらい 質問タイムを取ります。質問は大歓迎ですの でよろしくお願いします。 •  主にWeb業界のデータ分析について話します。 別の業界については全く異なる可能性があり ます。 •  また、サイバーエージェント以外の別のWeb 系企業さんでは、事情が異なる場合が十分 にありうるので注意してください。 •  このスライドは後でh7ps://www.slideshare.net にアップロードします 2
  3. 3. CyberAgent, Inc. 会社紹介 3 •  インターネット広告事業 •  ゲーム事業 •  メディア事業 •  その他
  4. 4. CyberAgent, Inc. 自己紹介 •  高野雅典 – データマイニングエンジニア @ CyberAgent – 博士(情報科学) •  普段の仕事 – ソーシャルゲーム・SNS・プラットフォームの分析 – 分析システムの設計・開発 – データ分析に関わる研究開発 •  得意/興味のある領域 – 複雑系科学・計算社会科学・進化心理学 – 統計モデリング・R・機械学習 – 可視化・JavaScript •  Twi$er: @mtknnktm 4
  5. 5. CyberAgent, Inc. 経歴 – 興味と所属の推移 プログラミング・遺伝的アルゴリズム – 会津大学 コンピュータ理工学部 複雑系・人工生命・進化・ヒトの社会性 – 名古屋大学大学院情報科学研究科(修士・博士) システム開発・コンサルティング – システムインテグレータ – システムエンジニア Webサービス・フロントエンド・ユーザインターフェース – ㈱サイバーエージェント – フロントエンドエンジニア データマイニング・Webサービス・計算社会科学 – ㈱サイバーエージェント – データマイニングエンジニア 5 イマココ
  6. 6. CyberAgent, Inc. 今日話すこと •  ビッグデータ •  データサイエンティスト •  Webサービスのデータ分析 •  データ分析の面白み •  データ分析を仕事にするには 6
  7. 7. CyberAgent, Inc. ビッグデータ 7
  8. 8. CyberAgent, Inc. ビッグデータ •  最近のブーム以前から、データ分析によるビジネス 貢献(リスク定量化・効率化等)はたくさんあった – 幅広い科学・業種で統計分析技術が使用されている –  経済を予測したり、薬の効果を検証したり、機械の故障を予測 したり、天気を予測したり、マーケットの現状を把握したり •  近年、インターネットの普及やデータ処理基盤の進 歩により大量のデータを取得・処理可能に – それによって、いろいろ良いことが有ったので、 ビッグデータという言葉が大きなブームに •  ビッグデータの特徴を現す3つのV – 高ボリューム、高速度、高バラエティ 8
  9. 9. CyberAgent, Inc. ビッグデータ •  ビッグデータの例 – 人の行動ログ(多くの人や物のデータ) •  Amazon, Google, SNS, ソシャゲ, 携帯電話, ネット広告, IoT, etc. – センサデータ(ミリ秒単位の詳細データ) •  自動車, ロボット, IoT, 気象データ, etc. – これまで個別管理されていたデータも統合によりビッグ データに? •  病院のカルテデータ統合の試み –  h7p://www.slideshare.net/naomikawashima52/medical-bigdatameetup2 •  大規模データ処理基盤の例 –  Hadoop, Spark, BigQuery, RedshiT, etc. –  サイバーエージェントもHadoopを中心とした大規模データ処理基 盤を構築し、データ活用に利用 –  発表スライド: h7p://www.slideshare.net/cyberagent/cloudera-world-tokyo-2013 9
  10. 10. CyberAgent, Inc. ビッグデータでうれしいこと – 機械学習 •  機械学習 –  学習データとして入力と出力(正解)の組を与え、その規則を学 習させる。未知の入力に対して出力を予測する(教師あり学習) •  例: Amazonの購入履歴 → 次に買いそうな商品 –  データを突っ込むと、その特徴から似たようなものを分類すること ができる(教師なし学習) •  例: 似た画像の分類 •  ビッグデータの恩恵 – データが少ない •  単純な(パラメータの少ない)モデルじゃないとうまくいかない → 単純な規則しか学習できない – データが多い •  複雑な(パラメータの多い)モデルでもうまくいく(ことがある) → 複雑な規則も学習できる(こともある)。 → これによってものすごく高精度になることも。ビッグデータ万歳。 参考資料:ビッグデータを活かす機械学習技術 h7p://www.n7.co.jp/journal/1304/files/jn201304031.pdf 10
  11. 11. CyberAgent, Inc. データ サイエンティスト 11
  12. 12. CyberAgent, Inc. データサイエンティストとは •  (企業だと)データをなんとかしてうまいことする人 のこと – 定義はけっこう曖昧 –  会社によっては、アナリスト、データマイニングエンジニア、データコンサル タント、データアーキテクト、ビッグデータエンジニアとか言ったりする(微妙 に意味も違ったりする) •  以下のいずれか(or 複数)をやっていることが多い – データから得られた知見をビジネスに活かす – データを統計分析して知見を得る – 機械学習を使った予測や推薦をするアルゴリズムの 開発、システムの構築・運用 – 大規模データ処理基盤を構築・運用 12
  13. 13. CyberAgent, Inc. データ分析の スキル概観 13
  14. 14. CyberAgent, Inc. データにまつわる技術の概観 – だいたいこんな感じ? 14 機械学習統計分析 大規模 データ処理 ビジネス 広告 小売 人材 ※各領域の境界は結構曖昧 メディア ゲーム 医療 自動車 インフラ
  15. 15. CyberAgent, Inc. サイバーエージェントでやっている範囲 15 機械学習統計分析 大規模 データ処理 ビジネス 広告 小売 人材 ※各領域の境界は結構曖昧 メディア ゲーム 医療 自動車 インフラ
  16. 16. CyberAgent, Inc. 各技術とサービスの関連(サイバーエージェントの場合) 16
  17. 17. CyberAgent, Inc. 高野の業務範囲 17 機械学習統計分析 大規模 データ処理 ビジネス 広告 小売 人材 ※各領域の境界は結構曖昧 メディア ゲーム 医療 自動車 インフラ だいたい このへん
  18. 18. CyberAgent, Inc. Webサービスの データ分析 18
  19. 19. CyberAgent, Inc. Webサービスとは •  インターネット(アプリ含む)上のサービスのこと – Google, Amazon, Facebook, Twi7er, ブログ, スマートフォンゲーム, LINEなど – アメーバブログ, アメーバピグ, ガールフレンド(仮/♪), AWA, 755などなど ※ この意味でのWebサービスは実は誤用だが割と広く通じるので気にしないことにする 19
  20. 20. CyberAgent, Inc. Webサービスとデータ分析 •  ユーザの行動ログという形で簡単にデータが取れる •  サービス改善の反映スピードが早い → データ分析がしやすい、データ分析の結果が 活かしやすいビジネス形態 20 サービスの サーバ 大規模データ 処理基盤 ユーザ アクセスして サービスを利用 行動ログの 収集
  21. 21. CyberAgent, Inc. ゲーム運営サイクル 21 サービス運営 チーム Hadoopクラスタ BIツール: Hawkeye データマイニング チーム マーケティング チーム アドホック分析 経営層 Shiny 分析基盤 チーム コンサル チーム 仮説 立案 分析 提案 施策 実装 検証
  22. 22. CyberAgent, Inc. ゲーム運営サイクル – 検証 22 サービス運営 • 売上目標の達成はできそうか? •  売上や主要なKPI(DAU/顧客単価/課金率) は想定通りか? • 今の状態は健全か? •  ヘビーユーザ数は増えているか? •  課金率や顧客単価が高すぎ/低すぎではな いか? 仮説 立案 分析 提案 施策 実装 検証 • 目標達成・健全性に課題はあるならばどこか? •  どんな層のユーザのどの指標が課題か? KPIビューア 日々の各KPI観測 コンサル
  23. 23. CyberAgent, Inc. コンサル ゲーム運営サイクル – 仮説立案 23 サービス運営 • 課題の原因は何か? • チュートリアルや説明がわかりにくい? • ギルド・コミュニティが機能してない? • イベントが難しすぎた/簡単すぎたから? • お得情報の訴求が不十分? 仮説 立案 分析 提案 施策 実装 検証 KPIビューア 様々な指標のチェック データマイニング エンジニア 仮説 課題 ヒアリング 要件・課題整理
  24. 24. CyberAgent, Inc. ゲーム運営サイクル – 分析 24 • 課題・仮説は正しいか? • 目的変数・説明変数の設計・分析 • 仮説が正しいのであれば、どうやったら改善で きるか? • 操作可能な説明変数はあるか? 仮説 立案 分析 提案 施策 実装 検証 データマイニング エンジニア アドホックで柔軟なデータ抽出 Let’s データマイニング!
  25. 25. CyberAgent, Inc. ゲーム運営サイクル – 提案・施策実装 25 • 提案は妥当か? • サービスを知り尽くしている運営として分析 と施策提案は納得できるものか? (提案施策の結果に責任持てるか?) • 実現可能な施策か? 仮説 立案 分析 提案 施策 実装 検証 コンサル データマイニング エンジニア サービス運営 • 施策の実現方法・実装の計画・設計をして、実 装、リリース! レポート 計画・設計ついて 相談 リリース
  26. 26. CyberAgent, Inc. ゲーム運営サイクルの例 26 •  ギルドで協力して課題をクリアすることがコアのゲーム •  ユーザはチュートリアル完了時に必ずどこかのギルドに 所属する 分析対象のサービス ※: 今回の例と画像は関係ありません
  27. 27. CyberAgent, Inc. ゲーム運営サイクルの例 27 検証・課題発見 DAUが増え ないなぁ… 継続率が あまり良く ないぞ 特に新規ユーザの 継続率がよくない サービス運営 日々の各KPI観測 コンサル KPIビューア 仮説 立案 分析 提案 施策 実装 検証
  28. 28. CyberAgent, Inc. ゲーム運営サイクルの例 28 仮説立案 仮説 立案 分析 提案 施策 実装 検証 コンサル サービス運営 KPIビューア 様々な指標のチェック データマイニング エンジニア 新規ユーザがギルド の機能、あまり使っ てない? せっかくギルドに入っ ても楽しめなかった人 がやめちゃってる?
  29. 29. CyberAgent, Inc. ゲーム運営サイクルの例 29 分析 仮説 立案 分析 提案 施策 実装 検証 データマイニン グエンジニア 新規加入したギルド の属性で新規ユーザ の継続・離脱が分類 できるハズ 目的変数: 新規ユーザの継続・離脱 説明変数: ギルドの属性値 で分類器(決定木)を作成 • ギルドのアクティブメンバー数がある一定以上 • ギルドメンバーが強すぎない というギルドに加入したユーザが継続していた
  30. 30. CyberAgent, Inc. ゲーム運営サイクルの例 30 提案・施策実装 仮説 立案 分析 提案 施策 実装 検証 コンサル データマイニング エンジニア サービス運営 レポート 計画・設計ついて 相談 アクティブ かつ 強すぎないギルドほど 推薦リストの上に来るようにしましょう 長期的にはN人以上が アクティブなギルドを増 やせるような推薦ロジッ クをしたいですね → 次の分析へ
  31. 31. CyberAgent, Inc. まとめ •  Webサービスの運営は – サービス運営チーム (企画者・エンジニア・デザイナーなど) – データ分析者 が – 目的・目標・課題を共有し、 – 分析・提案・実装・検証・仮説立案をし続ける ことでサービスの品質を向上させていく •  データ分析者は、サービスの ビジネスモデル・運営方針・ユーザ感情 についてよく理解することが大事 31
  32. 32. CyberAgent, Inc. データ分析の 面白いところ 32
  33. 33. CyberAgent, Inc. 面白いこと・楽しいこと •  お客様(ユーザ)の満足度に貢献 – 関わっているサービスに関して、SNSとかでユー ザが盛り上がっていたり、数値(継続率とか)に現 れたりすると嬉しい •  分析結果は "サービスの方針決定" という重 要な部分に大きな影響を与えうる •  データから知見を探索・発見をするというプロ セスが楽しい •  新しい技術・手法を勉強したり、開発したり、 使ったりするのが楽しい •  ヒトの行動に関して大量のデータが得られる 33
  34. 34. CyberAgent, Inc. データ分析関連の 仕事をするには (Web業界で) 34
  35. 35. CyberAgent, Inc. 正直良く わからない… Web業界自体が若い上に、データ分析が流行ったのも最 近なので、様々な経歴を持っている人が、様々な立ち位 置でデータ分析に関わっている ※ 高野は元々サービスの開発者でしたが、いろいろ偶然が有ってデータ分析に 関わることになりました(やりたかったことなのでとても幸運に恵まれた思います) 35
  36. 36. CyberAgent, Inc. とりあえずデータ分析関連の求人はある様子 36 ※ サイバーエージェントの中途採用のページ から抜粋。 ※ サイバーエージェントの新卒採用はビジネ スコース(営業とか)とテクノロジー・デザイン コース(システム技術者・デザイナとか)の2種 類。データ分析系の仕事はどちらにも存在。
  37. 37. CyberAgent, Inc. なので重要そうなことをご紹介 •  データ分析したい対象 –  データ分析技術だけでなく対象(弊社だとゲームとかSNSとか広告とか)につい て深く知っていることが大事 –  ビジネスモデル、お客さんの気持ち、マーケット、歴史など •  基礎学力 –  データ分析だけでなく多くの科学者・技術者にとって、 線形代数、微積分、英語は何をやるにしてもついてまわる •  なんでも良いので何か一つ専門性 –  直接仕事に役立てばとても幸せ –  そうでなくても "解決すべき問題を発見し、解決までの道筋を立て、試行錯誤を 繰り返し、解決に至る能力" は身につく (どんな仕事をする上でも超重要!!) –  知識体系を身に付けることは未知の事に関する勉強・理解の仕方も身につく ※ データ分析系同僚の専門も生物学・経済学・脳科学・数学・情報工学など様々 •  何かを作ることができると便利(プログラミングとか) –  何かをやりたい時に作って人に見せることができる –  構想だけでは本人も他人もよくわからない事が多い 37
  38. 38. CyberAgent, Inc. ご清聴あり がとうござ いました 38
  39. 39. CyberAgent, Inc. 参考書籍 39
  40. 40. CyberAgent, Inc. ビッグデータの正体 - 情報の産業革命が世界のすべてを変える •  ビッグデータによって世界の何が 変わるか? について解説した本。 •  わかりやすいので全体像を知りた い人にオススメ •  URL: h7p://www.amazon.co.jp/dp/4062180618 40
  41. 41. CyberAgent, Inc. データサイエンティスト養成読本 ビッグデータ時代のビジネスを支えるデータ分析力が身につく •  まずは手を動かしていろいろ分析 してみる時に最適。オススメ。 •  URL: h7p://www.amazon.co.jp/dp/4774158968 41
  42. 42. CyberAgent, Inc. 会社を変える分析の力 •  データ分析者の仕事の仕方につ いて。心構えなど。 •  高度な技術で分析するだけでなく、 どのようにしたら会社にインパクト を与えるような仕事ができるか? •  著者は大阪ガス勤務 •  URL: h7p://www.amazon.co.jp/dp/4062882183 42

×