デブサミ関西2013 「ソーシャルゲームのデータサイエンス」
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share

デブサミ関西2013 「ソーシャルゲームのデータサイエンス」

  • 2,536 views
Uploaded on

デブサミ関西 セッションB3 ...

デブサミ関西 セッションB3
「ソーシャルゲームのデータサイエンス」

More in: Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
2,536
On Slideshare
2,499
From Embeds
37
Number of Embeds
2

Actions

Shares
Downloads
24
Comments
0
Likes
10

Embeds 37

https://twitter.com 27
https://www.google.co.jp 10

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Summit Developers Developers Summit 2013 Kansai Action ! ソ ー シ ャ ル ゲ ー ム の デ ー タ サ イ エ ン ス 越智修司 KLab株式会社 ビジネスデベロップメント部 マーケティンググループ #kansumiB3 B3
  • 2. Summit Developers #kansumiB3 自己紹介 •越智 修司(神戸市在住) •ビジネスデベロップメント部 マーケティンググループ所属 •エンジニア・プログラマ • Felica/Edy,ガラケサイト,銀行アプリ,きせかえ • アプリ・サービスのプロトタイピング • 有名アーティスト・アイドルのファンクラブアプリ開発 • iOSアプリ開発(プライベートで継続中) • python,Rなど @ponpoko1968
  • 3. Summit Developers #kansumiB3 作ったもの 「クリップリーダー」  電子書籍リーダー • 自炊PDFに特化 • evernote連携 • 段組書籍 「勤怠くん」 勤怠メールを素早く送信 iPhone版 (無料) iPad版 (85円) 「SweetHome」 • 「帰る」メールをジオフ ェンス技術で自動送信 「あとも」 • PM2.5アプリ
  • 4. Summit Developers #kansumiB3 はじめに • データ分析重要らしい • 何から手をつけて良いかわからない • 体制は? • 技術選定は? 我々がおかれた条件と過程を中 心に説明します。
  • 5. Summit Developers #kansumiB3 KLab • 2000年設立(筆者は9年目) • 入社時は100名強→669名 • 歴史 • 携帯アプリ • モバイルサイト+プロダクト • ソーシャルゲーム ← イマココ
  • 6. Summit Developers #kansumiB3 大阪事業所もあります
  • 7. Summit Developers #kansumiB3 43サイト(分析対象 分) 数千万PV/日/タイトル KLabのソーシャルゲーム 2年で13サイト増加
  • 8. Summit Developers #kansumiB3 組織 技術 データ
  • 9. Summit Developers #kansumiB3 組織
  • 10. Summit Developers #kansumiB3 経緯 • ボトムアップ的に発達 • レポートWebが必要 • もっと詳細な分析の必要 • 技術者が自発的に開発を始めた • 平行して企画者によるKPIチームが発足 • 統合
  • 11. Summit Developers #kansumiB3 分析チーム • 約10名 • 技術者チーム(2名は大阪勤務) • 分析インフラ構築 • 新規案件対応 • 自動化 • KPI分析チーム • 運営チームのコンサル • 社内案件の傾向分析 • コンテンツ間のノウハウ共有
  • 12. Summit Developers #kansumiB3 データサイエンティスト ITスキル プログラミング データベース ビジネススキル マーケティング 統計学 データマイニング 機械学習
  • 13. Summit Developers #kansumiB3 バックグラウンド • 統計学の経験あり • モバイルサイト・ソ ーシャルゲームの開 発経験 • ECサイトのマーケテ ィング経験 • モバイルサイトのデ ィレクター 技術者チーム KPI分析チーム
  • 14. Summit Developers #kansumiB3 現状: ヒューリスティックス >サイエンス
  • 15. Summit Developers #kansumiB3 ミッション定義 • 自社コンテンツの価値向上 • おもしろさ/遊びやすさ • + 継続性 • = 収益性 • まずは定量的な状況・傾向を把握すべし
  • 16. Summit Developers #kansumiB3 現在のステータス データ分析をやっているチームがあるら しいが直接役に立つイメージでもない ゲームの数字について知りたいとおもっ たら、分析チームに依頼すれば何かしら 出してくれるようだ アウトプットを継続
  • 17. Summit Developers #kansumiB3 技術
  • 18. Summit Developers #kansumiB3 データ分析基盤(1) 分析システムコンテンツ側システム S3 Log Log MySQL Log Sales 0100100100 0111001100 1110111110 11111111 0100100100 0111001100 1110111110 11111111 EMR! RDS Log Sales
  • 19. Summit Developers #kansumiB3 データ分析基盤(2) • 基盤部分はほぼ内製 • AWS上に構築 • データウェアハウス(原データの保管所) • S3 • データ集計 • EC2 • データマート(集計済みデータ、一次加工後のデータ保管所) • RDS(MySQL) → redshift • ビッグデータ解析 • EMR(elastic map reduce) • ログ解析など
  • 20. Summit Developers #kansumiB3 使用言語は?
  • 21. Summit Developers #kansumiB3 Python Python使っている方は?
  • 22. Summit Developers #kansumiB3 Why Python? • 保守性 • 習得の容易さ • 速度 • 汎用言語の中では最も統計処理が得意 • 詳しい人が社内にいる(重要) • 気が向いたらコードを添削してプルリクエスト してくれるなど
  • 23. Summit Developers #kansumiB3 データ分析と言えば、 Rなんじゃない?
  • 24. Summit Developers #kansumiB3 Python vs. R • Pythonの利点 • 汎用言語であるため統計以外のソフトウェア資産も豊富 • AWS関連 • 単一の言語で完結できる • 保守性 • Rの利点 • 可視化処理 • アドホックなデータ操作 • 探索的データ解析に適している KPIの発見・検討には、RやSPSSも使って います あくまで組織のおかれた状況次第ってと ころはあります。 Rに詳しい人がいて、Rの欠点を補えると 判断できればRの方が良いかも。
  • 25. Summit Developers #kansumiB3 Pythonライブラリ • S3操作 • boto • mapreduce/hadoop • mrjob • numpy • pandas • R風のデータ操作・加工
  • 26. Summit Developers #kansumiB3 まずはデータ収集 • 自社サイトからのデータ収集 • ETL • Extraction • Translation • Loading
  • 27. Summit Developers #kansumiB3 分析システムコンテンツ側システム S3 Log Log MySQL Log Sales 0100100100 0111001100 1110111110 11111111 0100100100 0111001100 1110111110 11111111 EMR! RDS Log Sales ETL ETL処理
  • 28. Summit Developers #kansumiB3 ETL • アクセスログ解析 • DAUの抽出 • iOS/androidのシェア分布 • 地域・国の分布 • ゲーム用RDBからのデータ抽出 • レベル・アイテム所持状況など、刻々変わるもののスナッ プショットを取る • ゲーム共通なデータ抽出はライブラリ化して分析チームが担当 かつてはゲーム開発チームが担当。 スキーマ設計やフレームワークなども各 チームで試行錯誤しているため、 案件毎に前回の反省を踏まえ改良が入 る。 差異を吸収するのが結構大変
  • 29. Summit Developers #kansumiB3 チーム発足当時、すでに10数 サイト ↓ とても面倒 急速に成長したため、システム が乱立 同工異曲ではない カオスな状態に
  • 30. Summit Developers #kansumiB3 ETL • ゲームシステムの理解 • ヒアリング • 事前準備・交渉 • スキーマ設計 • ログ形式
  • 31. Summit Developers #kansumiB3 商用プロダクト使ってないの? • 使っています • KPI分析チーム • 最終工程など • レポート作成 • SPSS Modeler • Microsoft Excel
  • 32. Summit Developers #kansumiB3 データ
  • 33. Summit Developers #kansumiB3 どんなデータを集計しているの? • DAU • 継続率 • 仮想通貨売り上げ • インストール数/日 • チュートリアル進度 • レベル • ギルド・友達 • イベント参加状況 • プロモーション効果 業務データベースの中身は変わるので、ス ナップショット重要
  • 34. Summit Developers #kansumiB3 アウトプット • レポートWeb • KPIメール • 月次レポート • 独自テーマのレポート • 運営チームからの依頼 • 自発的 • データダウンローダー
  • 35. Summit Developers #kansumiB3 レポートWeb • アクセス制限 • 時系列グラフ • ゲーム別・全体
  • 36. Summit Developers #kansumiB3 KPIメール(1) • 一日一回送信 • 全体・OS別集計(iOS/android) • Excelシート添付 • 運営チームの報告書作成に 活用
  • 37. Summit Developers #kansumiB3 KPIメール(2) gmail/GoogleAppsを導入してい るので手軽に閲覧可能
  • 38. Summit Developers #kansumiB3 月次レポート • プロデューサー、経営層向け • 主要KPIの動向報告 • レポートWeb、KPIメールと異なり、担 当の傾向分析が盛り込まれる
  • 39. Summit Developers #kansumiB3 独自レポート • 月次レポート等を作成する過程で浮かび上がった課題を掘り下げ る • 例 • ユーザ層のクラスタリング • レベル(習熟度) • 課金額 • S-in後の初動調査調査 • 定着率 • チュートリアル突破状況
  • 40. Summit Developers #kansumiB3 例)コンテンツの収益性可視化 課金率 ARPPU コアユーザ多い 優良だが小規模 要てこ入れ カジュアル
  • 41. Summit Developers #kansumiB3 分析軸の重要性 • 売り上げ・DAUの減少 • 一律に減ることは少ない • 要因となるクラスタが存在 • いかに豊富な分析軸をもつか
  • 42. Summit Developers #kansumiB3 課題 • 信頼性の向上 • リアルタイム性の向上 • 可視化・レポーティングの強化 • コスト削減 • スマートフォン対応 • 問題解決型から、問題発見・提案型へ
  • 43. Summit Developers #kansumiB3 ソリューション • BIツール導入 • クラウド型解析ツール • 組織改革
  • 44. Summit Developers #kansumiB3 BIツール導入 • 目的 • コスト削減 • リアルタイム性向上 • 信頼性向上 • 自社サーバに設置するタイプ • Tabreau • pentaho • 自社スキーマに合わせカスタマイズ可能
  • 45. Summit Developers #kansumiB3 分析システムコンテンツ側システム S3 Log Log MySQL Log Sales 0100100100 0111001100 1110111110 11111111 0100100100 0111001100 1110111110 11111111 EMR! RDS Log Sales BIツール 独自 レポーティング画面
  • 46. Summit Developers #kansumiB3 クラウド型解析ツール • 目的 • スマートフォン対応 • クライアントサイドの状況を把握 • アプリの活性化・非活性化など • 独自レポーティング画面を代替 • コスト削減 • クラウド型解析ツール • Kontagent • Flurry • mixpanel • SDKを組み込む
  • 47. Summit Developers #kansumiB3 画面例(flurry) ※画面は筆者の個人アプリのデータです
  • 48. Summit Developers #kansumiB3 分析チーム • 約10名 • 技術者チーム • 分析インフラ構築 • 新規案件対応 • 自動化 • KPI分析チーム • 運営チームのコンサル • 社内案件の傾向分析 • コンテンツ間のノウハウ共有 別の組織!
  • 49. Summit Developers #kansumiB3 組織改革 • ノウハウが属人化していた • 案件担当型→チームで対応 • ジョブローテ • 開発→KPI分析 • 二つの視点を兼ね備えることで分析の質を向上 • マーケティング視点 • 技術
  • 50. Summit Developers #kansumiB3 まとめ • コンテンツ数が一定数を超えると分析 チームの結成を検討を • 自社の資産(人材・技術)にみあった 技術選定 • 内製→プロダクトだったが、プロダクト →一部内製が効率良いかも
  • 51. Summit Developers #kansumiB3 おすすめ本 データ分析に関する 本は多いですが、BIの 概念から入るのがわ りと実践的
  • 52. Summit Developers #kansumiB3 ご清聴ありがとうございました