• Like
デブサミ関西2013 「ソーシャルゲームのデータサイエンス」
Upcoming SlideShare
Loading in...5
×

デブサミ関西2013 「ソーシャルゲームのデータサイエンス」

  • 2,116 views
Uploaded on

デブサミ関西 セッションB3 …

デブサミ関西 セッションB3
「ソーシャルゲームのデータサイエンス」

More in: Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
2,116
On Slideshare
0
From Embeds
0
Number of Embeds
2

Actions

Shares
Downloads
24
Comments
0
Likes
10

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Summit Developers Developers Summit 2013 Kansai Action ! ソ ー シ ャ ル ゲ ー ム の デ ー タ サ イ エ ン ス 越智修司 KLab株式会社 ビジネスデベロップメント部 マーケティンググループ #kansumiB3 B3
  • 2. Summit Developers #kansumiB3 自己紹介 •越智 修司(神戸市在住) •ビジネスデベロップメント部 マーケティンググループ所属 •エンジニア・プログラマ • Felica/Edy,ガラケサイト,銀行アプリ,きせかえ • アプリ・サービスのプロトタイピング • 有名アーティスト・アイドルのファンクラブアプリ開発 • iOSアプリ開発(プライベートで継続中) • python,Rなど @ponpoko1968
  • 3. Summit Developers #kansumiB3 作ったもの 「クリップリーダー」  電子書籍リーダー • 自炊PDFに特化 • evernote連携 • 段組書籍 「勤怠くん」 勤怠メールを素早く送信 iPhone版 (無料) iPad版 (85円) 「SweetHome」 • 「帰る」メールをジオフ ェンス技術で自動送信 「あとも」 • PM2.5アプリ
  • 4. Summit Developers #kansumiB3 はじめに • データ分析重要らしい • 何から手をつけて良いかわからない • 体制は? • 技術選定は? 我々がおかれた条件と過程を中 心に説明します。
  • 5. Summit Developers #kansumiB3 KLab • 2000年設立(筆者は9年目) • 入社時は100名強→669名 • 歴史 • 携帯アプリ • モバイルサイト+プロダクト • ソーシャルゲーム ← イマココ
  • 6. Summit Developers #kansumiB3 大阪事業所もあります
  • 7. Summit Developers #kansumiB3 43サイト(分析対象 分) 数千万PV/日/タイトル KLabのソーシャルゲーム 2年で13サイト増加
  • 8. Summit Developers #kansumiB3 組織 技術 データ
  • 9. Summit Developers #kansumiB3 組織
  • 10. Summit Developers #kansumiB3 経緯 • ボトムアップ的に発達 • レポートWebが必要 • もっと詳細な分析の必要 • 技術者が自発的に開発を始めた • 平行して企画者によるKPIチームが発足 • 統合
  • 11. Summit Developers #kansumiB3 分析チーム • 約10名 • 技術者チーム(2名は大阪勤務) • 分析インフラ構築 • 新規案件対応 • 自動化 • KPI分析チーム • 運営チームのコンサル • 社内案件の傾向分析 • コンテンツ間のノウハウ共有
  • 12. Summit Developers #kansumiB3 データサイエンティスト ITスキル プログラミング データベース ビジネススキル マーケティング 統計学 データマイニング 機械学習
  • 13. Summit Developers #kansumiB3 バックグラウンド • 統計学の経験あり • モバイルサイト・ソ ーシャルゲームの開 発経験 • ECサイトのマーケテ ィング経験 • モバイルサイトのデ ィレクター 技術者チーム KPI分析チーム
  • 14. Summit Developers #kansumiB3 現状: ヒューリスティックス >サイエンス
  • 15. Summit Developers #kansumiB3 ミッション定義 • 自社コンテンツの価値向上 • おもしろさ/遊びやすさ • + 継続性 • = 収益性 • まずは定量的な状況・傾向を把握すべし
  • 16. Summit Developers #kansumiB3 現在のステータス データ分析をやっているチームがあるら しいが直接役に立つイメージでもない ゲームの数字について知りたいとおもっ たら、分析チームに依頼すれば何かしら 出してくれるようだ アウトプットを継続
  • 17. Summit Developers #kansumiB3 技術
  • 18. Summit Developers #kansumiB3 データ分析基盤(1) 分析システムコンテンツ側システム S3 Log Log MySQL Log Sales 0100100100 0111001100 1110111110 11111111 0100100100 0111001100 1110111110 11111111 EMR! RDS Log Sales
  • 19. Summit Developers #kansumiB3 データ分析基盤(2) • 基盤部分はほぼ内製 • AWS上に構築 • データウェアハウス(原データの保管所) • S3 • データ集計 • EC2 • データマート(集計済みデータ、一次加工後のデータ保管所) • RDS(MySQL) → redshift • ビッグデータ解析 • EMR(elastic map reduce) • ログ解析など
  • 20. Summit Developers #kansumiB3 使用言語は?
  • 21. Summit Developers #kansumiB3 Python Python使っている方は?
  • 22. Summit Developers #kansumiB3 Why Python? • 保守性 • 習得の容易さ • 速度 • 汎用言語の中では最も統計処理が得意 • 詳しい人が社内にいる(重要) • 気が向いたらコードを添削してプルリクエスト してくれるなど
  • 23. Summit Developers #kansumiB3 データ分析と言えば、 Rなんじゃない?
  • 24. Summit Developers #kansumiB3 Python vs. R • Pythonの利点 • 汎用言語であるため統計以外のソフトウェア資産も豊富 • AWS関連 • 単一の言語で完結できる • 保守性 • Rの利点 • 可視化処理 • アドホックなデータ操作 • 探索的データ解析に適している KPIの発見・検討には、RやSPSSも使って います あくまで組織のおかれた状況次第ってと ころはあります。 Rに詳しい人がいて、Rの欠点を補えると 判断できればRの方が良いかも。
  • 25. Summit Developers #kansumiB3 Pythonライブラリ • S3操作 • boto • mapreduce/hadoop • mrjob • numpy • pandas • R風のデータ操作・加工
  • 26. Summit Developers #kansumiB3 まずはデータ収集 • 自社サイトからのデータ収集 • ETL • Extraction • Translation • Loading
  • 27. Summit Developers #kansumiB3 分析システムコンテンツ側システム S3 Log Log MySQL Log Sales 0100100100 0111001100 1110111110 11111111 0100100100 0111001100 1110111110 11111111 EMR! RDS Log Sales ETL ETL処理
  • 28. Summit Developers #kansumiB3 ETL • アクセスログ解析 • DAUの抽出 • iOS/androidのシェア分布 • 地域・国の分布 • ゲーム用RDBからのデータ抽出 • レベル・アイテム所持状況など、刻々変わるもののスナッ プショットを取る • ゲーム共通なデータ抽出はライブラリ化して分析チームが担当 かつてはゲーム開発チームが担当。 スキーマ設計やフレームワークなども各 チームで試行錯誤しているため、 案件毎に前回の反省を踏まえ改良が入 る。 差異を吸収するのが結構大変
  • 29. Summit Developers #kansumiB3 チーム発足当時、すでに10数 サイト ↓ とても面倒 急速に成長したため、システム が乱立 同工異曲ではない カオスな状態に
  • 30. Summit Developers #kansumiB3 ETL • ゲームシステムの理解 • ヒアリング • 事前準備・交渉 • スキーマ設計 • ログ形式
  • 31. Summit Developers #kansumiB3 商用プロダクト使ってないの? • 使っています • KPI分析チーム • 最終工程など • レポート作成 • SPSS Modeler • Microsoft Excel
  • 32. Summit Developers #kansumiB3 データ
  • 33. Summit Developers #kansumiB3 どんなデータを集計しているの? • DAU • 継続率 • 仮想通貨売り上げ • インストール数/日 • チュートリアル進度 • レベル • ギルド・友達 • イベント参加状況 • プロモーション効果 業務データベースの中身は変わるので、ス ナップショット重要
  • 34. Summit Developers #kansumiB3 アウトプット • レポートWeb • KPIメール • 月次レポート • 独自テーマのレポート • 運営チームからの依頼 • 自発的 • データダウンローダー
  • 35. Summit Developers #kansumiB3 レポートWeb • アクセス制限 • 時系列グラフ • ゲーム別・全体
  • 36. Summit Developers #kansumiB3 KPIメール(1) • 一日一回送信 • 全体・OS別集計(iOS/android) • Excelシート添付 • 運営チームの報告書作成に 活用
  • 37. Summit Developers #kansumiB3 KPIメール(2) gmail/GoogleAppsを導入してい るので手軽に閲覧可能
  • 38. Summit Developers #kansumiB3 月次レポート • プロデューサー、経営層向け • 主要KPIの動向報告 • レポートWeb、KPIメールと異なり、担 当の傾向分析が盛り込まれる
  • 39. Summit Developers #kansumiB3 独自レポート • 月次レポート等を作成する過程で浮かび上がった課題を掘り下げ る • 例 • ユーザ層のクラスタリング • レベル(習熟度) • 課金額 • S-in後の初動調査調査 • 定着率 • チュートリアル突破状況
  • 40. Summit Developers #kansumiB3 例)コンテンツの収益性可視化 課金率 ARPPU コアユーザ多い 優良だが小規模 要てこ入れ カジュアル
  • 41. Summit Developers #kansumiB3 分析軸の重要性 • 売り上げ・DAUの減少 • 一律に減ることは少ない • 要因となるクラスタが存在 • いかに豊富な分析軸をもつか
  • 42. Summit Developers #kansumiB3 課題 • 信頼性の向上 • リアルタイム性の向上 • 可視化・レポーティングの強化 • コスト削減 • スマートフォン対応 • 問題解決型から、問題発見・提案型へ
  • 43. Summit Developers #kansumiB3 ソリューション • BIツール導入 • クラウド型解析ツール • 組織改革
  • 44. Summit Developers #kansumiB3 BIツール導入 • 目的 • コスト削減 • リアルタイム性向上 • 信頼性向上 • 自社サーバに設置するタイプ • Tabreau • pentaho • 自社スキーマに合わせカスタマイズ可能
  • 45. Summit Developers #kansumiB3 分析システムコンテンツ側システム S3 Log Log MySQL Log Sales 0100100100 0111001100 1110111110 11111111 0100100100 0111001100 1110111110 11111111 EMR! RDS Log Sales BIツール 独自 レポーティング画面
  • 46. Summit Developers #kansumiB3 クラウド型解析ツール • 目的 • スマートフォン対応 • クライアントサイドの状況を把握 • アプリの活性化・非活性化など • 独自レポーティング画面を代替 • コスト削減 • クラウド型解析ツール • Kontagent • Flurry • mixpanel • SDKを組み込む
  • 47. Summit Developers #kansumiB3 画面例(flurry) ※画面は筆者の個人アプリのデータです
  • 48. Summit Developers #kansumiB3 分析チーム • 約10名 • 技術者チーム • 分析インフラ構築 • 新規案件対応 • 自動化 • KPI分析チーム • 運営チームのコンサル • 社内案件の傾向分析 • コンテンツ間のノウハウ共有 別の組織!
  • 49. Summit Developers #kansumiB3 組織改革 • ノウハウが属人化していた • 案件担当型→チームで対応 • ジョブローテ • 開発→KPI分析 • 二つの視点を兼ね備えることで分析の質を向上 • マーケティング視点 • 技術
  • 50. Summit Developers #kansumiB3 まとめ • コンテンツ数が一定数を超えると分析 チームの結成を検討を • 自社の資産(人材・技術)にみあった 技術選定 • 内製→プロダクトだったが、プロダクト →一部内製が効率良いかも
  • 51. Summit Developers #kansumiB3 おすすめ本 データ分析に関する 本は多いですが、BIの 概念から入るのがわ りと実践的
  • 52. Summit Developers #kansumiB3 ご清聴ありがとうございました