• Like
  • Save
デブサミ関西2013 「ソーシャルゲームのデータサイエンス」
Upcoming SlideShare
Loading in...5
×
 

デブサミ関西2013 「ソーシャルゲームのデータサイエンス」

on

  • 2,315 views

デブサミ関西 セッションB3

デブサミ関西 セッションB3
「ソーシャルゲームのデータサイエンス」

Statistics

Views

Total Views
2,315
Views on SlideShare
2,279
Embed Views
36

Actions

Likes
9
Downloads
20
Comments
0

2 Embeds 36

https://twitter.com 26
https://www.google.co.jp 10

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    デブサミ関西2013 「ソーシャルゲームのデータサイエンス」 デブサミ関西2013 「ソーシャルゲームのデータサイエンス」 Presentation Transcript

    • Summit Developers Developers Summit 2013 Kansai Action ! ソ ー シ ャ ル ゲ ー ム の デ ー タ サ イ エ ン ス 越智修司 KLab株式会社 ビジネスデベロップメント部 マーケティンググループ #kansumiB3 B3
    • Summit Developers #kansumiB3 自己紹介 •越智 修司(神戸市在住) •ビジネスデベロップメント部 マーケティンググループ所属 •エンジニア・プログラマ • Felica/Edy,ガラケサイト,銀行アプリ,きせかえ • アプリ・サービスのプロトタイピング • 有名アーティスト・アイドルのファンクラブアプリ開発 • iOSアプリ開発(プライベートで継続中) • python,Rなど @ponpoko1968
    • Summit Developers #kansumiB3 作ったもの 「クリップリーダー」  電子書籍リーダー • 自炊PDFに特化 • evernote連携 • 段組書籍 「勤怠くん」 勤怠メールを素早く送信 iPhone版 (無料) iPad版 (85円) 「SweetHome」 • 「帰る」メールをジオフ ェンス技術で自動送信 「あとも」 • PM2.5アプリ
    • Summit Developers #kansumiB3 はじめに • データ分析重要らしい • 何から手をつけて良いかわからない • 体制は? • 技術選定は? 我々がおかれた条件と過程を中 心に説明します。
    • Summit Developers #kansumiB3 KLab • 2000年設立(筆者は9年目) • 入社時は100名強→669名 • 歴史 • 携帯アプリ • モバイルサイト+プロダクト • ソーシャルゲーム ← イマココ
    • Summit Developers #kansumiB3 大阪事業所もあります
    • Summit Developers #kansumiB3 43サイト(分析対象 分) 数千万PV/日/タイトル KLabのソーシャルゲーム 2年で13サイト増加
    • Summit Developers #kansumiB3 組織 技術 データ
    • Summit Developers #kansumiB3 組織
    • Summit Developers #kansumiB3 経緯 • ボトムアップ的に発達 • レポートWebが必要 • もっと詳細な分析の必要 • 技術者が自発的に開発を始めた • 平行して企画者によるKPIチームが発足 • 統合
    • Summit Developers #kansumiB3 分析チーム • 約10名 • 技術者チーム(2名は大阪勤務) • 分析インフラ構築 • 新規案件対応 • 自動化 • KPI分析チーム • 運営チームのコンサル • 社内案件の傾向分析 • コンテンツ間のノウハウ共有
    • Summit Developers #kansumiB3 データサイエンティスト ITスキル プログラミング データベース ビジネススキル マーケティング 統計学 データマイニング 機械学習
    • Summit Developers #kansumiB3 バックグラウンド • 統計学の経験あり • モバイルサイト・ソ ーシャルゲームの開 発経験 • ECサイトのマーケテ ィング経験 • モバイルサイトのデ ィレクター 技術者チーム KPI分析チーム
    • Summit Developers #kansumiB3 現状: ヒューリスティックス >サイエンス
    • Summit Developers #kansumiB3 ミッション定義 • 自社コンテンツの価値向上 • おもしろさ/遊びやすさ • + 継続性 • = 収益性 • まずは定量的な状況・傾向を把握すべし
    • Summit Developers #kansumiB3 現在のステータス データ分析をやっているチームがあるら しいが直接役に立つイメージでもない ゲームの数字について知りたいとおもっ たら、分析チームに依頼すれば何かしら 出してくれるようだ アウトプットを継続
    • Summit Developers #kansumiB3 技術
    • Summit Developers #kansumiB3 データ分析基盤(1) 分析システムコンテンツ側システム S3 Log Log MySQL Log Sales 0100100100 0111001100 1110111110 11111111 0100100100 0111001100 1110111110 11111111 EMR! RDS Log Sales
    • Summit Developers #kansumiB3 データ分析基盤(2) • 基盤部分はほぼ内製 • AWS上に構築 • データウェアハウス(原データの保管所) • S3 • データ集計 • EC2 • データマート(集計済みデータ、一次加工後のデータ保管所) • RDS(MySQL) → redshift • ビッグデータ解析 • EMR(elastic map reduce) • ログ解析など
    • Summit Developers #kansumiB3 使用言語は?
    • Summit Developers #kansumiB3 Python Python使っている方は?
    • Summit Developers #kansumiB3 Why Python? • 保守性 • 習得の容易さ • 速度 • 汎用言語の中では最も統計処理が得意 • 詳しい人が社内にいる(重要) • 気が向いたらコードを添削してプルリクエスト してくれるなど
    • Summit Developers #kansumiB3 データ分析と言えば、 Rなんじゃない?
    • Summit Developers #kansumiB3 Python vs. R • Pythonの利点 • 汎用言語であるため統計以外のソフトウェア資産も豊富 • AWS関連 • 単一の言語で完結できる • 保守性 • Rの利点 • 可視化処理 • アドホックなデータ操作 • 探索的データ解析に適している KPIの発見・検討には、RやSPSSも使って います あくまで組織のおかれた状況次第ってと ころはあります。 Rに詳しい人がいて、Rの欠点を補えると 判断できればRの方が良いかも。
    • Summit Developers #kansumiB3 Pythonライブラリ • S3操作 • boto • mapreduce/hadoop • mrjob • numpy • pandas • R風のデータ操作・加工
    • Summit Developers #kansumiB3 まずはデータ収集 • 自社サイトからのデータ収集 • ETL • Extraction • Translation • Loading
    • Summit Developers #kansumiB3 分析システムコンテンツ側システム S3 Log Log MySQL Log Sales 0100100100 0111001100 1110111110 11111111 0100100100 0111001100 1110111110 11111111 EMR! RDS Log Sales ETL ETL処理
    • Summit Developers #kansumiB3 ETL • アクセスログ解析 • DAUの抽出 • iOS/androidのシェア分布 • 地域・国の分布 • ゲーム用RDBからのデータ抽出 • レベル・アイテム所持状況など、刻々変わるもののスナッ プショットを取る • ゲーム共通なデータ抽出はライブラリ化して分析チームが担当 かつてはゲーム開発チームが担当。 スキーマ設計やフレームワークなども各 チームで試行錯誤しているため、 案件毎に前回の反省を踏まえ改良が入 る。 差異を吸収するのが結構大変
    • Summit Developers #kansumiB3 チーム発足当時、すでに10数 サイト ↓ とても面倒 急速に成長したため、システム が乱立 同工異曲ではない カオスな状態に
    • Summit Developers #kansumiB3 ETL • ゲームシステムの理解 • ヒアリング • 事前準備・交渉 • スキーマ設計 • ログ形式
    • Summit Developers #kansumiB3 商用プロダクト使ってないの? • 使っています • KPI分析チーム • 最終工程など • レポート作成 • SPSS Modeler • Microsoft Excel
    • Summit Developers #kansumiB3 データ
    • Summit Developers #kansumiB3 どんなデータを集計しているの? • DAU • 継続率 • 仮想通貨売り上げ • インストール数/日 • チュートリアル進度 • レベル • ギルド・友達 • イベント参加状況 • プロモーション効果 業務データベースの中身は変わるので、ス ナップショット重要
    • Summit Developers #kansumiB3 アウトプット • レポートWeb • KPIメール • 月次レポート • 独自テーマのレポート • 運営チームからの依頼 • 自発的 • データダウンローダー
    • Summit Developers #kansumiB3 レポートWeb • アクセス制限 • 時系列グラフ • ゲーム別・全体
    • Summit Developers #kansumiB3 KPIメール(1) • 一日一回送信 • 全体・OS別集計(iOS/android) • Excelシート添付 • 運営チームの報告書作成に 活用
    • Summit Developers #kansumiB3 KPIメール(2) gmail/GoogleAppsを導入してい るので手軽に閲覧可能
    • Summit Developers #kansumiB3 月次レポート • プロデューサー、経営層向け • 主要KPIの動向報告 • レポートWeb、KPIメールと異なり、担 当の傾向分析が盛り込まれる
    • Summit Developers #kansumiB3 独自レポート • 月次レポート等を作成する過程で浮かび上がった課題を掘り下げ る • 例 • ユーザ層のクラスタリング • レベル(習熟度) • 課金額 • S-in後の初動調査調査 • 定着率 • チュートリアル突破状況
    • Summit Developers #kansumiB3 例)コンテンツの収益性可視化 課金率 ARPPU コアユーザ多い 優良だが小規模 要てこ入れ カジュアル
    • Summit Developers #kansumiB3 分析軸の重要性 • 売り上げ・DAUの減少 • 一律に減ることは少ない • 要因となるクラスタが存在 • いかに豊富な分析軸をもつか
    • Summit Developers #kansumiB3 課題 • 信頼性の向上 • リアルタイム性の向上 • 可視化・レポーティングの強化 • コスト削減 • スマートフォン対応 • 問題解決型から、問題発見・提案型へ
    • Summit Developers #kansumiB3 ソリューション • BIツール導入 • クラウド型解析ツール • 組織改革
    • Summit Developers #kansumiB3 BIツール導入 • 目的 • コスト削減 • リアルタイム性向上 • 信頼性向上 • 自社サーバに設置するタイプ • Tabreau • pentaho • 自社スキーマに合わせカスタマイズ可能
    • Summit Developers #kansumiB3 分析システムコンテンツ側システム S3 Log Log MySQL Log Sales 0100100100 0111001100 1110111110 11111111 0100100100 0111001100 1110111110 11111111 EMR! RDS Log Sales BIツール 独自 レポーティング画面
    • Summit Developers #kansumiB3 クラウド型解析ツール • 目的 • スマートフォン対応 • クライアントサイドの状況を把握 • アプリの活性化・非活性化など • 独自レポーティング画面を代替 • コスト削減 • クラウド型解析ツール • Kontagent • Flurry • mixpanel • SDKを組み込む
    • Summit Developers #kansumiB3 画面例(flurry) ※画面は筆者の個人アプリのデータです
    • Summit Developers #kansumiB3 分析チーム • 約10名 • 技術者チーム • 分析インフラ構築 • 新規案件対応 • 自動化 • KPI分析チーム • 運営チームのコンサル • 社内案件の傾向分析 • コンテンツ間のノウハウ共有 別の組織!
    • Summit Developers #kansumiB3 組織改革 • ノウハウが属人化していた • 案件担当型→チームで対応 • ジョブローテ • 開発→KPI分析 • 二つの視点を兼ね備えることで分析の質を向上 • マーケティング視点 • 技術
    • Summit Developers #kansumiB3 まとめ • コンテンツ数が一定数を超えると分析 チームの結成を検討を • 自社の資産(人材・技術)にみあった 技術選定 • 内製→プロダクトだったが、プロダクト →一部内製が効率良いかも
    • Summit Developers #kansumiB3 おすすめ本 データ分析に関する 本は多いですが、BIの 概念から入るのがわ りと実践的
    • Summit Developers #kansumiB3 ご清聴ありがとうございました