KLabソーシャルゲームの
   KPI分析について

 開発部プロトタイピンググループ
       越智修司
自己紹介
•越智修司

•開発部   プロトタイピンググループ所属
 •   Felica/Edy,ガラケサイト,銀行アプリ,きせかえ
 •   アプリ・サービスのプロトタイピング
 •   有名アーティスト・アイドルのファンクラブアプリ開発
 •   最近はデータ解析
 •   python,Rなど




     @ponpoko1968
作ったもの
          「クリップリーダー」
              電子書籍リーダー
 iPad版
(85円)     •   自炊PDFに特化
          •   evernote連携
          •   段組書籍
iPhone版
(無料)


          「勤怠くん」
          勤怠メールを素早く送信
KLabのソーシャルゲー
      ム
• コンテンツ数
 • 12タイトル
 • 33サイト
• 一日あたりのログ
 • 最大数千万PV/日/タイトル
体制(1)
•   BI(kg_report)チーム
    •   開発者で構成
    •   ミッション
        •   レポート閲覧・管理サイト開発
        •   売り上げ管理
        •   企画者向け動向分析
•   データマイニング(kg_kpiチーム)
    •   企画者/開発者の混成チーム
    •   ミッション
        •   新しい分析軸の模索
体制(2)
                       経営層


                      経理・IR担当


DB
           BI
                       企画者
Log         フィードバック


       Data mining
BI?
•   ビジネスインテリジェンスの略
•   企業内外の事実に基づくデータを組織的かつ系統的に蓄積・分
    類・検索・分析・加工して、ビジネス上の各種の意思決定に有
    用な知識や洞察を生み出すという概念や仕組み、活動のこと。
    また、そうした活動を支えるシステムやテクノロジを含む場合
    もある。(@IT 情報マネジメント用語辞典より)
•   見る人
    •   企画統括者
    •   経営層
•   データ
    •   全数が基本
データマイニング?
• BIに含まれる概念らしい
• 見る人
 • 分析者
 • コンテンツの企画・開発者
• データ
 • サンプリング
システム構成(1)
•   AWSを活用
    •   EC2 Large Instance 1000h
    •   RDS 1000h
    •   EMR(Elastic MapReduce)
        •   ログ加工
    •   S3
        •   加工済みログストレージとして
システム構成(2)
  コンテンツ側システム                               コンテンツ側システム
                                       Sale
    Web
   server
                              S3        s
                                        Log               RDS
                       Log    Log          010010010
                               Log         001110011
                                              010010010
                                           001110111
                                              001110011
                                           110111111
                                              001110111
                                           11 110111111
                       Sale                   11

                        s
                                                           EC2

MySQL
            Contents
             master
                                     EMR
kg_report

•   ブラウザで常時閲覧
•   アクセス制限
•   全体/個別
•   時系列グラフ
KPIとは

• KPI (key performance indicator)の略
• 重要業績評価指標
データマイニング
    チーム

• ソーシャルゲームは未開の分野
• KPIを見つけていくチーム
使っている要素技術
•   言語
    •   探索的に分析するのは"R"など
        を使用
    •   運用に用いるのは主にPython
        •   豊富なライブラリ
        •   可読性
工夫していること

• msgpack
• ジニ係数
msgpack

• バイナリフォーマット
• 一旦msgpack化することで検索・処理
 時間を軽減




              msgpack web site (msgpack.org) より
msgpack(2)

• EMR(Elastic Map-Reduce)で変換
• <app>.app.<Y-m-d>_hh.<dd>
• <dd>=Opensocial viewer id % 100

時刻   opensocial_viewer_i
     d
                           URL(path)   GET param
ログ検索の高速化
500



450
                          Intel(R) Xeon(R) CPU
                          L3426 @ 1.87GHz x 8
400
                          memory 8G
350



300



250                       msgpack
200
                          bzip+grep
150



100



 50



  0
      real   user   sys
ジニ係数(1)

• ジニ係数とは,所得の組合せ(yi,yj)をす
 べての構成員について考え,その差(絶
 対値)の平均額を平均所得μで除した値
 の半分である。
ジニ係数(2)
RFM分析


• 実演します
4/22
5/27
課題
•   インフラが整備できてきた

•   まだまだこれから

•   ビジュアライゼーション

    •   意思決定者に理解されてなんぼ

•   (文字通りの意味で)ソーシャル分析

•   モデリング・データマイニング

    •   市販パッケージツールも導入

    •   システムとして組み込むためにはオープンソースの活用が不可
        欠

        •   統計・データマイニングライブラリ

        •   weka,Rapid-Miner

第1回関西ソーシャルゲーム勉強会 kpi発表

  • 1.
    KLabソーシャルゲームの KPI分析について 開発部プロトタイピンググループ 越智修司
  • 2.
    自己紹介 •越智修司 •開発部 プロトタイピンググループ所属 • Felica/Edy,ガラケサイト,銀行アプリ,きせかえ • アプリ・サービスのプロトタイピング • 有名アーティスト・アイドルのファンクラブアプリ開発 • 最近はデータ解析 • python,Rなど @ponpoko1968
  • 3.
    作ったもの 「クリップリーダー」 電子書籍リーダー iPad版 (85円) • 自炊PDFに特化 • evernote連携 • 段組書籍 iPhone版 (無料) 「勤怠くん」 勤怠メールを素早く送信
  • 4.
    KLabのソーシャルゲー ム • コンテンツ数 • 12タイトル • 33サイト • 一日あたりのログ • 最大数千万PV/日/タイトル
  • 5.
    体制(1) • BI(kg_report)チーム • 開発者で構成 • ミッション • レポート閲覧・管理サイト開発 • 売り上げ管理 • 企画者向け動向分析 • データマイニング(kg_kpiチーム) • 企画者/開発者の混成チーム • ミッション • 新しい分析軸の模索
  • 6.
    体制(2) 経営層 経理・IR担当 DB BI 企画者 Log フィードバック Data mining
  • 7.
    BI? • ビジネスインテリジェンスの略 • 企業内外の事実に基づくデータを組織的かつ系統的に蓄積・分 類・検索・分析・加工して、ビジネス上の各種の意思決定に有 用な知識や洞察を生み出すという概念や仕組み、活動のこと。 また、そうした活動を支えるシステムやテクノロジを含む場合 もある。(@IT 情報マネジメント用語辞典より) • 見る人 • 企画統括者 • 経営層 • データ • 全数が基本
  • 8.
    データマイニング? • BIに含まれる概念らしい • 見る人 • 分析者 • コンテンツの企画・開発者 • データ • サンプリング
  • 9.
    システム構成(1) • AWSを活用 • EC2 Large Instance 1000h • RDS 1000h • EMR(Elastic MapReduce) • ログ加工 • S3 • 加工済みログストレージとして
  • 10.
    システム構成(2) コンテンツ側システム コンテンツ側システム Sale Web server S3 s Log RDS Log Log 010010010 Log 001110011 010010010 001110111 001110011 110111111 001110111 11 110111111 Sale 11 s EC2 MySQL Contents master EMR
  • 11.
    kg_report • ブラウザで常時閲覧 • アクセス制限 • 全体/個別 • 時系列グラフ
  • 12.
    KPIとは • KPI (keyperformance indicator)の略 • 重要業績評価指標
  • 13.
    データマイニング チーム • ソーシャルゲームは未開の分野 • KPIを見つけていくチーム
  • 14.
    使っている要素技術 • 言語 • 探索的に分析するのは"R"など を使用 • 運用に用いるのは主にPython • 豊富なライブラリ • 可読性
  • 15.
  • 16.
  • 17.
    msgpack(2) • EMR(Elastic Map-Reduce)で変換 •<app>.app.<Y-m-d>_hh.<dd> • <dd>=Opensocial viewer id % 100 時刻 opensocial_viewer_i d URL(path) GET param
  • 18.
    ログ検索の高速化 500 450 Intel(R) Xeon(R) CPU L3426 @ 1.87GHz x 8 400 memory 8G 350 300 250 msgpack 200 bzip+grep 150 100 50 0 real user sys
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
    課題 • インフラが整備できてきた • まだまだこれから • ビジュアライゼーション • 意思決定者に理解されてなんぼ • (文字通りの意味で)ソーシャル分析 • モデリング・データマイニング • 市販パッケージツールも導入 • システムとして組み込むためにはオープンソースの活用が不可 欠 • 統計・データマイニングライブラリ • weka,Rapid-Miner