博士課程の新卒エンジニアが
データ分析環境を作った話
株式会社サイバード
データアナリスト
大曽根 圭輔
交流会ということで
自己紹介
ABOUT:ME
• 大曽根圭輔
博士(工学) 茨城県出身
• 現在
データ分析チーム
• 趣味 たくさん
- 観る: 野球観戦、ライブ
- やる: 6/21にビッグバンドのライブやります
- Youtubeで7万再生突破 (黒歴史
絶賛CM放映中!!
具体的な業務
- モニタリングツール構築
- ユーザの行動分析
- 広告効果測定
- ユーザテスト
- アンケートなど
本日の話題
(ほぼ)ゼロから
データ分析環境を
作るまで
サービス
Webサーバ
DB
各種API
この環境が
できるまで
2013年某日
当時の業務
アプリ制作
(WEB、ネイティブ)
博士課程在籍時
計算知能、HAIなどの研究
統計学も少し
偉い人
会社のゲームも軌道に乗ってきたの
で、データ分析に力を入れたい。
君の経験を買ってデータアナリストに
なって欲しい
私
偉い人
会社のゲームも軌道に乗ってきたの
で、データ分析に力を入れたい。
君の経験を買ってデータアナリストに
なって欲しい
私
まかせて下さい!
分析開始
エンジ
ニア
このデータを調べれば離脱要因がわ
かる。
このSQLをたたいていいですか?
スロークエリ投げられたら
困るので。。
私
。。。
エンジ
ニア
成長度も含めてクラスタリングをした
いから、ユーザレベルの変遷を知り
たい
レベルはアップデートされ
るから残ってません。。
私
。。。
他にも
モニタリングツールが未整備
-> 可視化はEXCELで
-> 数字だけ見てもわかりづらい
レポーティングに手間がかかる
手元にある(スモール)データで
ある程度分析できる!
- コホート分析
- 施策の効果測定(時系列)
- KPIシミュレーションなど
しかし、やはり
機械学習などの知識を使いたい!
効率化も行いたい!
•機械学習 (NN、SVM、SOMなど)
•多変量解析 (重回帰分析、主成分分析など)
•統計学
•可視化
自分が持っている
データ分析に役立つ(はずの)スキル
というわけで直訴
上司
アップデートしなくて自由に触れる
データをためる場所作りたいです!
たしかにメリットも多いの
でやってみる価値はある
私
上司
かくかくしかじかで。。。
今後のために必要だな
偉い人
上司
定常作業効率化のためにモニタリン
グツール作りたいんです
たしかにメリットも多いの
でやってみる価値はある
私
上司
かくかくしかじかで。。。
今後のために必要だな
偉い人
結果
サービス
Webサーバ
DB
各種API
•機械学習 (NN、SVM、SOMなど)
•多変量解析 (重回帰分析、主成分分析など)
•統計学 (検定など)
•可視化
自分が持っている
データ分析に役立つ(はずの)スキル
•機械学習 (NN、SVM、SOMなど)
•多変量解析 (重回帰分析、主成分分析など)
•統計学 (検定など)
•可視化
自分が持っている
データ分析に役立つスキル
• 機械学習 (NN、SVM、SOM、決定木など)
-> イベント参加予測、継続要因特定
• 多変量解析 (重回帰分析、主成分分析など)
-> ユーザの分類
• 統計学
-> キャンペーンの効果測定
• 微分積分
レベル毎のDAUの予測
大事な事
周りを巻き込んで
やりたいことを創る!
モニタリング指標の自動生成
特徴点の自動抽出
可視化レポーティング自動化
今後の展望
ご清聴
ありがとうございました!

2014/06/13 若手Webエンジニア交流会発表資料「博士課程の新卒エンジニアがデータ分析環境を作った話」