Home
Explore
Submit Search
Upload
Login
Signup
Advertisement
20160906 bq sushi
Report
tetsuro ito
Follow
Director & Data Analysis
Sep. 7, 2016
•
0 likes
2 likes
×
Be the first to like this
Show More
•
877 views
views
×
Total views
0
On Slideshare
0
From embeds
0
Number of embeds
0
Check these out next
Anonymity, trust, accountability
Eleanor McHugh
Ley reformatoria para la justicia laboral y el trabajo en el hogar
Luis Felipe Lopez Nevarez
B - Tech Degree (NMIMS MPSTME)
Chirag Chauhan
social_inclusion_plan
Paul Pellerin
Whispered secrets
Eleanor McHugh
Final Messaging
streetsidestories
Membership Programs
caseytruffo
Textos científicos
Cecyt 11 "Wilfrido Massieu", ESCA Santo Tomás
1
of
33
Top clipped slide
20160906 bq sushi
Sep. 7, 2016
•
0 likes
2 likes
×
Be the first to like this
Show More
•
877 views
views
×
Total views
0
On Slideshare
0
From embeds
0
Number of embeds
0
Download Now
Download to read offline
Report
Data & Analytics
GCP_NEXT後のBQ_Sushiで発表した資料です
tetsuro ito
Follow
Director & Data Analysis
Advertisement
Advertisement
Advertisement
Recommended
Dataflow(python)を使ってelasticsearchにデータを移行した話
Ryo Yamaoka
2.1K views
•
25 slides
Dataflow(python)を触った所感
Ryo Yamaoka
1.5K views
•
20 slides
Sano web広告最適化20131018v3
Masakazu Sano
30.9K views
•
38 slides
GCE を利用した Sansan マイクロサービス移行とそのメリット
Shimpei Nagai
772 views
•
19 slides
JAWSUG 20190620
陽平 山口
755 views
•
54 slides
[ML15]Class Cat佐々木さん「いち早く人工知能テクノロジーを取り入れた製品・サービスを市場に展開するには?」
AINOW
2.1K views
•
18 slides
More Related Content
Viewers also liked
(13)
Anonymity, trust, accountability
Eleanor McHugh
•
457 views
Ley reformatoria para la justicia laboral y el trabajo en el hogar
Luis Felipe Lopez Nevarez
•
607 views
B - Tech Degree (NMIMS MPSTME)
Chirag Chauhan
•
1.1K views
social_inclusion_plan
Paul Pellerin
•
99 views
Whispered secrets
Eleanor McHugh
•
1.9K views
Final Messaging
streetsidestories
•
440 views
Membership Programs
caseytruffo
•
383 views
Textos científicos
Cecyt 11 "Wilfrido Massieu", ESCA Santo Tomás
•
1.1K views
Вовед на темата говор на омраза
Metamorphosis
•
687 views
Awareness of OER and OEP in Scotland: Survey Findings from the OEPS Project
OEPScotland
•
1K views
Copy of Official Academic Transcript, Ship U
Michael Hageman
•
750 views
Cafe coffee Day
nima15288
•
62.5K views
短期間で新技術を学ぶ技術
Takafumi ONAKA
•
26.6K views
Similar to 20160906 bq sushi
(20)
Microsoft ではじめる AI DLラボ パートナープログラムご紹介
Hirono Jumpei
•
622 views
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
Recruit Technologies
•
7.1K views
【Japan Partner Conference 2019】Society 5.0 “超スマート社会” の実現に向けた日本マイクロソフトの取り組み
日本マイクロソフト株式会社
•
710 views
Open Cloud カンファレンス@札幌 Microsoft AI最前線
Daiyu Hatakeyama
•
409 views
Dyna traceによるuxマネジメント
伸夫 森本
•
854 views
秒間5万リクエストを処理する リアルタイム広告システム / BS3-3 新しい潮流:ビッグデータのリアルタイム応用:ユーザ事例 #QConTokyo
Takahiro Yasuda
•
4.6K views
アジャイルソフトウェア開発の道具箱
Koichi ITO
•
5.8K views
Social GAME における AI 活用事例 [第 4 回 Google Cloud INSIDE Games & Apps]
Google Cloud Platform - Japan
•
3K views
リクルートにおけるPaaS活用事例
Recruit Technologies
•
3.3K views
JJUG CCC リクルートの Java に対する取り組み
Recruit Technologies
•
7.5K views
Creating Mashup service in Yamaguchi
Ohishi Mikage
•
730 views
2016 #meijisap - 明治大学理工学部情報科学科 情報システム論1講義「デジタルによるビジネスモデルの変革」
Masahiro Furusawa
•
345 views
【A-4】kintone API、JavaScript APIの実力
Cybozucommunity
•
12.1K views
システム高速化フォーラム向け プッシュ通知基盤のアーキテクチャ
Recruit Technologies
•
12.7K views
20180627 - DEEP LEARNING LAB / Cognitive Services 最新情報 30 分でズバリ!
Takashi Okawa
•
1.8K views
RPA勉強会 Power BI を学ぶ特別編!
Yugo Shimizu
•
3.6K views
もうすぐ来る新しい DirectQuery の自動更新をいま可能なモノで模倣してみた!~ 誕生日のパラドックスを使って体験するのだ ~
Yugo Shimizu
•
3.4K views
概説 Data API v3
Yuji Takayama
•
1.6K views
カスタマーサクセスとプロダクトUX_uxjam#30_20190722
Toru Komaya
•
173 views
Retty recommendation project
Jiro Iwanaga
•
9.6K views
Advertisement
More from tetsuro ito
(20)
[Up用]rでqr
tetsuro ito
•
1K views
20170912 data analyst meetup tokyo vol.5
tetsuro ito
•
1.6K views
DataOps in Moneyforward
tetsuro ito
•
1.3K views
20170207 bigdata analytics_tokyo講演資料
tetsuro ito
•
973 views
20161029 dots machine learning in money forward
tetsuro ito
•
1.4K views
TokyoR LT Rで連続データを離散化
tetsuro ito
•
3.8K views
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
tetsuro ito
•
3.6K views
20150303続パタ5章後半
tetsuro ito
•
4.4K views
PRML読書会1スライド(公開用)
tetsuro ito
•
11.8K views
20140614 tokyo r lt
tetsuro ito
•
2.5K views
20140329 tokyo r lt 「カーネルとsvm」
tetsuro ito
•
9.7K views
20140204はじパタlt
tetsuro ito
•
9.2K views
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
tetsuro ito
•
3.1K views
はじパタ8章 svm
tetsuro ito
•
23.2K views
Tokyo R LT 20131109
tetsuro ito
•
2.1K views
はじパタ2章
tetsuro ito
•
21.5K views
第31回TokyoR LT資料
tetsuro ito
•
9.2K views
集合知プログラミング5章発表
tetsuro ito
•
1K views
集合知プログラミング11章
tetsuro ito
•
1.7K views
集合知プログラミング勉強会キックオフMTG LT用資料
tetsuro ito
•
1.4K views
Recently uploaded
(20)
★可查可存档〖制作普利茅斯大学文凭证书毕业证〗
vgfg1
•
2 views
#学位证靠谱办基尔大学文凭证书全套
qghfsvkwiqiubridge
•
2 views
《布克大学毕业证|学位证书校内仿真版本》
124hdjkhas
•
2 views
揭秘英国留学:如何获得约克圣约翰大学毕业证?
gukeho1
•
2 views
《麦吉尔大学毕业证|学位证书校内仿真版本》
124hdjkhas
•
3 views
《圭尔夫大学毕业证|学位证书校内仿真版本》
124hdjkhas
•
3 views
《格里菲斯大学毕业证|学位证书校内仿真版本》
hj123saf
•
2 views
《诺丁汉大学毕业证|学位证书校内仿真版本》
w124dsa
•
2 views
★可查可存档〖制作阿苏萨太平洋大学文凭证书毕业证〗
fgfg45
•
2 views
★可查可存档〖制作罗德岛大学文凭证书毕业证〗
fgfg45
•
2 views
#全套原版1:1精仿不来梅大学学位证成绩单
b6f0190421d1rma
•
2 views
#专业办证《怀卡托大学毕业证学位证原版精仿》
ee61223771acdrman
•
1 view
★可查可存档〖制作堪萨斯大学文凭证书毕业证〗
fgfg45
•
2 views
#专业办证《Griffith毕业证学位证原版精仿》
ee61223771acdrman
•
1 view
《拜欧拉大学毕业证|学位证书校内仿真版本》
123shab123
•
2 views
★可查可存档〖制作亚利桑那大学文凭证书毕业证〗
vvvvv24
•
2 views
★可查可存档〖制作圣地亚哥大学文凭证书毕业证〗
vvvvv24
•
3 views
#学位证靠谱办Mizzou文凭证书全套
buxvunsvjiujzternetk
•
2 views
★可查可存档〖制作曼尼托巴大学文凭证书毕业证〗
tujjj
•
2 views
#全套原版1:1精仿U of G学位证成绩单
pivepar3oflipcom
•
2 views
Advertisement
20160906 bq sushi
BigQueryとRでの機械学習による 350万ユーザの行動分析と 可視化スピードの大幅改善 2016/09/06 BQ sushi @プリンスパークタワー東京
自己紹介 所属:株式会社マネーフォワード PFM本部 名前:伊藤 徹郎 (@tetsuroito) 仕事:企画や分析など
(プレミアムサービス担当) 言語:RやSQL 好きなアルゴリズム:SVM (RBFカーネル) 一言:マネーフォワードをDLして、もしよければ プレミアムサービスも使っていただけるとうれしいです。
マネーフォワード紹介 自動でグラフ化、ラクして節約! 350万人が選んだ 自動家計簿・資産管理サービス マネーフォワード
マネーフォワード紹介
マネーフォワード紹介
アジェンダ ・BigQueryを導入の背景 ・BigQueryを用いた350万人の行動分析 ・Rと機械学習を使った可視化の高速化
アジェンダ ・BigQueryを導入の背景 ・BigQueryを用いた350万人の行動分析 ・Rと機械学習を使った可視化の高速化
BigQuery導入背景 BigQuery導入前 担当者 サービス利用ログをMySQLに保存、利用時も専用端末からMySQL利用 MySQL
BigQuery導入背景 BigQuery導入前 担当者 当初は良かったが、サービス成長とともにボトルネックとなる 分析にはつらい... ボトルネック MySQL
BigQuery導入背景 BigQuery導入後 BigQueryにデータを入れることで利用コストが格段に下がりました 担当者 dailyバッチで転送 MySQL
導入時に悩んだこと ・BigQueryに入れるデータをどうするか ・どういうテーブル構成にするか ・運用フローをどうするか ・コストはどのくらいかかるか
Github issueで起票 →
PRレビュー → CISOと複数メンバーで議論 BigQueryに入れるデータをどうするか
Github issueで起票 →
PRレビュー → CISOと複数メンバーで議論 BigQueryに入れるデータをどうするか LGTM BigQueryにimport!
どういうテーブル構成にするか 現状のDBの定義を踏襲し、 データ量の多いものは月ごとに区切ってテーブル化
運用フローをどうするか ・Slackに専用チャンネルを作って関連話題は集約 ・転送完了通知もSlackで通知 ・アカウント追加は適宜実施 (用途次第でアカウント追加) ・esaに基本的な使い方やクエリリファレンスを記載 ・実行前に処理量をチェックしてから実行する など
コストはどのくらいかかるか 事前に見積もりを実施 あらかじめ予算を決め、それをスコープに実施
ちょっと困ったこと ・Timestampを入れるとUTCに変換されて入る → 事前に +9
hourしてhoge_JSTカラムを作成し回避 回避策はとっているので、困っていませんが、 この仕様どうにかならないでしょうか?
アジェンダ ・BigQueryを導入の背景 ・BigQueryを用いた350万人の行動分析 ・Rと機械学習を使った可視化の高速化
BigQueryを用いた350万人の行動分析 ・新機能リリース後の効果検証 例、家計診断機能 ・どのくらい利用されているか ・どんな人に利用されているか ・他にどんな機能を使っているか ・利用環境による違いはないか ・改善箇所はどこか などの詳細な分析が可能になりました
BigQueryを用いた350万人の行動分析 ・Window関数を用いたパス解析 row_number関数やRank関数を利用してユーザーの行動パスを解析 パス解析の結果から初日アクションへの施策立案へと繋がった事例です
BigQueryを用いた350万人の行動分析 その他にも・・・ ・ロイヤリティユーザーの行動解析 ・端末別の機能パフォーマンス調査 ・ユーザー状態別のアクセス分析 ・長期間のCSログ調査 などの従来は取り組めていなかった分析が可能になりました
アジェンダ ・BigQueryを導入の背景 ・BigQueryを用いた350万人の行動分析 ・Rと機械学習を使った可視化の高速化
Rと機械学習を使った可視化の高速化 担当者 dailyバッチで転送 統計解析 機械学習 可視化 MySQL
RにBigQueryを読み込ませる Rには様々なパッケージが存在します。その中にbigrqueryパッケージがあります。
作者はR界の神と呼ばれる人です
Rへのデータロードの仕方 bigrqueryパッケージの他にクエリを抽出するためにhttpuvパッケージも必要です httpuvパッケージのquery_exec関数にプロジェクト名と引き出したいクエリを 記述してRにデータをにロードします。 * 抽出時のデータ型には注意しましょう (デフォルトはstring型)
Rを使った可視化事例 Hadleyのggplot2パッケージを使って、自社の時間・曜日別の行動を可視化しました 使用例: 新機能をリリースした時 どの曜日のどの時間帯に告知 するかを左記を見てあたりを つけました
Rを使った機械学習事例 rpartパッケージを使って、ユーザーのリテンションを分析しました [問題設定] どういうユーザーが継続して使ってくれるのか知りたい [特定方法] 実際にリテンションしているユーザーからその行動要因を特定する [タスク設定]
ユーザーの行動ログを月次で集計して分類モデルを作る [アルゴリズム設定] 要因分解メインなので、理解しやすい決定木を使おう こんな一人ブレストをしました
数時間後... パラメータチューニングしながらほしいアウトプットがすぐに得られました 使用例: リテンションに効く要件を 満たすようにコミュニケーション設 計をして施策を実施
BigQuery ビフォーアフター [Before] [After] 欲しい調査クエリのアウトプットが 数時間後に得られた 欲しい調査クエリから Rで可視化してみて、 一人ブレストをしたのち、 機械学習モデルを作って結果を得 た 圧倒的な改善が実現!!
機械学習の取り組みはまだ始まったばかり 環境は整ったので、 たくさんあるデータから価値あるアルゴリズムを検証して、 より世の中に価値のあるモデルを作っていきたい そう、考えています。
We’re Hiring 詳細はマネーフォワード採用ページ、もしくはWantedlyページをご確認ください。 ■マネーフォワード採用ページ https://recruit.moneyforward.com/ ■Wantedly https://www.wantedly.com/companies/moneyforward/projects マネーフォワードでは、一緒に働く仲間を募集しています。 特にAndroidエンジニア 機械学習エンジニア
Thank you! ご清聴ありがとうございました
Advertisement