Submit Search
Upload
Lie to me S01.e01.黄金矿工
•
0 likes
•
446 views
L
lanlancamp
Follow
用JavaScript写数据分析任务
Read less
Read more
Technology
Report
Share
Report
Share
1 of 25
Download now
Download to read offline
Recommended
Do You Framework.s01.e02.kissy dpl 设计
Do You Framework.s01.e02.kissy dpl 设计
lanlancamp
20100915 學習撰寫 Google Chrome Extension
20100915 學習撰寫 Google Chrome Extension
Justin Lee
再见侏罗纪.S01.e02.CoffeeScript
再见侏罗纪.S01.e02.CoffeeScript
lanlancamp
请给我结果.S01 e01.小清新式的项目管理
请给我结果.S01 e01.小清新式的项目管理
lanlancamp
lie to me.s1.e3-数据源头那些事
lie to me.s1.e3-数据源头那些事
lanlancamp
Lie to me S01.e02.反馈体验
Lie to me S01.e02.反馈体验
lanlancamp
CoffeeScript
CoffeeScript
Scott Leberknight
The Six Highest Performing B2B Blog Post Formats
The Six Highest Performing B2B Blog Post Formats
Barry Feldman
Recommended
Do You Framework.s01.e02.kissy dpl 设计
Do You Framework.s01.e02.kissy dpl 设计
lanlancamp
20100915 學習撰寫 Google Chrome Extension
20100915 學習撰寫 Google Chrome Extension
Justin Lee
再见侏罗纪.S01.e02.CoffeeScript
再见侏罗纪.S01.e02.CoffeeScript
lanlancamp
请给我结果.S01 e01.小清新式的项目管理
请给我结果.S01 e01.小清新式的项目管理
lanlancamp
lie to me.s1.e3-数据源头那些事
lie to me.s1.e3-数据源头那些事
lanlancamp
Lie to me S01.e02.反馈体验
Lie to me S01.e02.反馈体验
lanlancamp
CoffeeScript
CoffeeScript
Scott Leberknight
The Six Highest Performing B2B Blog Post Formats
The Six Highest Performing B2B Blog Post Formats
Barry Feldman
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
NTC.im(Notch Training Center)
Introduction to big data
Introduction to big data
邦宇 叶
「大數據之路:阿里巴巴大數據實戰」 讀書心得
「大數據之路:阿里巴巴大數據實戰」 讀書心得
Chang Tai-Wei
数据挖掘理论与实践
数据挖掘理论与实践
medcl
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
James Chen
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
Jazz Yao-Tsung Wang
Geo science cafe 如何找到一份满意的工作
Geo science cafe 如何找到一份满意的工作
kewuc
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouse
Jack Gao
数据架构方面的一些探讨
数据架构方面的一些探讨
Chao Zhu
A brief introduction to Machine Learning
A brief introduction to Machine Learning
Wen-Tien Chang
自助工具助Dba提升效率
自助工具助Dba提升效率
Chao Zhu
网站离线数据安全分析漫谈 2012cert
网站离线数据安全分析漫谈 2012cert
ph4nt0m
云存储: 三分开发,七分运维
云存储: 三分开发,七分运维
LI Daobing
美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New
翀 刘
大规模数据库存储方案
大规模数据库存储方案
XiaoJun Hong
淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]
KennyZ
碰撞
碰撞
yq76034150
七牛云存储详解
七牛云存储详解
niuer7
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
li luo
淘宝双11双12案例分享
淘宝双11双12案例分享
vanadies10
More Related Content
Similar to Lie to me S01.e01.黄金矿工
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
NTC.im(Notch Training Center)
Introduction to big data
Introduction to big data
邦宇 叶
「大數據之路:阿里巴巴大數據實戰」 讀書心得
「大數據之路:阿里巴巴大數據實戰」 讀書心得
Chang Tai-Wei
数据挖掘理论与实践
数据挖掘理论与实践
medcl
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
James Chen
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
Jazz Yao-Tsung Wang
Geo science cafe 如何找到一份满意的工作
Geo science cafe 如何找到一份满意的工作
kewuc
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouse
Jack Gao
数据架构方面的一些探讨
数据架构方面的一些探讨
Chao Zhu
A brief introduction to Machine Learning
A brief introduction to Machine Learning
Wen-Tien Chang
自助工具助Dba提升效率
自助工具助Dba提升效率
Chao Zhu
网站离线数据安全分析漫谈 2012cert
网站离线数据安全分析漫谈 2012cert
ph4nt0m
云存储: 三分开发,七分运维
云存储: 三分开发,七分运维
LI Daobing
美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New
翀 刘
大规模数据库存储方案
大规模数据库存储方案
XiaoJun Hong
淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]
KennyZ
碰撞
碰撞
yq76034150
七牛云存储详解
七牛云存储详解
niuer7
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
li luo
淘宝双11双12案例分享
淘宝双11双12案例分享
vanadies10
Similar to Lie to me S01.e01.黄金矿工
(20)
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
Introduction to big data
Introduction to big data
「大數據之路:阿里巴巴大數據實戰」 讀書心得
「大數據之路:阿里巴巴大數據實戰」 讀書心得
数据挖掘理论与实践
数据挖掘理论与实践
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
Geo science cafe 如何找到一份满意的工作
Geo science cafe 如何找到一份满意的工作
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouse
数据架构方面的一些探讨
数据架构方面的一些探讨
A brief introduction to Machine Learning
A brief introduction to Machine Learning
自助工具助Dba提升效率
自助工具助Dba提升效率
网站离线数据安全分析漫谈 2012cert
网站离线数据安全分析漫谈 2012cert
云存储: 三分开发,七分运维
云存储: 三分开发,七分运维
美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New
大规模数据库存储方案
大规模数据库存储方案
淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]
碰撞
碰撞
七牛云存储详解
七牛云存储详解
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
淘宝双11双12案例分享
淘宝双11双12案例分享
Lie to me S01.e01.黄金矿工
1.
黄金矿工
季札
2.
用户行为数据是⼀一座金矿!
但是我们没有趁手的挖掘工具...
3.
问题 • UED 访问数据的成本太高 •
自己分析? • 需要解决数据采集、存储以及分析的⼀一系列问题 • 需要掌握专门的工具或编程语言 • 找专门的数据团队? • 人手、资源有限,大部分需求不能得到满足 • 自定程度较低
4.
数据流程(传统)
5.
为什么不使用 JavaScript 来分析日志数据?
6.
7.
数据流程(黄金矿工)
Google V8
8.
数据流程
埋点 js 黄金矿工 报表页面 js job
9.
黄金矿工 ——使用 JavaScript 写数据分析任务!
10.
两个重要前提 • 每⼀一条采集到的日志数据都可以用 Key
/ Value 的形式表示 • 如 { type: 2, x: 348, y: 982, tagname: “div”, ip: “202.38.12.45”, datetime: “2012-04-26 14:05:30”, ua: “Mozilla ....”, ...} • 后台的数据分析步骤可以分解为⼀一些基本的常用的操作 • 如 filter、map、count、distinct、group、sum ... • 这些基本操作可以使用另⼀一种胶水语言(JavaScript)组合起来
11.
基本架构
12.
打点 黄金矿工
13.
打点 JS • goldlog.emit(id,
key_value_data); • 实际上是对 new Image(); 的⼀一个封装 • http://www.atpanel.com/ued.1.1.2?type=9&_gm:id={id}
14.
分析 黄金矿工
15.
新增全局对象 • log • datetime •
GoldMiner
16.
log 记下指定日志信息 • log(“message”);
17.
datetime 常用时间日期方法 • datetime.yesterday() •
datetime.today() • datetime.now() • datetime.daysOffset(n) • datetime.datetime(year, month, day, hour=0, minute=0, second=0) • ... • 也可以使用 new Date() 代替,但 datetime 更方便
18.
GoldMiner 与后台数据的接口 • var
goldminer = new GoldMiner(“global_sample”, datetime.yesterday()); • var data = goldminer.data; • data.filter() • data.map() • data.group() • data.count() • ...
19.
20.
分析 JS
21.
http://goldminer.taobao.org
22.
23.
Q&A
24.
下集预告 / to
be continued...
25.
Thanks! :-)
Download now