SlideShare a Scribd company logo
1 of 25
Download to read offline
黄金矿工   季札
用户行为数据是⼀一座金矿!
                但是我们没有趁手的挖掘工具...
问题

• UED 访问数据的成本太高


• 自己分析?


 • 需要解决数据采集、存储以及分析的⼀一系列问题


 • 需要掌握专门的工具或编程语言


• 找专门的数据团队?


 • 人手、资源有限,大部分需求不能得到满足


 • 自定程度较低
数据流程(传统)
为什么不使用 JavaScript 来分析日志数据?
数据流程(黄金矿工)




             Google
               V8
数据流程




   埋点 js   黄金矿工      报表页面
            js job
黄金矿工
  ——使用 JavaScript 写数据分析任务!
两个重要前提

• 每⼀一条采集到的日志数据都可以用 Key / Value 的形式表示


 • 如 { type: 2, x: 348, y: 982, tagname: “div”, ip: “202.38.12.45”, datetime:
   “2012-04-26 14:05:30”, ua: “Mozilla ....”, ...}


• 后台的数据分析步骤可以分解为⼀一些基本的常用的操作


 • 如 filter、map、count、distinct、group、sum ...


 • 这些基本操作可以使用另⼀一种胶水语言(JavaScript)组合起来
基本架构
打点
黄金矿工
打点 JS

• goldlog.emit(id, key_value_data);


• 实际上是对 new Image(); 的⼀一个封装


• http://www.atpanel.com/ued.1.1.2?type=9&_gm:id={id}
分析
黄金矿工
新增全局对象

• log


• datetime


• GoldMiner
log 记下指定日志信息

• log(“message”);
datetime 常用时间日期方法

• datetime.yesterday()


• datetime.today()


• datetime.now()


• datetime.daysOffset(n)


• datetime.datetime(year, month, day, hour=0, minute=0, second=0)


• ...


• 也可以使用 new Date() 代替,但 datetime 更方便
GoldMiner 与后台数据的接口

• var goldminer = new GoldMiner(“global_sample”, datetime.yesterday());


• var data = goldminer.data;


   • data.filter()


   • data.map()


   • data.group()


   • data.count()


   • ...
分析 JS
http://goldminer.taobao.org
Q&A
下集预告 / to be continued...
Thanks! :-)

More Related Content

Similar to Lie to me S01.e01.黄金矿工

淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座NTC.im(Notch Training Center)
 
Introduction to big data
Introduction to big dataIntroduction to big data
Introduction to big data邦宇 叶
 
「大數據之路:阿里巴巴大數據實戰」 讀書心得
「大數據之路:阿里巴巴大數據實戰」 讀書心得「大數據之路:阿里巴巴大數據實戰」 讀書心得
「大數據之路:阿里巴巴大數據實戰」 讀書心得Chang Tai-Wei
 
数据挖掘理论与实践
数据挖掘理论与实践数据挖掘理论与实践
数据挖掘理论与实践medcl
 
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lakeJames Chen
 
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法Jazz Yao-Tsung Wang
 
Geo science cafe 如何找到一份满意的工作
Geo science cafe 如何找到一份满意的工作Geo science cafe 如何找到一份满意的工作
Geo science cafe 如何找到一份满意的工作kewuc
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseJack Gao
 
数据架构方面的一些探讨
数据架构方面的一些探讨数据架构方面的一些探讨
数据架构方面的一些探讨Chao Zhu
 
A brief introduction to Machine Learning
A brief introduction to Machine LearningA brief introduction to Machine Learning
A brief introduction to Machine LearningWen-Tien Chang
 
自助工具助Dba提升效率
自助工具助Dba提升效率自助工具助Dba提升效率
自助工具助Dba提升效率Chao Zhu
 
网站离线数据安全分析漫谈 2012cert
网站离线数据安全分析漫谈 2012cert网站离线数据安全分析漫谈 2012cert
网站离线数据安全分析漫谈 2012certph4nt0m
 
云存储: 三分开发,七分运维
云存储: 三分开发,七分运维云存储: 三分开发,七分运维
云存储: 三分开发,七分运维LI Daobing
 
美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New翀 刘
 
大规模数据库存储方案
大规模数据库存储方案大规模数据库存储方案
大规模数据库存储方案XiaoJun Hong
 
淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]KennyZ
 
七牛云存储详解
七牛云存储详解七牛云存储详解
七牛云存储详解niuer7
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里li luo
 
淘宝双11双12案例分享
淘宝双11双12案例分享淘宝双11双12案例分享
淘宝双11双12案例分享vanadies10
 

Similar to Lie to me S01.e01.黄金矿工 (20)

淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
 
Introduction to big data
Introduction to big dataIntroduction to big data
Introduction to big data
 
「大數據之路:阿里巴巴大數據實戰」 讀書心得
「大數據之路:阿里巴巴大數據實戰」 讀書心得「大數據之路:阿里巴巴大數據實戰」 讀書心得
「大數據之路:阿里巴巴大數據實戰」 讀書心得
 
数据挖掘理论与实践
数据挖掘理论与实践数据挖掘理论与实践
数据挖掘理论与实践
 
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
 
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
 
Geo science cafe 如何找到一份满意的工作
Geo science cafe 如何找到一份满意的工作Geo science cafe 如何找到一份满意的工作
Geo science cafe 如何找到一份满意的工作
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouse
 
数据架构方面的一些探讨
数据架构方面的一些探讨数据架构方面的一些探讨
数据架构方面的一些探讨
 
A brief introduction to Machine Learning
A brief introduction to Machine LearningA brief introduction to Machine Learning
A brief introduction to Machine Learning
 
自助工具助Dba提升效率
自助工具助Dba提升效率自助工具助Dba提升效率
自助工具助Dba提升效率
 
网站离线数据安全分析漫谈 2012cert
网站离线数据安全分析漫谈 2012cert网站离线数据安全分析漫谈 2012cert
网站离线数据安全分析漫谈 2012cert
 
云存储: 三分开发,七分运维
云存储: 三分开发,七分运维云存储: 三分开发,七分运维
云存储: 三分开发,七分运维
 
美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New
 
大规模数据库存储方案
大规模数据库存储方案大规模数据库存储方案
大规模数据库存储方案
 
淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]
 
碰撞
碰撞碰撞
碰撞
 
七牛云存储详解
七牛云存储详解七牛云存储详解
七牛云存储详解
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
 
淘宝双11双12案例分享
淘宝双11双12案例分享淘宝双11双12案例分享
淘宝双11双12案例分享
 

Lie to me S01.e01.黄金矿工