SlideShare a Scribd company logo
个人介绍| 唐晓韬介绍
1
2011.4
微软
2012.11
EMC
2014.4
百度
Microsoft EMC²
AGENDA
技术卓越与创新
元芳平台建设
数据库设计调优
抓取服务调研
跨部门合作
2
跨职能合作与推动
Good Coder
招聘面试
新人培训
项目测试与贡献
统计Rcv端测试
大司南项目测试
技术卓越与创新 | 元芳平台介绍
点我!!! 看看您关心产品的用户舆情吧
3
技术卓越与创新 | 元芳平台
日均2W产品评论
提取1.5K有效情感反馈
日均用户访问5K条反馈数据
90+ 公司产品
10+ 竞品
销售监察部、无线凤巢、网盟、百度云、LBS糯米等
舆情报表、数据接口
2014年总监奖
(合作平台最佳合作项目)
数据量
产品覆盖
用户合作
平台输出
4
技术卓越与创新 | 元芳Web展现
5
元芳Web端开发工作
团队当时没有FE
团队技术偏后端,没有Web开发经验
迎难而上,接手元芳Web端,一周快速学习
使用Django,Bootstrap,ECharts等第三方组件
元芳界面简洁美观,收到业务方一致好评
后续需求迭代持续跟进
元芳上线后,收到很多来自用户的需求反馈
将业务方需求评审开发
保持周级别的快速迭代上线
需求分析&报表展现
分析需求,从产品和用户的角度进行设计
多次进行调整,挖掘对用户最有价值的报表形态
用户的数据 -> 聚合产品问题点
技术卓越与创新 | 元芳数据库
6
清晰的数据库设计
技术卓越与创新 | 典型问题
7
需求
根据几下几个维度:
时间区间
产品线
数据源
舆情正负向
问题点相关舆情内容
难点
实时入库不适合离线缓存
性能要求:实时查询
涉及关联表多(6个)
GROUP BY 聚合效率低
解决过程
试选主表
调试性能
存储过程
1秒内的查询时间
持续改进
根据数据规模跟进
迁移Palo,Doris等
技术卓越与创新 | 网页抓取服务
起因
百度与新浪合作未继续
微博数据不再推送至UDW
影响
元芳微博数据断流
影响其他部门的依赖项目
产品方急切盼望能续上数据
难点
微博数据量大
需要登陆帐号并带cookie 访问
微博反抓取策略黑盒
存在公司IP段被屏蔽的风险
公司现有平台无法完成抓取
8
平台 账号登陆 带Cookie访问 日均千万级别 自定义解析 抓取频率设置
PIE
Crawler
FATS
额外开发 额外开发 额外开发
技术卓越与创新 | 网页抓取服务
解决方案
改全量抓取为搜索结果抓取,解决数量多难点和质量差难点
解决了页面结构复杂,帐号登陆,访问限制三个技术难点
反复尝试,解决反抓取策略难点:同IP无限制,但帐号有地域限制和频率限制
抓取效果
产出稳定:日均抓取9W+数据
资源消耗低:单机3小时即可满足元芳需求
数据质量无下降:日均有效情感数据维持在1K以上
成果总结
框架通用化,轻松接入元芳后续数据源抓取需求
服务平台化,今后可以接入元芳以外的抓取需求
针对微博封禁,可以通过众测肉鸡方式,平滑扩展抓取能力
9
技术卓越与创新 | 跨部门合作
元芳平台对接MSD
- 为MSD团队提供元芳服务
- 元芳的数据量高于其他外部舆情工具
- 完成MSD提出的新需求并整合到元芳平台
元芳平台对接众测
- 双方都刚刚开始做API开发,及时沟通,2天完成联调
- 2次线上问题,1天内定位解决
- 每日吞吐1.5w标注数据
- 每日数据在3小时内返回,并在元芳平台展现
- 标注准确性提升到97%
10
元芳平台对接风控团队
- 为风控团队提供定向的舆情抓取
- 发布元芳数据访问接口
- 保证风控团队的舆情日历按时上线
项目测试与贡献 | 统计Rcv测试
11
统计Rcv项目背景:
业务逻辑多,回归测试工作量大
rcv由原先一年几次发布,到今年共有15次上线
为了适应将来的需求,Rcv今年进行整体重构
整个统计项目的日志接收器,性能要求高
Rcv如果出问题,下游数据将断流
项目测试与贡献 | 统计Rcv测试
12
我的贡献:
和RD一起沟通梳理,将RCV的业务逻辑整理成文档
开发Rcv的自动化测试工具,覆盖产品核心功能
降低测试时间,添加新功能的测试时间由4-5天降为2-3天
团队价值:
今年一共发布15个Release,做到线上0事故
项目测试与贡献 | 大司南测试
司南背景:
百度司南基于百度积累海量网民行为数据和先进行为分析技术,以强大的数据分析优势,
将看不见的用户需求进行量化,以数字形式准确展现用户行为,为广告主提供精准的营销
决策依据
目前现状:
收费项目1个,1.0项目2个
今年上线19次,完成story 79个
Story中规划的新项目4个
13
项目测试与贡献 | 大司南测试
14
项目概况
持续新功能,新项目上线,测试量大
QA:RD人力配比 1:15
测试方向
在Story评审发现逻辑bug
在详设评审中及时打回设计不合理
在严格的Code Review中发现代码问题
今年成果
项目均按时发布上线无Delay
QA提交bug69个,收敛44%
后续规划
推动司南的UT覆盖率
司南项目自动化测试
流程把控
自动化方案
提高工作效率
跨职能合作与推动 | 我的贡献
Good Coder 之路
QA CMC 第一个通过Good Coder 认证
作为二审向Code Master迈进
参与4人的Good Coder评审
团队建设
面试
技术帮助
新人培训
其他
15
Q & A
16

More Related Content

Similar to work@baidu 2014

移动互联网的机遇与挑战
移动互联网的机遇与挑战移动互联网的机遇与挑战
移动互联网的机遇与挑战
Courtney Chow
 
橙果數位行銷_公司簡介及經典案例介紹
橙果數位行銷_公司簡介及經典案例介紹橙果數位行銷_公司簡介及經典案例介紹
橙果數位行銷_公司簡介及經典案例介紹Calven Kang
 
数据采集中间件技术交流
数据采集中间件技术交流数据采集中间件技术交流
数据采集中间件技术交流
jerry tom
 
Picoway Company Profile 1.5
Picoway Company Profile 1.5Picoway Company Profile 1.5
Picoway Company Profile 1.5
picoway
 
Picoway Company Profile V1.5
Picoway Company Profile V1.5Picoway Company Profile V1.5
Picoway Company Profile V1.5
picoway
 
Resume - CV - Shanghai
Resume - CV - ShanghaiResume - CV - Shanghai
Resume - CV - Shanghai
Zac John
 
New ratonwork bp(20 pages angelist pinch) final 902
New ratonwork bp(20 pages angelist pinch)  final 902New ratonwork bp(20 pages angelist pinch)  final 902
New ratonwork bp(20 pages angelist pinch) final 902Wei Zhong
 
20170108 微軟大數據整合解決方案- cortana intelligence suite
20170108 微軟大數據整合解決方案- cortana intelligence suite20170108 微軟大數據整合解決方案- cortana intelligence suite
20170108 微軟大數據整合解決方案- cortana intelligence suite
Meng-Ru (Raymond) Tsai
 
文思业务介绍
文思业务介绍文思业务介绍
文思业务介绍
Jiang_haike
 
中華民國科技管理個案競賽 Motivate our taiwan
中華民國科技管理個案競賽 Motivate our taiwan中華民國科技管理個案競賽 Motivate our taiwan
中華民國科技管理個案競賽 Motivate our taiwan孟賢 顏
 
2009/04/19 UI Gathering專題演講-「偽」網站設計-Website Prototype Design的實務應用分享
2009/04/19 UI Gathering專題演講-「偽」網站設計-Website Prototype Design的實務應用分享2009/04/19 UI Gathering專題演講-「偽」網站設計-Website Prototype Design的實務應用分享
2009/04/19 UI Gathering專題演講-「偽」網站設計-Website Prototype Design的實務應用分享
Justin Lee
 
PPT设计形象化
PPT设计形象化PPT设计形象化
PPT设计形象化CaoQingpeng
 
Don’T Make Me Think—Ppt设计中的形象化表达 田士庆(小田)
Don’T Make Me Think—Ppt设计中的形象化表达 田士庆(小田) Don’T Make Me Think—Ppt设计中的形象化表达 田士庆(小田)
Don’T Make Me Think—Ppt设计中的形象化表达 田士庆(小田)
WooKong
 
Webinsight互联网全景测评
Webinsight互联网全景测评Webinsight互联网全景测评
Webinsight互联网全景测评Rachel Zhou
 
05 朱近之 ibm云计算解决方案概览 0611
05 朱近之 ibm云计算解决方案概览 061105 朱近之 ibm云计算解决方案概览 0611
05 朱近之 ibm云计算解决方案概览 0611ikewu83
 
美团点评技术沙龙011 - 客户端用户体验数据量化
美团点评技术沙龙011 - 客户端用户体验数据量化美团点评技术沙龙011 - 客户端用户体验数据量化
美团点评技术沙龙011 - 客户端用户体验数据量化
美团点评技术团队
 
雲端行動商務發展趨勢 V1.2
雲端行動商務發展趨勢 V1.2雲端行動商務發展趨勢 V1.2
雲端行動商務發展趨勢 V1.2yaohung
 
Velocity2011分享
Velocity2011分享Velocity2011分享
Velocity2011分享
Zoom Quiet
 
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境drewz lin
 

Similar to work@baidu 2014 (20)

移动互联网的机遇与挑战
移动互联网的机遇与挑战移动互联网的机遇与挑战
移动互联网的机遇与挑战
 
橙果數位行銷_公司簡介及經典案例介紹
橙果數位行銷_公司簡介及經典案例介紹橙果數位行銷_公司簡介及經典案例介紹
橙果數位行銷_公司簡介及經典案例介紹
 
数据采集中间件技术交流
数据采集中间件技术交流数据采集中间件技术交流
数据采集中间件技术交流
 
Picoway Company Profile 1.5
Picoway Company Profile 1.5Picoway Company Profile 1.5
Picoway Company Profile 1.5
 
Picoway Company Profile V1.5
Picoway Company Profile V1.5Picoway Company Profile V1.5
Picoway Company Profile V1.5
 
Resume - CV - Shanghai
Resume - CV - ShanghaiResume - CV - Shanghai
Resume - CV - Shanghai
 
New ratonwork bp(20 pages angelist pinch) final 902
New ratonwork bp(20 pages angelist pinch)  final 902New ratonwork bp(20 pages angelist pinch)  final 902
New ratonwork bp(20 pages angelist pinch) final 902
 
20170108 微軟大數據整合解決方案- cortana intelligence suite
20170108 微軟大數據整合解決方案- cortana intelligence suite20170108 微軟大數據整合解決方案- cortana intelligence suite
20170108 微軟大數據整合解決方案- cortana intelligence suite
 
文思业务介绍
文思业务介绍文思业务介绍
文思业务介绍
 
中華民國科技管理個案競賽 Motivate our taiwan
中華民國科技管理個案競賽 Motivate our taiwan中華民國科技管理個案競賽 Motivate our taiwan
中華民國科技管理個案競賽 Motivate our taiwan
 
2009/04/19 UI Gathering專題演講-「偽」網站設計-Website Prototype Design的實務應用分享
2009/04/19 UI Gathering專題演講-「偽」網站設計-Website Prototype Design的實務應用分享2009/04/19 UI Gathering專題演講-「偽」網站設計-Website Prototype Design的實務應用分享
2009/04/19 UI Gathering專題演講-「偽」網站設計-Website Prototype Design的實務應用分享
 
Medialand 2013
Medialand 2013Medialand 2013
Medialand 2013
 
PPT设计形象化
PPT设计形象化PPT设计形象化
PPT设计形象化
 
Don’T Make Me Think—Ppt设计中的形象化表达 田士庆(小田)
Don’T Make Me Think—Ppt设计中的形象化表达 田士庆(小田) Don’T Make Me Think—Ppt设计中的形象化表达 田士庆(小田)
Don’T Make Me Think—Ppt设计中的形象化表达 田士庆(小田)
 
Webinsight互联网全景测评
Webinsight互联网全景测评Webinsight互联网全景测评
Webinsight互联网全景测评
 
05 朱近之 ibm云计算解决方案概览 0611
05 朱近之 ibm云计算解决方案概览 061105 朱近之 ibm云计算解决方案概览 0611
05 朱近之 ibm云计算解决方案概览 0611
 
美团点评技术沙龙011 - 客户端用户体验数据量化
美团点评技术沙龙011 - 客户端用户体验数据量化美团点评技术沙龙011 - 客户端用户体验数据量化
美团点评技术沙龙011 - 客户端用户体验数据量化
 
雲端行動商務發展趨勢 V1.2
雲端行動商務發展趨勢 V1.2雲端行動商務發展趨勢 V1.2
雲端行動商務發展趨勢 V1.2
 
Velocity2011分享
Velocity2011分享Velocity2011分享
Velocity2011分享
 
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
 

work@baidu 2014

Editor's Notes

  1. Agenda 项目测试与贡献 产品和用户导向 技术卓越与创新 跨职能合作与推动
  2. 技术卓越与创新(微博抓取) 起因: UDW断流 过程: 登录、结构:调研spider平台无法满足 量大:日均千万级别 改进: 改为搜索结果抓取 编写登录模块 多线程抓取 成果: 日均9万结果,3小时 正在改造以提供更多服务 另外之前我们是从UDW获取的新浪微博数据,但是去年正在元芳还没接入贴吧数据时,微博的合作到期了,导致数据断流。我们通过调研,发现我厂的各个spider平台,在功能上无法满足新浪微博的抓取需求,最终使得我们开发了自有的新浪微博抓取平台。 之所以其它平台无法满足需求,是因为新浪微博几个限制:第一,需要登录账号、记住cookie才能完整访问,不然只能访问前5条,而且访问页面时有一次http重定向、一次js重定向;第二,较严格的反抓取策略,单账号大约要在1min+才能抓取一次,还时不时出来验证码页面;第三,微博量大,一天数千万的记录数,其实有用的才几万条,这点我们最终也是改变策略,改为抓取微博搜索页面拿到的。基本上,通用的抓取平台容易卡在第一点和第四点,fats则卡在第二点和第三点上。 针对这些,我们设计了一套微博抓取服务,当前只服务于元芳平台,所以是以关键字为抓取目标的。 整个平台设计分为三块:一块是url生成器,与关键词绑定,通过关键词和时间段生成url列表,并负责解析抓取页面的内容;一块是client,和微博账号绑定,拿到url后进行抓取;最后一块是manager,负责merge各待抓取的url列表并分发给可用的client上,并且有监控机制,定时检查client的可用性,将这个client上未抓取的url重新分发给其它client,最后manager还会将结果保存至文件。 这个抓取平台的特点有:支持多产品并行抓取;支持多spider提升抓取速度;自动错误检查;可断点续抓。当前在单机情况下,3小时抓取完元芳所需的一天的微博数据约10万。并且利用富余的抓取能力,为销售监察部提供监控数据。 将来这一块会接口化,对外提供新浪微博关键字内容抓取能力;同时,内部代码结构也会持续调整,便于为其它难搞定的数据源,提供抓取服务。
  3. 技术卓越与创新(微博抓取) 起因: UDW断流 过程: 登录、结构:调研spider平台无法满足 量大:日均千万级别 改进: 改为搜索结果抓取 编写登录模块 多线程抓取 成果: 日均9万结果,3小时 正在改造以提供更多服务 另外之前我们是从UDW获取的新浪微博数据,但是去年正在元芳还没接入贴吧数据时,微博的合作到期了,导致数据断流。我们通过调研,发现我厂的各个spider平台,在功能上无法满足新浪微博的抓取需求,最终使得我们开发了自有的新浪微博抓取平台。 之所以其它平台无法满足需求,是因为新浪微博几个限制:第一,需要登录账号、记住cookie才能完整访问,不然只能访问前5条,而且访问页面时有一次http重定向、一次js重定向;第二,较严格的反抓取策略,单账号大约要在1min+才能抓取一次,还时不时出来验证码页面;第三,微博量大,一天数千万的记录数,其实有用的才几万条,这点我们最终也是改变策略,改为抓取微博搜索页面拿到的。基本上,通用的抓取平台容易卡在第一点和第四点,fats则卡在第二点和第三点上。 针对这些,我们设计了一套微博抓取服务,当前只服务于元芳平台,所以是以关键字为抓取目标的。 整个平台设计分为三块:一块是url生成器,与关键词绑定,通过关键词和时间段生成url列表,并负责解析抓取页面的内容;一块是client,和微博账号绑定,拿到url后进行抓取;最后一块是manager,负责merge各待抓取的url列表并分发给可用的client上,并且有监控机制,定时检查client的可用性,将这个client上未抓取的url重新分发给其它client,最后manager还会将结果保存至文件。 这个抓取平台的特点有:支持多产品并行抓取;支持多spider提升抓取速度;自动错误检查;可断点续抓。当前在单机情况下,3小时抓取完元芳所需的一天的微博数据约10万。并且利用富余的抓取能力,为销售监察部提供监控数据。 将来这一块会接口化,对外提供新浪微博关键字内容抓取能力;同时,内部代码结构也会持续调整,便于为其它难搞定的数据源,提供抓取服务。
  4. 技术卓越与创新(微博抓取) 起因: UDW断流 过程: 登录、结构:调研spider平台无法满足 量大:日均千万级别 改进: 改为搜索结果抓取 编写登录模块 多线程抓取 成果: 日均9万结果,3小时 正在改造以提供更多服务 另外之前我们是从UDW获取的新浪微博数据,但是去年正在元芳还没接入贴吧数据时,微博的合作到期了,导致数据断流。我们通过调研,发现我厂的各个spider平台,在功能上无法满足新浪微博的抓取需求,最终使得我们开发了自有的新浪微博抓取平台。 之所以其它平台无法满足需求,是因为新浪微博几个限制:第一,需要登录账号、记住cookie才能完整访问,不然只能访问前5条,而且访问页面时有一次http重定向、一次js重定向;第二,较严格的反抓取策略,单账号大约要在1min+才能抓取一次,还时不时出来验证码页面;第三,微博量大,一天数千万的记录数,其实有用的才几万条,这点我们最终也是改变策略,改为抓取微博搜索页面拿到的。基本上,通用的抓取平台容易卡在第一点和第四点,fats则卡在第二点和第三点上。 针对这些,我们设计了一套微博抓取服务,当前只服务于元芳平台,所以是以关键字为抓取目标的。 整个平台设计分为三块:一块是url生成器,与关键词绑定,通过关键词和时间段生成url列表,并负责解析抓取页面的内容;一块是client,和微博账号绑定,拿到url后进行抓取;最后一块是manager,负责merge各待抓取的url列表并分发给可用的client上,并且有监控机制,定时检查client的可用性,将这个client上未抓取的url重新分发给其它client,最后manager还会将结果保存至文件。 这个抓取平台的特点有:支持多产品并行抓取;支持多spider提升抓取速度;自动错误检查;可断点续抓。当前在单机情况下,3小时抓取完元芳所需的一天的微博数据约10万。并且利用富余的抓取能力,为销售监察部提供监控数据。 将来这一块会接口化,对外提供新浪微博关键字内容抓取能力;同时,内部代码结构也会持续调整,便于为其它难搞定的数据源,提供抓取服务。
  5. 技术卓越与创新(微博抓取) 起因: UDW断流 过程: 登录、结构:调研spider平台无法满足 量大:日均千万级别 改进: 改为搜索结果抓取 编写登录模块 多线程抓取 成果: 日均9万结果,3小时 正在改造以提供更多服务 另外之前我们是从UDW获取的新浪微博数据,但是去年正在元芳还没接入贴吧数据时,微博的合作到期了,导致数据断流。我们通过调研,发现我厂的各个spider平台,在功能上无法满足新浪微博的抓取需求,最终使得我们开发了自有的新浪微博抓取平台。 之所以其它平台无法满足需求,是因为新浪微博几个限制:第一,需要登录账号、记住cookie才能完整访问,不然只能访问前5条,而且访问页面时有一次http重定向、一次js重定向;第二,较严格的反抓取策略,单账号大约要在1min+才能抓取一次,还时不时出来验证码页面;第三,微博量大,一天数千万的记录数,其实有用的才几万条,这点我们最终也是改变策略,改为抓取微博搜索页面拿到的。基本上,通用的抓取平台容易卡在第一点和第四点,fats则卡在第二点和第三点上。 针对这些,我们设计了一套微博抓取服务,当前只服务于元芳平台,所以是以关键字为抓取目标的。 整个平台设计分为三块:一块是url生成器,与关键词绑定,通过关键词和时间段生成url列表,并负责解析抓取页面的内容;一块是client,和微博账号绑定,拿到url后进行抓取;最后一块是manager,负责merge各待抓取的url列表并分发给可用的client上,并且有监控机制,定时检查client的可用性,将这个client上未抓取的url重新分发给其它client,最后manager还会将结果保存至文件。 这个抓取平台的特点有:支持多产品并行抓取;支持多spider提升抓取速度;自动错误检查;可断点续抓。当前在单机情况下,3小时抓取完元芳所需的一天的微博数据约10万。并且利用富余的抓取能力,为销售监察部提供监控数据。 将来这一块会接口化,对外提供新浪微博关键字内容抓取能力;同时,内部代码结构也会持续调整,便于为其它难搞定的数据源,提供抓取服务。
  6. 改进: 改为搜索结果抓取 编写登录模块 多线程抓取 成果: 日均9万结果,3小时 正在改造以提供更多服务
  7. 之前工作 性能优化 提升百度统计的前端页面展现性能 无线数据整理
  8. 项目测试与贡献(介绍) 司南产品组: 负责司南(专业版)、司南代言人、司南舆情、精算四个产品 简单介绍 难点: 人力比约1:8,且自测 自动化复杂度高,数据耦合严重 Story较多,实际工作量较大 共xxx个story,上线yyy次, 项目测试与贡献(贡献部分) 提早接入,改进送测质量:从MRD、RD评审等开始展现QA能力,改进xxx处 改造、丰富自动化lib库,实现代码xxx行,部署时间从1天降至0.5小时,新功能测试从3天降至1天 推进测试用例前置,改进测试质量,提出bugxxx个 CR改善提测质量 这其中,司南专业版在接手前刚刚经历了一次重大改版,产品代码几乎重写,测试用例几乎全失效;精算也新增两个大功能点;再加上两个1.0的项目,其中还有一个是百度大会展示产品。在人力比长期1:10+的情况下,还长期存在架构的不合理、自测程度低的问题。 改进的点主要有两个: 第一是 提升测试质量,在人力紧张的情况下仍然主动参与MRD评审和详设评审,从前期保证设计质量;同时,广泛采用送测时showcase的方式,从RD处保证送测质量;同时每个story也会由一位QA进行测试用例设计或测试脑图设计后由其它人review,也保证了测试过程质量。另外坚持CR、坚持可自动化测试部分的100%功能覆盖也是保证质量的一部分。 第二是 提升测试效率,一方面是完善测试所需的自动化部署脚本、进一步封装请求脚本,这里相对复杂的后端部署,从10小时降低至1小时,数据准备从无法同步更新优化至同步更新,后端story测试也平均从3人天降低至1人天。另一方面也推进非主要功能的RD自测,周边模块的搭建也拉入RD进行部署,降低工作量,更能focus在主要功能的测试上。
  9. 项目测试与贡献(介绍) 司南产品组: 负责司南(专业版)、司南代言人、司南舆情、精算四个产品 简单介绍 难点: 人力比约1:8,且自测 自动化复杂度高,数据耦合严重 Story较多,实际工作量较大 共xxx个story,上线yyy次, 项目测试与贡献(贡献部分) 提早接入,改进送测质量:从MRD、RD评审等开始展现QA能力,改进xxx处 改造、丰富自动化lib库,实现代码xxx行,部署时间从1天降至0.5小时,新功能测试从3天降至1天 推进测试用例前置,改进测试质量,提出bugxxx个 CR改善提测质量 这其中,司南专业版在接手前刚刚经历了一次重大改版,产品代码几乎重写,测试用例几乎全失效;精算也新增两个大功能点;再加上两个1.0的项目,其中还有一个是百度大会展示产品。在人力比长期1:10+的情况下,还长期存在架构的不合理、自测程度低的问题。 改进的点主要有两个: 第一是 提升测试质量,在人力紧张的情况下仍然主动参与MRD评审和详设评审,从前期保证设计质量;同时,广泛采用送测时showcase的方式,从RD处保证送测质量;同时每个story也会由一位QA进行测试用例设计或测试脑图设计后由其它人review,也保证了测试过程质量。另外坚持CR、坚持可自动化测试部分的100%功能覆盖也是保证质量的一部分。 第二是 提升测试效率,一方面是完善测试所需的自动化部署脚本、进一步封装请求脚本,这里相对复杂的后端部署,从10小时降低至1小时,数据准备从无法同步更新优化至同步更新,后端story测试也平均从3人天降低至1人天。另一方面也推进非主要功能的RD自测,周边模块的搭建也拉入RD进行部署,降低工作量,更能focus在主要功能的测试上。
  10. 项目测试与贡献(介绍) 我是BDG下holmes QA 周迎凤,在holmes组已经两年了。 Holmes的对应的产品线有3大块,一块是统计系,包括百度统计、百度移动统计和duair;一块是司南系,包括司南专业版、百度精算、百度代言人和百度舆情用户版,之前还有过百度预测;另一块是百度推荐。 这其中我参与过百度统计的后端测试,后来逐步调整到整个司南产品系列,包括前后端。 简单说下,司南是一个面向广告主和代理商的产品,是以cookie为键值打通百度各个产品的数据,分析某个产品的人群、某个目标人群会关注哪些关键词、会常上哪些网站、在哪些地区会有更高的比例; 精算是一个查看广告效果的产品,能统计在某个网站上某个广告位,看过多少次、点击过多少次,并且还能结合大搜数据统计出回搜的比例。 百度代言人和百度舆情都是1.0的项目,前者是帮各个品牌分析哪个娱乐明星、哪个体育明星适合做代言,后者是将抓取各个电商和专业论坛的信息后聚类出网友们对某个产品的评论。
  11. 项目测试与贡献(介绍) 我是BDG下holmes QA 周迎凤,在holmes组已经两年了。 Holmes的对应的产品线有3大块,一块是统计系,包括百度统计、百度移动统计和duair;一块是司南系,包括司南专业版、百度精算、百度代言人和百度舆情用户版,之前还有过百度预测;另一块是百度推荐。 这其中我参与过百度统计的后端测试,后来逐步调整到整个司南产品系列,包括前后端。 简单说下,司南是一个面向广告主和代理商的产品,是以cookie为键值打通百度各个产品的数据,分析某个产品的人群、某个目标人群会关注哪些关键词、会常上哪些网站、在哪些地区会有更高的比例; 精算是一个查看广告效果的产品,能统计在某个网站上某个广告位,看过多少次、点击过多少次,并且还能结合大搜数据统计出回搜的比例。 百度代言人和百度舆情都是1.0的项目,前者是帮各个品牌分析哪个娱乐明星、哪个体育明星适合做代言,后者是将抓取各个电商和专业论坛的信息后聚类出网友们对某个产品的评论。
  12. 之前工作 性能优化 提升百度统计的前端页面展现性能 无线数据整理
  13. 跨职能合作与推动 Good coder通过 多次联调 3. 协助组内几个topic