Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
外卖场景下的订单预测及列表
优化问题
王兴星
内容概览
•  外卖背景	
  
•  订单预测	
  
•  列表优化	
  
•  总结
外卖行业的发展
1993.8
丽华快
餐
2009.4
饿了么
2013.12
美团外
卖 淘
点点
2014.5
百度外
卖
2014.11
美团外
卖100w
单
2015.12
美团外
卖300w
单
2016.5
美团外
卖400w
单
外卖行业的发展
外卖与团购的异同
流量
性价比
方便快捷
支付
线上
线上为主
就餐
套餐+到店消费
点餐+配送到家
外卖的特点
•  移动化	
  
•  本地化	
  
•  场景化	
  
外卖的特点:移动化
•  移动化
外卖的特点:本地化
•  本地化	
  
– 某城市各品类距离占比:
外卖的特点:场景化
•  场景化
订单预估的应用场景
•  订单量预估的应用场景:	
  
– 城市稳定性;	
  
– 运力监控、预估;	
  
– 广告流量预估、定价;	
  
城市订单预估
•  城市订单稳定性:	
  
– 城市维度的波动是否正常?	
  
– 人工检查工作量大;	
  
– 人工确认波动原因成本大;	
  
– 定位到原因,难以量化;	
  
城市订单预估
•  模型需要解决的问题:	
  
– 自动的监控、报警;	
  
– 原因发现;	
  
– 原因的影响的量化;
城市订单预估
•  解决路径:	
  
– 简单平均;	
  
– 时间序列预估;	
  
– 自回归模型;	
  
– 级联模型;
城市订单预估:牛刀小试
数据收集
• 全国约100个城市;
• A&B类城市占据大部分订单;
预处理
• 小城市,订单量小,波动大
• 异常样本过滤
简单平均
• 周期性:工作区&居住区
时间序列
• 指数平滑
• Holt-­‐Winters
城市订单预估:效果
•  评价指标:	
  
–  误差率:	
  
	
   |预测单量-真实单量|	
  / 真实单量 * 100%	
  
•  效果分析:	
  
城市订单预估:应用场景的差异
•  不用数据表现差别较大:	
  
	
  	
  	
  	
  
	
  
	
  
	
  
	
  
	
  
	
   (商圈级别表现更加明显)	
  	
  	
  	
  	
  	
  	
  	...
城市订单预估:其他因素
•  订单量此外的因素:	
  
– 天气;	
  
– 星期几;	
  
– 节假日;	
  
– 平均配送费用;	
  
– 是否开启红包;	
  
– 红包使用的比例;	
  
– …
城市订单预估
•  非订单因数,怎么融入?	
  
– 建立统一模型:	
  
•  如何达到非线性效果:特征&模型;	
  
•  特征如何处理:	
  
–  归一化;	
  
–  离散化;	
  
–  交叉化	
  
•  核心关注点...
城市订单预估:级联模型
•  级联模型:	
  
– 第一级:自回归模型;	
  
– 第二级:	
  
•  目标:真实值/自回归值;	
  
•  特征:	
  
–  非自回归模型特征;	
  
•  效果:	
  
–  BoosDng...
城市订单预估:级联模型
•  可解释性:	
  
– 特征间差异直接反映了对订单量的影响;
天气 权重
大雨 0.1780
暴雨 0.1492
晴 -­‐0.0038
…
列表优化
•  产品形态
列表优化:架构
•  架构
列表优化:离线流程
•  负样本的有效性:	
  
– 常用负样本的产生方法:	
  
•  采样、高频用户/商品;	
  
– 流量清洗:	
  
•  抓取流量;	
  
•  无效加载
列表优化:特征体系
•  特征矩阵:
1.商家 2.用户
3.商家&用户
列表优化:模型
•  树模型:为什么使用树模型?	
  
– Decision	
  Tree:简单贪婪,C4.5;	
  
– Bagging:民主智慧,RF;	
  
– BoosDng:知错就改,GBDT;
•  非线性模型:	
  
–...
列表优化:实时性要求
•  实时性的要求:	
  
–  商家库存;	
  
–  商家服务质量;	
  
–  商家活动情况;	
  
–  配送运力情况;
	
  
•  实时性方案:	
  
–  方案一:非统计特征,模型实时学习,在线学...
列表优化:特征实时性
•  特征实时化:
列表优化:跨系统交互
•  跨系统交互:(配送)	
  
– 商家售罄:	
  
•  库存、单量预测;	
  
– 流控:	
  
•  实时负载指标;	
  
•  配送等待时间;	
  
•  配送预计送达时间;
列表优化:新商家
•  新商家:	
  
– 如何确定新商家的质量?	
  
•  固定位置,定义新商家,同类型展示;	
  
•  不确定位置,E&E策略;	
  
•  其他运营方案:广告;
总结
•  总结:	
  
– 理解业务,技术驱动;	
  
– 没有完全一致的技术方案;	
  
– 最小可迭代方案,不断优化;	
  
Thank	
  You!
Upcoming SlideShare
Loading in …5
×

美团点评技术沙龙09 - 美团外卖中的单量预估及列表优化

1,147 views

Published on

经过几年的发展,目前每天美团外卖的已是一个数百万单量级的大应用。在此报告中我们一起探讨其中的几个问题: 1,订单量的预测:针对不同地理位置级别,如果对日单量进行建模,分析有哪些因数会影响单量,如何提高预测精度的同时,保证模型的可解释性; 2,主流量的优化:列表是美团外卖平台的主要流量入口,利用技术手段更好地完成了用户订餐需求和商家外卖供给的个性化匹配,提升用户点餐体验和流量使用效率。

Published in: Engineering
  • Login to see the comments

美团点评技术沙龙09 - 美团外卖中的单量预估及列表优化

  1. 1. 外卖场景下的订单预测及列表 优化问题 王兴星
  2. 2. 内容概览 •  外卖背景   •  订单预测   •  列表优化   •  总结
  3. 3. 外卖行业的发展 1993.8 丽华快 餐 2009.4 饿了么 2013.12 美团外 卖 淘 点点 2014.5 百度外 卖 2014.11 美团外 卖100w 单 2015.12 美团外 卖300w 单 2016.5 美团外 卖400w 单
  4. 4. 外卖行业的发展
  5. 5. 外卖与团购的异同 流量 性价比 方便快捷 支付 线上 线上为主 就餐 套餐+到店消费 点餐+配送到家
  6. 6. 外卖的特点 •  移动化   •  本地化   •  场景化  
  7. 7. 外卖的特点:移动化 •  移动化
  8. 8. 外卖的特点:本地化 •  本地化   – 某城市各品类距离占比:
  9. 9. 外卖的特点:场景化 •  场景化
  10. 10. 订单预估的应用场景 •  订单量预估的应用场景:   – 城市稳定性;   – 运力监控、预估;   – 广告流量预估、定价;  
  11. 11. 城市订单预估 •  城市订单稳定性:   – 城市维度的波动是否正常?   – 人工检查工作量大;   – 人工确认波动原因成本大;   – 定位到原因,难以量化;  
  12. 12. 城市订单预估 •  模型需要解决的问题:   – 自动的监控、报警;   – 原因发现;   – 原因的影响的量化;
  13. 13. 城市订单预估 •  解决路径:   – 简单平均;   – 时间序列预估;   – 自回归模型;   – 级联模型;
  14. 14. 城市订单预估:牛刀小试 数据收集 • 全国约100个城市; • A&B类城市占据大部分订单; 预处理 • 小城市,订单量小,波动大 • 异常样本过滤 简单平均 • 周期性:工作区&居住区 时间序列 • 指数平滑 • Holt-­‐Winters
  15. 15. 城市订单预估:效果 •  评价指标:   –  误差率:     |预测单量-真实单量|  / 真实单量 * 100%   •  效果分析:  
  16. 16. 城市订单预估:应用场景的差异 •  不用数据表现差别较大:                       (商圈级别表现更加明显)                
  17. 17. 城市订单预估:其他因素 •  订单量此外的因素:   – 天气;   – 星期几;   – 节假日;   – 平均配送费用;   – 是否开启红包;   – 红包使用的比例;   – …
  18. 18. 城市订单预估 •  非订单因数,怎么融入?   – 建立统一模型:   •  如何达到非线性效果:特征&模型;   •  特征如何处理:   –  归一化;   –  离散化;   –  交叉化   •  核心关注点:   –  精度;   –  可解释性;    
  19. 19. 城市订单预估:级联模型 •  级联模型:   – 第一级:自回归模型;   – 第二级:   •  目标:真实值/自回归值;   •  特征:   –  非自回归模型特征;   •  效果:   –  BoosDng思想,误差率进一步降低;   –  可解释性好;  
  20. 20. 城市订单预估:级联模型 •  可解释性:   – 特征间差异直接反映了对订单量的影响; 天气 权重 大雨 0.1780 暴雨 0.1492 晴 -­‐0.0038 …
  21. 21. 列表优化 •  产品形态
  22. 22. 列表优化:架构 •  架构
  23. 23. 列表优化:离线流程 •  负样本的有效性:   – 常用负样本的产生方法:   •  采样、高频用户/商品;   – 流量清洗:   •  抓取流量;   •  无效加载
  24. 24. 列表优化:特征体系 •  特征矩阵: 1.商家 2.用户 3.商家&用户
  25. 25. 列表优化:模型 •  树模型:为什么使用树模型?   – Decision  Tree:简单贪婪,C4.5;   – Bagging:民主智慧,RF;   – BoosDng:知错就改,GBDT; •  非线性模型:   – 稠密特征:分裂的复杂度;   – 特征选择、组合;  
  26. 26. 列表优化:实时性要求 •  实时性的要求:   –  商家库存;   –  商家服务质量;   –  商家活动情况;   –  配送运力情况;   •  实时性方案:   –  方案一:非统计特征,模型实时学习,在线学习;   –  方案二:统计特征,模型稳定,特征实时更新;   –  方案三:两者混合;  
  27. 27. 列表优化:特征实时性 •  特征实时化:
  28. 28. 列表优化:跨系统交互 •  跨系统交互:(配送)   – 商家售罄:   •  库存、单量预测;   – 流控:   •  实时负载指标;   •  配送等待时间;   •  配送预计送达时间;
  29. 29. 列表优化:新商家 •  新商家:   – 如何确定新商家的质量?   •  固定位置,定义新商家,同类型展示;   •  不确定位置,E&E策略;   •  其他运营方案:广告;
  30. 30. 总结 •  总结:   – 理解业务,技术驱动;   – 没有完全一致的技术方案;   – 最小可迭代方案,不断优化;  
  31. 31. Thank  You!

×