一、模型框架
简易流程图
具体流程:
- 根据每个商品的聚集程度(7日均值与上一个7日均值的自相关系数)进行打分(0~1分)
0~1分表示,聚集程度从低到高。(聚集程度高,代表商品每七天销量关系大)
2. 根据商品聚集程度的打分,采取不同策略得到基础模型:
聚集程度高(分数1)的商品可以采用近期策略(双窗口滑动平均:过去两周加权均值,近的一周权值高)。
聚集程度低(分数0)的更适合长期策略(7个月的中位数)。
聚集程度低居中的,两种策略加权平均。 3. 在大类目级别提取周期因子(一周7天的销量波动、节假日波动)(在平均销量基础上的上浮下调比例)。 4. 将这些因子叠加到上一步的基础模型上:(基础模型 * 周期因子 + 促销因子)
根据未来21天的周信息、节假信息(乘以前面的周期因子)、促销档期(加上前面的促销因子),得到最终输出。
二、模型总体效果
销量分层(不加权):
【分析】
- 周销量低于1的时候,由于销量基数(分母)太低,相对偏差会偏大,这个可以理解。
- 周销量大的bad case,案例分析列举如下: (桃李焙软全 麦切片面包 370g)
[注]:(蓝线是每天实际销量,黄线是预测销量) 本周(8.2~8.9)实际售卖3个,预测96个(相对误差远远大于1)。(看历史的销量比较明显可能有阶段性的促销档期,但是在系统里面该商品在7-8月份并没有促销信息)所以,黄线的预测策略其实没有问题,因为无法判断未来销售会跳回0。 (精香梨 约240g)
[注]:(蓝线是每天实际销量,黄线是预测销量)
该商品也无法预断未来销售突变为0。
五、促销效果
【注】蓝色为实际销量、黄色为促销还原的销量、绿色为是否为促销的标识
- 促销标注比较准确的效果:
- 促销标注不准确的效果:
【注】:模型会平均每次标为促销时的销量影响,不准确的促销标记会导致模型提取的促销效应不准确:1、如果非促销标记为大促,则下一次大促销量预测会偏低;1、如果非促销标记为大促,则下一次大促销量预测会偏高。
作者:张珂瑜 陈鹏飞