Project:供应链采购中的BI分析
To Do:
供应链数据探索
对用户进行分层运营
对于欺诈订单进行预测,即Order Status='SUSPECTED_FRAUD'
对于迟交货订单进行预测,即Delivery Status= 'Late delivery'
对于销售额进行预测,即Sales字段
对于订货数量进行预测,即Order Item Quantity
Project:智能供应链分析
供应链数据探索
1)是否有缺失字段 => 数据补全
2)这些特征之间的相关性如何 => 热力图呈现
3)对于销售额进行探索(对应 Sales per customer)
按照不同的Market, Order Region
按照不同的Category Name
按照不同的时间维度(年,月,星期,小时)的趋势
Product Price与Sales per customer 相关性如何
使用RFM对用户进行分层
使用RFM对用户进行分层管理
RFM指标
每个指标越大=>用户价值越高,用3个指标作为XYZ坐标轴,将空间分成8个部分进行分析
Recency,最近一次消费时间间隔
Frequency,消费频率,一段时间(比如1年)内的消费次数
Monetary,消费金额,一段时间(比如1年)内的消费金额
用户分类
最近一次消费时间间隔(R)
消费频率(F)
消费金额(M)
1、重要价值用户
高
高
高
2、重要发展用户
高
低
高
3、重要保持用户
低
高
高
4、重要挽留用户
低
低
高
5、一般价值用户
高
高
低
6、一般发展用户
高
低
低
7、一般保持用户
低
高
低
8、一般挽留用户
低
低
低
RFM指标计算:
Step1,计算用户的R、F、M打分
按价值打分
最近一次消费时间间隔(R)
消费频率(F)
消费金额(M)
1
20天以上
2次以内
1000元以内
2
10-20天
2-6次
1000-1500元
3
5-10天
6-8次
1500-3000元
4
3-5天
8-15次
3000-5000元
5
3天以内
15次以上
5000元以上
Step2,计算平均值
用户ID
最近一次消费间隔(R)
消费频率(F)
消费金额(M)
R值打分
F值打分
M值打分
1
4
1
4500
4
1
4
2
1
12
1200
5
4
2
价值 平均值
4.5
2.5
3
Step3,用户分类
用户ID
R值打分
F值打分
M值打分
R值评价
F值评价
M值评价
1
4
1
4
低
低
高
2
5
4
2
高
高
低
Step4,对应表格,找到用户属于哪个分类
用户1:重要挽留用户(分类4)
用户2:一般价值用户(分类5)
对欺诈行为(fraud)进行预测
对发货延迟(late delivery)进行预测
针对欺诈订单、发货延迟进行预测
fraud = 0, 1
late_delivery = 0, 1
LR,GaussianNB,LinearSVC,KNeighborsClassifier,LinearDiscriminantAnalysis,DecisionTreeClassifier,RandomForestClassifier,XGBClassifier
可以针对LR / 树模型查看 feature_importances_
对销售业绩(Sales)进行预测
对订货数量( Order Item Quantity )进行预测
Sales, Order Item Quantity
LinearRegression, Lasso, Ridge, DecisionTreeRegressor, XGBRegressor, LGBMRegressor, RandomForestRegressor
最小二乘估计是最小化残差平方和(RSS)
lasso是最小化RSS中,加入了L1惩罚项(作为约束)
岭回归在最小化RSS中,加入了L2惩罚项