week10智能供应链分析

252 阅读3分钟

Project:供应链采购中的BI分析

To Do:

供应链数据探索

对用户进行分层运营

对于欺诈订单进行预测,即Order Status='SUSPECTED_FRAUD'

对于迟交货订单进行预测,即Delivery Status= 'Late delivery'

对于销售额进行预测,即Sales字段

对于订货数量进行预测,即Order Item Quantity

Project:智能供应链分析

供应链数据探索

1)是否有缺失字段 => 数据补全

2)这些特征之间的相关性如何 => 热力图呈现

3)对于销售额进行探索(对应 Sales per customer)

按照不同的Market, Order Region

按照不同的Category Name

按照不同的时间维度(年,月,星期,小时)的趋势

Product Price与Sales per customer 相关性如何

使用RFM对用户进行分层

使用RFM对用户进行分层管理

RFM指标

每个指标越大=>用户价值越高,用3个指标作为XYZ坐标轴,将空间分成8个部分进行分析

Recency,最近一次消费时间间隔

Frequency,消费频率,一段时间(比如1年)内的消费次数

Monetary,消费金额,一段时间(比如1年)内的消费金额

用户分类

最近一次消费时间间隔(R)

消费频率(F)

消费金额(M)

1、重要价值用户

2、重要发展用户

3、重要保持用户

4、重要挽留用户

5、一般价值用户

6、一般发展用户

7、一般保持用户

8、一般挽留用户

RFM指标计算:

Step1,计算用户的R、F、M打分

按价值打分

最近一次消费时间间隔(R)

消费频率(F)

消费金额(M)

1

20天以上

2次以内

1000元以内

2

10-20天

2-6次

1000-1500元

3

5-10天

6-8次

1500-3000元

4

3-5天

8-15次

3000-5000元

5

3天以内

15次以上

5000元以上

Step2,计算平均值

用户ID

最近一次消费间隔(R)

消费频率(F)

消费金额(M)

R值打分

F值打分

M值打分

1

4

1

4500

4

1

4

2

1

12

1200

5

4

2

价值 平均值

4.5

2.5

3

Step3,用户分类

用户ID

R值打分

F值打分

M值打分

R值评价

F值评价

M值评价

1

4

1

4

2

5

4

2

Step4,对应表格,找到用户属于哪个分类

用户1:重要挽留用户(分类4)

用户2:一般价值用户(分类5)

对欺诈行为(fraud)进行预测

对发货延迟(late delivery)进行预测

针对欺诈订单、发货延迟进行预测

fraud = 0, 1

late_delivery = 0, 1

LR,GaussianNB,LinearSVC,KNeighborsClassifier,LinearDiscriminantAnalysis,DecisionTreeClassifier,RandomForestClassifier,XGBClassifier

可以针对LR / 树模型查看 feature_importances_

对销售业绩(Sales)进行预测

对订货数量( Order Item Quantity )进行预测

Sales, Order Item Quantity

LinearRegression, Lasso, Ridge, DecisionTreeRegressor, XGBRegressor, LGBMRegressor, RandomForestRegressor

最小二乘估计是最小化残差平方和(RSS)

lasso是最小化RSS中,加入了L1惩罚项(作为约束)

岭回归在最小化RSS中,加入了L2惩罚项