用Python进行精益六西格玛数据分析 - Kruskal Wallis测试
如何用Python 替代Minitab 来进行 Kruskal Wallis测试,评估培训对仓库操作员生产力的影响
如果您对与供应链数据科学相关的文章感兴趣,请随时查看我的作品集。 https://samirsaci.com
精益六西格玛(LSS) 是一种基于逐步改进流程的方法。
这种方法通常遵循5个步骤**(定义、测量、分析、改进和控制)** ,用于改进原因不明的现有流程问题。
在这篇文章中,我们将探讨Python 如何在分析 步骤中取代Minitab (LSS专家广泛使用的软件) ,以测试假设 并了解 什么可以改善特定过程的性能指标 。
SUMMARY
I.问题陈述
1.1. 情景
你是一家以时装、香水和手表为主的标志性奢侈品公司的配送中心(DC)的持续改进经理 。
仓库收到的 服装需要在进货过程中进行最终组装和增值服务(VAS)。
(如需了解更多信息,您可以看看我以前的文章。 用Python对奢侈品最终装配线进行调度)
在一个奢侈品牌的分销中心,有4条增值服务线的工作车间的例子 - (作者的CAD模型)
对于收到的每件衣服 ,你的操作员需要用当地语言 打印一个标签并进行标签缝制。
标签的例子 - (图片由作者提供)
在这篇文章中,我们将重点讨论如何提高标签缝制的生产率。标签是按30个标签的批次分发给操作员的。生产率是根据完成一个批次所需的时间(以秒计)来计算的。
4个用于缝制标签的工作站 - (作者的CAD模型)
2.培训员工队伍的影响
在研发团队的支持下,你为VAS操作员设计了培训,以提高他们的生产力,减少质量问题。
问题是
培训对操作人员的生产力是否有积极影响?
假设
培训对VAS操作员的生产力有积极影响。
实验
随机选择操作员,测量每批的时间_(完成一批30个标签的时间,以秒为单位)_,建立一个56条记录的样本。
数据驱动的分析来测试我们的假设--(图片由作者提供
II.数据分析
1.探索性数据分析
你可以在这个CSV文件中下载这个实验的结果,在你的电脑上运行整个代码(这里)。
56条记录
35条未经培训的操作员的记录
21条受过培训的操作员的记录
箱形图
实验结果的箱形图 - (图片由作者提供)
根据样本数据,我们可以看到,受过培训的操作员的中位数和平均值要低得多。
假设
培训减少了每个批次的平均时间。
代码
Minitab
2.方差分析(ANOVA)
在这种情况下,我们想检查培训(变量X) 是否影响到每批的总时间(变量Y)。
因为 X是一个分类变量(培训=是/否),Y是数字,所以适当的方法是方差分析。
方差分析是一种统计方法,用于检查我们是否可以将样本数据中看到的平均值差异概括为整个人口。
步骤1:计算P值
Source: Training
p-value is below 5%
代码
Minitab
第2步:验证方差分析的假设
根据p值,我们知道平均值的差异是真实的,而不是由于随机波动造成的。
然而,在下结论之前,我们需要检查方差分析的假设是否得到满足
- 残差是自然分布的
残差的分布 - (作者的图片)
**答案:是。**不是
- 没有离群值或不规则值
与顺序 - (作者的图片)
**回答:没有。**没有
结论
没有达到方差分析的要求,我们需要另一种方法来证实培训确实影响了操作员的生产力。
代码
Minitab
3.克鲁斯卡-瓦利斯检验
如果你的样本数据不能满足方差分析 的要求,你可以使用Kruskal-Wallis检验来检查平均值的差异是否是由于随机波动造成的。
statistic
结论
p值低于5%,所以我们可以得出结论,均值的差异是有统计学意义的。
我们可以确认,培训对操作员的生产力有积极的影响。
代码
Minitab
III.结论
这种数据驱动的方法给了你足够的元素来说服你的管理层投资于劳动力培训。
你通过使用统计学从样本数据中归纳出模式,以适度的实验努力带来了足够的洞察力 。
参考文献
[1] 方差分析,Ted Hessing,六西格玛学习指南,链接
[2] 奢侈品最终装配线的调度,Samir Saci,链接
_请随时与我联系,我愿意就数据科学和供应链相关的话题进行分享和交流。
我的作品集。
_https://samirsaci.comLinkedin: www.linkedin.com/in/samir-sa…
Lean Six Sigma Data Analytics with Python - Kruskal Wallis Test最初发表于Towards Data Scienceon Medium,人们在这里通过强调和回应这个故事来继续对话。