数据化解析轿车故障:变速箱(II)

234 阅读2分钟
原文链接: zhuanlan.zhihu.com
之前的文章(数据化解析轿车故障:变速箱)引起不少讨论和非议,甚至有人怀疑是否被盗号了,因此不得不出来澄清并直面大家的质疑。大部分质疑集中在两个方面:
  • 数据量是否足够?数据哪里来的?
  • 数据样本是否有问题:保有量低的车辆故障概率高?也许这个车型不爱出故障,而出故障之后才去维修且大部分故障为变速箱,所以变速箱故障率自然高,但其实这个车型恰恰是质量可靠?(对应的评论比如:“A车目前在世面上100辆在运行,发生过故障的10辆,其中变速箱故障的5辆。B车同样100辆运行,发生过故障的50辆,其中变速箱故障的20辆。用文中的统计方法,A车变速箱故障率50%,B车40%,你说搞笑不搞笑?”)

首先,还是请大家仔细看看数据来源和定义。这次的数据覆盖94,288辆汽车以及986,697次维修保养记录,平均每辆车有10次左右的维修保养记录。另外,维修保养记录不等于维修记录,这是基本的用车常识,质量再好且维护再好的轿车,基本也需要每年或者每半年保养一次。即使没有任何故障或者零件更换,换机油也会被这次的数据捕获。同时这次的数据覆盖了大部分的4S店以及相当数量的线下维修店(主要通过读取它们的维修保养记录),所以数据是具有相当代表性的。


同时为了消除误差,对于数量小于50的车型,不会出现在排名中。

其次,核心公式是:x部位的故障率=在x部位发生故障的车辆数/维修保养的总车辆数 x 100%。虽然,维修保养的总车辆数不能完全代表某个品牌或者车型的汽车保有量,但是两者高度相关。很简单直接的道理:汽车保有量高的车型或者品牌,去4S店以及线下各种维修店进行维修保养的数量自然就高。除非你告诉吃瓜群众,有某些车型或者品牌根本不去做维修保养



...更多回答请看何明科的主页
...更多文章请到数据冰山 - 知乎专栏