故事的开端是和两个朋友聊天,聊到了年终考评,朋友A吐槽说他们领导根据大家出勤时间来打分的,效率高的同事准点下班分数被打的很低,整天写bug每天加班改的同事反而获得了高分。而朋友B的遭遇,更令人陷入思考,朋友B说他们领导是纯粹根据每个人写代码的bug数评分的,但是自己总是在做一些攻坚克难的工作,另一个和他同级别的同事总是被分配简单的工作bug数自然而然地比他少,因此他觉得最后得分比同事低很委屈。
说到这里,我想起了前两天看到的一篇文章,是关于“辛普森悖论”的。大致是你得了一种疾病,两家医院可以选择,距离和诊疗费均相等,从近1000人就诊数据看,甲医院治愈率90%,乙医院治愈率80%,问你选择哪家医院就医?相信大家毫无疑问就会选择甲医院。但是当信息进一步扩展,这种疾病有轻症和重症之分时,甲医院收治了100名重症,治愈30人,治愈率30%;乙医院收治了400名重症,治愈210人,治愈率52.5%。再看轻症患者,甲医院900名,治愈870人,治愈率96.7%;乙医院600名,治愈590人,治愈率98.3%。无论是轻症还是重症,选择乙医院治愈率都比甲医院高,但是综合起来,甲医院治愈率90%,乙医院只有80%。
| 医院 | 轻症 | 轻症治愈数 | 轻症治愈率 | 重症 | 重症治愈数 | 重症治愈率 | 总人数 | 总治愈数 | 总治愈率 |
|---|---|---|---|---|---|---|---|---|---|
| 甲 | 900 | 870 | 96.7% | 100 | 30 | 30% | 1000 | 900 | 90% |
| 乙 | 600 | 590 | 98.3% | 400 | 210 | 52.5% | 1000 | 800 | 80% |
明明无论是轻症还是重症,乙医院都是优选,但是综合起来,数据反而没有甲医院好。这个情况,和上面B同学的境遇是不是很相似。这就是统计学著名的“辛普森悖论”(Simpson's Paradox)。
质与量并不等价,但在现实生活中,量更容易测量,于是很容易就单纯地使用数量进行比较和评定。如何避免辛普森悖论的出现呢? 在评定时,加上权重。例如B同学的考核,如果他的领导在分配开发任务时,就把任务难度作ABCD不同区分,完成A级任务,完成系数X2,完成D级简单任务,完成系数X0.5,或者开发出bug对应乘以不同系数进行考评,会相对于单纯使用bug数考评更为公正。
但并不是每个Leader都会这么细致,所以当你选择挑战更高难度的任务时,就要做好吃力不讨好的心理准备(比如现在的我,刚接盘了一个烂摊子代码,产品说改个很简单的功能,但是项目里代码如蛛网般纠缠,阅读和理解代码的时间成本就很高)。
最后,希望大家都能遇到个开明且理解质与量之间关系的好领导。