风控算法中的精确率与召回率

14 阅读2分钟

风控算法中的精确率与召回率


一、混淆矩阵

预测为正(风险用户)预测为负(正常用户)
实际为正(风险用户)TP 真正例FN 假负例(漏掉的坏人)
实际为负(正常用户)FP 假正例(误杀的好人)TN 真负例

二、精确率 Precision

Precision=TPTP+FPPrecision = \frac{TP}{TP + FP}

通俗理解: 拦截了100个人,真正有问题的有几个?

风控含义:精确率低 = 好用户被误拦太多,影响业务收入


三、召回率 Recall

Recall=TPTP+FNRecall = \frac{TP}{TP + FN}

通俗理解: 100个坏人里,抓到了几个?

风控含义:召回率低 = 坏人漏网,产生坏账或欺诈损失


四、风控场景的业务取舍

场景更关注原因
欺诈检测召回率漏掉一个欺诈损失巨大
信贷审批精确率误拒好客户影响业务收入
反洗钱召回率监管合规要求不能漏
营销风控精确率误拦影响转化率

五、两者的矛盾关系

  • 阈值越高 → 精确率↑,召回率↓,模型更保守,少拦人
  • 阈值越低 → 召回率↑,精确率↓,模型更激进,多拦人

两者无法同时最优,需根据业务损失来定阈值:漏掉一个坏人的损失 vs 误拦一个好人的损失,哪个更大就往哪个方向倾斜。


六、综合指标

F1=2×Precision×RecallPrecision+RecallF1 = 2 \times \frac{Precision \times Recall}{Precision + Recall}

指标说明适用场景
F1-Score精确率与召回率的调和平均两者都重要时
KS值区分好坏用户的能力,>0.3为良好信贷评分卡标配
AUC-ROC综合排序能力,越接近1越好通用

七、总结

风控模型的阈值没有统一答案,核心是结合业务场景:

  • 欺诈、反洗钱 → 优先召回率,宁可误杀不能放过
  • 信贷、营销 → 精确率和召回率需要平衡
  • 最终评估 → KS + AUC + F1 三者结合看,不能只看准确率

你在风控项目中更关注精确率还是召回率?欢迎评论交流。 持续更新风控建模实战内容,欢迎关注。