风控算法中的精确率与召回率
一、混淆矩阵
| 预测为正(风险用户) | 预测为负(正常用户) | |
|---|---|---|
| 实际为正(风险用户) | TP 真正例 | FN 假负例(漏掉的坏人) |
| 实际为负(正常用户) | FP 假正例(误杀的好人) | TN 真负例 |
二、精确率 Precision
通俗理解: 拦截了100个人,真正有问题的有几个?
风控含义:精确率低 = 好用户被误拦太多,影响业务收入
三、召回率 Recall
通俗理解: 100个坏人里,抓到了几个?
风控含义:召回率低 = 坏人漏网,产生坏账或欺诈损失
四、风控场景的业务取舍
| 场景 | 更关注 | 原因 |
|---|---|---|
| 欺诈检测 | 召回率 | 漏掉一个欺诈损失巨大 |
| 信贷审批 | 精确率 | 误拒好客户影响业务收入 |
| 反洗钱 | 召回率 | 监管合规要求不能漏 |
| 营销风控 | 精确率 | 误拦影响转化率 |
五、两者的矛盾关系
- 阈值越高 → 精确率↑,召回率↓,模型更保守,少拦人
- 阈值越低 → 召回率↑,精确率↓,模型更激进,多拦人
两者无法同时最优,需根据业务损失来定阈值:漏掉一个坏人的损失 vs 误拦一个好人的损失,哪个更大就往哪个方向倾斜。
六、综合指标
| 指标 | 说明 | 适用场景 |
|---|---|---|
| F1-Score | 精确率与召回率的调和平均 | 两者都重要时 |
| KS值 | 区分好坏用户的能力,>0.3为良好 | 信贷评分卡标配 |
| AUC-ROC | 综合排序能力,越接近1越好 | 通用 |
七、总结
风控模型的阈值没有统一答案,核心是结合业务场景:
- 欺诈、反洗钱 → 优先召回率,宁可误杀不能放过
- 信贷、营销 → 精确率和召回率需要平衡
- 最终评估 → KS + AUC + F1 三者结合看,不能只看准确率
你在风控项目中更关注精确率还是召回率?欢迎评论交流。 持续更新风控建模实战内容,欢迎关注。