首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
MonkeBai
掘友等级
风控算法工程师
|
京东数科
运动,读书,分享
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
使用hive和python多种方式实现PSI的计算
上次我们讲到用python实现psi的计算。本文是PSI系列的最后一篇文章,主要讲计算模型分的PSI,连续以及离散特征的PSI,以及用hive实现PSI的计算,最后会在kaggle上给出一个简单的实例。那我们开始吧~ 上述计算代码中,我们对变量的分箱采用最简单的无监督的等距的分…
换个角度理解PSI(2)——从KL散度到PSI的奇幻之旅
并且用熵的概念简要的说明了为什么对数项可以表明信息量的大小。 从这部分入手,有一种更好的解释,熟悉熵家族的同学可能已经看出来了,每一项其实都是相对熵(也被称为KL散度),PSI其实是和分布互相的相对熵之和。 KL散度又称相对熵、信息散度。KL散度主要是用来衡量两个概率分布之间的…
换个角度理解PSI(1)——从信息熵到IV和PSI的关系
做风控模型的同学对IV和PSI值都熟悉,IV值一般用于衡量变量的重要性,PSI用来监控模型分和特征的稳定性。 其中为特征的分箱数。 特征的IV值越大,则表示该特征的信息价值也就越大。为什么IV可以表示特征的信息,我们从公式中的对数项入手。 其中为特征的分箱数。 我们发现WOE的…
个人成就
文章被阅读
7,125
掘力值
109
关注了
6
关注者
2
收藏集
0
关注标签
6
加入于
2020-07-05