Class Transformation Model增益模型

119 阅读1分钟

什么是Class Transformation Model、

本文要讲述的增益模型类别是Class Transformation Model,即类转换模型,该模型主要应用于二元因果分类问题,即干预和结果都是二元变量。类转换模型的主要思想是通过对结果变量做变换,将Uplift模型预估任务 转化为一个分类任务。下面主要给出两个版本的类转换模型的理论推导:(1.)等分随机版本(2.)倾向分修订版本。

公众号原文:Class Transformation Model增益模型

等分随机版本

下面基于营销场景的用户购买情况说明如何进行标签转换:构造响应变量Z,对“营销 购买客户”和“未营销 未购买客户”使得Z=1,否则Z=0;

Zi=Yiobs Wi+(1Yiobs )(1Wi)Z_i=Y_i^{\text {obs }} W_i+\left(1-Y_i^{\text {obs }}\right)\left(1-W_i\right)

其中,YiobsY_i^{obs}表示观测结果,Wi{0,1}W_i \in\{0,1\}表示是否营销,分情况展开就是:

Zi={1, if Wi=1 and Yi=11, if Wi=0 and Yi=00, otherwise Z_i= \begin{cases}1, & \text { if } W_i=1 \text { and } Y_i=1 \\ 1, & \text { if } W_i=0 \text { and } Y_i=0 \\ 0, & \text { otherwise }\end{cases}

假设营销组和未营销组的个体是随机一半一半分配的,即

P(Wi=1)=P(Wi=0)=12P ( W _ { i } = 1 ) = P ( W _ { i } = 0 ) = \frac { 1 } { 2 }

则可推导uplift与P(Z=1|X)的关系如下

τ(Xi)=2P(Zi=1Xi)1\tau(X_i)=2P(Z_i=1|X_i)-1

所以,只需要对P(Z=1|X)建模即可。详细推导参考下图:

image.png

公众号原文:Class Transformation Model增益模型

倾向分修订版本

很显然,上面的等分随机版本模型营销组和未营销组的个体随机一半一半分配的假设过强。为了克服以上问题,有如下的倾向分修订版本模型。

利用倾向性得分pip_i对观测结果YiobsY_i^{obs}变换,倾向性得分就是预测个体接收干预的概率。

Zi=YiobsWipipi(1pi)Z_i=Y_i^{obs}\cdot\frac{W_i-p_i}{p_i(1-p_i)}

其中,Wi{0,1}W_i\in\{{0,1}\}表示是否营销,分情况展开就是:

Zi={Yiobs1pi,ifWi=1Yiobs11pi,ifWi=0Z_i=\begin{cases}Y_i^{obs}\cdot\frac{1}{p_i},&\mathrm{if}W_i=1\\-Y_i^{obs}\cdot\frac{1}{1-p_i},&\mathrm{if}W_i=0&\end{cases}

也就是

Zi=Yi(1)WipiYi(0)1Wi1piZ_i=Y_i(1)\cdot\frac{W_i}{p_i}-Y_i(0)\cdot\frac{1-W_i}{1-p_i}

以上变换,本质是对样本做个逆概率加权(IPW,Inverse Probability Weighting)。

基于无混淆假设(也就是 条件独立性假设: Wi{Yi(0),Yi(1)}XiW_i\perp\{Y_i(0),Y_i(1)\}\mid X_i

可以证明E(ZiXi=x)=τ(x)E(Z_i|X_i=x)=\tau(x)。详细证明过程可参考公众号原文:Class Transformation Model增益模型

关于Class Transformation Model增益模型的内容基本介绍完了,对相关主题感兴趣的读者欢迎留言交流讨论。感谢你看到这里,你的支持是我持续创作的动力~更多优质内容请关注瑞行AI公众号:

小.jpg