本文已参与「新人创作礼」活动,一起开启掘金创作之路。
0. 前言
损失函数一般表示为L(f,f(x)),用以衡量真实值y和预测值f(x)之间不一致的程度。在回归为重,一般
1. logit模型
1.1. Odds
Odds和概率都用来描述某件事情发生的可能性,区别在于概率描述的是事件A出现的次数与所有可能的结果出现的次数之比,Odds描述的是事件A发生的概率与事件A不发生的概率之比。显然,概率的区间是[0,1],Odds的区间是[0,+∞]
1.2. logit模型
logit可以理解成log-it(即it的自然对数,这里的it指的就是Odds)。logit变换是从概率P→Odds→Logit的一个变换,数学形式为ln(1−PiPi)。取对数是为了防止数值太大或太小,并且可以让取值由[0,+∞]映射到[−∞,+∞]。
为什么要用logit模型对概率建模呢?如果要对一个变量建模,最简单的就是线性回归模型,例如:Y=β0+βX,Y∈[−∞,+∞]。但是概率是[0,1]的,无法直接用线性回归来对概率建模。如果用logit模型对概率进行一个变换,则可以用线性模型来表示概率了。
ln(1−PiPi)=β0+β1x1+β2x2+⋯+βnxn(1-1)
由上式可以得到概率Pi的表达式:
Pi=1+e−(β0+β1x1+β2x2+⋯+βnxn)1(1-2)
这也是为什么机器学习/深度学习里面喜欢用sigmoid模型来对概率建模的原因。