什么是逻辑回归
逻辑回归是有监督的,判别式的参数模型
核心公式
η(x)=1+e−(wTx+b)1
对于二分类问题,可以视作标签为1的概率。
求解
首先基于二项分布,可以求出单个样本的概率
p(y∣x;θ)=η(x;θ)y(1−η(x;θ))1−y,y=0,1,
然后利用最大似然概率求解
L(θ):=i=1∏np(yi∣xi;θ)
取对数后得
ℓ(θ):=logL(θ)=i=1∑nlogp(yi∣xi;θ)=i=1∑n[yilog(1+e−θTx~i1)+(1−yi)log(1+e−θTx~ie−θTx~i)].
求∇l=0
正则化
L1正则化
L1正则化又称Lasso回归,假设ω服从拉普拉斯回归
f(w∣μ,b)=2b1exp(−b∣w−μ∣)
所以原公式写为
L(w)=P(y∣w,x)P(w)=i=1∏Np(xi)yi(1−p(xi))1−yij=1∏d2b1exp(−b∣wj∣)
log后取负得到
−lnL(w)=−i∑[yilnp(xi)+(1−yi)ln(1−p(xi))]+2b21j∑∣wj∣
L2正则化
L2正则化又称ridge回归(岭回归),假设ω服从高斯分布
f(w∣μ,σ)=2πσ1exp(−2σ2(w−μ)2)
所以原公式写为
L(w)=P(y∣w,x)P(w)=i=1∏Np(xi)yi(1−p(xi))1−yij=1∏d2πσ1exp(−2σ2wj2)=i=1∏Np(xi)yi(1−p(xi))1−yi2πσ1exp(−2σ2wTw)
取 In 再取负,得到目标函数:
−lnL(w)=−i∑[yilnp(xi)+(1−yi)ln(1−p(xi))]+2σ21wTw