线性回归

165 阅读1分钟

什么是线性回归

之前所讲的模型全部都是离散的分类模型,但是实际应用中有很多模型是用来预测连续值的,被称为回归模型。在回归模型中,最简单的一类便是线性回归。即在公式

minfL(f,y)\min_f L(f,y)

f 取线性函数ωTx+b\omega^{T}x+b

线性回归是有监督的,判别式的参数模型。

核心公式

当我们使用L2求距离时

minfi=1NωTxi+byi2+λω2\min _f \sum_{i=1}^N\left\|\omega^{T}x_i+b-y_i\right\|^2+ \lambda\left\|\omega \right\|^2

求得解析解为

w^=(X~TX~+λnI)1X~Ty~b^=yˉw^Tx\begin{aligned} & \widehat{\boldsymbol{w}}=\left(\tilde{\boldsymbol{X}}^T \tilde{\boldsymbol{X}}+\lambda n \boldsymbol{I}\right)^{-1} \tilde{\boldsymbol{X}}^T \tilde{\boldsymbol{y}} \\ & \widehat{b}=\bar{y}-\widehat{\boldsymbol{w}}^T \overline{\boldsymbol{x}} \end{aligned}

当然也可以用迭代法求解。

SGD

假设

J(θ)=inJi(θ)J(\theta) =\sum_i^n J_i(\theta)

其中Ji(θ)J_i(\theta)仅与xi,yix_i,y_i有关,则

Initialize θ0\boldsymbol{\theta}_0, set t=0t=0

For j=1,j=1, \ldots, max_iter

For i=1,,ni=1, \ldots, n in random order

θtθt1αjJi(θt1)tt+1\begin{aligned} & \boldsymbol{\theta}_t \leftarrow \boldsymbol{\theta}_{t-1}-\alpha_j \nabla J_i\left(\boldsymbol{\theta}_{t-1}\right) \\ & t \leftarrow t+1 \end{aligned}

End

If convergence condition satisfied, exit

End