本文已参与「新人创作礼」活动,一起开启掘金创作之路。
线性回归模型
(本章内容是后续logistic回归和softmax回归的基础)
给定数据集D={(x1,y1),(x2,y2),…,(xm,ym)},其中xi={xi1;xi2;…;xid}是具有d个分量的特征向量,yi∈R为数据标签,线性模型(linear model)试图学得一个通过属性的线性组合来进行预测的函数:
f(xi)=wTxi+b(1)
来尽可能准确地预测标签yi,其中w=(w1;w2;…;wd)。
如何确定参数w和b的取决于我们怎么定义f(xi)和yi之间的差别。均方误差是回归任务中最常用的性能度量,因此我们可试图让均方误差最小化:
(w∗,b∗)=(w,b)arg mini=1∑m(f(xi)−yi)2=(w,b)arg mini=1∑m(yi−wxi−b)2(2)
线性模型(1)的预测值用来逼近真实标记y时,我们就得到线性回归模型。线性回归模型简写为
y=wTx+b(3)
也可令模型预测值逼近y的衍生物g(y)
y=g−1(wTx+b)(4)
这样得到的模型成为“广义线性模型”。例如,当g(y)=ln(y)时,称为对数线性回归。