01ppt:
也叫损失函数。
判断最佳回归线而使用。
坐标轴说明:
线的长度,是误差。
我们需要找到合适的参数,然后使得误差平方和最小。 从而找到更好的回归线。 所有点的误差加起来,
公式说明:
i代表样本点,m个样本,(误差)求平方
∑,累加符号。每个样本点误差的平方,累加起来
∑除以m(m个样本点)
要乘以2m分之一,是因为求解更好看。-与平方约掉。
ps:平方比较方便,因为有正负。
02ppt:
03ppt
斜率=1
=求和(预测值-真实值)平方 /2m
计算:
-
- 1.1-1=0 ,2-2=0 , 3-3= 0
-
- 2.(0+0+0)² /2m (m3个样本)
-
- 3.0/6 =0
当预测值为1时
1、
2、
3、图
斜率为0时,代价函数: 预测值为0. 计算:
2.333
04ppt
最后可以得到:
大概可以画出
可以看到,代价函数取1时,能取到最小值。
回归头,我们可以知道。
所以这才是最好的线。即斜率为1时
05ppt
θ0是截距。θ1是斜率。
每一个圈,代表一样的数值。
这条绿色的线上,所有的值都是一样的(类似等高线。)
这是能取到的最小值。
最小值的情况:
06ppt
相关系数公式:
相对系数,衡量两个变量的线性关系
07ppt
决定系数:
真实值-所有样本点的真实值的平均值
预测值-真实值的平均值
越接近于1,越接近关系