女神图开篇

参考:清华慕课 SVM章节
线性svm
-
问题:找到一个超平面将两类点分开
-
本质:低维的input space 到高维的feature space做映射,在高维空间切分
-
SVM是一个线性分类器,线性超平面方程为:
,其中
,
-
是平面法向量,和该平面垂直。
-
对于空间中的某一个点表示为:
, 该点带入平面方程为
,
-
该点到超平面的距离是:
, 其中
是平面上的点,辅助计算的。
-
什么是最优分类面:将点尽可能分开
-
margin:将超平面向两边平移,最先碰到的点到超平面的距离叫做margin,碰到的点就叫做支持向量。
-
margin越大,容错能力越强。SVM的训练目标是让margin最大
-
选择平面
,
为正样本;和平面
,
为负样本。且保证没有点在
之间。(可以通过缩放系数做到),此时 margin 为
怎么分样本(数学表达
- 带不等式约束极值问题,也可以用拉格朗日乘数法
- 拉格朗日函数
求导后可以转化为对偶问题,对偶问题
可解
- 解出来很多
为0 ,不为0 对应的是支持向量。
软间隔svm
放宽约束
-
约束条件改为:
-
最小化目标函数为:
, 其中
-
求解方法同上,对偶问题如下
- 注意主要不同点在于限制条件:
才是最后的解。不在该范围内的点无效。
核svm
-
出发点:为了解决线性不可分问题
-
基本思想:样本点在原始空间不是线性可分,映射到高维空间线性可分。
-
映射方法:主要有多项式映射和高斯函数映射。
-
映射函数记为
, 例如单位圆上的点
,非线性可分。选取
, 点在线上 ,线性可分。
-
映射到高维空间的问题:计算复杂度变高很多 (例如二维变为1000维)。怎样降低复杂度,于是有人提出了核函数。
-
多项式核函数
,(唯一的表达式,复杂略去),该核函数有一个特殊性质,满足
-
注意:a,b是原始空间的两个向量,
是映射到高维空间的向量内积,转化为了低维空间的内积。这正是巧妙之处。
-
核函数记为
,
,
是在m维空间计算,等价计算出了
维空间 的值
. (其实平方就是
维的计算啊,但是因为平方只用算m维就可以算出
维的
-
注意区分映射函数
和核函数
-
例如
这里
是两个点,都是m维向量,
。省略了映射函数