什么是超平面分离
超平面分离是线性分类器,有监督的判别式的参数模型。
超平面分离的主要思想是确定不同类别数据之间的分隔平面ωTx+b=0

核心公式
ρ(w,b):=i=1,…,nmin∥w∥∣∣wTxi+b∣∣
w,bmaxρ(w,b) s.t. yi(wTxi+b)>0∀i.
其中ρ(w,b)表示点到平面的最短距离的绝对值,目标是使最短距离最大。
规范化形式
通过,求出m=min∣ωTxi+b∣,
ω=mωb=mb
所有的超平面公式都可以被写为规范形式,即
yi(wTxi+b)≥∀iyi(wTxi+b)=1∃i
在转化为规范形式后,原式可转化为
maxρ(w,b)i=1,…,nminρ(w,b)=∥w∥1
进一步的,
min∥ω∥2 s.t. yi(wTxi+b)≥1∀i.
通过求解该优化问题即可求得分离的超平面
线性不可分
实际应用中,有很多数据并不是线性可分的,如

这种情况下,我们有两种选择,一种是使用非线性分类器进行分类,另一种是容忍部分误差,继续使用线性分类器求出超平面,即最优软间隔超平面。我们下面将讨论最优软间隔超平面.
核心公式
w,b,ξmin21∥w∥2+nCi=1∑nξi s.t. yi(wTxi+b)≥1−ξi,∀iξi≥0,∀i.
其中,ξi为我们引入的松弛项,允许数据出现在超平面最小间隔以内ξi的距离.
可转化为如下问题求解
w,bmin2λ∥w∥2+n1∑max(0,1−yi(wTxi+b))