西瓜书笔记(五)—— 第六章

138 阅读2分钟

第六章

间隔与支持向量

  • 分类学习
    • 最基本的想法: 基于训练集 D 在样本空间中找到一个划分超平面,将不同类别的样本分开。
    • 划分超平面:wTx+b=0w^T x + b = 0
    • 支持向量:满足以下成立
      {wTxi+b+1,yi=+1wTxi+b1,yi=1\begin{cases} w^T x_i + b ≥ +1, & y_i = +1 \\ w^T x_i + b ≤ -1, & y_i = -1 \\ \end{cases}
    • 间隔:两个异类支持向量到超平面的距离之和
      γ=2wγ = \frac 2{||w||}
    • 支持向量机:
      • 最大化间隔:
        minw,b 12w2\min_{w, b} \ \frac 1{2}||w||^2

对偶问题

  • KKT 条件
    {αi0yif(xi)10αi(yif(xi)1)=0\begin{cases} \alpha_i ≥ 0 \\ y_if(x_i) - 1 ≥ 0 \\ \alpha_i(y_if(x_i) - 1) = 0 \end{cases}
  • SMO 算法
    • 基本思路:先固定 αi\alpha_i 之外的所有参数,然后求 αi\alpha_i 上的极值
    • SMO 先选取违背 KKT 条件程度最大的变量,第二个变量应选择一个使目标函数值减小最快的变量。所以尽量使选取两个变量,其所对应的样本之间的问隔是最大的。

核函数

  • 核函数定理: χ\chi 为输入空间,κ(,)\kappa(·,·) 是定义在 χ × χ\chi \ \times \ \chi 上的对称函数,则 κ\kappa 是核函数当且仅当对于任意数据 D={x1,x2,...,xm}D = \{x_1, x_2, ..., x_m\},“核矩阵” K\Kappa 总是半正定的。

    • 只要一个对称函数所对应的核矩阵半正定,它就能作为核函数使用。
    • 任何一个核函数都隐式地定义了一个称为“再生核希尔伯特空间” 的特征空间。
  • 常用核函数

    • 线性核:
      • κ(xi,xj)=xiTxj\kappa(x_i, x_j) = x_i^Tx_j
    • 多项式核:
      • κ(xi,xj)=(xiTxj)d     d1为多项式的次数\kappa(x_i, x_j) = (x_i^Tx_j)^d \ \ \ \ \ d \ge 1 为多项式的次数
    • 高斯核:
      • κ(xi,xj)=exp( xixj22σ2)     σ>0为高斯核的带宽\kappa(x_i, x_j) = exp(-\ \frac{||x_i - x_j||^2}{2\sigma^2}) \ \ \ \ \ \sigma > 0 为高斯核的带宽
    • 拉普拉斯核:
      • κ(xi,xj)=exp( xixjσ)     σ>0\kappa(x_i, x_j) = exp(-\ \frac{||x_i - x_j||}{\sigma}) \ \ \ \ \ \sigma > 0
    • Sigmoid核:
      • κ(xi,xj)=tanh(βxiTxj+θ)     tanh为双曲正切函数, β>0, θ<0\kappa(x_i, x_j) = tanh(\beta x_i^Tx_j + \theta) \ \ \ \ \ tanh 为双曲正切函数,\ \beta > 0,\ \theta < 0
  • 函数组合

    • κ1\kappa_1κ2\kappa_2 为核函数,则对于任意正数 γ1,γ2\gamma_1, \gamma_2,其线性组合也是核函数
      • γ1κ1+γ2κ2 \gamma_1\kappa_1 + \gamma_2\kappa_2
    • κ1\kappa_1κ2\kappa_2 为核函数,则核函数的直积也是核函数
      • κ1κ2(x,z)=κ1(x,z)κ2(x,z)\kappa_1\otimes\kappa_2(x,z) = \kappa_1(x,z)\kappa_2(x,z)
    • κ1\kappa_1为核函数,则对于任意函数 g(x)g(x),也是核函数
      • κ(x,z)=g(x)κ1(x,z)g(z)\kappa(x,z) = g(x)\kappa_1(x,z)g(z)

软间隔与正则化

  • 软间隔 vs 硬间隔

    • 硬间隔:所有样本都必须划分正确
    • 软间隔:允许某些样本不满足划分(当然不满足约束的样本要尽可能的少)
  • 正则化问题

支持向量回归

  • 支持向量回归
    • 即容忍某种偏差的绝对值,及落入间隔 ± 偏差形成的间隔带上,都可以被接受

核方法

  • 表示定理
  • 通过引入核函数来将线性学习器拓展为非线性学习器