【漫话机器学习系列】222.SVM 的径向基函数核（SVC Radioal Basis Function Kernel）

【可视化图解】SVM 中的径向基函数核（RBF Kernel）你真的懂了吗？

标签：机器学习、SVM、核函数、RBF、非线性分类

本文通过一张经典的手绘图（来自 Chris Albon）来深入讲解支持向量机（SVM）中的非线性核方法之一——径向基函数核（RBF Kernel） 。如果你曾疑惑“核函数到底在做什么？”“它真的能解决非线性问题吗？”，那么本文会给你一个直观、形象的答案！

支持向量机（SVM）最初被设计为线性分类器，也就是说，它只能通过一条直线（或超平面）来划分不同类别的样本。

但是在现实世界中，很多数据是非线性可分的。比如本文图中的数据：一堆蓝点被红点包围，怎么画直线都无法把两类分开。

这时候，核函数就登场了！

我们使用核函数的主要目的是：

把数据从原始空间“映射”到一个高维空间，使得在高维空间中线性可分。

这个过程有点像魔法：

这就是“核技巧（kernel trick）”的魅力！

我们来看这张图

这幅图分为三部分，从左到右依次展示了RBF 核函数的变换过程：

这是一个典型的非线性问题，线性 SVM 无能为力。

在这个高维空间中，就可以用一个平面来把蓝红两类数据线性分开

这就是核方法的精髓：在高维中线性分离，在原空间表现为非线性边界

图中的公式如下：

$K(x_i, x_j) = \exp\left( -\frac{\|x_i - x_j\|^2}{2\sigma^2} \right)$

解释一下每个部分：

可以理解为：越靠近的点，映射后越“相似”；越远的点，映射后越“区别”明显。

RBF（Radial Basis Function）核在实际应用中非常常见，原因有以下几点：

能处理非线性问题
对维度不敏感（不怕“维度灾难”）
只有一个参数 σ，易于调优
通常能取得较好的分类效果

如果你还记得一句话，那就记住这句：

核函数=维度魔术
RBF核=用“距离”把点拉开或拉近，在高维中创造分界线

再复杂的非线性问题，在核技巧的帮助下，也可以迎刃而解。

附：图中左下角原文

“径向基函数是一个取值仅仅依赖于离中心点距离的实值函数，一般使用欧氏距离。”

也就是说，它是一种只看距离、不看方向的“影响函数”，适合各种类型的数据结构。

如果你觉得本文对你有帮助，欢迎点赞、收藏、关注我！