详解核方法-正定核-两个定义&必要性证明【白板推导系列笔记】

116 阅读1分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第16天,点击查看活动详情

核函数定义

K:X×XR,x,zX K:X \times X \mapsto \mathbb{R},\forall x,z \in X

则称K(x,z)K(x,z)为核函数

 

正定核定义

K:X×X,x,zX,K(x,z)如果:ϕ:xR,ϕHs.t.K(x,z)=<ϕ(x),ϕ(z)> \begin{gathered} K:X \times X \mapsto,\forall x,z \in X,有K(x,z)\\ 如果\exists:\phi:x \mapsto \mathbb{R},\phi \in H\\ s.t.K(x,z)=\left<\phi(x),\phi(z)\right> \end{gathered}

那么称K(x,z)K(x,z)为正定核函数

 

这里ϕH\phi \in HHH是指Hilbert空间:完备的。可能是无限维的、被赋予内积的线性空间

完备的,可以理解为对极限是封闭的,即对于{Kn}\left\{K_{n}\right\},有

limnKn=KH\lim\limits_{n \to \infty}K_{n}=K \in H

被赋予内积的,要求该空间具有对称性、正定性、线性,对应满足公式

<f,g>=<g,f><f,f>0,=成立f=0<r1f1+r2f2,g>=r1<f1,g>+r2<f2,g>\begin{aligned} \left<f,g\right>&=\left<g,f\right>\\\left<f,f\right>&\geq 0,=成立\Leftrightarrow f=0\\\left<r_{1}f_{1}+r_{2}f_{2},g\right>&=r_{1}\left<f_{1},g\right>+r_{2}\left<f_{2},g\right>\end{aligned}

 

也可定义为

K:X×X,x,zX,K(x,z) \begin{gathered} K:X \times X \mapsto,\forall x,z \in X,有K(x,z)\\ \end{gathered}

如果K(x,z)K(x,z)满足如下两条性质

  1. 对称性K(x,z)=K(z,x)\Leftrightarrow K(x,z)=K(z,x)

  2. 正定性\Leftrightarrow任取NN个元素x1,x2,,xNXx_{1},x_{2},\cdots,x_{N}\in X,对应的Gram矩阵K=[K(xi,xj)]K=[K(x_{i},x_{j})]是半正定的

 

这里Gram矩阵K=[K(xi,xj)]K=[K(x_{i},x_{j})],第一个KK是Gram矩阵的代号,第二个KK是函数K(x,z)K(x,z)

 

现在证明K(x,z)=<ϕ(x),ϕ(z)>K(x,z)=\left<\phi(x),\phi(z)\right>\RightarrowGram矩阵半正定,且K(x,z)K(x,z)对称

 

实际上这个是充要的,在统计学习方法中有证明,也就说明了两个定义是等价的,这里只证明必要性

 

先证对称性

K(x,z)=<ϕ(x),ϕ(z)>K(z,x)=<ϕ(z),ϕ(x)> \begin{aligned} K(x,z)&=\left<\phi(x),\phi(z)\right>\\ K(z,x)&=\left<\phi(z),\phi(x)\right>\\ \end{aligned}

又根据内积具有对称性质(Hilbert空间定义的),即<ϕ(x),ϕ(z)>=<ϕ(z),ϕ(x)>\left<\phi(x),\phi(z)\right>=\left<\phi(z),\phi(x)\right>,因此

K(x,z)=K(z,x) K(x,z)=K(z,x)

因此K(x,z)K(x,z)满足对称性

再证Gram矩阵半正定,即证αRN,αTKα0\forall \alpha \in \mathbb{R}^{N},\alpha^{T}\cdot K \cdot \alpha \geq 0(这里的α\alphaKK的非零列向量),记Kij=K(xi,xj)K_{ij}=K(x_{i},x_{j})

αTKα=(α1α2 αN)(K11K12 K1NK21K22 K2N    KN1KN2 KNN)(α1α2 αN)=i=1Nj=1NαiαjKij=i=1Nj=1Nαiαj<ϕ(xi),ϕ(xj)>=i=1Nj=1Nαiαjϕ(xi)Tϕ(xj)=i=1Nαiϕ(xi)Tj=1Nαjϕ(xj)这里显然αR=[i=1Nαiϕ(xi)]Tj=1Nαjϕ(xj)=<i=1Nαiϕ(xi),j=1Nαjϕ(xj)>=i=1Nαiϕ(xi)20 \begin{aligned} \alpha^{T}K \alpha&=\begin{pmatrix} \alpha_{1} & \alpha_{2} & \cdot  & \alpha_{N} \end{pmatrix}\begin{pmatrix} K_{11} & K_{12} & \cdots  & K_{1N} \\ K_{21} & K_{22} & \cdots  & K_{2N} \\ \vdots  & \vdots  &  & \vdots  \\ K_{N1} & K_{N2} & \cdots  & K_{NN} \end{pmatrix}\begin{pmatrix} \alpha_{1} \\ \alpha_{2} \\ \vdots  \\ \alpha_{N} \end{pmatrix}\\ &=\sum\limits_{i=1}^{N}\sum\limits_{j=1}^{N}\alpha_{i}\alpha_{j}K_{ij}\\ &=\sum\limits_{i=1}^{N}\sum\limits_{j=1}^{N}\alpha_{i}\alpha_{j}\left<\phi(x_{i}),\phi(x_{j})\right>\\ &=\sum\limits_{i=1}^{N}\sum\limits_{j=1}^{N}\alpha_{i}\alpha_{j}\phi(x_{i})^{T}\phi(x_{j})\\ &=\sum\limits_{i=1}^{N}\alpha_{i}\phi(x_{i})^{T}\sum\limits_{j=1}^{N}\alpha_{j}\phi(x_{j})\\ &这里显然\alpha \in \mathbb{R}\\ &=\left[\sum\limits_{i=1}^{N}\alpha_{i}\phi(x_{i})\right]^{T}\sum\limits_{j=1}^{N}\alpha_{j}\phi(x_{j})\\ &=\left<\sum\limits_{i=1}^{N}\alpha_{i}\phi(x_{i}),\sum\limits_{j=1}^{N}\alpha_{j}\phi(x_{j})\right>\\ &=\left|\left|\sum\limits_{i=1}^{N}\alpha_{i}\phi(x_{i})\right|\right|^{2}\geq 0 \end{aligned}

因此KK是半正定的