持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第6天,点击查看活动详情
X=(x1x2⋯ xN)N×pT=⎝⎛x1Tx2T⋮ xNT⎠⎞=⎝⎛x11x21⋮ xN1x12x22⋮ xN2⋯⋯ ⋯ x1px2p⋮ xNP⎠⎞N×pxi∈Rp,i=1,2,⋯,N记1N=⎝⎛11⋮ 1⎠⎞N×1
对于样本均值
xˉ=N1i=1∑Nxi=N1(x1x2⋯ xN)⎝⎛11⋮ 1⎠⎞N×1=N1XT1N
对于样本方差
S=N1i=1∑N(xi−xˉ)(xi−xˉ)T
对于i=1∑N(xi−xˉ)有
i=1∑N(xi−xˉ)=(x1−xˉx2−xˉ⋯ xN−xˉ)=(x1x2⋯ xN)−(xˉxˉ⋯ xˉ)=XT−xˉ(11⋯ 1)=XT−xˉ1NT=XT−N1XT1N1NT=XT(IN−N11N1NT)
带回原式
S=N1(x1−xˉx2−xˉ⋯ xN−xˉ)⎝⎛(x1−xˉ)T(x2−xˉ)T⋮ (xN−xˉ)T⎠⎞=N1XT(IN−N11N1NT)⋅(IN−N11N1NT)TX
记H=IN−N11N1NT(H也被称为中心矩阵),上式为
S=N1XT(IN−N11N1NT)⋅(IN−N11N1NT)TX=N1XTH⋅HX
对于HT有
HT=(IN−N11N1NT)T=IN−N11N1NT=H
对于H2有
H2=H⋅H=(IN−N11N1NT)(IN−N11N1NT)=IN−N21N1NT+N211N1NT1N1NT
对于1N1NT
1N1NT1N1NT1N1NT=⎝⎛1⋮ 1⎠⎞(1⋯ 1)=⎝⎛1⋮ 1⋯ ⋯ 1⋮ 1⎠⎞=⎝⎛1⋮ 1⋯ ⋯ 1⋮ 1⎠⎞⎝⎛1⋮ 1⋯ ⋯ 1⋮ 1⎠⎞=⎝⎛N⋮ N⋯ ⋯ N⋮ N⎠⎞
带回H2有
H2=IN−N21N1NT+N211N1NT1N1NT=IN−N2⎝⎛1⋮ 1⋯ ⋯ 1⋮ 1⎠⎞+N21⎝⎛N⋮ N⋯ ⋯ N⋮ N⎠⎞=IN−N2⎝⎛1⋮ 1⋯ ⋯ 1⋮ 1⎠⎞+N1⎝⎛1⋮ 1⋯ ⋯ 1⋮ 1⎠⎞=IN−N1⎝⎛1⋮ 1⋯ ⋯ 1⋮ 1⎠⎞=IN−N11N1NT=H
因此有Hn=H,带回S
S=N1XTH⋅HX=N1XTHX
这里中心矩阵H的几何意义是,对于一个数据集X,XH可以认为是将数据集平移到坐标轴原点,H就是这个起到平移作用的矩阵