本文已参与「新人创作礼」活动,一起开启掘金创作之路。
矩
定义:
设X是随机变量,如果
E(Xk),k=1,2,⋯
存在,则称之为X的k阶原点矩
设X是随机变量,如果
E{[X−E(X)]k},k=1,2,3,⋯
存在,则称之为X的k阶中心矩
设X和Y是两个随机变量,如果
E(XkYl),k,l=1,2,⋯
存在,则称之为X和Y的k+l阶混合矩
设X和Y是两个随机变量,如果
E{[X−E(X)]k[Y−E(Y)]l},k,l=1,2,⋯
存在,则称之为X和Y的k+l阶混合中心矩
协方差
定义:对于随机变量X和Y,如果E{[X−E(X)][Y−E(Y)]}存在,则称之为X和Y的协方差,记作cov(X,Y),即
cov(X,Y)=E{[X−E(X)][Y−E(Y)]}
计算公式
-
cov(X,Y)=E(XY)−E(X)E(Y)
-
D(X±Y)=D(X)+D(Y)±cov(X,Y)
性质
-
cov(X,Y)=cov(X,Y)
-
cov(aX,bY)=abcov(X,Y),其中a,b是常数
-
cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y)
例1:设随机变量X1,X2,⋯,Xn(n>1)相互独立,均服从正态分布N(0,σ2),则cov(X1,n1i=1∑nXi)=()
注意此处n1i=1∑nXi=E(X)
cov(X1,n1i=1∑nXi)=E(X1−EX1)(n1i=1∑nXi−n1i=1∑nEXi)=E[X1(n1i=1∑nXi)]=n1E(X1i=1∑nXi)=n1E(X12+i=2∑nX1Xi)=n1(σ2+i=2∑n0)=nσ2
例2:箱中装有6个球,其中红、白、黑球的个数分别为1,2,3个,现从箱中随机地取出2个球,记X为取出红球的个数,Y为取出的白球个数,求cov(X,Y)
X \ Y | 0 | 1 | 2 | |
---|
0 | 51 | 52 | 151 | 32 |
1 | 51 | 152 | 0 | 31 |
| 52 | 158 | 151 | |
cov(X,Y)E(X)E(Y)E(XY)cov(X,Y)=E(XY)−E(X)⋅E(Y)=0×32+1×31=31=0×52+1×158+2×151=32=0×(51+52+151+51)+1×1×152+1×2×0=152=152−31×32=−454
相关系数
定义:随机变量X和Y,如果D(X)D(Y)=0,则称D(X)D(Y)cov(X,Y)为X和Y的相关系数,记为ρXY,即
ρXY=D(X)D(Y)cov(X,Y)
如果D(X)D(Y)=0,则ρXY=0
如果随机变量X和Y的相关系数ρXY=0,则称X和Y不相关
性质
P{Y=aX+b}=1
个人理解,相关系数的意义,相关系数可写作
ρ=DXDYE(X−EX)(Y−E(Y))=DXE(X−EX)⋅DYE(Y−EY)
即两个变量标准化后的协方差。两变量的协方差如果很大,无法直接得到其是由于E(X)或E(Y)大导致,还是二者差异大导致,因此进行标准化
例3:随机试验E有三种两两不相容的结果A1,A2,A3,且三种结果发生的概率均为31,将试验E独立重复做2次,X表示2次试验中结果A1发生的次数,Y表示2次试验中结果A2发生的次数,则X与Y的相关系数为()
设Z表示2次试验中结果A3发生的次数,试验是独立重复的,把A3发生看成是试验成功,且P(A3)=31,所以,随机变量Z必服从二项分布B(2,31),同理,X和Y也都服从B(2,31),因此DX=DY
显然有
X+Y+Z=2⇒Y=2−X−Z
因此
cov(X,Y)=cov(X,2−X−Z)=cov(X,2)−cov(X,X)−cov(X,Z)=0−DX−cov(X,Z)由对称性cov(X,Y)=cov(X,Z)=−DX−cov(X,Y)
即
cov(X,Y)=−2DX
则X与Y的相关系数
ρXY=DXDYcov(X,Y)=DX−2DX=−21
独立与不相关
-
如果随机变量X和Y相互独立,则X和Y必不相关;反之,X和Y不相关时,X和Y不一定相互独立
-
对二维正态随机变量(X,Y),X和Y相互独立的充分必要条件是ρ=0
-
对二维正态随机变量(X,Y),X和Y相互独立与X和Y不相关是等价的
例4:设随机变量X和Y的概率分布分别为
X | 0 | 1 |
---|
P | 31 | 32 |
Y | −1 | 0 | 1 |
---|
P | 31 | 31 | 31 |
且P{X2=Y2}=1
- 求二维随机变量(X,Y)的概率分布
由P{X2=Y2}=1,得P{X2=Y2}=0,因此有
X\ P | −1 | 0 | 1 | Pi⋅ |
---|
0 | 0 | | 0 | 31 |
1 | | 0 | | 32 |
P⋅j | 31 | 31 | 31 | |
可得
X\ P | −1 | 0 | 1 | Pi⋅ |
---|
0 | 0 | 31 | 0 | 31 |
1 | 31 | 0 | 31 | 32 |
P⋅j | 31 | 31 | 31 | |
显然存在pij=pi⋅ p⋅j,因此X与Y不独立
又有
ρXY=DXDYcov(X,Y)=DXDYEXY−EX⋅EY=DXDY0−32×0=0
因此X与Y不相关,不独立
例5:已知随机变量(X,Y)服从二维正态分布N(μ1,μ2;σ12,σ22;0),记Z1=X+Y和Z2=X−Y
- 求(Z1,Z2)的分布
由于
∣∣111−1∣∣=0
因此(Z1,Z2)=(X+Y,X−Y)服从二维正态
D(Z1)D(Z2)cov(Z1,Z2)ρZ1,Z2=D(X+Y)=DX+DY=σ12+σ22=D(X−Y)=DX+DY=σ12+σ22=cov(X+Y,X−Y)=cov(X,X)−cov(X,Y)+cov(Y,X)−cov(Y,Y)=σ12−σ22=DZ1DZ2cov(Z1,Z2)=σ12+σ22σ12−σ22
因此(Z1,Z2)∼N(μ1+μ2,μ1−μ2;σ12+σ22,σ12−σ22;σ12+σ22σ12−σ22)
- Z1与Z2是否相互独立
当σ1=σ2时,ρZ1Z2=0⇒
Z1,Z2不相关,相互独立
当σ1=σ2时,ρZ1Z2=0⇒
Z1,Z2不相互独立
(X,Y)是正态时,不相关与独立等价
(X,Y)正态时,X与Y必正态,反之不一定
X与Y均正态且相互独立,则(X,Y)必正态
(X,Y)正态的充要条件为∣∣acbd∣∣=0时,(aX+bY,cX+dY)为正态
例6:设随机变量(X,Y)服从二维正态分布N(0,0;1,4;−21),证明33(X+Y)是标准正态分布,且与X独立的是
显然X∼N(0,1),Y∼(0,4)
cov(X,Y)D(X+Y)=ρDXDY=−1=DX+DY+2cov(X,Y)=3
注意这里D(X+Y)=DX+DY,由于没有X,Y相互独立的条件
E[33(X+Y)]D[33(X+Y)]cov(33(X+Y),X)ρ33(X+Y),X=33(EX+EY)=0=323D(X+Y)=1=33[cov(X,X)+cov(Y,X)]=0=0
由于
∣∣331330∣∣=0
因此(33(X+Y),X)也服从二维正态分布,其中ρ33(X+Y),X=0,因此二者独立