本文已参与「新人创作礼」活动,一起开启掘金创作之路。
一、二维随机变量
定义:设X=X(ω),Y=Y(ω)是定义在样本空间Ω上的两个随机变量,则称向量(X,Y)为二维随机变量,或随机变量
定义:设二维随机变量(X,Y),对任意实数x,y,二元函数
F(x,y)=P{X≤x,Y≤y},−∞<x,y<+∞
称为二维随机变量(X,Y)的分布函数,或称随机变量X和Y的联合分布函数
分布函数F(x,y)的性质
-
对任意x,y,均有0≤F(x,y)≤1
-
F(−∞,y)=F(x,−∞)=F(−∞,−∞)=0,F(+∞,+∞)=1
-
F(x,y)关于x和关于y均单调不减
-
F(x,y)关于x和关于y是右连续的
-
P{a<X≤b,c<Y≤d}=F(b,d)+F(a,c)−F(b,c)−F(a,d)
二维随机变量(X,Y)的分布函数为F(x,y),分别称FX(x)=P{X≤x}和FY(y)=P{Y≤y}为(X,Y)关于X和关于Y的边缘分布
显然,边缘分布FX(x)和FY(y)与二维随机变量F(x,y)有如下关系:
-
FX(x)=P{X≤x}=P{X≤x,y<+∞}=F(x,+∞)
-
FY(y)=P{Y≤y}=P{X<+∞,Y≤y}=F(+∞,y)
这里F(x,+∞)应理解为y→+∞limF(x,y)
定义:如果对于任意给定的ξ>0,P{y−ξ<Y≤y+ξ}>0
ξ→0+limP{X≤x∣y−ξ<Y≤y+ξ}=ξ →0+limP{y−ξ<Y≤y+ξ}P{X≤x,y−ξ<Y≤y+ξ}
存在,则称此极限为在条件Y=y下X的条件分布,记作FX∣Y(x∣y)或P{X≤x∣Y=y}
类似地可以定义FY∣X(y∣x)
二、二维离散型随机变量
定义:如果随机变量(X,Y)可能取值为有限个或可数无穷个(xi,yi),(i,j=1,2,⋯)则称(X,Y)为二维离散型随机变量
定义:二维离散型随机变量(X,Y)的可能取值为(xi,yi),(i,j=1,2,⋯)称
P{X=xi,Y=yi}=pij,i,i=1,2,⋯
为二维离散型随机变量(X,Y)的概率分布或分布律
也可以用表格表示分布律
分布律pij的性质
-
pij≥0,i,j=1,2,⋯
-
i∑j∑pij=1
定义:pi⋅=P{X=xi},i=1,2,⋯和p⋅y=P{Y=yj},j=1,2,⋯分别被称为(X,Y)关于X和关于Y的边缘分布
显然,边缘分布pi⋅和p⋅j与二维概率分布pij有如下关系
pi⋅p⋅j=P{X=xi}=j=1∑+∞P{X=xi,Y=yj}=j=1∑+∞pij,i=1,2,⋯=P{Y=yj}=i=1∑+∞P{X=xi,Y=yj}=i=1∑+∞pij,j=1,2,⋯
定义:对给定的j,如果P{Y=yj}>0,j=1,2,⋯,则称
P{X=xi∣Y=yj}=P{Y=yj}P{Xi,Y=yj}=p⋅jpij
为Y=yj条件下随机变量X的条件分布
例1:袋中有1个红球,2个黑球,3个白球,现有放回地从袋中取两次,每次取一个球,以X和Y分别表示两次取球所得红球和黑球个数,试求
概率分布显然可以用古典概型计算,这里省略步骤
| X\ Y | 0 | 1 | 2 | pi⋅ |
|---|
| 0 | 41 | 31 | 91 | 3625 |
| 1 | 61 | 91 | 0 | 185 |
| 2 | 361 | 0 | 0 | 361 |
| p⋅j | 94 | 94 | 91 | |
因此边缘分布为
| X | 0 | 1 | 2 |
|---|
| pi⋅ | 3625 | 185 | 361 |
| Y | 0 | 1 | 2 |
|---|
| p⋅j | 94 | 94 | 91 |
有
P{Y=i∣X=1}P{X=1}P{Y=0∣X=1}P{Y=1∣X=1}P{Y=2∣X=1}=P{X=1}P{X=1,Y=i}i=0,1,2=185=18561=53=18591=52=1850=0
因此,在X=1条件下Y的条件分布
| Y | 0 | 1 | 2 |
|---|
| P{Y=i∣X=1} | 53 | 52 | 0 |
三、二维连续型随机变量
定义:如果对随机变量(X,Y)的分布F(x,y)存在非负函数f(x,y),使得对于任意实数x和y都有
F(x,y)=∫−∞x∫−∞yf(u,v)dudv,−∞<x,y<+∞
则称(X,Y)为二维连续型随机变量,函数f(x,y)称为(X,Y)的概率密度,或称为随机变量X和Y的联合概率密度
概率密度f(x,y)的性质
-
f(x,y)≥0
-
∫−∞+∞∫−∞+∞f(x,y)dxdy=1
-
随机变量(X,Y)落在区域D内的概率
P{(X,Y)∈D}=D∬f(x,y)dxdy
例2:设二维连续型随机变量(X,Y)的概率密度为
f(x,y)={k(x+y)00<y<x<1其他
则常数k=()
![![[附件/Pasted image 20220914121648.png|200]]](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/651650384d32478da99c84e09fdebc06~tplv-k3u1fbpfcp-zoom-in-crop-mark:1512:0:0:0.awebp)
由概率密度的性质
∫−∞+∞∫−∞+∞f(x,y)dxdy=∫01dx∫0xk(x+y)dy=k∫01(x2+21x2)dx=2k=1⇒k=2
对连续型随机变量(X,Y),设它的概率密度为f(x,y),由
FX(x)=F(x,+∞)=∫−∞x[∫−∞+∞f(x,y)dy]dx
可知,X也是一个连续型变量,且其概率密度为fX(x)=∫−∞+∞f(x,y)dy
定义:fX(x)=∫−∞+∞f(x,y)dy和fY(y)=∫−∞+∞f(x,y)dx分别称为(X,Y)关于X和关于Y的边缘密度
定义:设f(x,y)在点(x,y)连续,fY(y)连续且fY(y)>0,则条件分布
FX∣Y(x∣y)=∫−∞xfY(y)f(s,y)ds
其中fY(y)f(x,y)被称为在条件Y=y下的条件密度,记作fX∣Y(x∣y),即
fX∣Y(x∣y)=fY(y)f(x,y),fY(y)>0
类似可定义,当fX(x)>0时
fY∣X(y∣x)=fX(x)f(x,y)和FY∣X(y∣x)=∫−∞yfX(x)f(x,s)ds
例3:设二维连续型随机变量(X,Y)的概率密度为
f(x,y)={2(x+y)00<y<x<1其他
试求
-
fX(x),fY(y)
-
fX∣Y(x∣y),fY∣X(y∣x)
fX(x)=∫−∞+∞f(x,y)dy
当x≤0时,fX(x)=0
当x≥1时,fX(x)=0
当0<x<1时,
fX(x)=∫0x2(x+y)dy=3x2
因此
fX(x)={3x200<x<1其他
同理
fY(y)=⎩⎨⎧∫y12(x+y)dx=1+2y−3y200<y<2其他
由于
fX∣Y(x∣y)=fY(y)f(x,y),fY(y)>0
故当0<y<1时,
fX∣Y(x∣y)=⎩⎨⎧1+2y−3y22(x+y)00<y<x<1其他
同理0<x<1时,
fY∣X(y∣x)=⎩⎨⎧3x22(x+y)00<y<x<1其他
求条件概率密度时,一定要注意fY(y)>0,fX(x)>0的条件,即上面加粗的部分一定不能漏,否则fX∣Y(x∣y)中的其他会变为整个平面上的其他,而非0<y<1的其他
下题可能会有助于理解
例4:设(X,Y)是二维随机变量,X的边缘密度为fX(x)={3x200<x<1其他,在给定X=x(0<x<1)的条件下,Y的条件概率密度为
fY∣X(y∣x)=⎩⎨⎧x33y200<y<x其他
-
求(X,Y)的概率密度f(x,y)
-
求Y的边缘概率密度fY(y)
-
求P{X>2Y}
fY∣X(y∣x)=fX(x)f(x,y),其中fX(x)>0
当0<x<1时,即fX(x)>0时
f(x,y)=fX(x)⋅fY∣X(y∣x)=⎩⎨⎧x9y200<y<x其他,0<x<1
注意这里提前限制了当0<x<1时,即fX(x)>0时,指的是
![![[附件/Pasted image 20220914155946.png|300]]](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/4dd869155b0b40828277907f7f212bcc~tplv-k3u1fbpfcp-zoom-in-crop-mark:1512:0:0:0.awebp)
所有蓝色部分,0<y<x指的是橙色部分,式子中的其他指的是除了橙色部分的蓝色部分
但实际上,f(x,y)要的是全平面上的,该式只是0<x<1,−∞<y<+∞上的,因此,需要说明其他部分的值
有
∫01dx∫0xx9y2dx=1
因此可以确定在0<x<1,−∞<y<+∞以外的平面上f(x,y)≡0,因此有
f(x,y)=⎩⎨⎧x9y200<y<x<1其他
有
fY(y)=∫−∞+∞f(x,y)dx=⎩⎨⎧∫y1x9y2dx00<y<1其他={−9y2lny00<y<1其他

P{X>2Y}=x>2y∬f(x,y)dxdy=∫01dx∫02xx9y2dy=81
例3是大的其他变成小的其他,例4是小的其他变成大的其他