本文已参与「新人创作礼」活动,一起开启掘金创作之路。
矩估计法
用样本矩估计相应的总体矩,用样本矩的函数估计总体矩相应的函数,然后求出要估计的参数,称这种估计法为矩估计法
步骤
设X为连续型随机变量,其概率密度为f(x;θ1,θ2,⋯,θk),或X为离散型随机变量,其分布律为P{X=x}=p(x;θ1,θ2,⋯,θk),其中θ1,θ2,⋯,θk为待估计参数,X1,X2,⋯,Xn是来自X的样本。假设总体X的前k阶矩
μl=E(Xl)μl=E(Xl)=∫−∞+∞xlf(x;θ1,θ2,⋯,θk)dx(X连续型)=x∈RX∑xlp(x;θ1,θ2,⋯,θk)(X离散型)
(其中RX是X可能取值的范围)存在。一般来说,它们是θ1,θ2,⋯,θk的函数。基于样本矩
Al=n1i=1∑nXil
依概率收敛于相应的总体距μl(l=1,2,⋯,k),样本矩的连续函数依概率收敛于相应的总体矩的连续函数,我们就用样本矩作为相应的总体矩的估计量,而以样本矩的连续函数作为相应的总体矩的连续函数的估计量。这种估计方法称为矩估计法。矩估计法的具体做法如下:设
⎩⎨⎧μ1=μ1(θ1,θ2,⋯,θk)μ2=μ2(θ1,θ2,⋯,θk)⋮μk=μk(θ1,θ2,⋯,θk)
这是一个包含k个未知参数θ1,θ2,⋯,θk的联立方程组。一般来说,可以从中解出θ1,θ2,⋯,θk,得到
⎩⎨⎧⋮θ1=θ1(μ1,μ2,⋯,μk)θ2=θ2(μ1,μ2,⋯,μk)θk=θk(μ1,μ2,⋯,μk)
以Ai分别代替上式中的μi,i=1,2,⋯,k,就以
θi^=θi(A1,A2,⋯,Ak),i=1,2,⋯,k
分别作为θi,i=1,2,⋯,k的估计量,这种估计量称为矩估计量。矩估计量的观察值称为矩估计值
例1:设总体X在[a,b]上服从均匀分布,a,b未知,X1,X2,⋯,Xn是来自X的样本,试求a,b的矩估计量
μ1μ2=E(X)=2a+b=E(X2)=D(X)+[E(X)]2=12(b−a)2+4(a+b)2⇒⎩⎨⎧a+b=2μ1b−a=12(μ2−μ12)⇒⎩⎨⎧a=μ1−3(μ2−μ12)b=μ1+3(μ2−μ12)
注意到n1i=1∑nXi2−Xˉ2=n1i=1∑n(Xi−Xˉ)2,分别以A1,A2代替μ1,μ2,得到a,b的矩估计量分别为
a^b^=A1−3(A2−A12)=Xˉ−n3i=1∑n(Xi−Xˉ)2=A1+3(A2−A12)=Xˉ+n3i=1∑n(Xi−Xˉ)2
例2:设总体X的均值μ及方差σ2都存在,且有σ2>0。但μ,σ2均为未知,又设X1,X2,⋯,Xn是来自X得样本。试求μ,σ2的矩估计量
μ1μ2=E(X)=μ=E(X2)=D(X)+[E(X)]2=σ2+μ⇒{μ=μ1σ2=μ2−μ12
分别以A1,A2代替μ1,μ2,得μ和σ2的矩估计量分别为
μ^σ2^=A1=Xˉ=A2−A12=n1i=1∑nXi2−Xˉ2=n1i=1∑n(Xi−Xˉ)2
所得结果表名,总体均值与方差的矩估计量的表达式不因不同的总体分布而异
最大似然估计
若总体X属离散型,其分布律P{X=x}=p{x;θ},θ∈Θ的形式已知,θ为待估参数,Θ是θ可能取值的范围。设X1,X2,⋯,Xn是来自X的样本,则X1,X2,⋯,Xn的联合分布律为
i=1∏np(xi;θ)
又设x1,x2,⋯,xn是相应于样本X1,X2,⋯,Xn的一个样本值。易知样本X1,X2,⋯,Xn取到观察值x1,x2,⋯,xn的概率,亦即事件{X1=x1,X2=x2,⋯,Xn,xn}发生的概率为
L(θ)=L(x1,x2,⋯,xn;θ)=i=1∏np(xi;θ),θ∈Θ
这一概率随θ的取值而变化,它是θ的函数,L(θ)称为样本的似然函数(注意,这里x1,x2,⋯,xn是已知的样本值,它们都是常数
在θ取值的可能范围Θ内挑选使似然函数L(x1,x2,⋯,xn;θ)达到最大的参数值θ^,作为参数θ的估计值。即使θ^使
L(x1,x2,⋯,xn;θ^)=θ∈ΘmaxL(x1,x2,⋯,xn;θ)
这样得到的θ^与样本值x1,x2,⋯,xn有关,常记为θ^(x1,x2,⋯,xn),称为参数θ的最大似然估计值,而相应的统计量θ^(X1,X2,⋯,Xn)称为参数θ的最大似然估计量
若总体X属连续型,其概率密度f(x;θ),θ∈Θ的形式已知,θ为待估参数,Θ是θ可能取值的范围,设X1,X2,⋯,Xn是来自X得样本,则X1,X2,⋯,Xn的联合密度为
i=1∏nf(xi,θ)
设x1,x2,⋯,xn是相应于样本X1,X2,⋯,Xn的一个样本值,则随机点(X1,X2,⋯,Xn)落在点(x1,x2,⋯,xn)的邻域(边长分别为dx1,dx2,⋯,dxn的n维立方体)内的概率近似地为
i=1∏nf(xi;θ)dx
其值随θ的取值而变化,与离散型的情况一样,我们取θ的估计量θ^使概率取到最大值,但因子i=1∏ndxi不随θ而变,故只需考虑函数
L(θ)=L(x1,x2,⋯,xn;θ)=i=1∏nf(xi;θ)
的最大值,这里L(θ)称为样本的似然函数,若
L(x1,x2,⋯,xn;θ)=θ∈ΘmaxL(x1,x2,⋯,xn;θ)
则称θ^(x1,x2,⋯,xn)为θ的最大似然估计值,称θ^(X1,X2,⋯,Xn)为θ的最大似然估计量
这样,确定最大似然估计量的问题就归结为微分学中秋最大值的问题了,
在很多情形下,p(x;θ)和f(x;θ)关于θ可微,这时θ^常可从方程
dθdL(θ)=0
解得。又因L(θ)与L(lnθ)在同一θ处取到极值,因此,θ的最大似然估计θ也可以从方程
dθdlnL(θ)=0
求得,称为对数似然方程
例3:设X∼N(μ,σ2),其中μ,σ2(σ>0)均为未知参数,从总体取得样本为X1,X2,⋯,Xn,试求
E(X)E(X2)=μ=D(X)+[E(X)]2=σ2+μ2⇒⎩⎨⎧μ=Xˉσ2+μ2=n1i=1∑nXi2⇒⎩⎨⎧μ^=Xˉσ^=n1i=1∑nXi2−Xˉ2=n1i=1∑n(Xi−Xˉ)2
二阶矩可以用中心矩直接得到σ^=n1i=1∑nXi2−Xˉ2=n1i=1∑n(Xi−Xˉ)2
- μ和σ2的最大似然估计
由于X的密度为2πσ1e−2σ2(x−μ)2,−∞<x<+∞,所以
L(μ,σ2)lnL(μ,σ2)=(2πσ1)ne−2σ21i=1∑n(Xi−μ)2=−2nln(2π)−2nln(σ2)−2σ21i=1∑n(Xi−μ)2⇒⎩⎨⎧∂μ∂lnL=σ21i=1∑n(Xi−μ)=0∂σ2∂lnL=−2nσ21+2(σ2)21i=1∑n(Xi−μ)2=0⇒⎩⎨⎧μ^−Xˉσ2^=n1i=1∑n(Xi−Xˉ)2
例4:设总体X∼U[−θ,θ],X1,X2,⋯,Xn是来自总体X的简单随机样本,试求参数θ的最大似然估计
似然函数为
L(θ)=i=1∏nf(xi)=⎩⎨⎧(2θ)n10−θ≤x1,x2,⋯,xn≤θ其他
这里求导只能得到最小值
显然,θ越小,(2θ)n1越大,但θ必须满足−θ≤x1,x2,⋯,xn≤θ,也就是必有
{θ≥max(x1,x2,⋯,xn)−θ≤min(x1,x2,⋯,xn)⇒θ≥max(∣x1∣,∣x2∣,⋯,∣xn∣)
即有θ的最大似然估计θ^=max(∣X1∣,∣X2∣,⋯,∣Xn∣)