1 总体的k-因子模型
1.1 模型设定
x∼(μ,Σ),rank(Σ)=r,固定k<r,则k因子模型的设定为
x=Af+μ+ϵ
其中f为k维随机向量,称为共同因子(common factor),A为d×k的线性变换,称为因子载荷(factor loading)。
一般会做出这些假设:f∼(0,Ik),ϵ∼(0,Ψ)(其中Ψ为对角矩阵),Cov(f,ϵ)=0k×d。
有的文献中会假设Var(f)=Φ,Φ为对角矩阵,在这里我们假设它是球形的。在我们的假设下,我们有
Σ=AA′+Ψ
我们可以看Σ和AA′的各元素的接近程度,定义AA′的对角线元素τjj=∑l=1kajlajl为第j个communality(共同性),它满足σj2=σjj=τjj+ψj,而对于Σ的非对角线元素有σjm=τjm。
如果用一个正交k×k矩阵E,做A~=AE,f~=E′f,那么我们依然有
x=A~f~+μ+ϵ
它也是x的一个k-因子模型,也同样满足上文的那些假设,这说明因子模型不是唯一的。并且,如果没有额外的信息,我们想只利用Σ就求解出因子和载荷是不可能的,下面的例子就说明了这个问题。
1.2 案例
假设有2维随机向量x,Σ=[1.250.50.50.5],假设单因子模型为
x=[a1a2]f+[ϵ1ϵ2]
这里f为标量。
根据上文的推导,我们可以得出一些结论。如AA′的非对角线元素就是Σ的非对角线元素,即a1a2=0.5,而AA′的对角线元素必定小于Σ的对角线元素,即a12<σ11=1.25,a22<σ22=0.5。
但是,我们无法得出具体的A,比如我们可以取[a1a2]=[10.5],也可以取[a1∗a2∗]=[3/42/3],这些A都是可行的。也就是说,在没有额外信息或使用某些准则时,我们无法只利用Σ解出A。
2 一些选择A的准则
在1.2中,我们给出了一个案例,说明想要选择A的解,必须要借助一些准则。这里介绍两种准则。
2.1 最小化Ψ准则
我们可以选择使Ψ更小的A。由于Ψ是对角矩阵,可以直接用它的迹来表示大小。
tr(Ψ)=0.25+0.25=0.5,tr(Ψ∗)=1611−181=0.7431,因此,可以选择[a1a2]=[10.5]。
2.2 Varimax准则
Kaiser(1958)提出了另一个准则varimax criterion:记ajl为d×k矩阵A的第j行、l列元素,他们定义
VC(A)=l=1∑k⎣⎡d1j=1∑dajl4−(d1j=1∑dajl2)2⎦⎤
式子看起来很复杂,但我们可以理解成,先将A的所有元素做平方,然后计算某一列上的元素的方差,最后再对所有列加总。
对1.2的案例进行计算,可以得到VC(A)=0.1406,VC(A∗)=0.0035,如果我们需要VC越大越好的载荷矩阵,就选择[a1a2]=[10.5]。尽管在这里两种方法选出的矩阵是一样的,但它们不等价。
Varimax criterion的另一个用途是,寻找旋转后的载荷AE,即它要寻找一个正交矩阵E,使得
E~=argmaxVC(AE)
3 样本的k-因子模型
将n个样本排成d×n的矩阵X=(x1,…,xn),并将对应的每个f排成k×n矩阵F=(f1,…,fn),将对应的每个ϵ排成d×n矩阵N=(ϵ1,…,ϵn),我们可以得到
X=AF+xˉℓn′+N
还是和总体情况下一样,这些变量满足F∼(0,Ik),N∼(0,Ψ),这里Ψ为对角矩阵,Cov(F,N)=0k×d。样本的协方差矩阵可写为
S=Var(X)=Var(AF)+Var(N)=AA′+Ψ
参考文献
- Kaiser, H. F. (1958). The varimax criterion for analytic rotation in factor analysis. Psychometrika 23, 187–200.