基尼系数双维度分解计算工具
今天推出的是一个基尼系数双维度分解工具,之前的基尼系数分解,要么是基不同的子群,或者基于不同的分项,但是有时候我们需要同时基于分组和分项来研究,如GDP,既需要根据区域分组研究区域差异,也需要揭示总体差异的产业来源,这时候常用的泰尔指数、Dagum基尼系数分解就不再适用了。
这个基尼系数双维度分解是由Mussard在2004年提出,其主要理论如下:
给定一个样本总体P,其规模为n,均值为μ,该总体划分为k 个子群,每个子群可以表示为Pi(∀j,h=1, 2,...,k)。每一个子群的均值和规模分别表示为μj和nj。基尼系数可以用下面的公式来计算,其中,sp,i,sp,r分别表示样本总体P中的个体i、个体r 的指标⟨i=1,2,⋯,n⟩。
G=2μn2∑^i=1∑^r=1∣xp,i−xp,r∣
总体指标被分成 q 个来源 xm(m=1,2,⋯,q) 。在样本总体 P 中,每个个体的指标可以表示为:
xP,i=n=1∑qxP,im
由于
∣xp,i−xp,r∣=xp,i+xp,r−2min{xp,i,xp,r}
因此,总体P 的基尼系数可以表示为:
G=2μn2∑i=1n∑i=1n(xp,i+xp,r−2min{xp,i,xp,r})
下面,根据总体指标来源对 2min{xp,i,xp,r} 进行分解:
m=1∑q2xP,ir∗m=2min{xP,i,xP,r}
例如,令2xp,i=2min{xp,i,xp,r},如果xp,i=xp,i1+xp,i2,那么
m=1∑q2xP,ir∗m=2∗(xP,i1+xP,i2)
因此,基尼系数可以按照分项指标进行如下测度:
G=n=1∑q(2μn2∑i=1n∑i=1n(xP,im+xP,rm−2xP,irm))
上式表明基尼系数被分解成 q 个部分,每个部分就是该指标各分项指标对于总体差异的贡献。根据 Dagum的基尼系数分解方法,基尼系数可以按照子群进行分解:
G=2μn2∑j=1k(∑i=1nj∣xj,i−xj,r∣)+2μn22∑j=2k∑h=1j−1(∑i=1nj∑r=1nh∣xj,i−xh,r∣)
其中,xj,r表示第j 个子群中第 r 个个体的指标。按照 Dagum,基尼系数分解为两个部分:
G=Gw+Ggb
其中,Gw 是区域内差异;Ggb 是区域间差异。基尼系数的双维分解可以按照如下公式进行:
G=m=1∑q⎩⎨⎧2μn2∑j=1k[∑i=1nj∑r=1nj(xj,im+xj,rm−2xj,irsm)]⎭⎬⎫+m=1∑q⎩⎨⎧2μn22∑j=2k∑k=1j−1[∑i=1nj∑r=1nk(xj,im+xk,rm−2xjk,irsm)]⎭⎬⎫
该模型计算过程比较复杂,我们开发出相关工具,可以直接计算基尼系数的双维度分解,结果如下:


分别是组内GINI和组间GINI,其和应等于总体GINI。
我们这个工具特点之一,就是可以在结果中指明对应分组的名称,而非用数字代替,简洁明了。
有需要可以联系微信:canglang12002