5.2 面板数据模型理论 5.2.1 面板数据模型及类型。
面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据从横截面(cross section)上看,是由若干个体(entity , unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。
面板数据用双下标变量表示。例如:
y it
, i =1, 2, , N ; t =1, 2, , T
其中,N 表示面板数据中含有的个体数。T 表示时间序列的时期数。若固定t 不变,y i ∙
(i =1, 2, , N ) 是横截面上的
N 个随机变量;若固定i 不变,y ∙t , (t =1, 2, , T ) 是纵剖面
上的一个时间序列。对于面板数据来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。
面板数据模型是建立在面板数据之上、用于分析变量之间相互关系的计量经济模型。面板数据模型的解析表达式为:
y it =αit +x it βit +μit i =1, 2, N ; j =1, 2, T
12k
, x it , , x it ) 为1⨯k 维解释变量向量;其中,y it 为被解释变量;αit 表示截距项,x it =(x it
βit =(βit , βit , , βit )
12k '
为k ⨯1维参数向量;i
表示不同的个体;t 表示不同的时间;μit 为
~IIDN (0, σμ) 。
2
随机扰动项,满足经典计量经济模型的基本假设μit
面板数据模型通常分为三类。即混合模型、固定效应模型和随机效应模型。
⑴ 混合模型。
如果一个面板数据模型定义为:
y it =α+x it β+μit
i =1, 2, N ; j =1, 2, T
则称此模型为混合模型。混合模型的特点是无论对任何个体和截面,回归系数α和β都是相同的
⑵ 固定效应模型。
固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model )、时间固定效应模型(time fixed effects regression model)和时间个体固定效应模型(time and entity fixed effects regression model)。
① 个体固定效应模型。
个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序
列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么模型就称为个体固定效应模型立,表示如下,
y it =αi +x it β+μit i =1, 2, N ; j =1, 2, T
12k
, x it , , x it ) 为1⨯k 维解释变量向量,αi 是随机变量,式中,y it 为被解释变量, x it =(x it
12k
, x it , , x it ) 有关;表示对于i 个个体有i 个不同的截距项,且其变化与x it =(x it
β=(β1, β2, , βk ) 为k ⨯1维回归系数向量,对不同的个体回归系数相同,μit 为随机
误差项,则称此模型为个体固定效应模型。
个体固定效应模型也可以表示为
y it = γ1 D 1 + γ2 D2 + … +γN DN +β x it +μit t = 1, 2, …, T 其中
⎧1, D i =⎨
⎩0,
如果属于第i 个个体,i =1, 2,..., N 。
其他
② 时间固定效应模型。
如果一个面板数据模型定义为:
y it =αt +x it β+μit i =1, 2, N ; j =1, 2, T
式中,αt 是随机变量,表示对于T 个截面有T 个不同的截距项,且其变化与
x it =(x it , x it , , x it ) 有关;对不同的个体回归系数相同,μit
1
2
k
为随机误差项,则称此模
型为时间固定效应模型。时间固定效应模型就是对于不同的截面(时刻点)有不同截距的模型。如果确知对于不同的截面,模型的截距显著不同,但是对于不同的时间序列(个体)截距是相同的,那么应该建立时刻固定效应模型。时间固定效应模型也可以表示如下
y it = α1 D 1 + α2 D 2 + … +αT D T +β1 x it +εit , i = 1, 2, …, N 其中
⎧1,
D i =⎨
⎩0,
如果属于第t 个截面,t =2,..., T 。
其他(不属于第t 个截面)
③ 个体时间固定效应模型。 如果一个面板数据模型定义为
y it =αi +γt +x it β+μit
i =1, 2, N ; j =1, 2, T 个个体有
N
式中,αi 是随机变量,表示对于
x it =(x it , x it , , x it ) 有关;γt
1
2
k
N
个不同的截距项,且其变化与
是随机变量, 表示对于T 个截面有T 个不同的截距项,且其
12k
变化与x it =(x it , x it , , x it ) 有关;对不同的个体回归系数相同,μit 为随机误差项,则称
此模型为个体时间固定效应模型。 ⑶ 随机效应模型
对于面板数据模型
y it =αi +x it β+μit i =1, 2, N ; j =1, 2, T
⨯1维回归系数向量,对不同的
如果y it 为被解释变量, x it 为1⨯k 维解释变量向量,β为k 为个体随机效应模型。
个体回归系数相同,αt 是随机变量,其分布与x it 无关;μit 为随机误差项,则称此模型
同理也可以定义时间随机效应模型和个体时间随机效用模型。
5.2.2 面板数据模型估计方法
面板数据模型中β的估计量既不同于截面数据估计量,也不同于时间序列估计量,其性质随模型类型的设定是否正确,是否采用了相应正确的估计方法而变化。面板数据模型中的解释变量X it 可以是时变的,也可以是非时变的。
⑴ 混合最小二乘估计
混合最小二乘估计方法是在时间上和截面上把N T 个观测值混合在一起,然后用最小二乘法估计模型参数。给定混合模型
y it =αi +x it β+μit ,i =1, 2, , N ; t =1, 2, , T
如果模型是正确设定的,且解释变量与误差项不相关,即C ov (X it , u it ) =0。那么无论是N →∞,还是T →∞,模型参数的混合最小二乘法估计量都具有一致性。
对混合模型通常采用的是混合最小二乘估计。
然而,对于经济面板数据,即使在随机误差项u it 服从独立同分布条件下,由最小二乘法得到的方差协方差矩阵通常也不会满足假定条件。因为对于每个个体i 及误差项u it 来说通常是序列相关的。N T 个自相关观测值要比N T 个相互独立的观测值包含的信息少。从而导致随机误差项u it 的标准差常常被低估,估计量的精度被虚假夸大。如果模型存在个体固定效应模型,即αi 与X it 相关,那么对模型应用混合最小二乘估计方法,估计量不再具有一致性。
⑵ 平均数最小二乘估计法
平均数最小二乘(between OLS)估计法的步骤是首先对面板数据中的每个个体求平均数,共得到N 个平均数估计值。然后利用y it 和X it 的这N 组观测值估计回归参数。以个体固定效应模型
'
X βi t +u y i t =α+i
i t
为例,首先对面板中的每个个体求平均数。令
T
i =T
-1
∑
t =1
y it , i =1, 2, , N
T
i =T
-1
∑u
t =1T
it
, i =1, 2, , N
X i =T 从而建立模型
-1
∑
t =1
X i , t =i 1, 2 ,
, ,N (X i 是k ⨯1阶列向量)
i =αi +X i ' β+i , i =1, 2, , N
变换上式得
i =α+X i ' β+(αi -α+i ), i =1, 2, , N
上式称做平均数模型。对上式应用最小二乘估计,则参数估计量称做平均数最小二乘估计量。此条件下的样本容量为N 。
如果X i 与(αi -α+i ) 相互独立,α和β的平均数最小二乘估计量是一致估计量。平均数最小二乘估计法适用于短期面板的混合模型和个体随机效应模型。对于个体固定效应模型来说,由于αi 和X it 相关,也就是说αi 和X i 相关,所以,回归参数的平均数最小二乘估计量是非一致估计量。
⑶ 离差变换最小二乘估计量
对于短期面板数据,离差变换最小二乘(within OLS )估计法的原理是先把面板数据中每个个体的观测值变换为对其平均数的离着观测值,然后利用离差变换数据估计模型参数。以个体固定效应模型为例,
y it =αi +X it β+u it
'
具体步骤是先对每个个体计算平均数、X i ,可得到如下模型,
+ i i =αi +X ' βi
其中、X i 、i 为每个个体的平均。上两式相减,消去了αi ,得
y it -i =(X it -X i ) β+(u it -i )
'
此模型称做离差变换数据模型。对离差变换数据模型应用最小二乘估计,
N
T
it
ˆ=β
∑∑(X
i =1t =1
N T
-X i )(y it -i )
'
∑∑
i =1t =1
(X it -X i )(X it -X i )
所得βˆ称做离差变换最小二乘估计量。对于个体固定效应模型,β的离差变换最小二乘估计量是一致估计量。如果u it 还满足独立同分布条件,β的离差变换最小二乘估计量不但具有一致性而且还具有有效性。
⑷ 可行广义最小二乘估计法(随机效应估计法) 有个体随机效应模型
y it =α0-X it ' β+(αi +u it )
其中α0为常数。αi ,u it 服从独立同分布。对其做以下变换
ˆ=(1-λˆ) α+(X -λˆX ) ' β+v y it -λi 0it i it
22ˆ) α+(u -λˆ) 渐近服从独立同分布,λ=1-σ/+T σ其中v it =(1-λX i 、i u u α0it i
i 的定义式见(15-14)。对式(15-17)应用最小二乘估计,则所得β
的估计量称为可行
ˆ=0时,式(15-17)等同于混合最小二乘广义最小二乘估计量或随机效应估计量。当λ
ˆ=1时,式(15-17)等同于离差变换最小二乘估计。 估计; 当λ
对于随机效应模型,可行广义最小二乘估计量不但是一致估计量,而且是有效估计量,但对于个体固定效应模型,可行广义最小二乘估计量不是一致估计量。
在实际的经济面板数据中,N 个个体之间相互独立的假定通常是成立的,但是每个个体本身却常常是序列自相关的,且存在异方差。为了得到正确的统计推断,需要克服这两个因素。
5.2.3 面板数据模型的检验
面板数据模型的检验是检验对于给定的面板数据应该建立何种类型的面板数据模型,包括混合模型、固定效应模型和随机效应模型。面板数据模型的检验有两种检验,F 检验和Hausman 检验。F 检验用于检验应该建立混合模型还是应该建立个体效应模型。Hausman 检验用于检验应该建立随机效应模型还是固定效应模型。
⑴ F 检验
F 检验用于检验应该建立混合模型还是应该建立个体效应模型。面板数据模型的一项重要任务就是判别模型中的是否存在给固定效应。
① 个体固定效应模型的检验
相对于混合模型来说,是否有必要建立个体固定效应模型可以通过F 检验来完成。F 检验的假设为:
原假设H 0:不同个体的模型截距项相同(建立混合估计模型)。 备择假设H 1:不同个体的模型截距项不同(建立个体固定效应模型)。 在假设成立的情况下F 统计量定义为: F =
(SSE r -SSE u ) /[(NT -2) -(NT -N -1)]
SSE u /(NT -N -1)
=
(SSE r -SSE u ) /(N -1) SSE u /(NT -N -1)
其中SSE r 表示估计的混合模型的残差平方和,SSE u 表示估计的个体固定效应模型的残差平方和。N 表示个体单位数量,T 表示时间的个数,当模型中含有k 个解释变量时,F 统计量的分母自由度是NT -N -k 。F 统计量定义为:
F =
(SSE
r u
-SSE u ) /(N -1) /(NT -N -1)
SSE
② 时间固定效应模型的检验
相对于混合估计模型来说,是否有必要建立时间固定效应模型可以通过F 检验来完成。F 检验的假设为:
H 0:对于不同横截面模型截距项相同(建立混合估计模型)。 H 1:对于不同横截面模型的截距项不同(建立时刻固定效应模型)。 在假设成立的情况下F 统计量定义为: F =
(SSE
r
-SSE u ) /[(NT -2) -(NT -T -1)]
SSE
u
/(NT -T -1)
=
(SSE r -SSE u ) /(T -1) SSE u /(NT -T -1)
其中SSE r ,SSE u 分别表示约束模型(混合估计模型的)和非约束模型(时刻固定效应模型的)的残差平方和。非约束模型比约束模型多了T -1个被估参数。当模型中含有k 个解释变量时,F 统计量的分母自由度是NT -T - k 。
③ 时间个体固定效应模型检验。
相对于混合估计模型来说,是否有必要建立时刻个体固定效应模型可以通过F 检验来完成。
H 0:对于不同横截面,不同序列,模型截距项都相同(建立混合估计模型)。 H 1:不同横截面,不同序列,模型截距项各不相同(建立时刻个体固定效应模型)。 在假设成立的情况下F 统计量定义为:
F =
(SSE r -SSE u ) /[(NT -2) -(NT -N -T )]
SSE u /(NT -N -T )
=
(SSE r -SSE u ) /(N +T -2)
SSE u /(NT -N -T )
其中SSE r ,SSE u 分别表示约束模型(混合估计模型的)和非约束模型(时间个体固定效应模型的)的残差平方和。非约束模型比约束模型多了N +T 个被估参数。当模型中含有k 个解释变量时,F 统计量的分母自由度是NT -N -T - k -1。
④ 变系数固定效应模型检验
相对于时间固定效应模型而言,变系数模型检验的基本假设为
H 0:对于不同横截面,模型截距项不相同、回归系数都相同。
(建立固定效应模型)。
H 1:对于不同横截面,模型截距项不相同、回归系数不同。
(建立变系数固定效应模型)。
在假设成立的情况下,F 统计量定义为
F 2=
(SSE
r
-SSE
u
u
) N -1) k ]
SSE N (T -k -1)]
~F [(N -1) k , N (T -k -1)]
其中SSE r ,SSE u 分别表示固定效应估计模型和变系数固定效应模型的残差平方和。
⑵ Hausman 检验
对一个参数的两种估计量差异的显著性检验称做H (Hausman )检验。H 检验由豪斯曼(Hausman )1978年提出,是在杜宾(Durbin ,1914年提出)和吴(Wu ,1973年提出)基础上发展起来的。所以H 检验也称做吴-杜宾检验和杜宾-吴-豪斯曼检验。
① H 检验原理。
比如在检验单一方程中某个解释变量的内生性问题时得到相应回归参数的两个估计量,一个是最小二乘估计量、一个是2SLS 估计量。其中2SLS 估计量用来克服解释变量可能存在的内生性。如果模型的解释变量中不存在内生性变量,那么最小二乘估计量和2SLS 估计量都具有一致性,都有相同的概率极限分布。如果模型的解释变量中存在内生性变量,那么回归参数的最小二乘估计量是不一致的而2SLS 估计量仍具有一致性,两个估计量将有不同的概率极限分布。
更一般地,假定用两种方法得到m 个回归系数的两组估计量θˆ和θ (都是m ⨯1阶的) ,则H 检验的零假设和备择假设是:
H 0:plim (θˆ-θ ) =0
H 1:plim (θˆ-θ ) ≠0
假定相应两个估计量的差作为一个统计量也具有一致性,在H 0成立的条件下,统计量
θˆ-θ ) →N (0,V H )
d
其中V
H 是θˆ-θ ) 的极限分布方差协方差矩阵。则H 统计量定义为:
-1ˆ-12
H =(θˆ-θ ) '(N V ) (θˆ-θ ) →χ(m ) H
其中(N -1V ˆH ) 是(θˆ-θ ) 的估计的方差协方差矩阵。在H 0成立条件下,H 统计量渐近服从χ2(m ) 分布。其中k 表示零假设中约束条件个数。
H 检验原理很简单,但实际中得到V H 的一致估计量V ˆH 却并不容易。一般来说,
-1ˆN V =Var (θˆ-θ ) =Var (θˆ) +Var (θ ) -2Cov (θˆ, θ ) H
其中Var (θˆ) ,Var (θ ) 在一般软件计算中都能给出。但C ov (θˆ, θ ) 不能给出,致使H 统计量(N -1V ˆH ) 在实际中无法使用。
实验中也常进行如下检验。
H 0:模型中所有解释变量都是外生的 H 1:模型中某些解释变量是内生的
在原假设成立条件下,解释变量参数的最小二乘估计量θˆ是有效估计量。则有
) =V a r (θˆ) 。于是式(15-20)变为 C o v (θˆ, θ
-1ˆ
N V =Var (θˆ) +Var (θ ) -2Cov (θˆ, θ ) =Var (θ ) -Var (θˆ) (15-21) H
把式(15-21)结果代入式(15-19),得
' -1
H =(θˆ-θ ) (Var (θ ) -Var (θˆ)) (θˆ-θ )
(15-22)
其中Var (θ ) 和Var (θˆ) 分别是对Var (θ ) 和Var (θˆ) 的估计。与式(15-20)比较,这个结果只要求计算Var (θ ) 和Var (θˆ) ,H 统计量(15-22)具有实用性。原假设成立条件下,式(15-22)定义的H 统计量渐近服从χ2(m ) 分布。
当θ为标题,只表示一个参数时,式(15-22)定义的H 统计量退化为标量,
H =
2
(θˆ-θ ) 2
2
ˆ-s s
χ(1)
2 (15-23)
ˆ2和s 2分别表示θ 和θˆ的样本方差。 其中s H
检验用途很广。可用来做模型丢失变量的检验、变量内生性检验、模型形式设定
检验、模型嵌套检验、建模顺序检验等。
② 面板数据中利用H 统计量确定模型形式的检验。
假定面板数据模型的误差项满足通常的假定条件,如果真实的模型是随机效应模型,那么β的离差变换最小二乘估计量βˆW 和可行广义最小二乘法估计量β R E 都具有一致性。如果真实的模型是个体固定效应模型,则参数β的离差变换最小二乘法估计量βˆW 是一致估计量,但可行广义最小二乘估计量β R E 是非一致估计量。那么,当对一个面板数据模型同时进行离差变换最小二乘估计和可行广义最小二乘估计时,如果回归系数的两种估计结果差别小,说明应该建立随机效应模型;如果回归系数的两种估计结果差别大,说明应该建立个体固定效应模型。可以通过H 统计量检验(β RE -βˆW )的非零显著性,检验面板数据模型中是否存在个体固定效应。H 检验原理见表15-3。
表15-3 两类不同模型两类估计量性质比较
离差变换最小 可行广义最小 具有一致性 估计量βR E
估计量之差
小 大
个体随机效应模型 估计量βW 具有一致性
不具有一致性 个体固定效应模型 估计量βˆW 具有一致性 估计量βR E
面板数据模型中豪斯曼检验的步骤是: 原假设与备择假设是
H 0:个体效应αi 与解释变量X it 无关(个体随机效应模型)
H 1:个体效应αi 与解释变量X it 相关(个体固定效应模型)
由样本计算豪斯曼值,根据显著性水平查卡方临界值表得临界值χα2(m ) ,其中α表示检验水平,m 表示被检验的回归参数个数。
差别规则是
若用样本计算的H ≤χα2(m ) ,则接受原假设,应该建立个体随机效应模型 若用样本计算的H >χα2(m ) ,则拒绝原假设,应该建立个体固定效应模型
5.2 面板数据模型理论 5.2.1 面板数据模型及类型。
面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据从横截面(cross section)上看,是由若干个体(entity , unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。
面板数据用双下标变量表示。例如:
y it
, i =1, 2, , N ; t =1, 2, , T
其中,N 表示面板数据中含有的个体数。T 表示时间序列的时期数。若固定t 不变,y i ∙
(i =1, 2, , N ) 是横截面上的
N 个随机变量;若固定i 不变,y ∙t , (t =1, 2, , T ) 是纵剖面
上的一个时间序列。对于面板数据来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。
面板数据模型是建立在面板数据之上、用于分析变量之间相互关系的计量经济模型。面板数据模型的解析表达式为:
y it =αit +x it βit +μit i =1, 2, N ; j =1, 2, T
12k
, x it , , x it ) 为1⨯k 维解释变量向量;其中,y it 为被解释变量;αit 表示截距项,x it =(x it
βit =(βit , βit , , βit )
12k '
为k ⨯1维参数向量;i
表示不同的个体;t 表示不同的时间;μit 为
~IIDN (0, σμ) 。
2
随机扰动项,满足经典计量经济模型的基本假设μit
面板数据模型通常分为三类。即混合模型、固定效应模型和随机效应模型。
⑴ 混合模型。
如果一个面板数据模型定义为:
y it =α+x it β+μit
i =1, 2, N ; j =1, 2, T
则称此模型为混合模型。混合模型的特点是无论对任何个体和截面,回归系数α和β都是相同的
⑵ 固定效应模型。
固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model )、时间固定效应模型(time fixed effects regression model)和时间个体固定效应模型(time and entity fixed effects regression model)。
① 个体固定效应模型。
个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序
列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么模型就称为个体固定效应模型立,表示如下,
y it =αi +x it β+μit i =1, 2, N ; j =1, 2, T
12k
, x it , , x it ) 为1⨯k 维解释变量向量,αi 是随机变量,式中,y it 为被解释变量, x it =(x it
12k
, x it , , x it ) 有关;表示对于i 个个体有i 个不同的截距项,且其变化与x it =(x it
β=(β1, β2, , βk ) 为k ⨯1维回归系数向量,对不同的个体回归系数相同,μit 为随机
误差项,则称此模型为个体固定效应模型。
个体固定效应模型也可以表示为
y it = γ1 D 1 + γ2 D2 + … +γN DN +β x it +μit t = 1, 2, …, T 其中
⎧1, D i =⎨
⎩0,
如果属于第i 个个体,i =1, 2,..., N 。
其他
② 时间固定效应模型。
如果一个面板数据模型定义为:
y it =αt +x it β+μit i =1, 2, N ; j =1, 2, T
式中,αt 是随机变量,表示对于T 个截面有T 个不同的截距项,且其变化与
x it =(x it , x it , , x it ) 有关;对不同的个体回归系数相同,μit
1
2
k
为随机误差项,则称此模
型为时间固定效应模型。时间固定效应模型就是对于不同的截面(时刻点)有不同截距的模型。如果确知对于不同的截面,模型的截距显著不同,但是对于不同的时间序列(个体)截距是相同的,那么应该建立时刻固定效应模型。时间固定效应模型也可以表示如下
y it = α1 D 1 + α2 D 2 + … +αT D T +β1 x it +εit , i = 1, 2, …, N 其中
⎧1,
D i =⎨
⎩0,
如果属于第t 个截面,t =2,..., T 。
其他(不属于第t 个截面)
③ 个体时间固定效应模型。 如果一个面板数据模型定义为
y it =αi +γt +x it β+μit
i =1, 2, N ; j =1, 2, T 个个体有
N
式中,αi 是随机变量,表示对于
x it =(x it , x it , , x it ) 有关;γt
1
2
k
N
个不同的截距项,且其变化与
是随机变量, 表示对于T 个截面有T 个不同的截距项,且其
12k
变化与x it =(x it , x it , , x it ) 有关;对不同的个体回归系数相同,μit 为随机误差项,则称
此模型为个体时间固定效应模型。 ⑶ 随机效应模型
对于面板数据模型
y it =αi +x it β+μit i =1, 2, N ; j =1, 2, T
⨯1维回归系数向量,对不同的
如果y it 为被解释变量, x it 为1⨯k 维解释变量向量,β为k 为个体随机效应模型。
个体回归系数相同,αt 是随机变量,其分布与x it 无关;μit 为随机误差项,则称此模型
同理也可以定义时间随机效应模型和个体时间随机效用模型。
5.2.2 面板数据模型估计方法
面板数据模型中β的估计量既不同于截面数据估计量,也不同于时间序列估计量,其性质随模型类型的设定是否正确,是否采用了相应正确的估计方法而变化。面板数据模型中的解释变量X it 可以是时变的,也可以是非时变的。
⑴ 混合最小二乘估计
混合最小二乘估计方法是在时间上和截面上把N T 个观测值混合在一起,然后用最小二乘法估计模型参数。给定混合模型
y it =αi +x it β+μit ,i =1, 2, , N ; t =1, 2, , T
如果模型是正确设定的,且解释变量与误差项不相关,即C ov (X it , u it ) =0。那么无论是N →∞,还是T →∞,模型参数的混合最小二乘法估计量都具有一致性。
对混合模型通常采用的是混合最小二乘估计。
然而,对于经济面板数据,即使在随机误差项u it 服从独立同分布条件下,由最小二乘法得到的方差协方差矩阵通常也不会满足假定条件。因为对于每个个体i 及误差项u it 来说通常是序列相关的。N T 个自相关观测值要比N T 个相互独立的观测值包含的信息少。从而导致随机误差项u it 的标准差常常被低估,估计量的精度被虚假夸大。如果模型存在个体固定效应模型,即αi 与X it 相关,那么对模型应用混合最小二乘估计方法,估计量不再具有一致性。
⑵ 平均数最小二乘估计法
平均数最小二乘(between OLS)估计法的步骤是首先对面板数据中的每个个体求平均数,共得到N 个平均数估计值。然后利用y it 和X it 的这N 组观测值估计回归参数。以个体固定效应模型
'
X βi t +u y i t =α+i
i t
为例,首先对面板中的每个个体求平均数。令
T
i =T
-1
∑
t =1
y it , i =1, 2, , N
T
i =T
-1
∑u
t =1T
it
, i =1, 2, , N
X i =T 从而建立模型
-1
∑
t =1
X i , t =i 1, 2 ,
, ,N (X i 是k ⨯1阶列向量)
i =αi +X i ' β+i , i =1, 2, , N
变换上式得
i =α+X i ' β+(αi -α+i ), i =1, 2, , N
上式称做平均数模型。对上式应用最小二乘估计,则参数估计量称做平均数最小二乘估计量。此条件下的样本容量为N 。
如果X i 与(αi -α+i ) 相互独立,α和β的平均数最小二乘估计量是一致估计量。平均数最小二乘估计法适用于短期面板的混合模型和个体随机效应模型。对于个体固定效应模型来说,由于αi 和X it 相关,也就是说αi 和X i 相关,所以,回归参数的平均数最小二乘估计量是非一致估计量。
⑶ 离差变换最小二乘估计量
对于短期面板数据,离差变换最小二乘(within OLS )估计法的原理是先把面板数据中每个个体的观测值变换为对其平均数的离着观测值,然后利用离差变换数据估计模型参数。以个体固定效应模型为例,
y it =αi +X it β+u it
'
具体步骤是先对每个个体计算平均数、X i ,可得到如下模型,
+ i i =αi +X ' βi
其中、X i 、i 为每个个体的平均。上两式相减,消去了αi ,得
y it -i =(X it -X i ) β+(u it -i )
'
此模型称做离差变换数据模型。对离差变换数据模型应用最小二乘估计,
N
T
it
ˆ=β
∑∑(X
i =1t =1
N T
-X i )(y it -i )
'
∑∑
i =1t =1
(X it -X i )(X it -X i )
所得βˆ称做离差变换最小二乘估计量。对于个体固定效应模型,β的离差变换最小二乘估计量是一致估计量。如果u it 还满足独立同分布条件,β的离差变换最小二乘估计量不但具有一致性而且还具有有效性。
⑷ 可行广义最小二乘估计法(随机效应估计法) 有个体随机效应模型
y it =α0-X it ' β+(αi +u it )
其中α0为常数。αi ,u it 服从独立同分布。对其做以下变换
ˆ=(1-λˆ) α+(X -λˆX ) ' β+v y it -λi 0it i it
22ˆ) α+(u -λˆ) 渐近服从独立同分布,λ=1-σ/+T σ其中v it =(1-λX i 、i u u α0it i
i 的定义式见(15-14)。对式(15-17)应用最小二乘估计,则所得β
的估计量称为可行
ˆ=0时,式(15-17)等同于混合最小二乘广义最小二乘估计量或随机效应估计量。当λ
ˆ=1时,式(15-17)等同于离差变换最小二乘估计。 估计; 当λ
对于随机效应模型,可行广义最小二乘估计量不但是一致估计量,而且是有效估计量,但对于个体固定效应模型,可行广义最小二乘估计量不是一致估计量。
在实际的经济面板数据中,N 个个体之间相互独立的假定通常是成立的,但是每个个体本身却常常是序列自相关的,且存在异方差。为了得到正确的统计推断,需要克服这两个因素。
5.2.3 面板数据模型的检验
面板数据模型的检验是检验对于给定的面板数据应该建立何种类型的面板数据模型,包括混合模型、固定效应模型和随机效应模型。面板数据模型的检验有两种检验,F 检验和Hausman 检验。F 检验用于检验应该建立混合模型还是应该建立个体效应模型。Hausman 检验用于检验应该建立随机效应模型还是固定效应模型。
⑴ F 检验
F 检验用于检验应该建立混合模型还是应该建立个体效应模型。面板数据模型的一项重要任务就是判别模型中的是否存在给固定效应。
① 个体固定效应模型的检验
相对于混合模型来说,是否有必要建立个体固定效应模型可以通过F 检验来完成。F 检验的假设为:
原假设H 0:不同个体的模型截距项相同(建立混合估计模型)。 备择假设H 1:不同个体的模型截距项不同(建立个体固定效应模型)。 在假设成立的情况下F 统计量定义为: F =
(SSE r -SSE u ) /[(NT -2) -(NT -N -1)]
SSE u /(NT -N -1)
=
(SSE r -SSE u ) /(N -1) SSE u /(NT -N -1)
其中SSE r 表示估计的混合模型的残差平方和,SSE u 表示估计的个体固定效应模型的残差平方和。N 表示个体单位数量,T 表示时间的个数,当模型中含有k 个解释变量时,F 统计量的分母自由度是NT -N -k 。F 统计量定义为:
F =
(SSE
r u
-SSE u ) /(N -1) /(NT -N -1)
SSE
② 时间固定效应模型的检验
相对于混合估计模型来说,是否有必要建立时间固定效应模型可以通过F 检验来完成。F 检验的假设为:
H 0:对于不同横截面模型截距项相同(建立混合估计模型)。 H 1:对于不同横截面模型的截距项不同(建立时刻固定效应模型)。 在假设成立的情况下F 统计量定义为: F =
(SSE
r
-SSE u ) /[(NT -2) -(NT -T -1)]
SSE
u
/(NT -T -1)
=
(SSE r -SSE u ) /(T -1) SSE u /(NT -T -1)
其中SSE r ,SSE u 分别表示约束模型(混合估计模型的)和非约束模型(时刻固定效应模型的)的残差平方和。非约束模型比约束模型多了T -1个被估参数。当模型中含有k 个解释变量时,F 统计量的分母自由度是NT -T - k 。
③ 时间个体固定效应模型检验。
相对于混合估计模型来说,是否有必要建立时刻个体固定效应模型可以通过F 检验来完成。
H 0:对于不同横截面,不同序列,模型截距项都相同(建立混合估计模型)。 H 1:不同横截面,不同序列,模型截距项各不相同(建立时刻个体固定效应模型)。 在假设成立的情况下F 统计量定义为:
F =
(SSE r -SSE u ) /[(NT -2) -(NT -N -T )]
SSE u /(NT -N -T )
=
(SSE r -SSE u ) /(N +T -2)
SSE u /(NT -N -T )
其中SSE r ,SSE u 分别表示约束模型(混合估计模型的)和非约束模型(时间个体固定效应模型的)的残差平方和。非约束模型比约束模型多了N +T 个被估参数。当模型中含有k 个解释变量时,F 统计量的分母自由度是NT -N -T - k -1。
④ 变系数固定效应模型检验
相对于时间固定效应模型而言,变系数模型检验的基本假设为
H 0:对于不同横截面,模型截距项不相同、回归系数都相同。
(建立固定效应模型)。
H 1:对于不同横截面,模型截距项不相同、回归系数不同。
(建立变系数固定效应模型)。
在假设成立的情况下,F 统计量定义为
F 2=
(SSE
r
-SSE
u
u
) N -1) k ]
SSE N (T -k -1)]
~F [(N -1) k , N (T -k -1)]
其中SSE r ,SSE u 分别表示固定效应估计模型和变系数固定效应模型的残差平方和。
⑵ Hausman 检验
对一个参数的两种估计量差异的显著性检验称做H (Hausman )检验。H 检验由豪斯曼(Hausman )1978年提出,是在杜宾(Durbin ,1914年提出)和吴(Wu ,1973年提出)基础上发展起来的。所以H 检验也称做吴-杜宾检验和杜宾-吴-豪斯曼检验。
① H 检验原理。
比如在检验单一方程中某个解释变量的内生性问题时得到相应回归参数的两个估计量,一个是最小二乘估计量、一个是2SLS 估计量。其中2SLS 估计量用来克服解释变量可能存在的内生性。如果模型的解释变量中不存在内生性变量,那么最小二乘估计量和2SLS 估计量都具有一致性,都有相同的概率极限分布。如果模型的解释变量中存在内生性变量,那么回归参数的最小二乘估计量是不一致的而2SLS 估计量仍具有一致性,两个估计量将有不同的概率极限分布。
更一般地,假定用两种方法得到m 个回归系数的两组估计量θˆ和θ (都是m ⨯1阶的) ,则H 检验的零假设和备择假设是:
H 0:plim (θˆ-θ ) =0
H 1:plim (θˆ-θ ) ≠0
假定相应两个估计量的差作为一个统计量也具有一致性,在H 0成立的条件下,统计量
θˆ-θ ) →N (0,V H )
d
其中V
H 是θˆ-θ ) 的极限分布方差协方差矩阵。则H 统计量定义为:
-1ˆ-12
H =(θˆ-θ ) '(N V ) (θˆ-θ ) →χ(m ) H
其中(N -1V ˆH ) 是(θˆ-θ ) 的估计的方差协方差矩阵。在H 0成立条件下,H 统计量渐近服从χ2(m ) 分布。其中k 表示零假设中约束条件个数。
H 检验原理很简单,但实际中得到V H 的一致估计量V ˆH 却并不容易。一般来说,
-1ˆN V =Var (θˆ-θ ) =Var (θˆ) +Var (θ ) -2Cov (θˆ, θ ) H
其中Var (θˆ) ,Var (θ ) 在一般软件计算中都能给出。但C ov (θˆ, θ ) 不能给出,致使H 统计量(N -1V ˆH ) 在实际中无法使用。
实验中也常进行如下检验。
H 0:模型中所有解释变量都是外生的 H 1:模型中某些解释变量是内生的
在原假设成立条件下,解释变量参数的最小二乘估计量θˆ是有效估计量。则有
) =V a r (θˆ) 。于是式(15-20)变为 C o v (θˆ, θ
-1ˆ
N V =Var (θˆ) +Var (θ ) -2Cov (θˆ, θ ) =Var (θ ) -Var (θˆ) (15-21) H
把式(15-21)结果代入式(15-19),得
' -1
H =(θˆ-θ ) (Var (θ ) -Var (θˆ)) (θˆ-θ )
(15-22)
其中Var (θ ) 和Var (θˆ) 分别是对Var (θ ) 和Var (θˆ) 的估计。与式(15-20)比较,这个结果只要求计算Var (θ ) 和Var (θˆ) ,H 统计量(15-22)具有实用性。原假设成立条件下,式(15-22)定义的H 统计量渐近服从χ2(m ) 分布。
当θ为标题,只表示一个参数时,式(15-22)定义的H 统计量退化为标量,
H =
2
(θˆ-θ ) 2
2
ˆ-s s
χ(1)
2 (15-23)
ˆ2和s 2分别表示θ 和θˆ的样本方差。 其中s H
检验用途很广。可用来做模型丢失变量的检验、变量内生性检验、模型形式设定
检验、模型嵌套检验、建模顺序检验等。
② 面板数据中利用H 统计量确定模型形式的检验。
假定面板数据模型的误差项满足通常的假定条件,如果真实的模型是随机效应模型,那么β的离差变换最小二乘估计量βˆW 和可行广义最小二乘法估计量β R E 都具有一致性。如果真实的模型是个体固定效应模型,则参数β的离差变换最小二乘法估计量βˆW 是一致估计量,但可行广义最小二乘估计量β R E 是非一致估计量。那么,当对一个面板数据模型同时进行离差变换最小二乘估计和可行广义最小二乘估计时,如果回归系数的两种估计结果差别小,说明应该建立随机效应模型;如果回归系数的两种估计结果差别大,说明应该建立个体固定效应模型。可以通过H 统计量检验(β RE -βˆW )的非零显著性,检验面板数据模型中是否存在个体固定效应。H 检验原理见表15-3。
表15-3 两类不同模型两类估计量性质比较
离差变换最小 可行广义最小 具有一致性 估计量βR E
估计量之差
小 大
个体随机效应模型 估计量βW 具有一致性
不具有一致性 个体固定效应模型 估计量βˆW 具有一致性 估计量βR E
面板数据模型中豪斯曼检验的步骤是: 原假设与备择假设是
H 0:个体效应αi 与解释变量X it 无关(个体随机效应模型)
H 1:个体效应αi 与解释变量X it 相关(个体固定效应模型)
由样本计算豪斯曼值,根据显著性水平查卡方临界值表得临界值χα2(m ) ,其中α表示检验水平,m 表示被检验的回归参数个数。
差别规则是
若用样本计算的H ≤χα2(m ) ,则接受原假设,应该建立个体随机效应模型 若用样本计算的H >χα2(m ) ,则拒绝原假设,应该建立个体固定效应模型