
二 引言及问题提出研究方法
(一)面板数据模型
面板数据也称时间序列截面数据或混合数据,是把时间序列沿空间方向扩展,或把截面数据沿时间扩展,同时选取样本观测值所构成的二维样本数据。相对于一般时间序列数据或截面数据,利用面板数据做回归分析建立模型时,可以增加估计量的抽样精度,相比单截面数据建模获得更多的动态信息。一般形式的面板数据模型可表示为:

其中,i=1,2,…,N代表不同截面;t=1,2,…,T表示各截面不同观测时期;yit是被解释变量在横截面i和时间t上的数值;=(x1it,x2it,…,xkit)为解释变量向量,代表k个解释变量指标在横截面i和时间t上的数值;αit为模型的常数项;βit=(β1it,β2it,…,βkit)表示对应于解释变量向量
的k×1维系数向量;εit为随机误差项,相互独立,且满足零均值、等方差的假设。αit包含一个常数项和一系列不随时间而变化的组别变量,它可能是可观察的个体效应,或者是不可观察的个体效应,类似的,βit包含时间和截面效应,反映出模型中被忽略的时间因素和个体差异因素的影响(Aselinetal.,2004)。根据参数的性质不同,面板数据模型分为混合估计模型、固定效应模型和随机效应模型三种。
1.混合估计模型(Pooled Estimation Model)
如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。
如果从时间和截面看模型截距都不为零,且是一个相同的常数,即混合估计模型表示为:

其中,α和β不随截面i和时间t变化,i=1,2,…,N;t=1,2,…,T。称模型(1)为混合估计模型。若模型设定正确,解释变量与误差项不相关,即Cov(xit,εit)=0,则无论N→∞,或者T→∞,则混合模型的最小二乘估计量都是一致估计量。
2.固定效应模型(Fixed Effects Regression Model)
如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,此种模型为固定效应模型。固定效应模型分为个体固定效应模型、时刻固定效应模型和时刻个体固定效应模型三种类型。
个体固定效应模型是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是,对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固定效应模型,表示如下:

其中,αi表示对i个个体有i个不同截距项,满足E(εitαi,x it)=0,i=1, 2,…,N。即αi是作为随机变量描述不同个体建立的模型间的差异。也可以表示为:

其中,i=1,2,…,N
时刻固定效应模型就是对于不同时刻有不同截距的模型。如果确知对于不同的时刻(截面),模型的截距显著不同,但是,对于不同的个体截距是相同的,应该建立时刻固定效应模型,表示如下:

其中,t= 2,…,T
时刻个体固定效应模型就是对于不同的时刻、不同个体都有不同截距的模型。如果确知对于不同的截面、不同的时间序列(个体)模型的截距都显著不同,那么应该建立时刻个体效应模型,表示如下:

其中,t=1,2,…,T
i=1,2,…,N
3.随机效应模型
假定解释被解释变量的信息不够完整,需要引进对误差项的分解来描述这种信息的缺失,并以此构建面板数据模型为随机效应模型。
yit=αi+βx'it+εit
其中,误差项在时间上和截面上都是相关的,用三个分量表示如下:
εit= ui+ vi+wit
即随机效应模型可以表示为:

其中,ui~N(0,)表示截面随机误差分量;vt~N(0,
)表示时间随机误差分量;wit~N(0,
)表示混合随机误差分量。同时,还假定ui、vi、 wit之间互不相关,各自分别不存在截面自相关、时间自相关和混合自相关。
(二)面板分位数回归
面板数据分位数回归是对面板数据模型采用分位数回归的方法进行参数估计。经典线性回归变量的条件均值与自变量之间有线性关系,而且需假设不同分布点上解释变量的效果是相同的。分位数回归(QR)的思想最早起源于Koenker和Bassett(1978),不同于经典回归模型,分位数回归是对模型中的随机干扰项不做任何分布的假定,当解释变量的条件分布是非标准分布时,如非对称分布、厚尾分布或截段分布,它用加权残差绝对值之和的方法估计参数,依据因变量的不同分位数对自变量进行回归,得到所有分位数下的回归模型。且分位数回归对于异常值的敏感程度远远小于均值回归,分位回归只受到是否存在异常值的影响,但与其具体位置无关,因此具有很强的稳健性。一般线性条件分位数函数为:

其中,0<τ<1,Q(τ)为Y的第τ个分位数,即Q(τ)= inf{y:F(y)≥τ}。
ρτ(μ)为概率函数,表示被解释变量的样本点处于τ分位点以下和τ分位点以上时概率密度函数关系:

其中,μ为反映概率密度函数的参数:
求解方程(9),可以得到估计参数。

面板数据模型采用分位数回归方法进行参数估计时,模型右端不再是关于解释变量的被解释变量的数学期望值,而是变成了关于解释变量的被解释变量的条件分位数(魏下海,2009),被解释变量的分位数方程为:

求解

其中,wj为各分位数权重,不同分位点上的面板参数估计值为:
