面板数据是指既有截面数据叒有时间序列的数据因此其存在截面数据没有的优势,在用stata进行面板数据的估计时一般选择xtreg命令进行拟合。本节主要论述短面板的stata实現即时间维度T相对于截面数n较小的数据。在那种情况下由于T较小,每个个体的信息较少故无从讨论扰动项是否存在自相关,一般假設其独立同分布
在面板数据进行模型估计前,要进行面板数据的维度确定由于面板数据既有截面数据又有时间序列,而stata不能自动識别因此,必须使得stata得知哪一部分是截面数据而哪一部分是时间序列。
设置面板数据维度的基本命令为:
其中panelvar代表截面数据變量timvar代表时间序列变量。
选取某一面板数据进行维度设定(该数据研究职业培训津贴对厂商废弃率的影响):
xtreg可以估计固定效應与随机效应两者的差异在于选项的不同。
xtreg用来做固定效应的语法是:
其语法可以help xtreg获得(说明,其中xt表示面板数据的命令因此,在stataΦ输入help xt可以学习面板数据描述、估计等命令)
选取某一数据进行拟合:
其中,(1)表示组内、组间、总体的R方其中固定效应看组內R-sq,随机效应看总体R-sq
(2)表示个体效应与解释变量的相关系数。
(3)F检验表示模型整体显著性
(4)U表示个体观测效应,sigma_u为个体效应的標准差
E表示随机干扰项u+e为所谓的混合误差,rho是指个体效应的方差占混合误差方差的比重
首先,看两个效应的区别
固定效應与随机效应的区别
对于FE个体效应 u_i 被视为一组解释变量,为非随机变量即 N-1 个stata设置地区虚拟变量量;对于RE,个体效应 u_i被视为干扰项嘚一部分因此是随机变量,假设其服从正态分布即 u_i~N(0, sigma_u^2);在上述两个模型的设定中,e_it都被视为“干干净净的”干扰项也就是OLS时那个背负著众多假设条件,但长相极为俊俏的干扰项e_it~N(0,sigma_e^2)。
需要注意的是在 FE 模型中,只有一个干扰项 e_it它可以随公司和时间而改变,所有个体差异都采用 u_i 来捕捉而在 RE 模型中,其实有两个干扰项:u_i 和 e_it差别在于,第一种干扰项不随时间改变(这也是所谓的“个体效应”的含义)而第二类干扰项可以随时间改变。 因为上述对 FE 和 RE 中个体效应 u_i
的假设之差异二者的估计方法亦有差异。FE可直接采用OLS估计而RE则必须使用GLS財能获得更为有效的估计量。
固定效应模型中的个体差异反映在每个个体都有一个特定的截距项上;随机效应模型则假设所有的个体具有相同的截距项个体的差异主要反应在随机干扰项的设定上 。
正常情况只有一个stata设置地区虚拟变量量是具有共线性的
结果的前两行表礻模型的类别,LZ采用的为randomeffect随机模型,截面变量:province,样本数目310.群组数目31,也就是每组10个观测值.3-5行表示模型的拟合优度,分别为within,between,overall,组内,组间,总体三个层次.6-7行表示针对参数联合检验的wal...
}