进行多期DID时的回归cmd命令怎么做游戏是reg还是xtreg

点击联系发帖人 时间：2017-10-15 02:21

电脑运行输入什么命令

拒绝访问 | www.ggdoc.com | 百度云加速
请打开cookies.
此网站 (www.ggdoc.com) 的管理员禁止了您的访问。原因是您的访问包含了非浏览器特征(44c8bcc80b6e438e-ua98).
重新安装浏览器，或使用别的浏览器苹果/安卓/wp
积分 126, 距离下一级还需 19 积分
权限: 自定义头衔
道具: 涂鸦板, 彩虹炫, 雷达卡, 热点灯, 显身卡, 匿名卡, 金钱卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 变色卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
我的面板是n=30,t=6的短面板，且不是平衡的。
直接用reg命令混合回归出来都很显著，且符合常理，但是xtreg不管是固定效应还是随机效应都不显著了，请问给位大神面板数据回归必须豪斯曼检验选择固定效应或者随机效应吗？我这里直接就用混合回归行不行？他们有什么区别，需要做什么说明吗？
感谢回答啊。
正确的做法：
你先xtreg, fe，结果底下有个F test that all u_i=0，这个检验如果不通过，即p值很小，那么混合回归reg就不能用。
接下来，就是fe和re的选择了。
热心帮助其他会员
总评分:&论坛币 + 50&
学术水平 + 1&
热心指数 + 1&
信用等级 + 1&
麻烦重修一遍国外的计量经济学教材再来问吧&&一点计量理论框架都没有&&说了你也云里雾里
lopez93 发表于
正确的做法：
你先xtreg, fe，结果底下有个F test that all u_i=0，这个检验如果不通过，即p值很小，那么 ...谢谢，但P值几乎都是o.ooo哦，那意思就是混合回归都不能用是吗？
haty23 发表于
麻烦重修一遍国外的计量经济学教材再来问吧&&一点计量理论框架都没有&&说了你也云里雾里谢谢，小弟就是计量几乎没学懂过。选择正在补习，要是大神都指点下就感激不尽了哦。
dbaoxiang 发表于
谢谢，但P值几乎都是o.ooo哦，那意思就是混合回归都不能用是吗？对那么混合回归就是不能用的
接下来就是在fe和re之间做选择了
如果结果不好那也没办法了尊重事实。。
lopez93 发表于
正确的做法：
你先xtreg, fe，结果底下有个F test that all u_i=0，这个检验如果不通过，即p值很小，那么 ...我看教科书还有文献都是选择了固定效应模型我的数据测出来是随机效应模型
我想做GMM分析请问是直接做GMM还是要怎么办?
不太懂固定效应随机效应模型具体怎么操作，求大神赐教
lopez93 发表于
对那么混合回归就是不能用的
接下来就是在fe和re之间做选择了你好，就是不平衡数据也要用hausman检验来选择是用固定效应还是随机效应吗？谢谢。
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向，请联系（010-）；
邮箱：service@pinggu.org
投诉或不良信息处理：（010-）
论坛法律顾问：王进律师11-5-1 23:42
Stata: 输出regression table到word和excel1. 安装estout。最简单的方式是在stata的指令输入：ssc install estout, replaceEST安装的指导网址是：2.跑你的regression3.写下这行指令esttab using test.rtf，然后就会出现个漂亮的表格给你（WORD文档）。只要再小幅修改，就可以直接用了。这个档案会存在my document\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\stata下。如果你用打开的是一个stata do file，结果会保存到do文件所在文件夹中。如果要得到excel文件，就把后缀改为.xls或者.csv就可以了4.跑多个其实也不难，只要每跑完一个regression，你把它取个名字存起来：est store m1。m1是你要改的，第一个model所以我叫m1，第二个的话指令就变成est store m2，依次类推。5.运行指令：esttab m1 m2 ... using test.rtf就行了。异方差的检验：Breusch-Pagan test in STATA：其基本命令是：estat hettest var1 var2 var3其中，var1 var2 var3 分别为你认为导致异方差性的几个自变量。是你自己设定的一个滞后项数量。同样，如果输出的P-Value 显著小于0.05，则拒绝原假设，即不存在异方差性。White检验：其基本命令是在完成基本的OLS 回归之后，输入imtest， white如果输出的P-Value 显著小于0.05，则拒绝原假设，即不存在异方差性&处理异方差性问题的方法：方法一：WLS&WLS是GLS（一般最小二乘法）的一种，也可以说在异方差情形下的GLS就是WLS。在WLS下，我们设定扰动项的条件方差是某个解释变量子集的函数。之所以被称为加权最小二乘法，是因为这个估计最小化的是残差的加权平方和，而上述函数的倒数恰为其权重。在stata中实现WLS的方法如下：reg （被解释变量）（解释变量1）（解释变量2）…… [aweight=变量名]其中，aweight后面的变量就是权重，是我们设定的函数。一种经常的设定是假设扰动项的条件方差是所有解释变量的某个线性组合的指数函数。在stata中也可以方便地实现：首先做标准的OLS回归，并得到残差项；reg （被解释变量）（解释变量1）（解释变量2）……predict r, resid生成新变量logusq，并用它对所有解释变量做回归，得到这个回归的拟合值，再对这个拟合值求指数函数；gen logusq=ln(r^2)reg logusq (解释变量1) （解释变量2）……predict g, xbgen h=exp(g)最后以h作为权重做WLS回归；reg （被解释变量）（解释变量1）（解释变量2）…… [aweight=h]如果我们确切地知道扰动项的协方差矩阵的形式，那么GLS估计是最小方差线性无偏估计，是所有线性估计中最好的。显然它比OLS更有效率。虽然GLS有很多好处，但有一个致命弱点：就是一般而言我们不知道扰动项的协方差矩阵，因而无法保证结果的有效性。方法二：HC SEThere are 3 kinds of HC SE（1）Huber-White Robust Standard Errors HC1，其基本命令是：reg var1 var2 var3, robustWhite（1980）证明了这种方法得到的标准误是渐进可用（asymptotically valid）的。这种方法的优点是简单，而且需要的信息少，在各种情况下都通用。缺点是损失了一些效率。这种方法在我们日常的实证研究中是最经常使用。（2）MacKinnon-White SE HC2，其基本命令是：reg var1 var2 var3, hc2（3）Long-Ervin SE HC3，其基本命令是：reg var1 var2 var3, hc3&约束条件检验：如果需要检验两个变量，比如x 与y，之间系数之间的关系，以检验两者系数相等为例，我们可以直接输入命令：test x=y再如检验两者系数之和等于1，我们可以直接输入命令：test x+y=1如果输出结果对应的P-Value 小于0.05，则说明原假设显著不成立，即拒绝原假设。&序列相关性问题的检验与处理&&序列相关性问题的检验：&首先，要保证所用的数据必须为时间序列数据。如果原数据不是时间序列数据，则需要进行必要的处理，最常用的方法就是：&gen n=_n&tsset n&这两个命令的意思是，首先要生成一个时间序列的标志变量n（或者t 也可以）；然后通过tsset 命令将这个数据集定义为依据时间序列标志变量n定义的时间序列数据。&最直观的检验方式是通过观察残差分布，其基本步骤是在跑完回归之后，直接输入&Predict error, stdp&这样就得到了残差值；然后输入命令：&plot error n&会得到一个error 随n 变化的一个散点图。&D-W检验——对一阶自相关问题的检验：&D-W检验是对一阶自相关问题的常用检验方法，但是如果实际问题中存在高阶序列相关性问题，则不能用这个检验方法。&D-W 检验的命令如下：&首先，输入回归命令，&reg Variable1 Variable2 Variable3…VariableM&输出一个简单的OLS估计结果。然后，再输入命令：dwstat&这时会输出一个DW& 统计量。通过与临界值之间的比较，可以得出结论。也可以执行如下命令estat durbinalt&直接进行Durbin检验。&&Breusch-GodfreyTest in STATA——检验高阶序列相关性：&在得到一个基本回归结果和error 之后，我们假设这样一个关系：&et = α0 + α1 et-1 + α2 et-2 …+ αk et-p + β1 x1t + β2 x2t … +βk xkt +εt&BG& 检验的原假设是：H0& ：& α1 = α2 = … αp =0。&其基本命令是：&bgodfrey , lags(p)&其中p& 是你自己设定的一个滞后项数量。如果输出的p-value 显著小于0.05，则可以拒绝原假设，这就意味着模型存在p& 阶序列相关性；如果输出的p-value 显著大于0.05& 甚至很大，则可以接受原假设，即不存在p& 阶序列相关性。&&&处理序列相关性问题的方法——GLS：&常用的几种GLS& 方法：&（1） Cochrane-Orcutt estimator 和Prais-Winsten estimator&其基本命令是&prais var1 var2 var3, corc&（2） Newey-West standard errors&其基本命令是&newey var1 var2 var3, lag(3)&其中，lag（3）意思是对三阶序列相关性问题进行处理；如果需要对p& 阶序列相关性问题进行处理，则为lag（p）&&&t因变量，g,f,c是自变量，_26存放了弟26个观测值，为需要预测的值reg t g f c if _n!=26点预测predict taxpredict if _n==26均值的区间预测predictnl py=predict(xb),ci(lb ub) l(95)因变量的区间预测adjust g= f=24649.95 c=99.9,stdf ci level(95)&Hausman检验是检验内生性的最常用的方法。它是通过比较一致估计量与有效估计量的Wald统计量。命令格式为：& .hausman name-constistent [name-efficent] [,options]其中，name-cosistent指一致估计的结果， name-efficent 指有效估计的结果。注意，一致、有效估计量的先后顺序不能改变。Option选项：constant& 计算检验统计量将常数也包括在内，默认值为排除常数allegs 利用所有方程进行检验，默认只对第一个方程进行检验skipeqs(eqlist) eqlist只能以方程名称而不能以方程序号表示equation(matchlist) 比较设定的方程。force 即使假设条件不满足仍进行检验df(#) 默认值为一致估计与有效估计的协方差矩阵的差的估计sigmamore 协方差矩阵采用有效估计量的协方差矩阵sigmaless&& 协方差矩阵采用一致估计量的协方差矩阵tconsistent(string)& 一致估计量的标题tefficient(string) 有效估计量的标题&工具变量估计命令格式：.ivregress esitimator depvar [varlist1] [varlist2=varlist_iv] [if] [in] [weight][,options]其中，estimator包括2sls,gmm,liml三种。varlist1为模型中的外生变量，varlist2为模型中的内生变量，varlist_iv为模型中的工具变量。Nonconstant& 不包括常数项Hascons& 用户自己设定常数项CMM 选项：& wmatrix(wmtype)& robust,cluster clustvar,hac kernel, unadjusted& center& 权数矩阵采用中心矩& igmm 采用迭代GMM估计& eps(#) 参数收敛标准。默认值为eps（le-6）& weps(#)& 权数矩阵的收敛标准。默认值为w eps(le-6)Vce(vcetype) unajusted,robust,cluster clustvar,bootstrap,jackknife,hac kernellevel(#)置信区间First 输出第一阶段的估计结果Small 小样本下的自由度调整.estat firststage [,all forcenonrobust]&&&&&&& 该命令给出第一阶段的估计结果以及各种统计量，包括排除外生变量的相关性检验。All选项给出所有的拟合优度统计量。如果模型存在多个内生变量，则stata给出R2、偏R2、调整的R2 、F统计量；如果模型存在多个内生变量，则stata给出Shea偏R2和调整的偏R2。&&&&&& forcenonrobust给出最小特征值统计量及其临界值，即使采用稳健估计（这一检验的假设条件是误差项为独立正态分布）。&&&&&&&&estat overid[,lag(#) forceweights forcenonrobust]该命令给出了过度识别约束检验。如果使用2sls估计估计，则Stata给Sargan’s(1958)和Basman’s(1960)卡方统计量，这也是Wooldridge’(1995）稳健得分检验。如果采用liml估计方法，则stata给出Anderson and Rubin’s(1950) 卡方统计量以及Basmann F统计量；如果采用GMM估计，则stata给出hansen’s(1982)J统计量。Lags(#)用于计算得分检验的HAC（异方差自相关一致）统计量的过程中进行去噪时设定滞后阶数。如果设定lag(0),则表示不进行去噪处理。默认选择为lag(1)。这一选择仅使用于2sls估计方法和设定vce(hac)选项情况。Forceweight&&& 表示即使采用aweights,pweights或iweights也进行检验。Stata仅对于fweights的情况进行检验，其他权数所得到临界值可能不准确。Forcenonrobust& 指在2sls或LIML估计中即使采用稳健标准差也进行Sargan and Basmann检验（这一检验的假设的假设条件是误差项为独立正态分布）。例子：log(wage)=a+b*educ+c*exper+d*expersq+u怀疑模型教育（educ）具有内生性问题，利用父母接受教育的年数（fatheduc,motheduc）作educ的工具变量估计上述模型。（1）利用2SLS估计模型.ivregress 2sls lwage exper expersq (educ=fatheduc motheduc),first第一阶段回归结果为：& educhat=9.1+0.19fatheduc+0.16motheduc+0.05exper&&&&&&&&&&&&& (21.34)&&&& &(5.62)&&&&&& (4.39)&&&&&& (1.12)&&&&&&&& - 0.001expersq&&&&&&&&&&&& (-0.84)第二阶段的估计结果为：&lwagehat=0.05+0.06educ+0.04exper-0.001expersq&&&&&&&&&&&&& (0.12)&&& &(1.95)&&&&& (5.29)&&&&&& (-2.24)（2）检验educ的内生性.quietly& ivreg& iwage exper expersq {educ=fatheduc motheduc}.est store IV_reg.quietly regress lwage exper expersq educ.est store LS_reg.hausman IV_reg LS_reg可以得到hausman估计量=2.7，P值=0.44。接受原假设，即educ是外生的。(3)进行过度识别的约束检验.estat overid&可得Sargan统计量=0.38，P值=0.54接受原假设。&面板数据估计首先对面板数据进行声明：前面是截面单元，后面是时间标识：tsset company yeartsset industry year产生新的变量：gen newvar=human*lnrd产生滞后变量Gen fiscal(2)=L2.fiscal产生差分变量Gen fiscal(D)=D.fiscal描述性统计：xtdes ：对Panel Data截面个数、时间跨度的整体描述Xtsum：分组内、组间和样本整体计算各个变量的基本统计量xttab 采用列表的方式显示某个变量的分布Stata中用于估计面板模型的主要命令：xtregxtreg depvar [varlist] [if exp] , model_type [level(#) ]Model& type&&&&&&&&&&&&& 模型be&&&&&&&&&&&& Between-effects estimatorfe&&&&&&&&&&&&& Fixed-effects estimatorre&&&&&&&&&&&& GLS Random-effects estimatorpa&&&&&&&&&& GEE population-averaged estimatormle&&&&&&& Maximum-likelihood Random-effects estimator主要估计方法：xtreg：&& Fixed-, between- and random-effects, and population-averaged linear modelsxtregar：Fixed- and random-effects linear models with an AR(1) disturbancextpcse ：OLS or Prais-Winsten models with panel-corrected standard errorsxtrchh ：Hildreth-Houck random coefficients modelsxtivreg ：Instrumental variables and two-stage least squares for panel-data modelsxtabond：Arellano-Bond linear, dynamic panel data estimatorxttobit ：Random-effects tobit modelsxtlogit ： Fixed-effects, random-effects, population-averaged logit modelsxtprobit ：Random-effects and population-averaged probit modelsxtfrontier ：Stochastic frontier models for panel-dataxtrc gdp invest culture edu sci health social admin,beta&xtreg命令的应用：声明面板数据类型：tsset& sheng t描述性统计：xtsum gdp invest sci admin1.固定效应模型估计：xtreg& gdp invest culture sci health admin techno,fe固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigma u 和sigma e），二者之间的相关关系(rho)最后一行给出了检验固定效应是否显著的F 统计量和相应的P 值&2.随机效应模型估计：xtreg& gdp invest culture sci health admin techno,re检验随机效应模型是否优于混合OLS 模型：在进行随机效应回归之后，使用xttest0检验得到的P 值为0.0000，表明随机效应模型优于混合OLS 模型3. 最大似然估计Ml：xtreg& gdp invest culture sci health admin techno,mleHausman检验Hausman检验究竟选择固定效应模型还是随机效应模型：第一步：估计固定效应模型，存储结果xtreg& gdp invest culture sci health admin techno,feest store fe第二步：估计随机效应模型，存储结果xtreg& gdp invest culture sci health admin techno,reest store re第三步：进行hausman检验hausman feHausman检验量为：H=(b-B)&[Var(b)-Var(B)]-1(b-B)～x2(k)Hausman统计量服从自由度为k的χ2分布。当H大于一定显著水平的临界值时，我们就认为模型中存在固定效应，从而选用固定效应模型，否则选用随机效应模型如果hausman检验值为负，说明的模型设定有问题，导致Hausman 检验的基本假设得不到满足，遗漏变量的问题，或者某些变量是非平稳等等可以改用hausman检验的其他形式：hausman fe, sigmaless对于固定效应模型的异方差检验和序列相关检验：Xtserial gdp invest culture sci health admin techno异方差检验：&&& xtreg& gdp invest culture sci health admin techno,fexttest3 (Modified Wald statistic for groupwise heteroskedasticity in fixed effect model)随机效应模型的序列相关检验：xtreg& gdp invest culture sci health admin techno,reXttest1Xttest1用于检验随机效应(单尾和双尾) 、一阶序列相关以及两者的联合显著检验结果表明存在随机效应和序列相关，而且对随机效应和序列相关的联合检验也非常显著可以使用广义线性模型xtgls对异方差和序列相关进行修正：xtgls& gdp invest culture sci health admin techno, panels(hetero)，修正异方差xtgls& gdp invest culture sci health admin techno, panels(correlated)，修正依横截面而变化的异方差xtgls& gdp invest culture sci health admin techno, panels(hetero) corr(ar1)，修正异方差和一阶序列相关ar(1)
大家都在看教师节倾情巨献 |最全STATA 常用命令集
本文由计量经济学服务中心综合整理
转载请注明来源
这两天，收到了很多节日祝福，同时祝愿中心越办越好。经过小编努力，为大家分享stata常用命令，抓紧时间收藏，拿走不谢。同时祝愿朋友们，节日快乐！推荐阅读Stata学习资源汇总
调整变量格式
format x1 %10.3f ——将x1的列宽固定为10，小数点后取三位
format x1 %10.3g ——将x1的列宽固定为10，有效数字取三位
format x1 %10.3e ——将x1的列宽固定为10，采用科学计数法
format x1 %10.3fc ——将x1的列宽固定为10，小数点后取三位，加入千分位分隔符
format x1 %10.3gc ——将x1的列宽固定为10，有效数字取三位，加入千分位分隔符
format x1 %-10.3gc ——将x1的列宽固定为10，有效数字取三位，加入千分位分隔符，加入“-”表示左对齐。
use "E:statapersonal 14高级计量经济学计量经济学服务中心.dta", clear
merge using "E:statapersonal 14高级计量经济学计量经济学服务中心2.dta.dta"
——将计量经济学服务中心和计量经济学服务中心2的数据按照样本（observation）排列的自然顺序合并起来
use "E:statapersonal 14高级计量经济学计量经济学服务中心.dta.dta", clear
merge id using "E:statapersonal 14高级计量经济学计量经济学服务中心2.dta.dta" ,unique sort
——将计量经济学服务中心和计量经济学服务中心2的数据按照唯一的（unique）变量id来合并，在合并时对id进行排序（sort）
建议采用第一种方法。
【收藏】stata官方的范例数据
对样本进行随机筛选
在观测案例中随机选取50%的样本，其余删除
sample 50,count
在观测案例中随机选取50个样本，其余删除
查看与编辑数据
browse x1 x2 if x3&3 （按所列变量与条件打开数据查看器）
edit x1 x2 if x3&3 （按所列变量与条件打开数据编辑器）
数据合并（merge）与扩展（append）
merge表示样本量不变，但增加了一些新变量；append表示样本总量增加了，但变量数目不变。
one-to-one merge：
数据源自stata tutorial中的exampw1和exampw2
第一步：将exampw1按v001～v003这三个编码排序，并建立临时数据库tempw1
use "t:statatutexampw1.dta"
su ——summarize的简写
sort v001 v002 v003
save tempw1
第二步：对exampw2做同样的处理
use "t:statatutexampw2.dta"
sort v001 v002 v003
save tempw2
第三步：使用tempw1数据库，将其与tempw2合并：
use tempw1
merge v001 v002 v003 using tempw2
第四步：查看合并后的数据状况：
ta _merge ——tabulate _merge的简写
第五步：清理临时数据库，并删除_merge，以免日后合并新变量时出错
erase tempw1.dta
erase tempw2.dta
drop _merge
数据扩展append：
数据源自stata tutorial中的fac19和newfac
use "t:statatutfac19.dta"
append using "t:statatutnewfac"
合并后样本量增加，但变量数不变
简单统计量的计算
（计算变量x的算术平均值、几何平均值和简单调和平均值，均显示样本量和置信区间）
mean var1 [pweight = var2]
（求取分组数据的平均值和标准误，var1为各组的赋值，var2为每组的频数）
summarize y x1 x2,detail
（可以获得各个变量的百分比数、最大最小值、样本量、平均数、标准差、方差、峰度、偏度）
***注意***
stata中summarize所计算出来的峰度skewness和偏度kurtosis有问题，与ECELL和SPSS有较大差异，建议不采用stata的结果。
summarize var1 [aweight = var2], detail
（求取分组数据的统计量，var1为各组的赋值，var2为每组的频数）
tabstat X1,stats(mean n q max min sd var cv)
（计算变量X1的算术平均值、样本量、四分位线、最大最小值、标准差、方差和变异系数）
概率分布的计算：
（1）贝努利概率分布测试：
webuse quick
bitest quick==0.3,detail
（假设每次得到成功案例‘1’的概率等于0.3，计算在变量quick所显示的二项分布情况下，各种累计概率和单个概率是多少）
bitesti 10,3,0.5,detail
（计算当每次成功的概率为0.5时，十次抽样中抽到三次成功案例的概率：低于或高于三次成功的累计概率和恰好三次成功概率）
（2）泊松分布概率：
display poisson(7,6)
（计算均值为7，成功案例小于等于6个的泊松概率）
display poissonp(7,6)
（计算均值为7，成功案例恰好等于6个的泊松概率）
display poissontail(7,6)
（计算均值为7，成功案例大于等于6个的泊松概率）
（3）超几何分布概率：
display hypergeometricp(10,3,4,2)
（计算在样本总量为10，成功案例为3的样本总体中，不重置地抽取4个样本，其中恰好有2个为成功案例的概率）
display hypergeometric(10,3,4,2)
（计算在样本总量为10，成功案例为3的样本总体中，不重置地抽取4个样本，其中有小于或等于2个为成功案例的概率）
检验极端值的步骤
常见命令：tabulate、stem、codebook、summarize、list、histogram、graph box、gragh matrix
step1.用codebook、summarize、histogram、graph boxs、graph matrix、stem看检验数据的总体情况：
codebook y x1 x2
summarize y x1 x2,detail
histogram x1,norm（正态直方图）
graph box x1（箱图）
graph matrix y x1 x2,half（画出各个变量的两两x-y图）
stem x1（做x1的茎叶图）
可以看出数据分布状况，尤其是最大、最小值
step2.用tabulate、list细致寻找极端值
tabulate code if x1==极端值（作出x1等于极端值时code的频数分布表，code表示地区、年份等序列变量，这样便可找出那些地区的数值出现了错误）
list code if x1==极端值（直接列出x1等于极端值时code的值，当x1的错误过多时，不建议使用该命令）
list in -20/l（l表示last one，-20表示倒数第20个样本，该命令列出了从倒数第20个到倒数第一个样本的各变量值）
step3.用replace命令替换极端值
replace x1=? if x1==极端值
去除极端值：
keep if y&1000
drop if y&1000
对数据排序：
（对数据按x进行升序排列）
（对数据按x进行降序排列）
gsort -x, generate(id) mfirst
（对数据按x进行降序排列，缺失值排最前，生成反映位次的变量id）
对变量进行排序：
order y x3 x1 x2
（将变量按照y、x3、x1、x2的顺序排列）
生成新变量：
gen logx1=log(x1)（得出x1的对数）
gen x1`=exp(logx1)（将logx1反对数化）
gen r61_100=1 if rank&=61&rank&=100（若rank在61与100之间，则新变量r61_100的取值为1，其他为缺失值）
replace r61_100 if r61_100!=1（“!=”表示不等于，若r61_100取值不为1，则将r61_100替换为0，就是将上式中的缺失值替换为0）
gen abs(x)（取x的绝对值）
gen ceil(x)（取大于或等于x的最小整数）
gen trunc(x)（取x的整数部分）
gen round(x)（对x进行四舍五入）
gen round(x,y)（以y为单位，对x进行四舍五入）
gen sqrt(x)（取x的平方根）
gen mod(x,y)（取x/y的余数）
gen reldif(x,y)（取x与y的相对差异，即|x-y|/(|y|+1)）
gen logit(x)（取ln[x/(1-x)]）
gen x=autocode(x,n,xmin,xmax)（将x的值域，即xmax-xmin，分为等距的n份）
gen x=cond(x1&x2,x1,x2)（若x1&x2成立，则取x1，若x1&x2不成立，则取x2）
gen gx=group(n)（将经过排序的变量x分为尽量等规模的n个组）
egen zx1=std(x1)（得出x1的标准值，就是用(x1-avgx1)/sdx1）
egen zx1=std(x1),m(0) s(1)（得出x1的标准分，标准分的平均值为0，标准差为1）
egen sdx1=sd(x1)（得出x1的标准差）
egen meanx1=mean(x1)（得出x1的平均值）
egen maxx1=max(x1)（最大值）
egen minx1=min(x1)（最小值）
egen medx1=med(x1)（中数）
egen modex1=mode(x1)（众数）
egen totalx1=total(x1)（得出x1的总数）
egen rowsd=sd(x1 x2 x3)（得出x1、x2和x3联合的标准差）
egen rowmean=mean(x1 x2 x3)（得出x1、x2和x3联合的平均值）
egen rowmax=max(x1 x2 x3)（联合最大值）
egen rowmin=min(x1 x2 x3)（联合最小值）
egen rowmed=med(x1 x2 x3)（联合中数）
egen rowmode=mode(x1 x2 x3) （联合众数）
egen rowtotal=total(x1 x2 x3)（联合总数）
egen xrank=rank(x)（在不改变变量x各个值排序的情况下，获得反映x值大小排序的xrank）
数据计算器display命令：
display x[12]（显示x的第十二个观察值）
display chi2(n,x)（自由度为n的累计卡方分布）
display chi2tail(n,x)（自由度为n的反向累计卡方分布，chi2tail(n,x)=1-chi2(n,x)）
display invchi2(n,p)（卡方分布的逆运算，若chi2(n,x)=p，那么invchi2(n,p)=x）
display invchi2tail(n,p)（chi2tail的逆运算）
display F(n1,n2,f)（分子、分母自由度分别为n1和n2的累计F分布）
display Ftail(n1,n2,f)（分子、分母自由度分别为n1和n2的反向累计F分布）
display invF(n1,n2,P)（F分布的逆运算，若F(n1,n2,f)=p，那么invF(n1,n2,p)=f）
display invFtail(n1,n2,p)（Ftail的逆运算）
display tden(n,t)（自由度为n的t分布）
display ttail(n,t)（自由度为n的反向累计t分布）
display invttail(n,p)（ttail的逆运算）
给数据库和变量做标记
label data "~~~"（对现用的数据库做标记，"~~~"就是标记，可自行填写）
label variable x "~~~"（对变量x做标记）
label values x label1（赋予变量x一组标签:label1）
label define label1 1 "a1" 2 "a2"（定义标签的具体内容：当x=1时，标记为a1，当x=2时，标记为a2）
tabulate x1,sort
tab1 x1-x7,sort（做x1到x7的频数表，并按照频数以降序显示行）
table c1,c（n x1 mean x1 sd x1）（在分类变量c1的不同水平上列出x1的样本量和平均值）
二维交互表：
auto数据库：
table rep78 foreign, c(n mpg mean mpg sd mpg median mpg) center row col
（rep78，foreign均为分类变量，rep78为行变量，foreign为列变量，center表示结果显示在单元格中间，row表示计算行变量整体的统计量，col表示计算列变量整体的统计量）
tabulate x1 x2,all
（做x1和x2的二维交互表，要求显示独立性检验chi2、似然比卡方独立性检验lrchi2、对定序变量适用的等级相关系数gamma和taub、以及对名义变量适用的V）
tabulate x1 x2,column chi2（做x1和x2的二维交互表，要求显示列百分比和行变量和列变量的独立性检验——零假设为变量之间独立无统计关系）
tab2 x1-x7,all nofreq（对x1到x7这七个变量两两地做二维交互表，不显示频数：nofreq）
三维交互表：
by x3,sort:tabulate x1 x2,nofreq col chi2（同时进行x3的每一个取值内的x1和x2的二维交互表，不显示频数、显示列百分比和独立性检验）
四维交互表：
table x1 x2 x3,c(ferq mean x1 mean x2 mean x3) by(x4)
tabstat X1 X2,by(X3) stats(mean n q max min sd var cv) col(stats)
tabstat X1 X2,by(X3) stats(mean range q sd var cv p5 p95 median),[aw=X4]（以X4为权重求X1、X2的均值，标准差、方差等）
ttest X1=1
count if X1==0
count if X1&=0
gen X2=1 if X1&=0
corr x1 x2 x3（做x1、x2、x3的相关系数表）
swilk x1 x2 x3（用Shapiro-Wilk W test对x1、x2、x3进行正太性分析）
sktest x1 x2 x3（对x1、x2、x3进行正太性分析，可以求出峰度和偏度）
ttest x1=x2（对x1、x2的均值是否相等进行T检验）
ttest x1,by(x2) unequal（按x2的分组方式对x1进行T检验，假设方差不齐性）
sdtest x1=x2（方差齐性检验）
sdtest x1，by(x2)（按x2的分组方式对x1进行方差齐性检验）
est命令的用法
（1）储存回归结果：
reg y x1 x2 x3（不限于reg，也可储存ivreg、mvreg、reg3）
est store A
（2）重现回归结果：
est replay A
（3）对回归结果进行进一步分析
est for A:sum（对A回归结果中的各个变量运行sum命令）
异方差问题：
获得稳健性标准误
reg y x1 x2 x3 if c1==1（当分类变量c1=1时，进行y和诸x的回归）
reg y x1 x2 x3,robust（回归后显示各个自变量的异方差-稳健性标准误）
estat vif（回归之后获得VIF）
estat hettest,mtest（异方差检验）
异方差检验的套路：
（1）Breusch-pagan法：
reg y x1 x2 x3
predict u,resid
gen usq=u^2
reg usq x1 x2 x3
display R/(1-R)*n2/n1（n1表示分子除数，n2表示分母除数）
display Ftail(……)
display R*n（n表示总样本量）
display chi2tail(……)
（2）white法：
reg y x1 x2 x3
predict u,resid
gen usq=u^2
gen ysq=y^2
reg usq y ysq
display R/(1-R)*n2/n1（n1表示分子除数，n2表示分母除数）
display Ftail(……)
display R*n（n表示总样本量）
display chi2tail(……)
（3）必要补充
F值和LM值转换为P值的命令：
display Ftail(n1,n2,a)（利用F值求p值，n1表示分子除数，n2表示分母除数，a为F值）
display chi2tail(n3,b)（利用LM值求p值，n3表示自由度的损失量，一般等于n1，b为LM值）
异方差的纠正——WLS
（1）基本思路：
reg y x1 x2 x3 [aw=x1]（将x1作为异方差的来源，对方程进行修正）
上式相当于：
reg y/(x1^0.5) 1/(x1^0.5) x1/(x1^0.5) x2/(x1^0.5) x3/(x1^0.5),noconstant
（2）纠正异方差的常用套路（构造h值）
reg y x1 x2 x3
predict u,resid
gen usq=u^2
gen logusq=log(usq)
reg logusq x1 x2 x3
gen h=exp(g)
reg y x1 x2 x3 [aw=1/h]
异方差hausman检验：
reg y x1 x2 x3
est store A（将上述回归结果储存到A中）
reg y x1 x2 x3 [aw=1/h]
est store B
hausman A B
当因变量为对数形式时（log(y)）如何预测y
reg logy x1 x2 x3
gen m=exp(k)
reg y m,noconstant
m的系数为i
y的预测值=i×exp(k)
【原创】stata介绍之outreg2 logout，从简单到基础，涵盖描述相关+回归，从时间到面板
1、基本套路：
xtreg y x1 x2,re
est store re
xtreg y x1 x2,fe
est store fe
hausman re fe
——如果hausman检验的结果为显著，则采用固定效应（fe）模型，不显著，则选取随机效应（re）模型
2、随机效应的检验：
xtreg y x1 x2,re
——xttest1是xttest0的扩展，若这xttest0的结果为显著，则采用随机效应（re）模型
xttest1的假设是没有随机效应和/或没有序列相关，它的七个结果分别表示：
1) LM Test for random effects, assuming no serial correlation
（假设没有序列相关情况下对随机效应进行LM检验）
2) Adjusted LM test for random effects, which works even under serial
correlation
（假设有序列相关的情况下对随机LM检验）
3) One sided version of the LM test for random effects
（假设没有序列相关的情况下对随机效应进行单边检验）
4) One sided version of the adjusted LM test for random effects
（假设有序列相关的情况下对随机效应进行单边检验）
5) LM test for first-order serial correlation, assuming no random effects
（假设没有随机效应的情况下对一阶序列相关进行检验）
6) Adjusted test for first-order serial correlation, which works even under
random effects （假设有随机效应的情况下对一阶序列相关进行检验）
7) LM Joint test for random effects and serial correlation
（随机效应和序列相关的联合检验）
3、固定效应模型，可采用广义最小二乘法（gls）进行估算，也可采用固定效应方程（fe）：
xtserial y x1 x2
xtgls y x1 x2
——xtserial用于检验固定效应模型中的一阶序列自相关，可通用于xtgls和fe之前
——xttest2用于检验不同厂商的相似性，若显著则各厂家的截面相似，可通用于xtgls和fe之后
——xttest3用于检验固定效应模型中的异方差问题，若显著则有异方差，可通用于xtgls和fe之后。
一元方差分析
anova y g1 / g1|g2 /（g*表示不同分类变量，计算g1和交互项/ g1|g2 /这两种分类的y值是否存在组内差异）
anova y d1 d2 d1*d2（d*表示虚拟变量，计算d1、d2和d1*d2的这三种分类的y值是否有组内差异）
anova y d1 d2 x1 d2*x1, continuous(x1)（x*表示连续的控制变量）
多元方差分析
webuse jaw
manova y1 y2 y3 = gender fracture gender*fracture（按性别、是否骨折及二者的交互项对y1、y2和y3进行方差分析）
manova y1 = gender fracture gender*fracture（相当于一元方差分析，以y1为因变量）
webuse nobetween
gen mycons = 1
manova test1 test2 test3 = mycons, noconstant
mat c = (1,0,-1 0,1,-1)
manovatest mycons, ytransform(c)
进行多元回归的方法：
多元回归分析：（与mvreg相同）
foreach vname in y1 y2 y3 { （确定y变量组vname）
reg `vname' x1 x2 x3 （将y变量组中的各个变量与诸x变量进行回归分析，注意vname的标点符号） }
上式等价于：
mvreg y1 y2 y3 = x1 x2 x3
reg3命令：
（1）简单用法：
reg3 (y1 = x1 x2 x3) (y2 = x1 x3 x4) (y3 = x1 x2 x5)
测试y1 coefs = 0
测试不同回归中相同变量的系数：
test [y1=y2=y3], common
test ([y1=y2]) ([y1=y3]), common constant（constant表示包含截距项）
（2）用reg3进行2SLS
reg3 (y1 = y2 x1 x2) (y2 = y1 x4),2sls
（2）用reg3进行OLS
reg3 (y1 = y2 x1 x2) (y2 = y1 x4),ols
对两个回归结果进行hausman检验：
reg3 (y1=x1 x2 x3)(y2=y1 x4),2sls
est store twosls
reg3 (y1=x1 x2 x3)(y2=y1 x4),ols
est store ols
hausman twosls ols,equations(1:1)（对两次回归中的方程1，即“y1=x1 x2 x3”进行hausman检验）
hausman twosls ols,equations(2:2)（对两次回归中的方程2，即“y2=y1 x4”进行hausman检验）
hausman twosls ols,alleqs（对所有方程一起进行检验）
检验忽略变量（模型的RESET）：
reg y x1 x2 x3
estat ovtest
滞后变量的制取
对变量y滞后一期：
gen y_l1=y[_n-1]
滞后两期：
gen y_l2=y[_n-2]
以此类推。
制取样本序号：
获得样本总量：
时间序列回归
回归元严格外生时AR(1)序列相关的检验
reg y x1 x2
predict u,resid
gen u_1=u[_n-1]
reg u u_1,noconstant
回归之后，u_1的序数如果不异于零，则该序列不相关
用Durbin-Watson Statistics检验序列相关：
tsset year @（对时间序列回归中代表时间的变量进行定义）@
reg y x1 x2
dwstat @（求出时间序列回归的DW值）@
durbina @（对该回归是否具有序列相关进行检验，H0为无序列相关，可根据chi2值求出P值）@
durbina,small @（small可以根据F值求出P值，以代替chi2值）@
durbina,force @（让检验能在robust、neway之后进行）@
durbina,small lag(1/10) @（lag可以求出更高阶滞后的序列相关，如本例中可求出1到10阶的序列相关）@
durbina,robust lag(1/10) @（robust可进行异方差—稳健性回归，避免未知形式的异方差）@
bgodfrey @（利用Breusch-Godfrey test求出高阶序列相关）@
bgodfrey,small lag(1/10)
回复关键词：微信群，进入中心科研社群
学术QQ群：（500人大群）
品牌网站：www.aiwanning.com
责任编辑：
声明：该文观点仅代表作者本人，搜狐号系信息发布平台，搜狐仅提供信息存储空间服务。
今日搜狐热点}

天天发财游戏网