打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
重磅!Stata 15的新模块(三):门槛回归

Prof. Bruce E. Hansen

University of Wisconsin, Madison


不久前,Stata公司发布了最新的Stata 15,包含了许多令人激动的重大升级,包括非参数回归、空间计量、门槛回归、面板协整、DSGE模型等。本公众号将陆续为你介绍,与计量经济学最为相关的几个全新模块。


并非所有个体的经济规律都一样


如果你做过跨国回归(cross-country regression),或许曾想过,难道发展中国家与发达国家的经济规律真的一样吗?也许,二者的经济规律(回归系数)并不相同呢?此时,传统的做法是,根据某个指标(比如人均GDP),主观设定一个门槛值,将样本一分为二,然后分别进行估计。


又比如,当你用企业数据做回归时,可能想过小企业与大企业的经济规律或许并不完全相同,但应该如何根据企业规模(firm size)来区分小企业与大企业呢?在这两个例子中,人均GDP与企业规模都是连续变量,而我们需要确定一个合理的门槛值。


门槛回归模型


为此,Hansen (2000) 提出使用样本数据来估计此门槛值,并对于门槛效应(threshold effect)进行严格的统计推断。考虑以下的门槛回归模型(threshold regression,也称门限回归):

 


其中,  为用来划分样本的 “门槛变量” (threshold variable),可以是解释变量  的一部分;而  为待估计的 “门槛值”(threshold level)。这意味着,当世界处于第 1 种区制(regime),即门槛变量  小于或等于门槛值  时,回归系数为 

 ;而当世界处于第 2 种区制,即  大于门槛值  时,回归系数则变为


显然,如果 

 ,这两个区制的回归系数完全相同,则不存在门槛效应。因此,可通过检验原假设 
,来考察究竟是否存在门槛效应。如果原假设 
 的约束条件成立,则门槛回归模型简化为一般的线性回归模型。为此,Hansen (2000) 提出基于有约束模型的 LM 检验来检验是否存在门槛效应。


条件 OLS


上述门槛回归的方程为分段函数,不易操作。为此,引入示性函数(indicator function),将其写为统一的方程:

 


其中,示性函数 

 取值为1,如果其括弧中的表达式为真;反之,则取值为0。显然,如果给定 (假设  已知),则可将上式的 
 与 
 均作为已知的解释变量,直接进行 OLS 估计即可。这被称为 “条件OLS”(conditional OLS),可将其残差平方和记为 


其次,我们只要选择 ,使得

 最小化 即可。注意到,虽然门槛变量  为连续的,但给定有限的样本容量 
,则门槛值  也最多只能取
 个值(若取其他值,不影响模型的估计结果),故不难找到最优的 
,使得 
 最小。


门槛回归的Stata命令


在Stata 15中,进行门槛回归的命令为


threshold y x1 x2, threshvar(q) regionvars(x3 x4) nthresholds(#) optthreh(#)


其中,y 为被解释变量,x1 x2 为回归系数不随区制(regime)而变的解释变量(也可以不设)。必选项 threshvar(q) 表示变量 q 为门槛变量,选择项 regionvars(x3 x4) 表示,x3 x4 为回归系数随区制(regime)而变的解释变量。此处的 region,其实就是文献中的 regime(区制)。


这个命令默认只有一个门槛值。也可以通过选择项 nthresholds(#) 来指定多个门槛值,比如 nthresholds(2) 表示有 2 个门槛值,即将世界分为 3 个区制。


更一般地,也可以通过选择项 optthreh(#) 来计算最优的门槛个数(默认使用BIC信息准则进行选择);比如,optthreh(5),表示最多允许有5个门槛值。


门槛回归的案例


参照Stata manual,下面以美联储如何制定联邦基金利率的季度数据集为例(类似于宏观经济学中著名的泰勒规则)。


. use http://www.stata-press.com/data/r15/usmacro

(Federal Reserve Economic Data - St. Louis Fed)


不妨先看一下联邦基金利率的时间趋势图。


. tsline fedfunds

 


下面进行门槛回归。


. threshold fedfunds, regionvars(l.fedfunds inflation ogap) threshvar(l.fedfunds)


此命令表示,门槛回归的被解释变量为 fedfunds(联邦基金利率),门槛变量为 l.fedfunds(联邦基金利率的滞后),而 l.fedfunds,inflation(通胀率)与 ogap(产出缺口)为回归系数随区制而变的解释变量。



上表显示,联邦基金利率滞后的门槛估计值为 9.35%,其对应的残差平方和(SSR)为 155.43。遗憾的是,此命令没有汇报门槛值的置信区间。


回归结果中的 Region1 与 Region2,在文献中通常称为 Regime 1 与 Regime 2。结果显示,当联邦基金利率滞后(l.fedfunds)小于或等于 9.35%,即处于 Region1 时,联邦基金利率高度依赖于其滞后(自回归系数为 0.93,且在 1% 水平上显著),而对于通胀水平(inflation)不敏感(p 值为 0.133),但产出缺口(ogap)的作用显著为正。


另一方面,当联邦基金利率滞后(l.fedfunds)大于 9.35%,即处于 Region2 时,联邦基金利率对于其滞后的依赖性减弱(自回归系数降为 0.70,仍在 1% 水平上显著),而对于通胀水平(inflation)变得敏感(p 值为0.002),但产出缺口(ogap)的作用则变得不显著。


Stata 15 门槛回归的局限与应对


虽然 Stata 15 的官方命令 threshold 可进行门槛回归的估计,并以漂亮的表格汇报回归结果,但在统计推断方面依然有所欠缺。比如,它既不提供门槛值的置信区间,也不检验究竟是否存在门槛效应(即检验 

)。根据 Hansen (2000) 的逻辑,应先检验是否存在门槛效应(此检验也有助于选择门槛变量);如果发现确实有门槛效应,再进行门槛模型的估计。


另外,命令 threshold 默认数据为时间序列,并不适用于横截面与面板数据,故首先需要 tsset 数据,才能使用 threshold 命令。


因此,如需对横截面数据进行门槛回归,或进行深入的统计推断,仍建议辅助使用门槛回归创始人 Bruce Hansen 在其个人网页所提供的非官方 Stata 命令 (thresholdreg 与 thresholdtest)。下载地址为:


http://www.ssc.wisc.edu/~bhansen/progs/progs_threshold.html


从该网页下载 zip 文件并解压,将所有文件放置于当前工作路径(current working directory)之后(在 Stata 页面的左下方会显示当前工作路径),输入命令 “do Hansen2000” 即可自动运行。


如果使用面板数据进行门槛回归,则建议使用南开大学王群勇教授的非官方 Stata 命令 xthreg(Wang, 2015),在 Stata 中可输入命令 findit xthreg 来搜索下载。 


备注:本公众号不提供 Stata 15。如需正版 Stata 15,可咨询 crystal@uone-tech.cn。进一步学习 Stata,可关注即将召开的第一届 Stata 用户大会,详情参见 www.uone-tech.cn。


参考文献


Hansen, Bruce E., 2000. "Sample Splitting and Threshold Estimation," Econometrica, 68, 575-603.


Wang, Qunyong, 2015. "Fixed-effect Panel Threshold Model Using Stata," The Stata Journal, 15(1), 121-134. 


陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年。


陈强,《计量经济学及Stata应用》,高等教育出版社,2015年。(配套教学视频,点击底部 “阅读原文”)


让计量经济学从此不再难!

点击底部 “阅读原文,立即试学





本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
推荐一篇《中国工业经济》上门槛回归方法论文
计量经济学 | 门限模型原理及应用
Stata之动态面板数据操作
Stata: 动态面板门槛模型
Stata:门槛效应模型
Stata:断点回归分析
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服