阅读:0
听报道
推文人 | 付明卫
原文信息:谢谦、薛仙玲、付明卫,2019,“断点回归设计方法应用的研究综述”,《经济与管理评论》第2期,pp.69-79。
引 言
Imbens and Lemieux(2008)、van der Klaauw (2008)、Lee and Lemieux (2010)、Skovron and Titiunik (2015)、Hausman and Repson(2018)专门综述了RDD(RegressionDiscontinuity Designs)的理论和应用研究。余静文和王春超(2011)用中文介绍了断点回归设计的发展历史、理论、实施步骤和应用情况。但是,由于RDD这种方法的理论研究仍很活跃,由于运用RDD涉及参数估计和非参数估计的选择、参数估计中多项式次数的选择和非参数估计最优带宽的确定等众多技术细节,文献中在RDD的具体用法上存在很大差别,特别是中文文献运用RDD的规范程度明显滞后于外文文献,有时还存在误用。因此,十分有必要归纳RDD应用的新进展,以为国内学者规范运用RDD提供借鉴。由于本文强调被五大RDD论文运用过的新进展,侧重于应用,我们不会涉及多配置变量RDD、分位数RDD、拐点回归设计、多断点RDD、远离断点处的处理效应的识别方法等五大RDD论文中未运用的新进展。
该文综述Lee and Lemieux (2010)以来RDD的新进展。Lee and Lemieux(2010)提出了运用RDD做经验研究的规范,算是一个共识。但是,通过归纳2011-2017年的五大RDD论文,我们发现:首先,很多论文都没有遵守此规范。其次,涌现出了很多被广泛应用的新进展,譬如非参数估计中确定带宽的IK法(Imbens和Kalyanaraman, 2009)和CCT法(Calonico、Cattaneo和Titiunik, 2014)、参数估计中只应使用配置变量的低次项和甜甜圈RDD(Donut hole RDD)等。
运用RDD的规范和新进展
Lee and Lemieux (2010)提出了运用RDD做经验研究的规范,概述如下:1. 利用配置变量检验RDD的适用性。2. 利用前定变量检验RDD的适用性。3. 画结果变量的图。4. 全样本参数估计。5. 子样本非参数估计。
Lee and Lemieux (2010)之后的七年里(2011-2017年),学者在运用RDD时出现了不少Lee and Lemieux (2010)未提及的新作法,譬如非参数估计中确定带宽的IK法和CCT法、甜甜圈RDD(Donut hole RDD)、参数估计中只应使用配置变量的低次项和利用配置变量做适用性检验的Frandsen(2013)法等。此处归纳比较重要的三种新作法,如下:
1. 非参数估计中最优带宽的确定。Lee和Lemieux(2010)介绍了ROT和CV两种确定最优带宽的方法。但是,2011-2017年间五大RDD论文使用得多的是IK法(Imbens和Kalyanaraman, 2009)和CCT法(Calonico、Cattaneo和Titiunik, 2014)。stata中用非参数法做断点回归估计时的命令rd,就是用IK法确定最优带宽,而命令rdrobust提供CV、IK、CCT三种不同的最优带宽计算方法选项。Imbens和Kalyanaraman(2009)指出,ROT和CV两种方法对于在整个支撑集(support set)里估计回归方程而言是最优的,但RDD只关心断点处的回归方程估计,故ROT和CV对于RDD而言不是最优的,而IK法对于RDD而言是渐近最优的;另外,CV法需要研究人员自己设定一个调节参数(tuning parameter),而IK法是完全数据驱动的。Imbens和Kalyanaraman(2012)进一步指出,尽管IK法具备这些优点,但研究人员不能只看这一个最优带宽下的估计结果,而应把这一带宽作为基准、检验结果对不同带宽的稳健性。Calonico、Cattaneo和Titiunik(2014)认为,ROT、CV和IK这些方法得出的最优带宽过大,导致相应的置信区间有偏,会过度拒绝“没有处理效应”的原假设,结果把“没有”处理效应说成“有”。CCT法校正了过大带宽带来的偏误。
2. 甜甜圈RDD(Donut hole RDD)。甜甜圈RDD用来克服数据堆积(heaping)问题对估计结果的影响。数据堆积指取配置变量某些值的观测值过多的现象。导致这一现象的原因包括受访者自报告某些信息时倾向于向某个数值近似,测量标尺的精读有限等。譬如,调查数据中受访者自报告的身高在160cm、170cm和180cm等取值上堆积,新生儿体重会在3000克、3500克和4000克等取值上堆积。数据操纵现象源自经济个体的逐利动机,只出现在断点处。然而,数据堆积不是源自经济个体的逐利动机,且可能出现在除断点之外的其他地方。如果结果变量受配置变量的堆积现象影响,那么RDD估计量可能是有偏的(Barreca、Lindo和Waddell,2011)。此时,可以去掉断点附近的某些观测值再做RDD估计。由于去掉断点附近的某些观测值后的数据就像一个“甜甜圈”,故称作“甜甜圈RDD”。至于去掉断点附近多少观测值为适,文献中尚未达成共识。
3. 全样本参数估计的缺点。根据Lee和Lemieux(2010),配置变量多项式要尝试到八九次。但是,Gelman和Imbens(2014)认为,不能尝试配置变量多项式的高次项,只能使用局部一次或局部二次多项式,理由有三点:第一,断点回归设计的估计量可以写成处理组结果的加权平均值和控制组结果的加权平均值之差,其中加权权重是配置变量的函数。运用全域高阶多项式方法时,当配置变量取值较大时,使用不同次数多项式得到的权重差别巨大。然而,局部线性回归方法给临近断点处的观测值赋予要大的权重,理论上讲更合理。第二,处理效应的估计值对全域高阶多项式的次数十分敏感。使用不同次数多项式得到的估计值差别很大。第三,在本身不存在断点的情况下,全域多项式方法得到错误结果(认为有断点)的概率高于实际水平,而局部一次(或二次)多项式方法得到错误结果的概率和实际水平差不多。
RDD的实际应用情况
2011-2017年,五大英文顶级经济学期刊共发表39篇运用RDD做的经验研究论文,涉及公共经济学、新政治经济学、劳动经济学和教育经济学等众多领域,具体情况如表1示(此表归纳39篇论文的研究问题,配置变量,做适用性检验的方法,描述统计图中画拟合曲线所用的多项式次数,参数估计中所用多项式的次数,非参数估计中使用的带宽,非参数估计中所用核密度函数,主要数据以及对Imbens and Lemieux (2008)、 Lee and Lemieux (2010)和Gelman and Imbens(2014)三篇论文的引用情况。详见文后百度网盘链接的原文)39篇论文中有33篇均是使用行政管理数据,由此可见开放行政管理数据对于RDD应用的重要性。第二部分提到的三个新进展的应用情况如下:首先,使用非参数估计的26篇论文中,用IK法、CCT法确定最优带宽的分别为13篇、6篇,表明这两种最优带宽确定方法已被学界接受。其次,在甜甜圈RDD被提出的2011年之后,33篇论文中有5篇用了此方法。最后,Dell (2015)和Pinotti (2017)引用了Gelman和Imbens(2014),但还使用超过二次的配置变量多项式做稳健性检验。
这些文献对RDD的运用与Lee and Lemieux (2010)提出的规范大体一致,譬如20篇(占51.28%)论文引用了Lee and Lemieux (2010),33篇(占84.62%)做了适用性检验。与Lee and Lemieux (2010)提出的规范不一致的情况,包括如下几点:
第一,Lee and Lemieux (2010)建议参数估计和非参数估计均要做,但这样做的只有16篇。只使用参数估计、只使用非参数估计的分别为13篇和10篇。在16篇同时使用了两种估计方法的文章中,将两种方法视为同等重要的有4篇,参数估计仅只是做稳健性检验、非参数仅只是做稳健性检验的分别为4篇和8篇。因此,总体来看,文献中偏重于参数估计。值得一提的是,ECMA上的4篇文章都只用非参数估计,而QJE上的5篇文章,除Malamud andPop-Eleches (2011)同时使用了两种方法外,其余4篇都只用参数估计。ECMA由国际计量经济学会主办,QJE由哈佛大学经济系主办。二者在RDD应用上的差异可能体现了两个主办方不同的学术风格。
第二,Lee and Lemieux (2010)建议用前定变量做适用性检验时,应该做似不相关检验,但没有一篇文献这样做。
第三,Lee and Lemieux (2010)建议画描述统计图中的拟合曲线时,用配置变量的4次多项式,但仅有3篇论文用了4次多项式。39篇论文中,仅有Chetty et al (2014)这一篇没在描述统计图中画上对散点的拟合曲线。在画了的38篇中,未说明用得什么方法、使用局部线性回归(local linear regression)、使用局部线性平滑(local linear smoother)、移动平均法(running-mean smoothing)和多项式方法的分别为3篇、3篇、3篇、1篇和28篇,可见多项式方法是主流方法。在画拟合曲线所用方法上的差异具有明显的期刊特色:使用局部线性回归法的3篇文章有1篇来自QJE、2篇来自JPE,使用局部线性平滑法的3篇文章均来自ECMA,使用移动平均法的那一篇文章来自RES,AER上的文章都使用多项式方法。在使用多项式方法的28篇论文中,使用1次、2次、3次、4次、8次及同时使用1次和2次多项式的分别为8篇、11篇、4篇、3篇、1篇和1篇,使用1次多项式和2次多项式的明显居多。值得一提的是,Meng (2017)在同一张图中同时画了1次多项式和2次多项式的拟合曲线。
第四,Lee and Lemieux (2010)建议参数估计时的配置变量多项式要尝试到八九次、然后挑选赤池信息准则(AIC)取值最小的模型。但是,使用过参数估计的29篇论文中,仅有Clark and Martorell (2014)和Deshpande(2016)根据AIC来挑选模型。在明确说明尝试过的多项式次数的论文中,仅有Auffhammer and Kellogg (2011)和Pinotti (2017)尝试过超过4次的多项式,绝大多数只尝试到4次多项式。
第五,Lee and Lemieux (2010)建议非参数估计时用矩形核密度函数。但是,在使用非参数估计、且说明了所用核密度函数的16篇文献中,使用矩形核密度函数的为7篇,而使用三角形核密度函数的有8篇,还有一篇使用帐篷型核密度函数(tent-shaped edge kernel)。
综上所述,Lee and Lemieux (2010)之后,运用RDD出现了IK和CCT两种最优带宽确定方法以及甜甜圈RDD两个新操作环节。Gelman和Imbens(2014)不该使用超过两次的多项式的建议,尚未被学界普遍接受。同时,学界在Lee and Lemieux (2010)涉及到的RDD运用环节上未达成共识。基于五大期刊的应用情况,我们认为,运用RDD时需要增加如下动作:首先,非参数估计应该同时尝试CV、IK和CCT三种带宽确定方法;其次,在配置变量存在堆积现象或被操纵的可能时,使用甜甜圈RDD。最后,尝试到四次多项式。
推文作者简介
付明卫,中国社会科学院经济研究所副研究员,研究领域为医疗卫生、创新和乡村治理。guoqushiling@163.com。
摘要
近几年来,国内经济学界颇为关注断点回归设计(RDD)方法,运用RDD的文章日益增多。本文首先概述Lee and Lemieux (2010)提出的运用RDD的规范,然后基于2011-2017年间五大英文顶级经济学期刊发表的RDD应用研究论文,归纳出运用RDD的三个新动作:新的最优带宽确定方法、甜甜圈RDD和参数估计中最高只能使用二次多项式。以国外的RDD用法为参照,我们发现,国内熟悉Lee and Lemieux (2010)提出的规范,也在吸收国外文献中出现的新动作,但运用RDD时存在如下几个突出问题:不做适用性检验、不重视描述统计图和不交代清楚非参数估计的关键细节。我们建议,国内运用RDD时需要增加如下动作:首先,非参数估计应该同时尝试CV、IK和CCT三种带宽确定方法;其次,在配置变量存在堆积现象或被操纵的可能时,使用甜甜圈RDD。最后,尝试到四次多项式。
话题:
0
推荐
财新博客版权声明:财新博客所发布文章及图片之版权属博主本人及/或相关权利人所有,未经博主及/或相关权利人单独授权,任何网站、平面媒体不得予以转载。财新网对相关媒体的网站信息内容转载授权并不包括财新博客的文章及图片。博客文章均为作者个人观点,不代表财新网的立场和观点。