财新传媒 财新传媒

阅读:0
听报道

图片来源:百度

原文信息:

Rambachan A, Roth J. 2023. “A more credible approach to parallel trends.” Review of Economic Studies,90(5): 2555-2591.

写在前面:在经验研究“可信性革命”背景下,双重差分是当前最常用的一种因果识别方法,平行趋势假设是双重差分估计的重要假设。由于平行趋势假设本身不可检验,当前大多事前平行趋势检验方法也存在一定问题。本文在放松平行趋势假设的条件下提出更可信的稳健推断和敏感性分析方法,为平行趋势检验的可信度提供更多有效证据。

01

研究背景

平行趋势假设指在没有干预的情况下,处理组和控制组的平均结果随时间变化的趋势相同。由于仅能观察到处理组受到冲击后的情况,此时控制组提供了一个可供研究的反事实,即可将未受到处理的控制组在观察时期内的“变化”近似于处理组倘若未受到冲击时的变化(黄炜等,2022)。

当平行趋势假设不满足时,以往主要有两种处理方式:一是给处理组重新匹配控制组;二是通过重新赋权的合成双重差分。本文作者Rambachan和Roth(2023)提出第三种方法:当平行趋势假设存在不同违背程度时,处理前趋势能提供违反平行趋势的有关信息,对相关估计结果进行敏感性分析,这种方法简称Honest DID。

近年来,不少学者指出处理前趋势检验对DID估计的有效性来说,既不充分也非必要。若处理前平行趋势检验的可信度不高,可能导致处理后处理效应估计的偏误。若不确定平行趋势假设的有效性,该怎么办?在可能违反平行趋势假设的情形下,本文提出对双重差分和事件研究进行稳健推理的方法。即没有要求平行趋势假设完全成立,而是限制了处理后违反平行趋势与处理前之间差异的不同程度。在这些限制条件下,构造不依赖于平行趋势的处理效应估计量,可以部分识别感兴趣的因果参数,同时利用平行趋势的敏感性检验得出结论。

什么是Honest DID

02

由于事前平行趋势检验通过并不意味着平行趋势假设一定成立,处理前趋势检验并不能作为满足平行趋势假设的经验证据,既有平行趋势检验方法也存在一些问题。因此,部分学者陆续提出通过引入非平行的处理前趋势,检验处理效应估计量对处理前趋势不满足平行趋势假设的敏感性。Bilinski 和Hatfield(2018)、Manski和Pepper(2018)、Rambachan和Roth(2023)提出了替代性的平行趋势检验方法。

Bilinski和Hatfield(2018)指出,首先得到具有复杂趋势的DID估计量,若认为存在平行趋势,则估计具有不同斜率的两种线性趋势模型,并将其与更简化的模型比较,再检验两种模型的处理效应(或在一定范围内)是否有差异。

Manski和Pepper(2018)认为在识别处理效应时,可以将不变性假设弱化为有界变差假设,运用直观和灵活的方法提高实证研究的可信度,评估推断不同识别限制的敏感性。

在Manski和Pepper(2018)的基础上,Rambachan和Roth(2023)提出了一种新的方法。若不满足平行趋势假设,对处理效应的点估计量的置信区间进行敏感性分析,在一定相对偏离程度下,若其置信区间未超过临界值,则说明平行趋势假设比较稳健。该方法是检验平行趋势假设的违反程度对点估计量和置信区间的影响,主要使用相对偏离程度限制和平滑限制,用平行趋势敏感性检验为处理效应可信度提供更多经验证据。

其核心思想是对处理后点估计量的置信区间进行稳健推断和敏感性分析。主要包括两个部分:一是构造与平行趋势的最大偏离程度(Mbar);二是构造与偏离程度对应的处理后点估计量的置信区间。若在最大偏离程度下,处理后点估计量的置信区间不包含0值,则表明处理效应对平行趋势的偏离程度具有较好的稳健性(许文立和孙磊,2023)。

具体地,首先假设DID待估计参数β一致,分解β:

其中,τ是感兴趣的因果参数,假设在处理前为0。δ是趋势差异产生的偏差。如在标准DID模型中,β是因果估计系数,τ代表平均处理效应(ATT)的向量,δ是处理组和控制组之间未经处理的潜在结果趋势差异。

识别τpost的平行趋势假设是满足δpost=0,但通常检验零假设δpre=0(“前趋势”检验)以评估该假设的合理性。此时并不要求平行趋势假设完全成立,而是在给定处理前趋势δpre下对处理后δpost的可能差异进行限制。这种限制形式的根本在于,处理前趋势提供了关于反事实处理后趋势差异的信息。本文假设δ∈Δ,Δ是指定的集合,在这种限制条件下因果参数τpost是部分识别的。这种形式的限制适用于可能违反平行趋势假设的条件。

如Manski和Pepper(2018)指出研究者可能愿意假设,造成处理后违反平行趋势的混杂因素,其程度与处理前的混杂因素相似。事实上,可以通过指定一个Δ,处理后平行趋势的最大违反程度用参数Mbar乘以处理前平行趋势的最大违反程度作为边界。平行趋势随着时间平稳变化,可以通过限定违反平行趋势的斜率随时间变化的程度来表述。

03 

如何使用Honest DID

(1)两种限制形式

在Honest DID估计中,主要涉及两种检验方法:一是相对偏离程度限制;二是平滑限制。其中,相对偏离程度限制的核心思想是处理后违反平行趋势的程度不超过处理前违反平行趋势的程度。平滑限制的核心思想是处理后违反平行趋势的程度不会与处理前线性外推趋势偏离太多。在具体检验过程中,主要包括两个部分:第一,基于相关研究背景,选择可能偏离平行趋势假设的程度Δ;第二,构造与偏离程度相应的置信区间。通过构建违反平行趋势假设时的稳健置信区间,并检验不同违反程度下处理效应的敏感性。

①相对偏离程度限制。假设处理后造成非平行趋势的混杂因素与处理前时期的混杂因素差异较小,这种限制可以表示为δ∈ΔRM(Mbar),Mbar ≥ 0。

ΔRM(Mbar)是将处理后连续时期内平行趋势的最大违反程度的边界,限制为处理前平行趋势的最大违反程度的Mbar倍。RM表示“相对程度”。若违反平行趋势可能是由于与前期混淆经济冲击规模相似的冲击驱动,则可以选择ΔRM(Mbar)。

②平滑限制。当长期趋势随着时间平稳变化,此时需要控制线性的特定时间趋势。但线性规范并不完全满足,通过限定其线性斜率在连续时期内可能变化的程度,使其微分趋势随时间平稳变化。这种限制表示为δ∈ΔSD(M),M ≥ 0。

参数M≥0决定了δ的斜率在连续周期之间的变化量,限制了二阶导数的离散模拟。SD表示“二阶导数”。在M = 0的情形下,SD(0)要求趋势的差异是完全线性。

(2)Δ的选择

需要基于经济学知识选择合适的Δ,解释可能产生非平行趋势的混杂因素。本文的主要案例中,ΔRM(Mbar)和ΔSD(M)是主要选择。

在一些经验情形下,可能关注对处理组和控制组的不同经济冲击,这些冲击导致违反平行趋势。若认为处理后期这些差异冲击的幅度与处理前相差不大,可以合理假设δ∈ΔRM(Mbar),根据处理前期观察到的违反情况,明确限定处理后违反平行趋势的相对幅度。

在其他情况下,若由于平稳变化的长期趋势差异对处理组和控制组的影响不同,导致违反平行趋势,此时可以假设δ∈ΔSD(M)。明确限制了趋势差异的斜率在连续期间内的变化程度。

(3)推断程序的选择

基于相关理论分析和蒙特卡洛模拟,对于一般和多维形式的Δ,推荐构建ARP混合置信区间。对于ΔSD(M)的特殊情况或其它类型的Δ,推荐使用FLCIs(保证FLCIs的一致性和有限样本近最优性)。相关推断程序可以在论文附录的HonestDiD R和Stata包中实现。

(4)敏感性分析

若选择了可能违反平行趋势的限制类别(如相对偏离程度限制ΔRM(Mbar)或平滑限制ΔSD(M)),需进一步对相关参数(对应Mbar≥0或M≥0)进行敏感性分析,这些参数决定了处理后违反平行趋势与处理前趋势的不同程度。因果结论的敏感性主要取决于该参数的选择和“分解”参数值。

Honest DID应用示例

04

为了更好地理解和应用Honest DID,作者选取两个示例,使Honest DID的抽象理论思想具体化。

(1)估算增值税削减的发生率

Benzarti和Carloni(2019)研究了法国餐馆增值税(VAT)削减的发生率。2009年7月,法国将坐式餐厅的税率从19.6%降至5.5%。该文使用动态DID设计分析VAT变化的影响,将餐馆与不受VAT变化影响的其他市场服务公司作为对照组进行比较,并估计OLS回归模型:

其中,Y是公司i第t年(税前)利润的对数,D表示i是否为餐厅。主要发现增值税削减能显著提升餐馆的利润。图4显示事件研究法的估计系数变化,2006和2007年的趋势似乎不同,从而拒绝平行趋势的假设(βpre = 0,p<0.01)。而2009—2011年的处理后估计系数比处理前更大。

可以看到,即使没有VAT的变化也可能存在未观测的行业或宏观经济冲击,这些冲击对餐馆与其他市场服务公司有不同的影响,处理后餐饮业受到的特定行业冲击不会比处理前大太多。然而,一贯认为特定行业冲击遵循平稳趋势似乎不合理,需要分析相对偏离程度限制ΔRM(Mbar)。

图5的左图显示在不同的Mbar值下,2009年ΔRM(Mbar)的处理效应的稳健置信区间。若Mbar =1,表示限制处理后违反平行趋势的程度不超过处理前违反平行趋势的最大程度,得到2009年餐馆利润效应的稳健置信区间[0.07, 0.31],其比最初OLS估计的置信区间更宽,在平行趋势假设完全成立时有效,但仍然拒绝了零值效应假设。可以看到,零值效应的“分解值”大约是Mbar = 2。因此,VAT变化显著影响餐厅利润,该结论取决于是否愿意限制处理后违反平行趋势程度不超过处理前最大值的2倍。考虑到处理后第一年(2009年)法国正面临经济大衰退,影响餐馆利润变化的因素在2009年可能比处理前更大。

右图估计了四个处理后时期内餐馆利润的平均因果效应,显示了类似的结果。当Mbar = 1时,稳健置信区间内包含零值,其效应约为第一期的两倍。可以看到,τbar的置信区间比τ2009更大,因为ΔRM(Mbar)将连续时期内违反平行趋势的程度限制为处理前期最大值的Mbar倍。由于处理组和控制组有更多的时间分离(如第二个周期的识别区间是第一个周期的两倍)。若愿意限制处理前期的最大经济冲击程度,后期的估计参数通常获得更宽的置信区间。

(2)谈判义务法对学生学习成绩的长期影响

Lovenheim和Willén(2019)研究了州级公共部门谈判义务(DTB)法的影响,该法律规定学区与教师工会谈判。该文研究这项法律制度对法律通过前后的学生在成人劳动力市场结果的影响。使用美国社区调查(ACS)数据,构建OLS模型分别估计了其对男性和女性的影响。

其中,Ysct是指在队列c中第t年出生在s州的学生队列的平均结果。Dscr指队列c在年满18岁之前的r年,s州是否通过了DTB法律。

图6是事件研究法中βr的估计系数。在男性样本中,处理前期的系数相对接近于零,而处理后的系数在长时期内为负。相比之下,女性样本显示了向下倾斜的预处理趋势。

该文的识别策略主要关注与处理效应不同的长期趋势,如劳动力供给或教育程度的混杂变化。考虑到长期趋势可能会随着时间平稳变化,此时适合选择ΔSD形式的平滑限制。事实上,在稳健性检验中,该估计模型具有特定群体的线性趋势,与ΔSD(0)大致对应。因此考虑ΔSD(M)形式的限制,其允许在连续时期内的非线性偏差不超过M。

图7报告了DTB法通过15年后的就业处理效应的影响结果,构建关于趋势差异的非线性变化的稳健置信区间。蓝线表示β15的原始OLS估计置信区间。红线表示不同M值下Δ=ΔSD(M)对应的推断程序FLCIs。M = 0对应只允许平行趋势的线性违反,较大的M值允许更大的线性偏差。

在左图的男性样本中,当允许近似线性(M≈0)的违反平行趋势时,FLCIs与OLS相似。随着更多的非线性变化,FLCIs变得更宽,在M≈0.01时具有显著影响。对于右图的女性样本,原始OLS估计值为负,置信区间不包括0值。当考虑平行趋势的线性违反(M = 0),原来的预处理下降趋势发生了实质性变化。当M < 0.01时稳健置信区间只包含正值。因此,若对男性施加与女性相同的平滑限制,则要么根据性别调整相反符号的显著影响(若M < 0.01),要么无法排除对两种性别的无效效应(若M≥0.01)。

05 

总结

当平行趋势假设不满足时,本文提出一种新的方法,依然能够提供稳健推断和敏感性分析。第一,对处理后违反平行趋势的程度进行量化限制,将其限定为处理前违反平行趋势程度的M倍。通过敏感性分析得到平均处理效应的置信区间,评估在不同M值的范围内处理效应的稳健性。在允许处理后违反平行趋势的程度为处理前M倍的情况下,DID估计的处理效应是否仍然显著。该方法的实用性在于,即使平行趋势假设可能不满足,依然能对DID处理效应进行合理的估计和推断。

第二,限制形式检验方法的选择。若认为处理后的混淆因素对处理组和控制组影响程度,与处理前的影响程度差异较小,则选择相对偏离程度限制构建稳健置信区间。若认为违反平行趋势的原因主要来自处理组和控制组的长期变化趋势差异,那么选择平滑限制构建稳健置信区间。事实上,在具体分析中,需要在相关经济社会制度背景下,讨论可能违反平行趋势假设的原因。

事实上,事前平行趋势检验通过并不够,因为平行趋势本身是不可检验的。那么,若平行趋势假设不成立或者放松平行趋势假设,此时仍然可以得到显著的处理效应,结论将更可信。这就是本文放松平行趋势假设的敏感性检验的思想。无论采取何种检验方法,应基于研究背景的经济学知识为可能违反平行趋势的讨论和分析提供更多信息,从而得出更可信的结论。

该方法的程序可以在R(命令:HonestDiD)和Stata(命令:honestdid)软件中应用。R语言参考链接:https://github.com/asheshrambachan/HonestDiD。

对于Rambachan和Roth(2023)的平行趋势假设敏感性检验,许文立和孙磊(2023)附录提供了相关do程序,参考如下。 

**附录图1政策实施年平行趋势敏感性检验图**

//处理当期的系数

matrix list e(b)

honestdid, pre(1/9) post(10/16) mvec(0(0.002)0.02) alpha(0.1)

local plotopts xtitle(平行趋势不成立的相对程度Mbar) ytitle(90%稳健置信区间) title(相对偏离程度限制) graphregion(fcolor(white) lcolor(white) ifcolor(white) ilcolor(white)) scheme(s1mono)

honestdid, cached coefplot `plotopts'

local plotopts xtitle(平行趋势不成立的相对程度Mbar) ytitle(90%稳健置信区间) title(平滑限制) graphregion(fcolor(white) lcolor(white) ifcolor(white) ilcolor(white)) scheme(s1mono)

honestdid, pre(1/9) post(10/16) mvec(0(0.002)0.02) delta(sd) alpha(0.1) coefplot `plotopts'

**附录图 2-4 Rambachan和Roth(2023)的平行趋势假设敏感性检验**

//处理后第4期d4

matrix l_vec = 0 \ 0 \ 0 \ 0 \ 1 \ 0 \ 0

honestdid,l_vec(l_vec) pre(1/9) post(10/16) mvec(0(0.002)0.02) alpha(0.1)

local plotopts xtitle(平行趋势不成立的相对程度Mbar) ytitle(90%稳健置信区间) title(相对偏离程度限制_post4) graphregion(fcolor(white) lcolor(white) ifcolor(white) ilcolor(white)) scheme(s1mono)

honestdid, cached coefplot `plotopts'

local plotopts xtitle(平行趋势不成立的相对程度Mbar) ytitle(90%稳健置信区间) title(平滑限制_post4) graphregion(fcolor(white) lcolor(white) ifcolor(white) ilcolor(white)) scheme(s1mono)

matrix l_vec = 0 \ 0 \ 0 \ 0 \ 1 \ 0 \ 0

honestdid,l_vec(l_vec) pre(1/9) post(10/16) mvec(0(0.002)0.02) delta(sd) coefplot `plotopts'

相关文献:

Benzarti Y, Carloni D. Who really benefits from consumption tax cuts? Evidence from a large VAT reform in France[J]. American Economic Journal: Economic Policy, 2019, 11(1): 38-63.

Bilinski A, Hatfield L A. Nothing to see here? Non-inferiority approaches to parallel trends and other model assumptions[J]. arXiv preprint arXiv:1805.03273, 2018.

Clarke D, Mühlrad H. Abortion laws and women’s health[J]. Journal of Health Economics, 2021, 76: 102413.

Lovenheim M F, Willén A. The long-run effects of teacher collective bargaining[J]. American Economic Journal: Economic Policy, 2019, 11(3): 292-324.

Manski C F, Pepper J V. How do right-to-carry laws affect crime rates? Coping with ambiguity using bounded-variation assumptions[J]. Review of Economics and Statistics, 2018, 100(2): 232-244.

Roth J, Sant’Anna P H C, Bilinski A, et al. What’s trending in difference-in-differences? A synthesis of the recent econometrics literature[J]. Journal of Econometrics, 2023, 235(2): 2218-2244.

黄炜,张子尧,刘安然.从双重差分法到事件研究法[J].产业经济评论,2022(2):17-36.

许文立,孙磊.市场激励型环境规制与能源消费结构转型——来自中国碳排放权交易试点的经验证据[J].数量经济技术经济研究,2023(7):133-155.

 Abstract 

This paper proposes tools for robust inference in difference-in-differences and event-study designs where the parallel trends assumption may be violated. Instead of requiring that parallel trends holds exactly, we impose restrictions on how different the post-treatment violations of parallel trends can be from the pre-treatment differences in trends (“pre-trends”). The causal parameter of interest is partially identified under these restrictions. We introduce two approaches that guarantee uniformly valid inference under the imposed restrictions, and we derive novel results showing that they have desirable power properties in our context. We illustrate how economic knowledge can inform the restrictions on the possible violations of parallel trends in two economic applications. We also highlight how our approach can be used to conduct sensitivity analyses showing what causal conclusions can be drawn under various restrictions on the possible violations of the parallel trends assumption.

推文作者:陈梁,华中科技大学经济学院博士生。

声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点。

话题:



0

推荐

香樟经济学术圈

香樟经济学术圈

1709篇文章 3小时前更新

香樟经济学术圈由中国社科院、哈佛大学、多伦多大学等国内外青年经济学者发起。此平台主要推送国外经济学领域经典前沿论文,发布国内外经济学相关资讯,以及香樟经济学者圈的相关活动公告。 期待能够对中国经济学研究和国家政策产生一定影响。微信订阅号:camphor2014。

文章