阅读:0
听报道
推文人 | 朱敏 中国地质大学(武汉)博士生
原文信息:Abadie A, Diamond A, Hainmueller J. Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California's Tobacco Control Program. Journal of the American Statistical Association.2010;105:493-505.
【摘要】基于Abadie和Gardeazabal(2003)的一个想法,本文研究了比较案例的控制方法的应用实例探究。我们讨论了这些方法的优点,并将其应用于研究99号提案--加州1988年实施的烟草控制计划的影响。我们证明,在第99号提案之后,烟草消费显着下降在加利福尼亚州相对于可比的合成控制区域。我们估计到2000年的年人均卷烟销售额加利福尼亚比没有第99号提案时的情况低了约26包。使用新的推论方法在本文中提出,我们证明了我们估计的重要性。鉴于许多政策干预和感兴趣的事件社会科学在总体水平(国家,地区,城市等)发生,并影响少数总体单位,即潜力综合控制方法对比较案例研究的适用性非常大,特别是在传统回归的情况下方法不合适。
一、引言
社会科学家通常对发生的事件或政策干预的影响感兴趣,为了评估这些事件或干预措施的效果,研究人员经常使用比较案例研究。在比较案例研究中,研究人员估计受特定事件发生或利益干预影响的结果(如死亡率、平均收入、犯罪率等)的演变,并将其与未受影响的单位(对照组)作对比估计。然而,比较案例研究受到影响其实证实施的两个问题的限制。首先,在比较案例研究中,通常会对如何选择比较单位有一定程度的模糊性。研究人员经常根据主观测量选择对照组,根据受影响和未受影响的单位之间的亲和力。第二,比较案例研究通常使用关于分类单元样本的数据和推理技术,这些技术仅测量人口中数据的总值的不确定性。如果聚合数据可用,则可以完全消除关于聚合变量值的不确定性。然而,聚合数据的可用性并不意味着可以无错误地估计事件或感兴趣的干预的影响。即使采用汇总数据,对照组在没有干预或感兴趣的事件的情况下再现受影响单位可能经历的反事实结果轨迹的能力仍然存在不确定性。这种不确定性没有通过传统推理技术构建的比较案例研究的标准误差来反映。我们主张使用数据驱动的程序来构建合适的对照组。数据驱动的程序减少了选择对照组自由裁量权,迫使研究人员使用观察到的可量化特征来证明受影响单元(处理组)与未受影响单元(对照组)之间的亲和性。在实践中,通常很难找到与处理组特征类似的对照组。综合控制方法背后的思想是,对照组的组合通常为处理组提供更好的比较。综合控制方法具有两个显著的特点。因为综合控制是可用控制单元的加权平均值,综合控制方法明确(1)每个控制单元对感兴趣的反事实的相对贡献;(2)处理组与对照组在干预前结果和干预后的预测因子方面的相关性。因为权重可以限制为正的且权重的加和为一,所以综合控制方法提供了防止外推的保障。此外,该文作者提出一种新的方法,在比较案例研究中执行推理,无论对照组的数量和数据的聚集程度如何,都会产生潜在的信息性推理。作者以加州禁烟法案--99号提案为例,证明,随着99号提案的通过,加州的烟草消费量相对于可比较的综合控制区域明显下降。我们估计,到2000年,加州的人均卷烟年销售量比没有99号提案的地区要低26包。
二、综合控制法模型
三、估计加州禁烟法案的效应
3.1 背景:
1988年,加州发起了一项名为“99号提案”的选民倡议,该提案是美国第一个现代大规模烟草控制项目。-吸烟教育预算,资助反吸烟媒体运动,并推动全州地方清洁室内空气条例(Siegel,2002)。加州普遍认为99号提案已经成功地减少了吸烟。从提案99的通过到1999年,加利福尼亚的成年人吸烟率下降了30%以上,青年吸烟率降至全国最低,人均香烟消费量减少了一半以上(加州卫生局,2006年)。1988年以前,加州人均香烟消费量落后于全国平均水平22.5包;10年后,人均消费量是40.4包。低于全国平均水平(西格尔,2002)。
3.2 数据与样本:
作者使用州面板数据,从1970--2000年。“99号提案”于1988年11月通过,1989年1月生效。我们的抽样期从1970年开始,因为这是第一年所有控制州都有卷烟销售数据。它于2000年结束,因为大约在这个时候,许多州都实施了禁烟措施。此外,在99号提案通过后长达十年的时间里,似乎对这种干预效果的合理预测范围有一个合理的限制。在通过99号提案之前,所得到的合成加利福尼亚州最好地再现了一组预测加利福尼亚香烟消费量的值。因为合成加利福尼亚州是为了再现没有“99号提案”的情况下加州所观察到的吸烟率,所以我们放弃了在样本期内采用其他一些大规模烟草控制计划的州。他们是马萨诸塞州、亚利桑那州、俄勒冈州和佛罗里达州在1989-2000年期间推出了正式的全州烟草控制计划,它们被排除在捐赠者之外。我们也放弃所有在1989年至2000年期间将州烟税提高50美分或更高的州(阿拉斯加、夏威夷、马里兰,密歇根、新泽西、纽约、华盛顿、哥伦比亚特区),这样,捐赠者池中有38个州。
结果变量是加州的年人均卷烟消费量水平,以人均卷烟销售量计算。协变量是:卷烟的平均零售价格,人均GDP,15-24岁人口的百分比,和人均啤酒消费量。这些变量是1980 - 1988年期间的平均值。另外还增加了三年的吸烟消费量(1975年,1980年和1988年)。
使用第II节中描述的技术,作者构建了一个“综合”的加利福尼亚州在第99号提案通过之前,反映加利福尼亚卷烟消费预测值的值。我们估计了99号提案对人均卷烟的影响。 然后作者进行一系列的安慰剂研究验证结论。
3.3 结论
图1描绘了加利福尼亚州和美国其他地区的人均香烟消费趋势。正如这个数字所表明的,美国其他地区可能无法为加州提供一个合适的比较组来研究99号提案对人均吸烟的影响。甚至在99号提案通过之前,加利福尼亚州和美国其他地区的香烟消费时间序列就明显不同。20世纪70年代初,加州和美国其他地区的香烟消费水平相似。70年代末,当加州的香烟消费达到顶峰并开始下降,而美国其他地区的消费仍在上升时,趋势开始出现分歧。20世纪80年代,香烟销量下降,但加州的销量下降幅度大于美国其他地方。1988年,99号提案通过的那一年,美国其他地方的香烟消费量比加利福尼亚高出约27%。随着法律的通过,加利福尼亚的卷烟消费量持续下降。为了评估99号提案对加州吸烟的影响,中心问题是,如果没有99号提案,加州在1988年以后的香烟消费将如何演变。综合控制方法提供了一种系统化的方法来估计这种反事实。
预测因子结果显示在表1中,它比较实际加州和合成加州的预处理特征,以及捐赠池中38个州的加权平均值。我们看到,在1989-2000年间没有实施大规模烟草控制计划的州平均数似乎没有为加利福尼亚提供一个合适的控制组。特别是,在通过99提案之前,38个控制州的平均啤酒消费和香烟零售价格低于加利福尼亚。此外,在99提案通过之前,38个对照州的人均香烟销售量显著高于加利福尼亚。相反,合成的加州在99提案之前,精确地再现了真实加州的值。
表2显示了合成加利福尼亚州中每种控制状态的权重。表2中报告的权重表明,在通过99提案之前加利福尼亚州的吸烟趋势最好由科罗拉多州,康涅狄格州,蒙大拿州,内华达州和犹他州的组合再现。捐赠者池中的所有其他状态都被指定为零W权重。
图2显示了1970-2000年期间加州及其合成加州的人均香烟销售额。与图1相比,合成加州的人均销售额非常密切地跟踪这个变量在加利福尼亚州99提案前的轨迹。结合表1,这表明,在没有99号提案的情况下,合成加利福尼亚州提供了合理的人均香烟包销售数量的近似值。比较加利福尼亚州人均香烟销售量与99号提案通过后的合成版本之间的差异。在法律通过后,两条线开始明显地分开。尽管合成加州的香烟消费继续保持温和的下降趋势,但真正的加州却经历了急剧的下降。这两条线之间的差异表明99号提案对人均香烟销售有很大负面影响。图2描绘了99号提案影响的年度估计,即加利福尼亚州和它的合成加州之间人均香烟消费的年度差距。图2表明,99提案对人均香烟销售有很大影响,并且这种影响随时间而增加。结果表明,在1989-2000年期间,平均每人减少了近20包香烟的消费,减少了约25%。作者又加入了其他的协变量用于稳健性检查。这些协变量包括国家一级的失业率、收入不平等、贫穷、福利转移、犯罪率、与毒品有关的逮捕率、香烟税、人口密度,以及捕捉人口、种族和社会结构的许多变量。结果估计依然稳健。
对第99号提案的影响进行分析的背景下,有几种方法可以违反第II节各单位之间不受干涉的假设。然而,这些潜在的违规行为似乎并不严重。第一问题是加利福尼亚州第99号提案所产生的反烟情绪的增加可能已经扩散到其他州,污染了捐助者池。另一个问题是,,烟草业可能会将资金从其他州的计划广告活动转移到加利福尼亚州。在这两种情况下,干扰都可能导致对照状态下吸烟水平降低,人为地减少对99号提案效果的估计幅度。另一方面,根据第99号提案实施的烟草税增加可能会增加从附近司法管辖区走私香烟或跨境采购。然而,Loven-heim(2008)和DeCicca,Kenkel和Liu(2008)提供的证据表明,在较低的烟草价格管辖范围内,加州的跨境卷烟购买水平较低。关于有组织走私的信息要少得多,尽管有人认为这种活动在美国的规模可能很小而且在下降(例如,Kleine,1993)。
3.4 安慰剂检验
把加州放入捐赠者池中,任意抽取捐赠者池中的一个州作为处置组,检测合成的效果,捐赠者池中的州依次检测。
灰线表示捐赠者池中每个州与其各自的合成版本之间的人均卷烟销售额的差异。叠加的黑线表示为加利福尼亚的人均卷烟销售额的差异。如图所示,加利福尼亚在1989 - 2000年期间的估计差距相对于捐助池中各州的差距分布异常大。加利福尼亚州的负面影响目前是迄今为止最低的。
四、结论
比较案例研究在社会科学中具有广泛的潜力。然而,比较案例研究的实证实施受到推理挑战和有效控制组选择模糊性的困扰。在本文中,作者提倡使用数据驱动程序在比较案例研究中选择合成比较单元。提出了一种在比较案例研究中产生推理的方法,该方法包含了对控制单元有效性的不确定性。通过研究加州禁烟法案--99提案的效果证明了合成控制方法的适用性。我们的结果表明烟草控制计划的效果远大于之前的估计报告。
Abstract
Building on an idea in Abadie and Gardeazabal (2003), this article investigates the application of synthetic control methods to comparative case studies. We discuss the advantages of these methods and apply them to study the effects of Proposition 99, a large-scale tobacco control program that California implemented in 1988. We demonstrate that, following Proposition 99, tobacco consumption fell markedly in California relative to a comparable synthetic control region. We estimate that by the year 2000 annual per-capita cigarette sales in California were about 26 packs lower than what they would have been in the absence of Proposition 99. Using new inferential methods proposed in this article, we demonstrate the significance of our estimates. Given that many policy interventions and events of interest in social sciences take place at an aggregate level (countries, regions, cities, etc.) and affect a small number of aggregate units, the potential applicability of synthetic control methods to comparative case studies is very large, especially in situations where traditional regression methods are not appropriate.
话题:
0
推荐
财新博客版权声明:财新博客所发布文章及图片之版权属博主本人及/或相关权利人所有,未经博主及/或相关权利人单独授权,任何网站、平面媒体不得予以转载。财新网对相关媒体的网站信息内容转载授权并不包括财新博客的文章及图片。博客文章均为作者个人观点,不代表财新网的立场和观点。