阅读:0
听报道
推文人 | 李静
推文信息:Wossen, T., Abdoulaye, T., Alene, A., et al. (2018). Estimating the productivity impacts of technology adoption in the presence of misclassification. American Journal of Agricultural Economics,101(1), 1-16.
一、引言
准确地度量采纳状态对于估计技术采纳对生产率影响是至关重要的。在大多数技术采纳研究中,假设农民的自我报告数据能正确地反映他们的真实采纳状态,就用家庭调研数据来衡量采用状态(e.g., Shiferaw et al., 2014; Zeng et al., 2015)。然而,自我报告的采纳状况可能被误分类,如果不能解释这种误分类,可能会导致有偏差的估计,并对政策产生影响。在采纳研究中,当农民错误地报告了他们的采纳状态时,就会发生误分类,即当他们不是采纳者时报告是采纳者(“假阳性”),或者当他们是采纳者时报告是不采纳者(“假阴性”)。这种误分类的发生由于种子市场缺陷(如经销商种子掺假),缺乏意识和改良品种的技术特征信息 (Kosmowski et al., 2016),种子回收和推广监管不力和品种命名系统(IIukor et al., 2017)。
较少但逐渐增多的文献 (Frazis & Loewenstein, 2003; Mahajan, 2006; Lewbel, 2007)提出了在误分类的情况下的多种因果识别策略。这些研究主要针对具有强分布假设的非参数和半参数方法。如Brachet(2008)推导了一种估计处理效果的方法,该方法假设了内源性处理状态和外源性错误分类。因此,这些研究中提出的识别策略不能推广到内源性误分类的情况。误分类在报道采纳状态可能是内生性因为农民谎报采纳状态更有可能在观测和未观测的特征上不同于那些不误报的,从而影响生产率。因此,对于潜在的内源性处理变量,可能存在与内源性误报相关的显著偏差。据我们所知,只有Nguimkeu, et al. (2017)利用Poirier的部分可观察性模型(1980)考虑了内源性误报对潜在内源性处理变量的后果。他们的结果表明,在潜在的内源性处理变量中,内源性误报可能不仅具有衰减偏差,而且具有信号逆转效应。
本文使用一个独特的数据集,结合自我报告和DNA-指纹采用的数据来评估处理效果估计偏差时,处理指标是内生的和内生误分类。基于DNA-指纹数据的真实采纳状态没有误分类,但仍然是内源性的,这是由于对处理的自我选择(在采纳者和未采纳者之间存在观测到的和未观测到的异质性)。因此,考虑到采用变量的二元性的常用IV程序将提供一致的估计。然而,当使用来自家庭调查的自我报告的采纳状况时,IV估计可能由于内生的误分类而有偏倚。因此,真实采纳状况(由DNA指纹采集的采纳数据测量)和代理采纳状况(由家庭调查测量)之间的参数估计的大小和方向的差异应该决定误分类偏差的大小和方向。
据我们所知,这是首个解决采纳研究中误分类问题的研究。本文以尼日利亚采用改良木薯品种为研究对象,提供了以下贡献:1)提供了家庭调查中误分类率的实证证据,包括误分类的家庭层面关联;2)为一个高度政策相关的参数提供了一个可靠的估计,即在内生的采纳状态和误分类的情况下采纳的回报。3)由于设计良好的随机对照试验(RCT)不存在误分类,因此本文的结果可以提供另一种见解,以了解随机对照试验(RCT)的结果与发展中经济体文献中的观测数据之间的一些差异。4)这篇文章还为非洲农业研究看似矛盾的低采用率和高回报提供了另一种解释 (Duflo, et al. 2008; Suri, 2011),主要关注农民在家庭调查中回答假阴性的发生率。
二、数据来源和实证策略
2.1 数据来源
本研究基于2015/16尼日利亚木薯监测调查(CMS)。CMS是尼日利亚2500个木薯生产商的全国代表性样本。采用多阶段分层抽样设计,选择样本家庭。1)尼日利亚进行全国人口普查的各地区(EAs)清单由国家人口委员会(NPC)提供。根据地方政府区域(LGA)获得了16个州的EAs清单,这些州加起来占尼日利亚木薯总产量的80%以上。这些国家被分为四个地缘政治区域:西南、正南、东南和北方。2)在每个区域,使用与大小成比例的概率抽样方法(PPS)选择125个EAs。3)从每个EA中随机选取5个种植木薯的家庭进行访谈。
每个区域选了625个家庭样本,总共调查了2 500个农业家庭。从每个被调查的家庭中,收集了关于品种和地块层面的自我报告采纳状态(采用改良的木薯品种)的信息,因为许多家庭拥有不止一块木薯田,在不同的地块上种植不同的品种。从农场中每个确定的品种中,收集木薯叶样品用于DNA指纹分析。除了采纳状态外,还收集了有关家庭的社会经济特征以及其他生产的数据。
DNA指纹识别过程是我们数据的新颖的一个方面。迄今为止,已经采用了几种用于跟踪改良品种的采用的品种鉴定方法,但是大多数具有固有的不确定性水平。与其他传统的品种鉴定方法相比,DNA指纹技术为准确鉴定农民种植的品种提供了一种可靠的方法,从而可以对采用情况进行可靠的测量。特别是,在投入市场不完善的情况下(当正式的种子系统不完善时),误分类可能会普遍存在,因为农民主要依赖于非正式的种子来源。
2.2 估计策略
三、结果分析
产量是通过总产量与GPS测量的地块大小的比值来计算的。然而,生产数据是基于自我报告的价值,也可能遭受潜在的测量误差。由于持续的丰收和农民缺乏收获记录,从给定的地块估算木薯产量是非常困难的。因此我们分两轮收集了生产数据。第一次2015年7- 8月,第二次2016年2-3月。在第一轮中,我们收集了特定地块上已经收获的木薯数量以及未来预期收获数量的数据。在第二轮中,我们收集了自第一轮以来收获的产值。
我们发现,不管采用什么方法来衡量采纳状况,采纳者的收益率都明显较高。然而,使用DNA指纹数据时,采纳者和非采纳者的产量差异更大。我们假设这些家庭特征影响农民采纳决策以及他们的生产水平。我们发现,在大多数控制变量上,采纳者和非采纳者之间存在显著的统计学差异。一般来说,采纳者往往更年轻,受教育程度更高,更富有。此外,采用者有更好的推广和信用。本研究还包括地块水平变量和用于控制地块水平异质性的投入。
3.1 误分类的程度
由于DNA指纹数据的采用率是无误差的,我们使用它们作为基准来计算来自家庭调查的误分类率。结果表明,假阳性和假阴性都普遍。然而,假阴性的发生率明显较高。数据还表明,误分类和木薯种子系统的潜在特征之间存在高度相关性。据调查,超过70%的采用者是通过非正式的当地交流获得种植品种,大多数人都不能通过名字来识别他们种植的品种。这表明缺乏适当的品种命名,以及传播力量的薄弱,在观察到的错分类率的良种中发挥了作用。
3.2 正确分类的决定因素
3.3 采纳对生产率的影响
OLS估计结果。使用DNA指纹采集的采纳数据与自我报告的采纳数据相比,对采纳率的影响要高18%,因此误分类会导致衰减偏差。在不存在误分类的情况下,两种模型的参数估计应该是相同的。因此,这两个结果之间的巨大差异表明,测量误差是相应的。由于采用决策的内生性,OLS估计仍然可能存在偏差。
IV估计结果表明,采纳对生产率的影响范围在60-80%之间。我们没有控制误分类的内生性,只控制了采用状态中未观察到的异质性。结果表明,使用工具变量来衡量采纳决策的内生性并不能纠正由内生性误分类造成的内生性偏差。这是因为基于自我报告采纳状况的参数估计总是与基于DNA指纹数据的估计不同。纠正这种偏差需要一种工具来控制采用状态的内生性,还需要一种额外的工具来控制误分类的内生性。
另一个相关问题,可能是农业部门的技术干预所特有的,是农民基于他们自己对采纳状况的主观自我评估而固有的行为调整。行为调整的某些方面是未观察到的,可能会引入偏差。例如,假阴性可能会由于负面的行为调节效应而引入向下偏差。因此,只有当行为调节效应为零时,才能得到对采纳影响的无偏且一致的参数估计。如果农民正确识别改良品种,处理变量(正确识别)的值为1,如果农民正确识别地方品种,处理变量的值为0(错误的阴性/阳性响应将丢失值)。正确的识别和采用变量之间的交互项则一致地捕获改进的多样性和行为调整效果。结果表明,在考虑技术效应和未观测的农民行为调整的情况下,采纳可提高约94%的生产率。然而,如果不考虑农民的这种未观察到的行为调整,采用改良品种可以提高81%的生产率。这些结果强调了不仅要通过DNA指纹等技术数据收集采纳技术获取纯技术效果的重要性,而且还要根据农民自身对采纳状况的主观评估对其随后的行为进行调整。
最后,我们总结了由内生性、误分类和行为调节效应引起的偏差大小。我们发现未能控制的误分类采纳状态(假设采用外生)偏见生产率OLS估计18个基点(60%到42%),而未能控制内生性的采纳现状偏见生产率估计约22个百分点(从一系列实验数据,采用估计范围从81.5%到60%)。如果没有同质性假设,IV估计值只是局部平均处理效果(LATE),而OLS结果是平均处理效果(ATE)。假设两种处理效应相同(ATE=LATE),结果强调控制误分类与控制未观测的异质性同样重要。事实上,由于误分类而产生的偏差可能与由于采纳决策的内生性而产生的偏差相似。这两种偏见的严重程度在很大程度上是一个经验问题,取决于误分类的严重程度。当误分类较少时,控制采纳决策的内生性可能比控制误分类更为重要。此外,忽略内在的行为调整还有13个百分点的额外偏差(94%-81%)。
3.4 稳健性检验
我们使用邻居/朋友的采纳决策作为识别工具。然而,如果农民除了从邻居/朋友那里了解改良品种之外,还从他们那里了解提高生产力的技术,就可能违反排除限制。在本研究中,这不大可能使工具变量无效。如果农民除了学习改良品种之外,还学习提高生产力的方法,那么这将不会成为我们对管理实践、土壤质量和投入使用的规范控制所关注的问题。此外,农民不太可能了解到邻居/朋友的一些不易察觉的特征,而正是这些特征使他们的生产效率更高。尽管如此,我们基于Conley, et al. (2012)提出的方法提出了一种替代的稳健性检验。这种方法允许在不需要精确保持排除限制的情况下产生边界效应(Clarke and Matta, 2017)。
四、讨论和结论
我们使用DNA指纹数据的采用情况作为基准,并检验了误分类偏差在多大程度上影响了采纳状态的参数估计。本文以DNA指纹采集数据为基准,比较了传统家庭调查的误分类率。本研究对影响评价文献尤其重要,因为大多数采纳研究都依赖于家庭调查,以衡量采纳对结果变量的影响。结果表明,假阳性和假阴性反应都很普遍。然而,假阴性的发生率是假阳性的两倍多。这表明传统的家庭调查更有可能低估采纳率。此外,我们发现,误报与家庭特征无关,很大程度上取决于受访者的教育水平和他们对结构性信息来源的获取。
Abstract
this article examines the impact that misreporting adoption status has on the identification and estimation of causal effects on productivity. In particular, by comparing measurement error-ridden self-reported adoption data with measurement-error-free DNA-fingerprinted adoption data, we investigate the extent to which such errors bias the causal effects of adoption on productivity. Taking DNA-fingerprinted adoption data as a benchmark, we find 25% “false negatives” and 10% “false positive” in farmers’ responses. Our results show that misreporting of adopting status is not exogenous to household characteristics, and produces a bias of about 22 percentage points in the productivity impact of adoption. Ignoring inherent behavioral adjustments of farmers based on perceived adoption status has a bias of 13 percentage points. The results of this article underscore the crucial role that correct measurement of adoption plays in designing policy interventions that address constraints to technology adoption in agriculture.
话题:
0
推荐
财新博客版权声明:财新博客所发布文章及图片之版权属博主本人及/或相关权利人所有,未经博主及/或相关权利人单独授权,任何网站、平面媒体不得予以转载。财新网对相关媒体的网站信息内容转载授权并不包括财新博客的文章及图片。博客文章均为作者个人观点,不代表财新网的立场和观点。