原文信息:
Mountjoy, Jack. 2022. "Community Colleges and Upward Mobility." American Economic Review, 112 (8): 2580-2630.
开篇前,先奉上笑话一则:
患者:大夫,我最近总是咳嗷,怎么办?
医生:少抽点烟,自然就好了。
半月后…
患者:大夫,我现在咳嗽更厉害了,你说的也不管用啊。
医生:你现在每天抽多少烟?
患者:每天半包。
医生:这也不算多啊,以前呢?
患者:以前不抽。
从因果推断的角度看,这则笑话的内核是不同边际上的处理效应异质性:医生默认患者处于「多抽烟→少抽烟」处理边际,而患者实际所在的处理边际是「不抽烟→少抽烟」。显然,少抽烟在前一个边际上的处理效应是减轻症状,而在后者上则产生相反的效果。
在应用微观和政策评估研究中,识别特定边际上的处理效应(margin-specific treatment effect)有时候比识别总的平均处理效应更具有实践意义,尤其是在不同边际效应大相径庭的情形下。本文所推介的研究提供了一种便于操作的解决方案,只需将 2SLS 回归的结果变量(Y)替换为结果变量与相应处理变量的乘积(YD),在合理的单调假设下,就可以识别特定边际上的处理效应。
01
背景、问题与数据
二年制的社区大学是美国高等教育制度的重要组成部分,近百年来吸收了大量来自低收入家庭的学生。然而,社区大学是否真的提高了社会流动性,却未有定论。社区大学有双重功能,一个是作为四年制大学的预科,学习前两年的基础课,很多四年制大学都有接收附近社区学院毕业生转入的传统,另一个是类似于中国的大专,以学习实用技能为主。三十年前就有社会学家指出,社区大学的存在让一些原本不会上大学的学生得以接受高等教育,同时又使得另一些原本可以直接上四年制大学的学生转向社区大学。二年制大学对前一类学生的影响被称为下沉效应(democratization effect),即在「不上大学→上二年制大学」边际上的效应;对后一类学生的影响则被称为分流效应(diversion effect),即在「上四年制大学→上二年制大学」边际上的效应。增加社区大学供给通过下沉所改善的社会流动性,就很有可能被分流带来的负面影响所抵消。
这项研究关注的核心问题是:两年制大学是否促进了那些本来不会参加高等教育的人的向上流动,还是说它们主要是将学生从四年制大学中向下分流出来?这个问题包含两组参数的识别:两类学生的比例(share)和二年制大学对两类学生的社会阶层的处理效应(effect)。二年制大学对整个学生群体的净效应就是以比例加权的平均处理效应。
作者提供了一系列描述性统计,进一步说明区分两种边际的必要性。这里选取其中两张图进行介绍。Figure 2 展示了「粘性处理」的现象:大多数入学二年制大学的学生最终没有向上转入四年制大学,反之亦然。要知道,许多学生是抱着转学到四年制大学的目的进入二年制大学的。这两张图则告诉我们两边之间的流动并不那么自由,起点的选择仍然在很大程度上决定了终点。
Figure 3 直接展示了两类学生的收入差异,四年制学生更长的学习时间换来的是长久的收入增加。这意味着,如果存在被分流的学生,二年制大学对他们的负面影响将会是相当深远的。这张图也展示了明显的性别差异:在女性群体中,不同学历类型的工资区别要明显大于男性,这些区别也更早地显现出来。原文也展示了这种性别差异在后续的因果分析中依旧明显。
02
识别与估计
1994 年,Imbens 与 Angrist 在 Econometrica 上发表了著名的局部平均处理效应(LATE)框架,指出在二元处理(binary treatment)的情况下,若满足独立、排他、单调的基本假设,则工具变量识别了依从者(complier)的 LATE。
存在多个处理边际的情况下,接受处理的依从者的反事实状态就存在多种可能,且常常是不可观测的。例如,在这个研究中,对于入学二年制大学的学生,如果没有二年制大学,他们是不上大学还是会去上四年制大学,就是无从知晓的。如果仅有一个上二年制大学的 IV ,以下 2SLS 识别的将是两个边际上 LATE 的加权平均,因为两类依从者的比例 未知,下沉效应 和分流效应 则无法从中区分出来:
( 是结果变量, 取 1 表示上二年制大学,其他情况取 0)
另一种方法是多变量 2SLS:下列方程中 、 分别是表示不上大学、上四年制大学的虚拟变量,、 是两个外生的工具变量,则系数 、 分别表示二年制大学的下沉和分流效应。
可以证明,这个 2SLS 要识别 、,需要相当强的同质处理效应假设。作者在原文中也通过过度识别检验证明了异质性处理效应的存在。因为传统 2SLS 无力应对异质性处理效应,作者构建了另一套 IV 方法,在对异质性保持稳健的前提下,分别识别两个边际上的处理效应。
首先,我们先定义接下来要用到的一系列符号:
处理变量 : 表示上二年制大学, 表示上四年制大学, 表示不上大学。
由处理变量 定义的虚拟变量 ,对于每个个体,有 。
工具变量 ,分别表示个体到最近的二年制大学和四年制大学的距离。
潜在处理变量 ,表示当外生给定 时,学生的选择 ,并由此定义相应的虚拟变量 。
潜在结果变量 ,观测到的实际结果可表示为 ; 表示下沉效应, 表示分流效应。
接下来,我们通过一个离散选择模型展示这个识别策略的基本直觉。在模型中,个体的在三种处理状态下的效用为:
其中,不上大学的效用设为基准, 代表不可观测的个体偏好异质性, 分别表示上二年制、四年制大学的成本,受到 两个外生变量的影响。由此可以推出:
下图在 的二维空间中展示了以上关系:给定 ,若 和 都比成本 和 小,个体就会选择不上大学;如果个体选择上某类大学,则说明相应的效用 较高。 决定了三个区域的分割线。
现在,我们考虑其中一个工具的变动: 由 减小至 。如下图所示,这个变动同时引起了两类依从者的选择变化:二年制大学成本下降,分割线整体向左移动,一部分原本选择不上大学( 依从者)和一部分原本选择上四年制大学( 依从者)的个体,现在变为上二年制大学。
虽然同时存在两类依从者,这个变动允许我们识别出两个潜在结果。首先,注意到当 时,有 ;当 时,有 。由于 依从者的 始终为 0, 变动引起的 变动完全由 依从者贡献。因此,下面的 Wald 比率识别了 依从者不上大学的潜在结果:
类似地, 依从者上四年制大学的潜在结果也可识别:
给定 ,以上两式都可用局部 2SLS 回归直接估计。当然,只有这两个潜在结果不足以得到我们关心的处理效应,我们还需要两类依从者上二年制大学的潜在结果。然而, 的变动不足以区分两类依从者的 :
现在第二个工具 的变动就可以派上用场。看下图, 由 增大至 ,分割线整体向上移动,此时 区域的扩大就完全是来自 依从者的选择变化。
于是,通过 变动引起的 变动,可以得到 依从者的 :
Panel D 和 E 展示了当两个工具的变动趋于 0(边际变动),对应的 依从者的重叠(黄色阴影部分)也趋于相同(得益于两个 IV 都是连续变量)。至此,方程 (5)-(8) 可以还原出所有需要的潜在结果的均值,从而允许我们识别出不同边际上的处理效应。
以上离散选择模型只是为了展示识别策略的基本直觉,实际上并不需要假设选择模型的结构,作者在原文中详细说明了三个必要的假设:
IE:与标准的 IV 假设一样,要求工具变量与所有潜在结果独立:
UPM:推广自标准 IV 的单调性假设,要求没有叛逆者(defier):
CC:平均而言,两个工具变动对应的 边际依从者的 相同:
在实际应用中,这三个假设通常需要在控制一系列变量之后才能成立。在实施这个工具变量估计时,作者采用了一种局部线性设定,在一系列 网格上求解下列核加权最小二乘问题:
其中, 是简约式或第一阶段的被解释变量, 是一个带宽为 的二维核,作者采用的是带宽为 40 英里的 Epanechnikov 核(抛物线形核), 是包含常数在内的一系列控制变量。这个设定对两个工具变量而言是非参数的(局部线性),可以充分捕捉工具变量在不同位置的异质性影响,同时限制控制变量的影响是全局线性的,规避了维度灾难的问题。
根据前面的模型,潜在结果的均值可以用 Wald 比率来直接估计,例如 依从者的 可以表示为下面两个系数之比,本质上是一个局部的 2SLS 估计:
作者提供了一系列证据支持三个基本假设。这里只展示对第三个假设 CC 的检验。如表 6,两个工具对应的 依从者在可观测的能力上(用成绩百分位衡量)是相似的,都在中等水平,支持假设 CC。反观同一个工具 对应的不同边际上的依从者却有较大差距, 依从者的成绩明显更差一些,进一步说明了区分两个处理边际的必要性。
03
结果
在原文中,作者展示了丰富的结果,包括不同的稳健性、异质性检验和一个简单的政策模拟。本文以介绍方法为主,这里只介绍基本结果和局部估计值的外部有效性。
表7 展示了基本结果。总体而言,社区大学的净效应是正面的;分解来看,受到下沉效应影响的学生( 依从者)数量大约是被分流的学生( 依从者)的两倍,且下沉对每个学生带来的好处也超过了分流的负面影响。
表 7 的结果是在两个工具变量的平均值处估计得到的,那么在其他位置的结果是否相似?图 7 回答了这个问题,净效应随着 的增加逐渐下降(左上),但两个处理边际的效应都没有明显变化(左下和右下),净效应的下降实际上来自不同位置依从者的组成变化(右上):离社区大学越远的地方, 依从者占比越少,而被分流却越多。
评点:
这篇论文展示了没有好IV也可以写出很好的实证论文来。到高校的距离是David Card估算教育回报率时用过的IV,今天看来这个IV的排他性假设很难成立。但是这篇论文通过计量方法上的创新,分别估算了两个边际处理效应,做到前人不能做到的事情,回答了美国教育体系中的重要问题,IV好不好就没那么重要了。
Abstract
Two-year community colleges enroll nearly half of all first-time undergraduates in the United States, but to ambiguous effect: low persistence rates and the potential for diverting students from four-year institutions cast ambiguity over two-year colleges' contributions to upward mobility. This paper develops a new instrumental variables approach to identifying causal effects along multiple treatment margins, and applies it to linked education and earnings registries to disentangle the net impacts of two-year college access into two competing causal margins: significant value added for two-year entrants who otherwise would not have attended college, but negative impacts on students diverted from immediate four-year entry.
声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点。
0
推荐