财新传媒 财新传媒

阅读:0
听报道

图片来源:百度图片

原文信息:

Pascal Flurin Meier, Raphael Flepp, Philippe Meier, Egon Franck, 2022, “Outcome bias in self-evaluations: Quasi-experimental field evidence from Swiss driving license exams”, Journal of Economic Behavior and Organization, Vol.201, 292-309.

 

少年得志毕竟少数,大器晚成方为常态。

 

早经受一些挫折,并非坏事。它会磨炼我们的意志,让我们的内心更加强大,厚积薄发,待到成功之时,心态成熟,能力稳定,基础牢靠,自然也更能守住成功。

 

01

引言

结果偏差(outcome bias)是一个普遍现象。它是指人们在进行自我评估时,更看重决策的结果而不是其信息内容。以往文献关于结果偏差的证据主要来自于第三方的评估设置,但对自我评估的结果偏差以及其是否会扭曲该领域的后续决策仍然缺乏全面了解。

 

论文通过调查年轻人在瑞士驾照考试中的行为填补了上述空白,主要的边际贡献如下:首先,为自我评估中的结果偏差提供了新的现场证据,并且探究了结果偏差所带来的后果;其次,样本数据近乎涵盖了全部的瑞士年轻人口,结论具有普适性;最后,准自然实验使得关于因果效应的识别更为干净和清晰。

 

这篇论文具有重要的现实意义:首先,证实了自我评估的结果偏差存在于整个群体中,并不局限于某些亚群体;其次,现实生活中存在很多连续性的考试。因此,自我评估中的结果偏差很可能会影响个人的职业路径。最后,为了减轻结果偏差的不利后果,备考人可以使用去偏倚策略。一个重要的典型事实在于:“勉强通过考试”很可能是先前“勉强不及格”的结果。

 

研究设计

02

(一)机构设置和数据

这篇论文使用的是瑞士20多岁普通人群的首次驾照考试数据。在瑞士,成年人在成功通过理论考试和实践考试后就可以驾驶机动车了。理论考试是采用无纸化进行的50个选择题,学员的错题数量小于或者等于15个,即视为通过理论考试;未通过考试的学员需要重新预约并且支付新的考试费用进行重考。通过理论考试的学员则会被颁发一张有效期为24个月的学习许可证,持有这个证明即可在教练的陪同下驾驶汽车,在上满8个小时的训练课程后,学员可以参加实践考试。实践考试是一项60分钟的驾驶测试,测试时会有安全员陪同,同时根据学员的表现判定其是否通过考试。同样的,未通过实践考试的学员需要重新学习、预约并且支付新的考试费用进行重考。通过实践考试的即可喜提驾照。和中国一样,必须先通过理论考试才能进行实践考试。

 

瑞士一共有26个州,各州的驾照考试流程一致,但是各州在实践考试中的判定标准有一些细微差别。这篇论文使用的是其中三个州的数据(记为A、B、C),涵盖了44486名学员理论考试和实践考试结果的完整数据,统计描述如下图所示:

其中,PractExam指的是学员是否在第一次通过实践考试;Objections指的是学员在考试不通过后进行异议的数量;FirstAttemptFailed指的是学员是否在第一次未通过理论考试;Errors指的是学员第一次在理论考试中的错题数量;Age指的是学员参加理论考试时的年龄;Gender指的是学员的性别;Swiss指的是学员是否是瑞士人。下图是学员在第一次理论考试中错题数量的直方图:

可以看到,大多数学员的错题数量相对较少,错题数量平稳地逐渐减少。

 

在论文研究的制度背景下,理论考试和实践考试的不通过均会带来金钱和非金钱的后果。具体来说,在金钱方面,理论考试的补考费用是38美元,实践考试的补考费用是142美元(不上额外的驾驶课程)~870美元(上额外的驾驶课程);在非金钱方面,理论考试补考则需要再等待37天,同时学员还需要承担不可忽视的声誉成本(理论考试很简单,通过率为86%),实践考试补考则需要再等待50天。所有这些成本对处在工作压力较大、收入较低时期的年轻人而言不可忽视。

 

(二)方法策略

这篇论文采用断点回归的方法进行因果识别:比较理论考试中“勉强及格”和“勉强不及格”的考生在后续的实践考试中是否通过,从而探究结果偏差对于自我评估的影响。理论上而言,“勉强及格”的考生和“勉强不及格”的考生实际上都没有为考试做足准备,但是前者会在理论考试中收获“正面的信号”,后者则会收获“负面的信号”,这就造成了自我评估中的结果偏差。

 

为了实证检验学员在经历不同结果后的未来表现,这篇论文主要依赖于三组结果。首先,图形化的研究在阈值周围的不连续性的存在,在理论检验中误差数的非重叠箱中绘制了因变量的局部样本均值;其次,使用参数方法和非参数方法,进行断点回归的定量分析,平衡好灵活性和简单性,从而保证结论的稳健性;最后,使用更详细的数据进行估计,以更精确地识别因果中的机制。

 

基准回归方程如下:

其中,观察值由核函数加权,带宽由数据驱动,均方误差(MSE)最优。在这里,最感兴趣的是FirstAttemptFailed的系数β,它表示的是理论考试不及格对未来实践考试的影响。f是errors的适当的多项式函数,它以及格线(ē)为中心。Xi是一系列的控制变量(Age、Gender、Swiss)以及州的固定效应。

 

03

结果

(一)主要结果

左图为以0~30个错题数量为窗口进行拟合的二阶多项式,右图为以10~20个错题数量为窗口进行拟合的一阶多项式。两张图均清晰的反映了在通过理论考试门槛附近的不连续性,表现出了理论考试“勉强不及格”对随后实践考试的积极效果:在理论考试中“勉强不及格”的学员比“勉强及格”的学员在之后更容易通过实践考试。

接下来,作者采用非参数方法和参数方法进行了定量分析。两种方法的核心解释变量FirstAttemptFailed的系数β均显著为正,与从拟合图像中所得出的结论基本一致。

此外,作者还进行了调整带宽、调整内核函数、调整多项式次数、匹配实验组和对照组样本、安慰剂检验、替换核心解释变量、替换被解释变量等一系列稳健性分析,结果与基准回归的结论基本保持一致。感兴趣的读者可以阅读文章的这一部分,在此不加赘述。

 

(二)机制分析

基准回归的结果表明,在理论考试中“勉强不及格”的学员比“勉强及格”的学员在之后更容易通过实践考试。在此,作者提出了两种机理解释:一方面,理论考试中“勉强不及格”的学员需要进行补考,在补考的备考中,他们积累了更多知识,这些知识有助于他们通过实践考试;另一方面,“勉强不及格”给学员们带来了不好的结果偏差,使得他们在实践考试的备考中更加努力,最终功夫不负有心人,通过了实践考试。

 

为了验证究竟是什么机理在其中发挥了作用,作者利用实践考试中不通过的原因进行了更详尽的分析。具体而言,实践考试中不通过的原因涵盖处理、视觉、环境、战术、动态、机动和控制等七个大方面,这七个大方面又涵盖了多项单独的小方面。A州和B州采用了相同的分类清单,C州与其他两州则有一些细微上的不同。这篇论文考虑了涵盖多项单独小方面的大方面,借鉴程序性知识的学习以及技能的获得两个理论进行了探究。

理论性考试补考所带来的知识积累,这在实践考试中表现在机动和控制两个大方面(这两项与理论知识更密切相关);结果偏差导致学员在实践考试中更加努力,根据相关理论,这会使得他们更容易同时处理两个及两个以上事情(反复练习使得他们更有经验),这在实践考试中表现在视觉、动态和战术三个大方面。作者进行了实证检验,结果如下图所示,可以看到“勉强不及格”的学员在实践考试中要比“勉强及格”的学员更少犯视觉和战术两类错误,这与第二种机制的解释相一致。在机动和控制两个大方面,两组学员则表现得几乎没有差异,即补考的备考中积累的知识,并不会有助于通过实践考试,第一种机制的解释并不成立。

 

结论

04

这篇论文证实了自我评估中的结果偏差:第一次“勉强通过”驾照理论考试的学员通过实践考试的概率明显低于第一次“勉强不通过”驾照理论考试的学员。根据实践考试更详细的数据,文章发现“勉强不通过”的学员会在实践考试中拥有更丰富的经验,这使得他们能够更好地管理双任务环境。作者将其阐释为结果偏差所造成的后续准备努力程度的不同。

 

总的来说,“勉强不及格”会对个人产生激励作用,提高个人之后的努力水平。

 

当然,论文也有一些不足之处:无法干净的识别出“勉强通过”/“勉强不通过”理论考试的学员之后所做的行为调整;无法推断任何一方/双方调整策略的程度,仅仅识别的是两组之间的相对差异,这表现出的是至少有一组受到结果偏差的影响。未来的研究可以从探究造成结果偏差的因素切入,这有助于更好理解。毕竟结果偏差在日常的决策中很普遍(我们每天要做很多的自我评估),这对个人的职业道路具有极大的影响。

 

05

写在最后

“早失败,早成功”,早在迭代的过程,而胜在时机。

 

初心易得,始终难守。人生是长跑,与其揪着过往不放,还不如奋力奔跑,争取在青春的赛道上跑出当代青年的最好成绩。

 

Abstract

Exploiting a quasi-experimental field setting, we examine whether people are outcome biased when self-evaluating their past decisions. Using data from Swiss driving license exams, we find that candidates who narrowly passed the theoretical driving exam are significantly less likely to pass the subsequent practical driving exam – which is taken several months after the theoretical exam – than those who narrowly failed. Those candidates who passed the theoretical exam on their first attempt receive more objections regarding their momentary, on-the-spot decisions in the practical exam, consistent with the idea that the underlying behavioral difference is worse preparation.

 

推文作者简介:杨杰,中国人民大学应用经济学院硕士生。推文可能存在纰漏与不足,非常欢迎大家批评和指正!

交流方式:yangjie__2000@163.com

 

声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点。
 

 

话题:



0

推荐

香樟经济学术圈

香樟经济学术圈

1297篇文章 1次访问 6小时前更新

香樟经济学术圈由中国社科院、哈佛大学、多伦多大学等国内外青年经济学者发起。此平台主要推送国外经济学领域经典前沿论文,发布国内外经济学相关资讯,以及香樟经济学者圈的相关活动公告。 期待能够对中国经济学研究和国家政策产生一定影响。微信订阅号:camphor2014。

文章