图片来源:
输入文章的标题和摘要后,由chatgpt-4 DALL-E生成
原文信息:
Cappelen, A. W., Kariv, S., Sørensen, E. Ø., & Tungodden, B. (2023). The development gap in economic rationality of future elites. Games and Economic Behavior, 142, 866-878.
01
引入
决策者的决策能力各不相同,因此会做出不同决策质量的选择。然而,要明确判断哪些选择的决策质量较低,哪些决策者的决策能力较差,需要个体层面的高质量数据,并且要求所有相关的权衡都是明确的,以便分类将某些决定视为“错误”。这几乎是不可能的,也因此,退而求其次,研究人员在经济发展研究中通常使用教育、认知和非认知能力,去衡量人力资本,进而去研究人力资本如何影响重要的经济结果。
本文利用实验室实验来评估和衡量经济理性( economic rationality)在不同国家精英人群中的发展差距。为什么可以这样做呢?作者给出的理由是:因为受试者面对着标准的经济决策问题,所以显示偏好理论可以适用。因此,这些得到的衡量经济理性的标准与微观经济理论有着牢固的联系,这种联系使得该衡量标准在经济上可以量化和解释。
本研究的实验对象来自美国最好的大学之一加州大学伯克利分校和非洲最好的大学之一达累斯萨拉姆大学(University of Dar es Salaam)的学生群体,达累斯萨拉姆大学是坦桑尼亚最古老、最大的公立大学,也是整个非洲排名最高的大学之一。坦桑尼亚和美国的样本在社会人口和经济背景上存在很大差异,并且面临着截然不同的经济前景。然而,他们代表了各自社会中未来精英。作为本国顶尖大学的毕业生,加州大学伯克利分校和达累斯萨拉姆大学的学生将对本国的经济和社会产生不成比例的影响。对于坦桑尼亚的学生来说尤其如此,他们中的许多人将在国家经济和政治事务中担任重要职务。因此,这些未来精英的决策能力可能会对整个国家的未来产生巨大的影响。
图 1 维基百科上对于达累斯萨拉姆大学的介绍。
作者向受试者提供了一个经济选择实验,可以高精度地衡量他们选择的经济理性。同时,使用同一个实验得到的数据,作者将经济理性划分为三个维度,分别是:1、决策是否与个人效用最大化相一致;2、决策是否一阶随机占优(FOSD);3、是否符合期望效用理论。(这个衡量经济理性的实验设计,以及实验有效性的证明,实验结果的具体分析方法,如何得出经济理想的指标,基本来源于同一作者在2007年的一篇AER的文章。本推文主要介绍如何从实验设计得到经济理性的直觉想法,具体说明请见下文)。
结果表明,美国受试者在所有三种经济理性指标上平均表现出比坦桑尼亚受试者更高的经济理性水平。那么本文采用的实验变量,在多大程度上会影响、或者解释现实生活重的经济结果呢? 同一作者在 2014年的AER文章表明,个体经济决策体现出来的效用最大化的一致性,在大量多样化样本中(主要是荷兰荷兰语人口)的家庭财富差异密切相关。
此外,在衡量经济理性的实验外,作者测试了受试者的智商(用于衡量认知能力,使用标准的非激励韦克斯勒成人智力量表(WAIS-IV)测试,该测试在过去的几十年里一直在进行迄今为止最常用的智商测试);五大人格特质(包括责任心、开放性、外向性、宜人性和神经质。其中,责任心与高质量经济决策的相关性最强。这些用于衡量非认知能力)。作者发现1、经济理性的发展差距对于控制认知能力、五大人格特质、风险厌恶和一组背景控制变量是稳健的;2、经济理性的发展差距约为认知能力发展差距的一半,这表明关注认知能力的发展差距会高估美国受试者和坦桑尼亚受试者决策能力的差异。
总而言之,在比较富裕国家和贫穷国家的未来精英时,本文发现经济理性方面存在发展差距,并表明现有的认知和非认知能力衡量标准并未完全反映决策能力。
本文篇幅并不长,数据结构和分析方法、数据结果也非常清晰和直观,基本上一看图便知。实验执行过程中具体的招募过程、样本量以及不同受试者之间的描述性统计,也是实证论文的“标准动作”,本推文不做详细介绍。后续本推文会重点说明本文最关键的衡量经济理性的实验是如何设计的,这样的实验为什么可以衡量经济理性,三个指标的经济学直觉是怎么样的。衡量认知/非认知能力/大五人格的方法,也是文献中的经典方法,不是该论文的原创贡献,也因此不做详细介绍,感兴趣的老师和同学们可以参看原文。
02
实验设计和程序
测量经济理性程度的实验
每个实验环节由 50 个独立决策问题组成。在每个问题中,受试者被要求在两个帐户之间分配代币,标记为 x 和 y。x 帐户对应于二维图中的 x 轴,y 帐户对应于 y 轴。每个选择都涉及在可能的代币分配的预算线上选择一个点(表明了budget constraint.)。每个决策问题首先让计算机从一组线中随机、独立地选择一条预算线,之后受试者使用鼠标将计算机屏幕上的指针移动到所需的分配结果。x 和 y 账户中的代币数量决定了每轮决策的收益。在一轮结束时,计算机随机选择帐户 x 或 y 之一,这两个帐户被选择的可能性相同。每个受试者都会收到分配给所选帐户的代币数量。
实验结束时,计算机为每个受试者选择一轮决策,其中每一轮被选中的概率相同,并且受试者将获得他们在所选回合中赚取的金额。收益以代币计算,然后转换为当地货币。在美国,每个代币价值 0.5 美元(USD),在坦桑尼亚(106 名受试者)的低激励组中,每个代币价值 100 坦桑尼亚先令(TZS)(相当于 0.06 美元),就购买力而言,两者大致相当。此外,在坦桑尼亚还有(110 名受试者)被分配进入了高激励组,每个代币价值 1,000 TZS。高-低激励组的收益差距是10倍之多。
图 2 衡量经济理性实验的图形界面。任务非常简单。在 50 个决策中,受试者在随即斜率的预算线上选择一个点。在每一轮结束时,电脑会随机选择 x 或 y 帐户中的一个,其中选择 x 帐户或 y 帐户的可能性相同。在这一轮中,收益由所选账户中的代币数量决定。在实验结束时,计算机将以相同的概率随机选择其中一轮决定受试者在本实验中的收益。决策没有对错之分,在每一轮中,受试者被鼓励努力找到自己喜欢的分配方案。
构建的三种衡量“经济理性”的变量
[1] GARP-rationalizability
显示偏好公理(generalized axiom of revealed preference,GARP)是微观理论的一块基石。在本文的实验设计下,通过收集在每一次不同的预算约束条件下受试者的选择,就可以得到他们的选择是否符合这一公理,用论文中的原话来说,就是If budget sets are linear (as in our experiment), classical revealed preference theory provides a direct test in that choices in a finite collection of budget sets are consistent with maximizing a well-behaved utility function if and only if they satisfy GARP.
作者使用了 Afriat's (1972) 中的指标关键成本效率指数(critical cost efficiency index, CCEI),来衡量被试者决策的一致性水平。这个参数作者命名为e⁎,其范围是[0,1], 它越接近 1,为了消除所有违反显示偏好公理的分配,所需改动的预算集就越少,因此数据就越接近合理化。可以将 CCEI 解释为决策者通过做出不一致的选择而“浪费”了1-e⁎比例 的收入。
[2] FOSD-rationalizability
鉴于究竟是选取x还是y作为回报的可能性相同,因此受试者向更便宜的产品分配较少的代币是一种违反一阶随机占优(FOSD)的选择。换句话说,任何将更少的代币分配给更便宜的产品(相对于 45 度线的预算线而言,选择的分配结果位于较短的那部分线段)的决定,无论风险态度如何,都违反 FOSD ,也可以合理地被视为决策错误。也就是说,受试者在选择这些分配结果时候,未能认识到某些分配会产生明显较低回报的收益分配。作者使用这个标准,继而参考Polisson et al. (2020) 构建了FOSD-rationalizability这一衡量性参数e⁎⁎。
[3] EU-rationalizability
作者承认,有很多很多时候效用函数并不完全是期望效用这样简单的计算方法,例如文献中经常使用的加权预期效用(weighted expected utility)、隐含预期效用(implicit expected utility)和前景理论(prospect theory)等等,符合这些效用假设的分配选择,都满足FOSD。但是本文还是从实验数据中构建出一个变量,衡量在不同轮次之前被试者的选择是否符合期望效用的假设。作者把这个参数称之为EU-rationalizability,并且用e⁎⁎⁎来表示。
图 3 FOSD rationalizability但期望效用不合理EU-rationalizability的例子,来源于Polisson et.al. 2020。在B1 ,B2和B3三条不同的预算约束之下,假如一被试者分别选择了(a,a),(b,b)和(c,d)这样的分配结果,那么这样的结果符合显示偏好公理、也符合FOSD,但是被试者却不是按照期望效用进行决策的,而是给损失的可能性加上了更大的权重。在这种情况下, e⁎⁎⁎<1
最后,同一实验数据中得到的三个衡量“经济理性”的变量之间,有这样的理论性的关系:0 作者强调,所有测试过程和结果变量,都是个人级别的并且纯粹是非参的,0<=e⁎⁎⁎<=e⁎⁎<=e⁎<=1对基础效用函数的参数形式没有做出任何假设。此外,虽然实验设计涉及非战略决策,但实验结果也适用于具有战略成分的决策——在几乎所有博弈论中,每个参与者都被假设最大化效用函数的期望值。因此,EU-rationalizability是战略理性核心的一部分。
03
实验结果简述
三种衡量经济理性的标准
图 4 按国家/地区划分的经济理性得分。包括GARP-理性 (e⁎)、FOSD-理性 (e⁎⁎) 和 EU-理性 (e⁎⁎⁎) 分数和 95% 置信区间。
1) 结果一: 在这三项指标上,美国受试者平均表现出比坦桑尼亚受试者更高的经济理性水平。在附录的图中显示,两个国家的差异既适用于对在公共部门工作表示积极偏好的受试者,也适用于对成为政府雇员持中立或消极态度的受试者。
图 5 高于不同经济理性临界值的受试者比例(按国家划分)
2)结果二: 两国的许多受试者在这些经济理性指标上都取得了高分,其中一些受试者已经接近完全理性行为的理想状态。但是获得高分的受试者比例,美国远高于坦桑尼亚。
经济理性和认知能力
图 6 标准化理性和智商分数的两国国家差异
3) 结果三: 智商测试在两个国家都产生了很大的差异,并且分数与经济理性指标的相关性很弱 (美国样本中,受试者的认知能力和三个经济理性指标的皮尔逊相关系数为 0.061、0.120 和 0.120,坦桑尼亚的皮尔逊相关系数为 0.109、0.165 和 0.159)。这表明该实验捕捉到了智商测试中未反映的决策质量的各个方面。此外,智商分数的平均国家差异远大于经济理性的国家差异,智商测试表明了比显示偏好测试更大的发展差距。
经济理性差异的稳健性
下表报告了相应的OLS分析。23 在第 (1)–(3) 列中,将每个经济理性衡量标准作为因变量进行估计,其中控制了许多受试者的背景变量。在每种情况下,当比较美国受试者和接受低激励组的坦桑尼亚受试者时,观察到坦桑尼亚受试者的估计系数非常显着。注意到,分配到高激励组组的坦桑尼亚受试者在 FOSD 理性和 EU 理性方面比低激励组的受试者表现稍好,但仍然明显差于美国受试者。
在第 (4)-(6) 列中,包含了对大五人格特质的控制。添加这些控制只会增加坦桑尼亚的系数点估计值的绝对值 ,这表明美国和坦桑尼亚受试者之间的经济理性差异并非由人格特质来驱动。
在第 (7)-(9) 列中,我们包含了 IQ 测试的分数。观察到智商与经济理性呈正相关。包含 IQ 分数后,坦桑尼亚的估计系数的绝对值降低了,但系数仍然显着。因此,结果表明,智商反映了经济理性方面的一些发展差距,但不能完全解释观察到的国家差异。
表 1 回归结果--“Tanzania”:坦桑尼亚样本中参与者的dummy variable,“High stakes (Tanzania)”:坦桑尼亚高激励组参与者的dummy variable
04
总结
笔者个人对于这篇文章的结果,主要好奇的地方在于,坦桑尼亚的大学生接触电脑可能会比美国大学生要少,在50次的经济决策实验中,表现出平均更低的经济理性结果,也有可能部分原因是这部分学生对于电脑操作的不熟练。如果在实验时间和经费允许的情况下,对于同一拨的受试者可以进行多轮的测试,这样就能看出在较短时期内,受试者有没有变得更擅长和电脑打交道。如果没有观察到经济理性在短期内的学习行为,那么本文的结果可能会更加可信。
最后,我觉得虽然这篇文章的实验方法和数据分析部分非常简单,但是对于行为经济学和实验室实验感兴趣的研究者,还是可以从中得到以下的启示:
1. 作者使用的实验方法已经在发达国家和发展中国家的实验背景下都进行了测试,结果表现良好。这简单的实验界面和步骤,使其在低收入国家的非学生人群中实施也具有高度的可行性。
2. 本文的重点放在相对而言较为高端的精英大学生群体,但是穷人在日常生活中也会做出许多关键决定,其中不符合经济理性的决策(有一个经济学的俚语表达这样的错误决策:leaving money on the table,把钱留在桌上)可能会产生非常严重的后果。并且有研究认为贫困可能会产生心理后果,导致决策失误和贫困持续存在。研究什么样的干预措施可以用来提高经济决策能力非常重要。
推文作者:贺彦磊,新加坡国立大学商学院,
邮箱:harold.yanlei.he@gmail.com
Abstract
We test the touchstones of economic rationality—utility maximization, stochastic dominance, and expected-utility maximization—of elite students in the U.S. and in Africa. The choices of most students in both samples are generally rationalizable, but the U.S. students' scores are substantially higher. Nevertheless, the development gap in economic rationality in incentivized risk choices between these future elites is much smaller than the difference in performance on a non-incentivized canonical cognitive ability test, often used as a proxy for economic decision-making ability in studies of economic development and growth. We argue for the importance of including consistency with economic rationality in studies of decision-making ability.
声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点。
0
推荐