财新传媒 财新传媒

阅读:0
听报道

原文信息:Stelios Michalopoulos. 2025. “Ethnographic Records, Folklore, and AI.” National Bureau of Economic Research.

原文链接略

01

引言

经济发展的驱动力是什么?诺贝尔奖得主罗伯特·卢卡斯曾言,一旦开始思考这个问题,便难以他顾。数十年来,经济学家们围绕历史与实验两大路径探索答案 。从聚焦国家宏观指标到深入微观田野实验,再到结合地理信息系统(GIS)和卫星数据进行大规模国内“中观”分析,经济学研究的视野不断拓展。然而,要理解欠发达的根源,经济学家必须跨越学科边界,与人类学、民族志学、历史学乃至民间传说研究等领域进行富有成效的对话。本项工作系统梳理了民族志和民间传说记录如何塑造了 21 世纪的文化经济学研究,并开创性地提出了利用大型语言模型(LLM)解锁这些宝贵数据潜力的方法论,为我们理解文化、制度与经济行为的互动提供了全新的视角。

量化民族志的基石与争议

02

论文首先回顾了跨文化人类学先驱George Peter Murdock的卓越贡献及其引发的争议。Murdock 致力于将人类学发展为一门能够使用全球数据集检验理论的比较科学。他主持编纂了多个里程碑式的数据集:

人类关系区域档案 (HRAF): 这是一个庞大的民族志资料库,旨在通过标准化的编码系统(文化材料大纲 OCM)整理全球文化信息,便于比较研究 。尽管 HRAF 内容丰富,但其文本性质限制了经济学家的直接应用。

民族志地图集 (Ethnographic Atlas, EA): 该地图集系统汇编了全球 1200 多个社会群体的 60 多项属性,如生计模式、家庭结构和社会组织等,成为经验导向社会科学家的重要工具 。EA 经过多次修订和扩展,特别是 Giuliano 和 Nunn (2018) 的更新,显著增加了东欧和西伯利亚群体的覆盖,并将其与 Ethnologue 的语言群体匹配,创建了前所未有的全球祖先特征数据库。

标准跨文化样本 (Standard Cross-Cultural Sample, SCCS): 作为 HRAF 的子集,SCCS 包含 186 个精心挑选的社会,旨在通过更科学的抽样设计(如考虑文化区域和避免地理/历史依赖性)来促进假设检验,解决 Galton 问题。

非洲及其人民 (Africa and Its People): Murdock 对非洲大陆的系统研究,特别是其绘制的非洲部落地图,为研究前殖民时期非洲社会奠定了基础。

然而,Murdock 将复杂的民族志描述简化为量化编码的做法,以及其绘制的静态边界图,也引发了诸多批评。批评者认为这种方法忽视了文化的动态性、历史变迁、个体能动性以及区域内部的多样性,甚至可能带有西方中心主义的偏见。例如,亲属关系和居住模式的复杂性难以用简单的编码完全捕捉 。非洲的“部落”概念本身也受到质疑,学者强调前殖民时期身份和边界的流动性,以及殖民统治对现代族群划分的塑造作用。

03

经济学中的民族志

尽管存在争议,Murdock 的数据库为经济学家研究文化和制度的长期影响提供了宝贵起点。早期研究通常将 EA 等数据库中的族群特征与民族语言地图(如苏联的《世界民族地图集》Atlas Narodov Mira,后数字化为GREG;以及基于Ethnologue的世界语言测绘系统 WLMS)结合,在国家层面进行聚合分析。例如,Mauro (1995) 和 Easterly & Levine (1997) 将国家的民族语言碎片化程度与腐败和经济增长联系起来。Gennaioli & Rainer (2007) 发现,历史上拥有更强国家机器的土著群体比例更高的非洲国家,表现往往更好。Nunn (2008) 利用Murdock的非洲地图估计了各国奴隶贸易的强度,揭示了其对当代经济表现的持久负面影响 。  

然而,跨国分析面临自由度有限、潜在混淆变量多等问题。研究重心逐渐转向国内的“中观”层面,利用族群或区域层面的差异进行分析。Nunn & Wantchekon (2011) 发现,历史上遭受奴隶贸易掠夺更严重的族群后裔,如今表现出更低的信任度。Michalopoulos & Papaioannou (2013) 证明,历史上政治更集权的族群所在地,当代的经济发展水平(以夜间灯光衡量)更高。Fenske (2014) 和 Alsan (2015) 分别探讨了贸易和采采蝇(TseTse fly)对非洲前殖民时期国家形成的影响。Enke (2019) 则强调了亲属结构(紧密 vs 松散)对道德体系演化的塑造作用。  

为了更可靠地识别因果关系,经济学家借鉴了微观计量经济学的工具,特别是利用边界进行分析。空间回归不连续设计(Spatial RDD)成为一种流行策略。通过比较地理上相邻但在历史或制度上不同的区域(如跨越族群边界),研究者可以控制地理等平滑变化的因素,更清晰地分离出特定制度或文化遗产的影响。Michalopoulos & Papaioannou (2013) 的研究就是一个例子,他们发现在同一国家内,从集权族群地区跨越到无国家社会地区,夜间灯光亮度会发生不连续下降。反之,通过比较被殖民边界分割的同一族群在不同国家的表现,可以控制族群特定因素,考察国家层面制度的影响。Michalopoulos & Papaioannou (2014) 利用这种自然实验发现,除非靠近首都,否则国家制度对分裂族群地区的经济发展影响有限,凸显了地方治理能力和族群自身特征的重要性。  

学者们也致力于改进民族志数据本身。Michalopoulos (2012) 发现地理异质性是解释民族语言多样性的重要因素,这部分支持了族群身份的深层根源,但也承认现代国家政策的建构作用。一些研究通过挖掘历史文献,为 EA 中的变量增加时间维度(如国家历史的长期暴露),或独立构建 EA 缺失的变量(如分节世系制度、年龄组与亲属群体、求雨仪式等)。Bahrami-Rad 等人 (2021) 通过将 EA 社会与当代人口健康调查(DHS)中的个体族群身份联系起来,发现 EA 中的历史记录与后代自我报告的特征之间存在显著的相关性,验证了 EA 的可靠性。

民间传说与历史叙事

04

尽管民族志数据功不可没,但它往往缺乏对过去社会文化结构(如价值观、规范、信仰)的直接衡量。这使得将历史事件与当代文化和经济结果联系起来的论证链条缺少了关键一环。Michalopoulos & Xue (2021) (简称 MX) 开创性地将人类学家 Yuri Berezkin 编纂的全球民间传说母题索引引入经济学。该索引包含来自 958 个口述传统的 2564 个母题(故事中的情节或意象)。  

MX 证明了民间传说的巨大潜力:

验证与补充: 民间传说母题可以反映群体的物理环境(如地震、作物)和部分民族志特征(如政治复杂度、畜牧业比重),从而交叉验证并补充 EA 数据,甚至有助于填补 EA 中的缺失值。由于 Berezkin 的目录在欧洲和亚洲的覆盖面比 EA 更广,它可以显著增加这些地区的研究样本。  

量化新维度: 民间传说可以提供 EA 完全缺失的维度信息,例如通过量化贸易相关母题来描绘前工业时期市场经济的范围。学者们已利用该目录量化了禁欲、复仇、魔法、个人主义/集体主义等多种文化特征。 

提取价值观: 由于母题通常通过象征和隐喻传递信息,直接计数难以捕捉抽象价值观 。MX 采用人类评分的方法,量化了母题中体现的风险态度(挑战成功 vs 失败)、信任(骗子受惩罚 vs 未受惩罚)和性别规范(刻板印象的体现),并将这些指标与当代经济行为联系起来。例如,挑战更常被克服的传说与更高的创业活动相关,惩罚反社会行为的传说与更高的社会信任度和 GDP 相关,性别偏见传说则与女性劳动参与率、农业分工等相关。Michalopoulos & Rauh (2024) 甚至发现,电影情节与当地民间传说越相似,其市场表现越好,证明了这些古老叙事强大的文化生命力。   

05

人工智能新方法

MX 的人类评分方法虽然有效,但成本高、耗时长且难以扩展。论文的核心创新在于提出了一套利用大型语言模型(LLM,如 GPT-4o)自动从民间传说母题中提取价值观和规范的方法论。  

该方法论的关键步骤包括:

 建立基准: 首先需要一个由人类评分者创建的基准数据集。  

 设计 Prompt: 精心设计向 LLM 提问的指令(Prompt),明确要求其判断特定文化特征(如性别刻板印象、反社会行为的结果、挑战的结局)是否存在,并给出分类和解释。 

图灵测试: 为了评估 LLM 输出的可靠性,论文提出了一种特殊的图灵测试。该测试比较 LLM 的答案与人类评分者群体(排除一个评分者后的)众数答案的一致性。如果 LLM 的一致性落入人类评分者之间一致性的范围内,则认为其通过了测试,表明其输出与人类判断难以区分。 

迭代优化: 如果 LLM 未通过测试,可以通过分析其错误原因(通常借助其自己提供的解释)来调整和优化 Prompt(即 Prompt Engineering),例如更清晰地定义概念或改变提问方式。  

论文通过复现 MX 关于性别规范、反社会行为和挑战态度的研究,展示了该方法的有效性。结果表明,最新版本的 LLM (GPT-4o) 在大多数任务上能够通过图灵测试,其生成的文化指标与人类评分高度相关(相关系数在 0.63 到 0.93 之间),并且在经济学回归分析中产生了与人类评分相似甚至更稳健的结果。例如,使用 LLM 评分的男性偏见传说与当代女性劳动参与率呈显著负相关,惩罚反社会行为的传说与当代信任度和 GDP 呈正相关,而挑战失败的传说与风险规避和较低的创业/创新水平相关。LLM 不仅大大降低了成本(从数千美元降至几美元)、缩短了时间(从一个月缩短到半小时),还为大规模量化历史文本中的文化信息开辟了道路。  

总结

06

本项研究不仅系统回顾了民族志和民间传说数据在经济学中的应用历程,更重要的是,它展示了大型语言模型如何能够成为连接人文社科领域与量化分析的强大桥梁。通过将这些蕴含丰富文化信息的非结构化文本数据(无论是民族志、民间传说,还是历史文献、访谈记录)转化为可分析的变量,LLM 有潜力彻底改变我们研究文化起源、演变及其经济后果的方式。  

未来,我们可以期待看到更多利用 LLM 分析各类文本和图像数据(如艺术品、老照片)的研究涌现,进一步加深我们对人类行为、社会规范和历史进程的理解。当然,LLM 的应用仍处于早期阶段,关于最佳实践、数据偏差、因果推断等问题仍有待深入探讨。但这无疑是一个激动人心的开端,预示着文化经济学乃至整个社会科学研究即将迎来一个由数据和算法驱动的新纪元。

 Abstract 

In this Handbook chapter, I examine how integrating ethnographic and folklore records has shaped research on culture and economics in the 21st century. Advances in text analysis techniques and the incorporation of historical and satellite data have transformed the field. I explore how George Peter Murdock’s ethnographic contributions and Yuri Berezkin’s seminal folklore motif index have been utilized to shed light on the roots of comparative development. I conclude by proposing a methodology for leveraging Large Language Models to extract cultural insights from folklore motifs, demonstrating how ancestral narratives can complement ethnographic records and offer valuable perspectives on societal norms and the historical forces shaping economic behavior today.

推文作者:罗朗,武汉大学本科生,邮箱:langluo.sociology@ 

声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点

话题:



0

推荐

香樟经济学术圈

香樟经济学术圈

1768篇文章 3小时前更新

香樟经济学术圈由中国社科院、哈佛大学、多伦多大学等国内外青年经济学者发起。此平台主要推送国外经济学领域经典前沿论文,发布国内外经济学相关资讯,以及香樟经济学者圈的相关活动公告。 期待能够对中国经济学研究和国家政策产生一定影响。微信订阅号:camphor2014。

文章