财新传媒 财新传媒

阅读:0
听报道

图片来源:Dorothea Lange《移民的母亲》

原文信息:Lagakos, David, Stelios Michalopoulos, and Hans-Joachim Voth. 2025. "American Life Histories." NBER Working Paper No. 33373. National Bureau of Economic Research.  

所谓发展,归根结底,是赋予众生更广阔的天地,去自主追寻并珍视那些闪耀着生命光彩的作为。

——阿米蒂亚·森

01

时光的低语

想象一下,如果人生真有一场“终场面试”,让我们在暮年有机会为后人留下一段生命简史,我们会诉说些什么?哪些经历定义了我们?什么又给予了我们生活的意义与满足?

为了回答这些看似缥缈的问题,这项研究追溯了一段尘封的历史。在风云变幻的1930年代,美国正经历着大萧条的阵痛与罗斯福新政的变革。在此期间,美国政府启动了一项非凡的计划——联邦作家计划,它不仅为失业的作家们提供了工作,更留下了一份独一无二的文化遗产——《美国生活史》。这个项目组织作家们深入美国各地,采访数千名普通老人,鼓励他们讲述自己的故事。没有预设的剧本,没有刻意的引导,目标是绘制一幅“自下而上”的美国社会画卷,一面映照普通人真实生活的镜子。这批珍贵的口述历史,为我们提供了一个前所未有的窗口,去窥探那个时代个体生命中的挣扎、希望、幸福与意义。

从《美国生活史》这些充满个性、细节繁杂且风格各异的叙事中系统性地提炼人生意义与幸福感的深刻洞见,是本研究的核心挑战与首要目标。传统方法难以捕捉其深层内涵,而强大的大型语言模型(LLMs)又存在捏造信息、带有偏见或误读复杂情感的风险。因此,本研究致力于开创一套严谨、创新的研究方法,巧妙融合前沿LLM技术与细致的人工验证及多阶段评估,旨在打造一把可靠、透明的“钥匙”,用以解锁这些复杂历史文本中蕴藏的人类情感与动机。拥有这套工具后,研究的第二个目标便是深入探索《美国生活史》这一富饶矿藏。研究者运用新方法系统分析这些大萧条后的生命回忆录,力图回答核心问题:究竟是什么(家庭、工作、社区等)带来了意义与幸福感?关键的人生转折点是积极还是消极?回顾一生的整体满意度如何?以及这些体验是否因性别、种族、阶层、地域和迁移背景等社会因素而呈现不同模式?

尘封的档案

02

1. 诞生于特殊年代的宏伟计划:联邦作家项目与《美国生活史》故事

故事要从罗斯福新政时期说起。为了缓解大萧条带来的失业危机,美国政府启动了众多“以工代赈”项目,其中一项颇具人文色彩的便是“联邦作家计划”(Federal Writers' Project, FWP)。这个计划的初衷并非纯粹的文学创作,而是优先为失业者提供工作岗位,其规模虽不及大型基建项目,却也一度雇佣了约6500人,被誉为“史上最大的文学工程”。FWP产出了包括著名的各州旅行指南在内的多项成果,但其中一项尤为独特且与本研究息息相关的,就是《美国生活史》(American Life Histories)。这个子项目的目标极具前瞻性:记录下普通美国老年人的生活经历,让他们亲口讲述自己的故事。项目负责人强调,在谈论民主的时代,“让人民自己说话”至关重要。因此,采访者们仅获得极少的指导,没有固定的问卷或脚本,旨在捕捉最真实、最鲜活的个体记忆,汇集成一部“自下而上”的美国社会史诗。

2. 从尘封档案到研究样本:筛选与界定

这些珍贵的访谈记录后来被美国国会图书馆数字化并公之于众,总计约2900份文档。然而,并非所有文档都是完整的生活史,其中也混杂了地方传说、事件描述等。为了聚焦于个体生命历程,研究团队首先进行了细致的人工筛选,辨别出1799份真正的生活史。随后,他们又合并了同一叙述者的重复或相似记录,最终确定了1478份独特的个人叙事。为了保证分析的质量和可比性,研究进一步聚焦于那些叙述者超过18岁、篇幅在500到10000词之间的记录,最终形成了包含1335份生活史的核心研究样本,这些访谈绝大多数完成于1938年至1939年间。

最后,研究者严谨地将《美国生活史》的样本特征与1940年的美国人口普查数据进行了对比。结果显示,虽然在年龄、性别、城乡比例上存在一定偏差,但当调整州分布权重或聚焦于特定可比人群(如50岁以上户主)时,样本在种族、移民身份、城乡分布等方面与普查数据的相似度显著提高。职业分布也基本反映了当时的社会状况。因此,尽管并非完美的随机抽样,但《美国生活史》确实在很大程度上实现了其初衷——“描绘出一幅关于社会结构与运作的公允图景”,为我们理解那个时代的美国提供了一个极其宝贵且相对可靠的资料来源。

03

大语言模型

1. 精准提问:用“是/否”问题作为探索的起点

面对浩如烟海、细节纷繁的生活故事,研究者们首先采取了一种看似简单直接,实则巧妙设计的策略:提出一系列具体的“是/否”问题。这种方法的优势在于其清晰度和透明度——对于人类读者而言,判断一个叙述是否提及特定事件或态度相对容易;对于大型语言模型(LLM)来说,这也提供了一个更明确的任务目标。当然,这种方法的局限性在于需要研究者预先设定好关注的焦点,无法涵盖叙事中所有可能的信息维度。但作为探索的第一步,它为后续更复杂的分析奠定了基础。

研究者精心挑选了七个具有代表性的“高层次”特征进行提问,涵盖了人生经历的不同方面:(一)是否提及“父母亡故”?(二)是否提及“年幼时父母亡故”?(特意设计两个相关问题以测试LLM的辨别精度)(三)是否提及“贫困导致辍学”?(四)“宗教信仰是否重要”?(五)“努力工作是否重要”?(六)“是否展现出随和的个性”?(七)“是否对他人的困境表现出共情”?这些问题的选择兼顾了客观事件(如父母去世)与主观态度、微妙情感(如共情),为评估不同分析方法的性能提供了一个全面的试验场。

2. 人机同台竞技:设计严谨的比较框架

为了验证GPT-4能否准确回答这些问题,研究者们设计了一场严谨的“人机对决”。他们随机抽取了300份生活史,邀请了6位人类研究助理进行阅读和判断。与此同时,他们开发了一套创新的“分块处理”方法来训练GPT-4进行同样的任务:

认识到直接处理长篇叙事对LLM的挑战,研究者将每份生活史分割成约150词的小“块”(chunks)。对每一个文本块,GPT-4被要求回答相应的“是/否”问题。然后,通过设定一个“阈值”(例如,如果超过X个文本块回答“是”,则整个文档判定为“是”),将零散的块级判断整合成对整个叙事的最终判断。这个阈值经过精心校准,使得GPT-4回答“是”的总体比例尽可能接近人类读者的平均水平。作为对比,研究者还使用了传统的基于关键词和词典(如LIWC)的方法来回答部分问题,同样校准了阈值。

如何评判GPT-4的表现?研究者们巧妙地运用了图灵测试的核心思想,进行了一场测试。由于没有绝对的“标准答案”,他们将多位人类读者判断的众数作为基准。然后,他们计算了每一位人类读者以及GPT-4(和词典方法)与这个人类众数答案的一致率(准确度)。关键的检验标准是:GPT-4的准确度是否落在了人类读者准确度的区间之内? 如果是,那么在这个特定问题上,GPT-4的表现就与人类读者无法区分,可以认为它通过了测试,成为了一个合格的“数字研究助理”。

结果表明(如图1),直接让GPT-4阅读全文来回答“是/否”问题,效果非常差,甚至不如随机猜测。而传统的词典方法也常常“不及格”。然而,当采用了150词分块处理的方法后,GPT-4的准确度大幅提升,成功地通过了所有七个问题的图灵测试!这证明了对于这类复杂的、需要理解上下文和细微情感的任务,将长文本分解是LLM取得成功的关键策略。有趣的是,更小的分块(如100词)反而效果下降,说明文本分块并非“越碎越好”。在所有问题上,经过优化的GPT-4方法,其准确度都稳稳地落在人类研究助理的表现范围之内,甚至接近人类的平均水平。这表明,在特定条件下,LLM确实能够以与人类相当的可靠性来完成这类相对复杂的文本信息提取任务。

图1  图灵测试:AI vs 人类

3. 规模化应用与模式发现:洞察美国社会

既然验证了方法的可靠性,研究者便将这套基于GPT-4的“是/否”问答系统应用到了全部1335份生活史中,极大地提高了效率。分析结果揭示了诸多有趣的模式。例如,“努力工作很重要”在叙事中被提及的频率很高(约三分之二),而“宗教很重要”则相对较低;大多数人都展现了随和与共情的一面;女性更倾向于提及父母亡故(尤其是年幼时)、贫困导致辍学、宗教的重要性以及展现随和/共情,这可能反映了她们作为“家庭守护者”的角色以及在那个时代面临的特定困境;非白人更强调宗教的重要性;社会经济地位(SES)较高的人更少提及因贫困辍学,也更少强调“努力工作”本身的重要性(可能工作性质不同),而SES较低的人则相反;移民极其看重努力工作;国内迁移者更少提及因贫困辍学,暗示迁移可能带来了更好的教育或发展机会。

生命意义的来源

04

1. 从开放式回答到系统化分类:挑战升级

研究者们首先让人类读者和GPT-4面对一个更具挑战性的任务:开放式地识别叙事中所有能体现幸福感和意义来源的主题。初步尝试直接向GPT-4提问发现,LLM能够生成看似合理的回应,例如识别出“为孩子谋福祉”、“母亲的影响”等与家庭相关的熟悉主题。但它也能捕捉到一些不那么传统、却同样深刻的来源:比如亲近自然的宁静、年轻时冒险的激动(如西部拓荒、海难余生)、信仰的指引、教育带来的改变,或是历经磨难后的坚韧本身。然而,开放式回答也带来了新的难题:LLM生成的答案五花八门,表述各异(例如“为孩子谋福祉”和“家庭与供养孩子”高度相似),且其准确性难以保证。

面对开放式问题的复杂性,研究者们借鉴了计算机科学中的“代理工作流”(agentic workflow)或称“多阶段评估”(multi-stage assessment)的思路,设计了一套更为精密的LLM使用策略,旨在提高答案的质量和可靠性:首先,通过一个简单的“是/否”问题判断叙事中是否包含任何积极意义的来源。然后,对包含积极来源的文本,依然采用分块处理(例如500词一块)的方式进行开放式提问。在第一轮开放式提问时,要求LLM不仅给出答案(主题、理由、证据引文),还要对其判断给出一个1到10的自信度评分。接着,调用另一个LLM实例(或者同一模型的不同会话),扮演“质检员”的角色。它的任务是审查第一轮LLM给出的答案,判断其“理由”和“证据引文”是否真的支持所识别出的“主题”。最终被采纳的答案,必须同时满足两个条件:通过第二轮LLM的质量检查,并且其自信度评分达到预设的阈值(例如,研究发现阈值设为8时,能在精确率和召回率之间取得最佳平衡)。研究者再次运用“图灵测试”的变奏版来检验这套复杂方法的有效性。他们让人类读者也对部分样本进行开放式主题识别,并将结果归入预设的几大类别(如家庭、工作、宗教、教育等)。然后比较经过多阶段评估和双重过滤后的LLM答案,在这些核心类别上与人类读者众数答案的一致性。

实验结果再次印证了方法的有效性,但也揭示了开放式问题的更高难度(如图2):直接让LLM回答开放式问题,即使分块处理,其准确度也远低于人类水平,无法通过图灵测试。只有结合了分块处理、多阶段评估(质检)、自信度评分过滤等多种策略后,LLM的答案才最终能够在多个核心主题上达到或接近人类读者的表现水平,通过了这场更为严格的图灵测试。这凸显了对于需要深度理解和推理的复杂任务,简单调用LLM是远远不够的,精心的流程设计和验证至关重要。

图2  图灵测试:工作/事业作为生命意义来源

2. 揭示意义来源的多样性:工作与社区的突出地位

将这套经过严格验证的方法应用到全部生活史样本后,研究者们绘制出了一幅关于1930年代美国人生命意义来源的丰富图景(如图3)。令人惊讶的是,“工作与事业”成为了最常被提及的意义来源(49%),紧随其后的是“社区与服务”(45%),然后才是“家庭与人际关系”(39%)。这与以往一些研究(如著名的哈佛成人发展研究)强调人际关系至高无上的结论形成了有趣的对比,凸显了在那个时代背景下,工作本身——无论是技艺的掌握、职业的成就、经济的独立,还是服务他人的价值感——对于个体生命意义构建的核心作用。此外,“亲近自然”(16%)、“冒险与探索”(14%)、“坚韧与克服挑战”(13%)、“教育与学习”(13%)也构成了重要的意义来源。“宗教信仰”(11%)和“其他”(10%)则相对提及较少。


 

图3  幸福、满足、意义或目标的来源

不同群体在意义来源上也呈现差异。例如:女性更倾向于从家庭、社区、宗教和坚韧中找到意义。高社会经济地位(SES)的人群更看重工作带来的意义,暗示好工作不仅收入高,精神回报也更丰富。移民也更强调工作的价值。非白人更突出信仰的力量。国内迁移者则更看重教育和冒险带来的提升。

研究还进行了一项有趣的探索,将叙述者的祖籍国民间传说故事特征(利用Michalopoulos & Xue (2021) 的数据)与其生活意义来源联系起来。结果发现:来自那些民间故事中充满克服挑战情节的文化背景的人,在自己的生活叙事中也更倾向于从“坚韧与克服挑战”中找到意义。在那些民间故事中性别角色分工男性占主导的文化背景下,女性更少从工作中获得意义感,而男性则更多。这暗示着深层的文化叙事可能潜移默化地影响着个体对生命意义来源的认知和选择。

05

关键转折点

1. 人生路口的抉择与际遇:识别关键转折

《美国生活史》的叙述者们普遍提及了塑造其人生的“关键转折点”(Critical Junctures)——那些难以忘怀的决定或事件,如同生命河流中的航标与险滩。研究者运用GPT-4系统地识别了这些被赋予特殊意义的时刻。分析发现,超过5600个转折点被提及(平均每份叙事4个以上),其中职业/就业(56%)、迁移/定居和家庭/人际关系是最常经历变动的领域,反映了工作变迁、社会高流动性及家庭事件的核心作用。教育、财务冲击、健康和历史事件等也在约五分之一的叙事中扮演重要角色。

研究人员进一步利用GPT-4评估了这些转折点在叙述者回忆中的正负面情感色彩。结果显示,与职业、迁移、社区、教育、文化相关的转折往往被积极回忆,暗示着机遇与成长。相反,财务冲击、健康问题和自然灾害则几乎完全被视为负面,凸显了困境带来的痛苦记忆。家庭与人际关系则呈现出复杂的两面性,尽管有积极回忆,但负面事件(如亲人离世)在数量上更为显著,且对女性影响尤深。值得注意的是,极少有转折点被描述为纯粹中性,表明这些关键节点在记忆中通常附带着强烈而明确的情感倾向。

2.  群体视角下的转折差异:社会结构的影响

当把这些转折点的类型和正负面影响,与叙述者的社会背景(性别、种族、社会经济地位、城乡、迁移经历等)联系起来分析时,深刻的社会结构性差异浮出水面(如图4):

(一)性别差异显著:女性的叙事中,负面的家庭相关转折点(如父母早逝成为人生分水岭)的提及率远高于男性(近三倍),她们在职业和迁移方面的负面经历也更多。这再次印证了她们作为“家庭守护者”所承担的重负,以及在社会经济领域可能面临的更多障碍。

(二)种族与文化:非白人更倾向于提及与文化认同相关的积极转折(提及率是白人的十倍!),以及积极的社区和个人成长经历。这可能反映了他们在特定历史背景下,通过文化和社群寻求力量与认同的独特路径。同时,他们的叙事中较少提及天气相关的负面冲击和迁移事件。

(三)社会经济地位(SES):高SES人群经历了更多积极的职业和教育转折,而负面的财务冲击则更少,清晰地反映了社会阶层带来的机遇差异。

(四)城乡与迁移:城市居民经历了更多职业相关的转折(无论正负),反映了城市劳动力市场更高的流动性。移民和国内迁移者则如预期般,经历了更多与迁移相关的转折,并且国内迁移者在职业、迁移和教育方面有更多积极的转折,暗示了迁移往往是为了追求更好的发展。

图4  不同子群体的积极与消极关键转折点优势比 

5. 意义与转折的交织:它们如何相互印证?

最后,研究者探索了“生命意义来源”与“关键转折点”之间的联系。结果显示,两者并非孤立存在,而是相互关联、相互印证的:例如,经历过积极职业转折的人,极大概率会在叙事中表达从工作中获得意义感。那些从宗教信仰中找到慰藉的人,也更可能提及经历过负面的健康冲击或积极的个人成长转折,这与宗教在应对苦难和促进心灵成长方面的作用相符。遭遇负面财务冲击的人,则更少地从工作、家庭或社区中找到幸福感,显示了经济困境对个体多方面幸福感的负面溢出效应。

你幸福吗?

06

1. 量化幸福感:用七分制标尺衡量人生满意度

在分别探究了生命意义的来源和人生的关键转折点之后,研究人员将焦点汇聚到了一个更为整体性的问题上:回首一生,这些叙述者究竟有多幸福? 由于无法直接询问当事人,研究者们再次展现了其方法论上的巧思,试图从字里行间“推断”出一种可度量的、回顾性的生活满意度评分。

研究者们设定了一个从1(极度不幸福)到7(极度幸福)的评分体系,并利用最新的前沿大型语言模型(GPT-4o)对每一份生活史进行整体评估。他们为LLM提供了详细的评分标准,指导其根据叙事的整体基调、关键事件的情感色彩(是充满悲伤、沮丧,还是洋溢着喜悦、满足)来打分。初步结果显示,LLM给出的评分分布在1到6分之间,平均分为4.31。这意味着,在LLM“眼中”,大多数叙述者的人生回顾偏向积极,但也存在着相当大的个体差异。

然而,我们能信任LLM给出的这个“幸福分数”吗?为了回答这个关键问题,研究者进行了两项核心验证工作:(一)内部一致性检验与传递性测试:幸福感的比较应该具有传递性,即如果A比B幸福,B比C幸福,那么A应该比C幸福。研究者随机抽取叙事组成三元组,让LLM直接比较两两之间的幸福程度,并检查是否存在矛盾。结果显示,在绝大多数(情况下,LLM的直接比较结果与基于其独立评分得出的排序是一致的,证明了其判断具有良好的内部逻辑自洽性。(二)外部一致性检验:更关键的是,LLM的评分是否与人类的判断一致?研究者选取了119份生活史,首先由LLM生成了这些故事的摘要(以便人类读者能在合理时间内处理)。然后,他们邀请了7位新的人类研究助理,对这些摘要进行1-7分的幸福感评分。人机对比的结果令人振奋(如图5):由于人类读者之间的评分并非完全一致,存在一定的分歧,而最新的GPT-4o表现极其出色,其评分与人类众数评分的偏差程度,略高于表现最好的人类读者,显著优于大多数人类读者。其与人类平均评分的相关性高达0.84。这表明,顶尖的LLM在理解和评估复杂叙事所传达的整体情感和生活满意度方面,已经达到了甚至在某种程度上超越了普通人类读者的水平。

图5  不同人类评估者和LLM相对于众数答案的平均绝对偏差

2. 幸福感的社会图谱:谁更幸福?

既然LLM评分的可靠性得到了充分验证,研究者便将其应用到全部样本,开始描绘1930年代美国老年人回顾性幸福感的社会图谱,有以下几点发现:(一)性别差异不显著:男性和女性的平均幸福感得分相似。(二)种族与阶层差异:非白人的平均幸福感略低于白人。高SES人群则显著比低SES人群更幸福,这与大量关于收入和主观幸福感的研究结论一致。(三)城乡与移民身份影响不大:城市与农村居民、移民与本土出生者的平均幸福感差异不显著。(四)迁移者的幸福优势:一个令人惊讶的发现是,国内迁移者的平均幸福感显著高于未迁移者。这种优势在只考虑向西迁移或向城市迁移的人群中依然存在,并且并非仅仅因为迁移者的叙事更长。这暗示着迁移经历本身,可能确实为当时的许多美国人带来了更高的生活满意度。(五)工作意义与幸福感:那些从工作中找到深层意义的人,其幸福感得分显著高于仅仅认为“努力工作很重要”的人。这再次凸显了工作满意度(而非仅仅是工作的必要性)对整体生活评价的重要性。

最后,研究者运用LASSO回归这一机器学习方法,来识别哪些“生命意义来源”和“关键转折点”(正负面)是预测回顾性幸福感的最强指标(如图6)。LASSO能自动筛选出最具预测力的变量,避免了变量间相关性的干扰。结果揭示了几个关键点:(一)从“自然”、“冒险”或“宗教”中获得意义,对整体幸福感的预测力相对较弱。(二)从“工作”和“社区”中找到意义,则是最强的两个积极预测因子。(三)积极的职业和家庭转折点与更高的幸福感显著相关。相反,负面的财务冲击和健康冲击则是最强的两个负面预测因子,显著拉低了生活满意度评分。

图6  人生满意度的LASSO预测因子

07

人生六境

在分别解构了意义来源、关键转折和幸福感之后,研究人员试图描绘一幅更宏观的图景:这些独一无二的生命“雪花”,是否能汇聚成几种可识别的“星座”?为此,他们采用了层次凝聚聚类方法(Hierarchical Agglomerative Clustering),基于个体在意义来源、积极与消极关键转折点上的综合得分,将1335份叙事划分为了六个截然不同的人生模式。

这六种模式各具特色:簇1(社区联结型,12%)以社区为核心意义,伴随积极的自然与迁移经历;簇2(工作成就型,10%)强调工作意义,关键转折多为积极的个人与职业成长;簇3(家庭中心型,28%)是最大的群体,家庭意义突出,常回味冒险,转折点好坏参半;簇4(教育驱动型,12%)极其看重教育提升,并伴有信仰与坚韧,积极的教育转折是其标志;而簇5(历史见证型,28%)与簇6(逆境聚焦型,15%)则较少表达明确的幸福或意义来源,前者更侧重外部历史事件的平淡记述,后者则高度聚焦于负面的家庭、职业等冲击,生活满意度显著偏低。

将这些人生模式与叙述者的人口经济特征相联系,进一步印证并深化了之前的发现。性别差异清晰可见,女性更多分布在家庭、教育和逆境相关的簇中,男性则偏向工作和历史见证型。非白人在教育驱动与信仰坚韧型(簇4)中比例显著更高。城市居民、国内迁移者和高SES人群也更倾向于归入教育驱动型(簇4)。值得注意的是,前四个“积极”簇的幸福感得分虽高且相似,却代表了通往满足感的不同路径,而最后两个簇的幸福感则明显较低。这表明,虽然不幸的模式可能相似,但幸福的人生却呈现出多元的形态,且这些模式深刻地嵌入在社会结构之中。

历史的回声

08

本研究超越了标准经济指标和简单的快乐衡量,独辟蹊径,将目光投向了历史的深处。作者并非聚焦于精英阶层的宏大叙事,而是选择倾听那些在1930年代美国社会变革浪潮中,走过大半人生旅程的普通民众的心声。通过联邦作家计划留下的《美国生活史》这份独一无二的宝藏,我们得以窥见超过1300多位平凡个体在回望一生。他们的故事,充满了生活的质感与历史的温度,为我们理解“何为有意义的人生”提供了来自基层的、无比珍贵的视角。

本研究的核心贡献之一,便是成功开发并严格验证了一套创新的研究方法。作者证明,前沿的大型语言模型(LLMs),在经过精心设计(如文本分块、多阶段评估、置信度筛选、质量互核、一致性测试、传递性测试)和严谨的人类审计(通过图灵测试的考验)后,能够以媲美甚至超越人类研究助理的可靠性,去解读和评估文本中蕴含的复杂情感、意义来源和整体生活满意度。借助这套强大的分析工具,本研究从这些尘封的叙事中发掘出一系列深刻的洞见:首先,它重塑了对意义来源的认知,发现除了人际关系,“工作与事业”及“社区贡献”对这代人具有核心重要性。工作常被视为价值感的源泉,体现了“人是制造者”的内在需求。其次,研究量化了生活满意度,并揭示其与性别、种族、阶层及国内迁移(后者与更高幸福感相关)等复杂社会因素的关联。分析指出,找到工作意义、紧密的社区联系、积极的职业/家庭转折点是幸福感的最强预测因子,而负面的财务与健康冲击则显著降低满意度。

总而言之,本研究通过深度挖掘《美国生活史》并辅以创新方法,描绘了1930年代普通美国人生命意义与幸福感的丰富画卷。它强调了工作与贡献的内在价值,展示了个体生命如何嵌入宏大的社会与历史背景。

推文作者:秦清华,中国科学院大学博士生。电子邮箱:。

 Abstract 

What does it take to live a meaningful life? We exploit a unique corpus of over 1,400 life narratives of older Americans collected by a team of writers during the 1930s. We combine detailed human readings with large language models (LLMs) to extract systematic information on critical junctures, sources of meaning, and overall life satisfaction. Under specific conditions, LLMs can provide responses to complex questions that are indistinguishable from those of human readers, effectively passing a version of the Turing Test. We find that sources of life meaning are more varied than previous research suggested, underlining the importance of work and community contributions in addition to family and close relationships (emphasized by earlier work). The narratives also highlight gendered disparities, with women disproportionately citing adverse family events, such as the loss of a parent, underscoring their role as keepers of the kin. Our research expands our understanding of human flourishing during a transformative period in American history and establishes a robust and scalable framework for exploring subjective well-being across diverse historical and cultural contexts.

声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点。

话题:



0

推荐

香樟经济学术圈

香樟经济学术圈

1762篇文章 1天前更新

香樟经济学术圈由中国社科院、哈佛大学、多伦多大学等国内外青年经济学者发起。此平台主要推送国外经济学领域经典前沿论文,发布国内外经济学相关资讯,以及香樟经济学者圈的相关活动公告。 期待能够对中国经济学研究和国家政策产生一定影响。微信订阅号:camphor2014。

文章