图片来源:百度图片
原文信息:
Teutloff, O., Einsiedler, J., Kässi, O., Braesemann, F., Mishkin, P., & del Rio-Chanona, R. M. Winners and losers of generative AI: Early Evidence of Shifts in Freelancer Demand[J]. Journal of Economic Behavior & Organization, 2025: 106845.
01
写在前面
在这个AI飞速迭代的时代,你是否也曾恍然察觉:有些技能,还没来得及精进,就已被时代悄然淘汰。ChatGPT上线已两年有余,DeepSeek也走入大众视野半年多,生成式AI正在无声地重塑着我们的谋生方式——有人借助AI之力乘风破浪,有人却在原本赖以生存的领域中悄然隐退。
今天,笔者将分享一篇即将发表于Journal of Economic Behavior and Organization上的论文。这篇文章利用300多万条平台招聘数据,采用BERTopic来形成和命名具有类似技能要求的岗位发布集群,根据GPT-4o将岗位发布集群归类至AI暴露标签(替代组、互补组、无影响组),从而揭示生成式AI如何在不同技能间划分出“赢家”和“输家”。
AI并非打击所有人,而是在重新定义“值钱的技能”。当一些初级写作、翻译类短工需求锐减时,AI聊天机器人开发、机器学习编程类技能却快速走红,甚至需求翻倍。技能的命运,从来都不是静止的,它紧扣时代脉搏,也在无声提醒着我们:方向对了,努力才有意义。
引言
02
由于早期研究的不同结果,大语言模型对劳动力市场的影响仍然是一个值得探讨的问题。为了更好地理解生成式AI对工作和就业的影响,这篇论文考察了ChatGPT的推广对可由大语言模型替代/补充的细粒度技能集群的劳动力需求的影响。
已有研究主要估计了自动化的风险(人工智能取代职业技术的可行性)、探讨了新兴技术创新对劳动力市场的影响。在大语言模型方面,一些文献研究了其对劳动力市场的影响。然而,这些研究要么关注受控的实验室环境(难以转化为复杂的劳动力市场),要么关注有限的广泛技能(容易掩盖异质性的影响)。此外,关于在线劳动招聘平台的研究主要考察了替代效应,而大语言模型也可能扮演互补角色,在不完全取代整个工作的情况下助力某些任务。
因此,有必要深入了解技能异质性的影响,并区分可替代技能和互补技能。但该研究思路存在两个挑战:①在线劳动市场上的技能类别会随着时间的推移而演变,这使得在细粒度上使用共现网络变得更加复杂;②手工将大语言模型对数百万个岗位招聘发布的影响分为替代、互补和不受影响的类别不太可行。
NLP神经语言程式有助于克服上述挑战,文本算法能够解决文档相似性度量和概念检测。因此,这篇论文采用主题建模方法将岗位招聘发布分为具有相似语义含义的技能集群,最终确定了116个不同的技能集群。为了克服分配工作AI暴露标签的挑战,论文采用大语言模型提示符将技能集群分为替代、互补和不受影响的组别(116个集群中,有12个是替代组,59个是互补组,45个是无影响组)。最后,采用双重差分法即可识别ChatGPT的推广对可由大语言模型替代/补充的细粒度技能集群的劳动力需求的影响。
研究发现,ChatGPT的推广使得无影响组和互补组的劳动需求增加,但替代组的岗位招聘发布数量减少了7%。DID的结果表明,与无影响组相比,替代组下降了25%,而互补组则没有显著影响。进一步根据岗位招聘的合同时间划分,发现替代组的减少主要集中在短期(1-3周)的工作。在招聘劳动的工作经验方面,替代组之间的异质性有限。在互补组中,新员工的岗位招聘发布有所下降。在具体组别层面,与房地产(real estate content writing)和“关于我们”相关(writing “about us” pages)的写作下降幅度最大,分别为52%和59%。翻译工作也受到了重大影响,“西欧语言”组下降了23%。在互补组中,劳动招聘需求变化喜忧参半,一些组显著下降,另一些组显著上升。值得注意的是,“人工智能聊天机器人”组的招聘需求几乎增长了两倍,为179%。“机器学习”组也出现了显著增长,为29%。
总体而言,论文的研究结果表明在评估人工智能对劳动力市场的影响时,十分有必要考虑任务的具体性质和人工智能实施的背景。将人工智能融入工作流程可以创造赢家和输家,这取决于人工智能技术的使用方式和涉及的特定技能。
03
数据与方法
(一)数据
论文利用一个全球在线自由职业者平台的数据(平台希望保持匿名)。该平台上面的工作涵盖写作、翻译、软件开发、营销设计、法律服务等领域,用人单位涉及个人、初创公司和世界500强等。在招聘岗位发布时,用人单位需要提供详细的技能需求(如写作、平面设计、翻译、Microsoft Office、Photoshop等)。总体而言,每个岗位平均需要六种技能。同时,每个岗位发布都包含一个标题和一项指定任务描述,论文只考虑技能标签(因为技能标签时不变,同时对特定技能的需求变化比传统劳动市场环境更快显现)。
文章收集了2021年1月至2023年9月期间每天发布的新招聘岗位信息,涵盖数百万个岗位。除了技能需求信息外,还包括岗位的合同签订时间(3周以下、3-9周、9-18周、18-52周)、工人的经验水平要求、岗位每日工作时长、国籍、申报预算(作为雇主支付劳动力意愿的代理)等。
(二)招聘岗位根据技能集群归类
论文采用BERTopic来形成和命名具有类似技能要求的岗位发布集群,具体包含嵌入(embedding)、降维(dimensionality reduction)、归类(clustering)、向量化(vectorization)、连续词频逆文档频率(cTF-IDF)五个步骤。感兴趣的读者可以阅读原文查阅。
(三)从技能集群到AI暴露标签
论文采用GPT-4o将岗位发布集群归类至AI暴露标签(替代组、互补组、无影响组),具体包含手动标签(manual labeling)、快速工程(prompt engineering)、一致性检查(consistency checks)三个步骤。感兴趣的读者可以阅读原文查阅。
(二)和(三)的总体方法概览如下图所示:
(四)计量模型构建
论文的计量模型构建如下所示:
其中,i表示岗位发布集群,t表示周。被解释变量是Postings(代表招聘岗位发布数量),Complementary表示是否为互补组,Substitutable表示是否为替代组,After表示是否为ChatGPT推广。同时,论文也采用了固定效应和分样本回归的方法作为稳健性检验。标准误聚类到技能集群层面:
结果分析
04
(一)描述性统计
招聘岗位的技能要求如下图所示。大多数都列出了3-8项技能要求,中位数为5项。同时,招聘信息中的需求技能也呈现高度异质:JavaScript、平面设计和内容写作等流行技能出现在近一百万个招聘岗位上,突显了它们在零工经济中的基本作用。翻译、PowerPoint专业知识和深度神经网络开发等专业技能在约一千个岗位中都有所体现,反映了它们的利基需求。蒙台梭利教育、特定手语等高度专业技能只被提及了几次,表明需求有限。
嵌入空间和AI暴露标签如下图所示。在116个集群中,有12个是替代组,59个是互补组,45个是无影响组。该分布也符合预期,因为互补组只需要一部分工作涉及大语言模型,而替代组则要求大多数工作可以自动化。在替代组中,涉及的岗位主要与写作和翻译有关;在互补组中,涉及的岗位主要与编程和软件开发有关;在无影响组中,涉及的岗位主要与平面设计和插图有关。
样本的描述性统计如下图所示。互补组平均每周有295个新岗位招聘发布,替代组平均每周有402个新岗位招聘发布,无影响组平均每周有451个新岗位招聘发布。三个组中,平均值均远大于中位数,反映分布的右倾,因此需要进行对数化处理。在岗位招聘的合同时间和所需劳动的工作经验方面,各组别分布相似。总体而言,在线劳动市场发布的岗位总数持续增长,反映了对流行技能的动态需求(替代[红色]、互补[绿色]、无影响[蓝色])。其中,互补组和无影响组的招聘需求大幅增长,而替代组的招聘需求呈现下降趋势。
(二)实证结果分析
实证结果如下图所示。不难看出,无论是否加入控制变量,是否采用固定效应模型,ChatGPT的推广使得替代组相对无影响组的岗位招聘发布数量减少了24%((exp(0.28)-1) ×100%)。该效应可以分解为两类:无影响组的岗位招聘发布数量增加17%((exp(0.16)-1) ×100%)和替代组的岗位招聘发布数量减少7%(-24%+17%)。此外,互补组相对无影响组的岗位招聘发布数量也为负,但不显著,主要是因为ChatGPT的推广使得一些互补组的需求下降,另一些互补组的需求增加。上述结论通过了平行趋势检验、安慰剂检验、排除特定组别样本等稳健性分析。
进一步根据岗位招聘的合同时间划分,发现替代组的减少主要集中在短期(1-3周)的工作。进一步地,即使是短期工作,无影响组的劳动需求也在增加,并且互补组相对无影响组的差异也不显著,同时系数也很小。上述结果表明,ChatGPT的推广使得替代组的招聘岗位从短期转向长期。
在招聘劳动的工作经验方面,替代组之间的异质性有限,不同工作经验的岗位需求均显著下降。在互补组中,新员工的岗位招聘发布有所下降。上述结果表明,ChatGPT的推广使得互补组对新手的需求下降。这些发现也表明在评估人工智能对劳动力市场的影响时,有必要考虑除技能要求之外其它维度的异质性影响。
接下来,论文采用分样本回归的形式,考察ChatGPT的推广对替代组(红色)和互补组(绿色)的异质性影响,结果如下图所示。不难看出,大部分替代组的岗位招聘发布数量均减少,其中,与房地产(real estate content writing)和“关于我们”相关(writing “about us” pages)的写作下降幅度最大,分别为52%和59%。在互补组中,劳动招聘需求变化喜忧参半,一些组显著下降,另一些组显著上升。值得注意的是,“人工智能聊天机器人”组的招聘需求几乎增长了两倍,为179%。“机器学习”组也出现了显著增长,为29%。但是,这些结果应当审慎解释(难以区分真实和随机的事前趋势、估计值的比较需要调整多重假设检验)。尽管如此,总体可以认为,ChatGPT的推广使得与人工智能相关的组在聊天机器人开发、潜在客户开发和机器学习方面的需求大幅增加,写作和翻译工作的需求大幅下降。
接下来文章尝试排除竞争性研究假说,即岗位招聘发布数量的减少来源于需求侧的冲击,而非劳动供给的减少。首先,将岗位招聘发布视为劳动需求的代理是相对纯粹的,其独立于应聘者数量和特征等供给侧因素。其次,招聘单位在每个岗位发布上花费的平均预算需要补充和替代的技能集群,并没有因为ChatGPT的推广而改变。这表明,招聘单位愿意为劳动力支付相同的价格,但要求更少,这与ChatGPT推广后劳动力需求曲线的左移相一致。
最后,每个岗位发布的申请人数增加是由于岗位发布的减少,而非申请人数的增加。当然,ChatGPT的推广也可能导致应聘者的壁垒下降,进而造成招聘需求下降。但是,该平台允许招聘单位密切监控应聘者的表现,甚至在交付物质量不足的情况下扣留付款。这种监管降低了招聘单位纯粹因为应聘者素质的不确定性而降低劳动需求的可能性。
05
讨论
这篇论文利用全球在线自由职业者平台的数据,采用主题建模方法将岗位招聘发布分为具有相似语义含义的技能集群,并利用大语言模型提示符将技能集群分为替代、互补和不受影响的组别,构建双重差分模型考察ChatGPT的推广,对可由大语言模型替代/补充的细粒度技能集群的劳动力需求的影响。
研究发现,ChatGPT的推广使得无影响组和互补组的劳动需求增加,但替代组的岗位招聘发布数量减少了7%。DID的结果表明,与无影响组相比,替代组下降了25%,而互补组则没有显著影响。进一步根据岗位招聘的合同时间划分,发现替代组的减少主要集中在短期(1-3周)的工作。在招聘劳动的工作经验方面,替代组之间的异质性有限。在互补组中,新员工的岗位招聘发布有所下降。在具体组别层面,与房地产(real estate content writing)和“关于我们”相关(writing “about us” pages)的写作下降幅度最大,分别为52%和59%。翻译工作也受到了重大影响,“西欧语言”组下降了23%。在互补组中,劳动招聘需求变化喜忧参半,一些组显著下降,另一些组显著上升。值得注意的是,“人工智能聊天机器人”组的招聘需求几乎增长了两倍,为179%。“机器学习”组也出现了显著增长,为29%。
研究结果为ChatGPT和其它生成式AI技术对劳动力市场的影响提供了细致入微的视角。当然,论文也存在一些局限:①平台随着时间的推移,引入了新功能并禁用了某些功能,这给数据的收集带来了噪音;②将岗位发布集群归类至AI暴露标签(替代组、互补组、无影响组)过于依赖GPT。③关注新技术的部分均衡效应,没有捕捉到平台之外的潜在生产率增长:技术进步可以减少工人需求,但生产率的提高可能会引致新的资本和投资,从而可能增加劳动需求。④研究只考察了劳动需求,忽视了工资。
未来的研究可以更精确地考察需求变化的周期,探究招聘单位需要多长时间才能采用人工智能驱动的工具,这有助于揭示如何从招聘平台的调查结果推广到传统劳动市场。此外,进一步的分析也可以回答招聘需求的减少是否有必要,以及效率如何。
写在最后
06
AI的浪潮来了,带着冰冷的数据,也带着滚烫的未来。它既不是救世主,也不是末日的预告,而是在提醒我们:旧的路径正在变窄,新的入口正在悄然开启。
不是所有人都会被取代,真正被淘汰的,是那些拒绝改变、拒绝学习、拒绝重新认识自己的惯性。曾经被视为“铁饭碗”的技能,如今可能成了枷锁;曾经引以为傲的经验,或许也成了转身时的沉重行囊。
时代不等人,也从不惧人。它只对行动者温柔。愿你我都能成为那个愿意改变的人——不盲从、不焦虑,在风起云涌中找到属于自己的平衡感。走得慢一点没关系,只要方向对了,就永远不算晚。
推文作者简介
杨杰,中国人民大学应用经济学院博士研究生。推文可能存在纰漏与不足,非常欢迎大家批评和指正!
Abstract
We examine how ChatGPT has changed the demand for freelancers in jobs where generative AI tools can act as substitutes or complements to human labor. Using BERTopic we partition job postings from a leading online freelancing platform into 116 fine-grained skill clusters and with GPT-4o we classify them as substitutable, complementary or unaffected by LLMs. Our analysis reveals that labor demand increased after the launch of ChatGPT, but only in skill clusters that were complementary to or unaffected by the AI tool. In contrast, demand for substitutable skills, such as writing and translation, decreased by 20–50% relative to the counterfactual trend, with the sharpest decline observed for short-term (1-3 week) jobs. Within complementary skill clusters, the results are mixed: demand for machine learning programming grew by 24%, and demand for AI-powered chatbot development nearly tripled, while demand for novice workers declined in general. This result suggests a shift toward more specialized expertise for freelancers rather than uniform growth across all complementary areas.
声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点
0
推荐