财新传媒 财新传媒

阅读:0
听报道

图片来源:ChatGPT-4

原文信息:van Binsbergen, J. H., Bryzgalova, S., Mukhopadhyay, M., & Sharma, V. (2024). (Almost) 200 Years of News-Based Economic Sentiment. National Bureau of Economic Research, No. w32026.

https://doi.org/10.3386/w32026

写在前面:

随着大数据时代的到来,经济学家们愈发依赖创新技术来破解复杂的经济现象。传统的经济指标和调查方法已难以应对日益复杂的全球经济体系,而创新的技术手段则为经济学研究提供了更强大的分析工具。以今年初NBER发布的工作论文《(Almost) 200 Years of News-Based Economic Sentiment》为例,研究团队通过对近170年间逾2亿页美国地方报纸内容的文本进行分析,构建全新的“经济情绪指数”。

这项研究的一个重要发现是,新闻中的情绪变化不仅能够预测经济活动,还反映出公众对经济的看法,并通过情绪传播影响实际的经济决策和市场行为。值得注意的是,研究还指出,自20世纪70年代以来,美国新闻报道中的经济情绪整体上趋于负面,但这一趋势与经济基本面无关。这种情绪变化揭示了媒体在塑造公众经济预期中的作用,并为理解经济周期和政策制定提供了新的视角。

囿于篇幅限制,本文将简要介绍该研究的核心方法和结论,关于具体的计量分析细节,读者可参阅原文。

01

研究背景

经济情绪作为反映市场信心、消费者预期和经济活力的重要指标,长期以来备受学术界和政策制定者的关注。传统的经济情绪测量方法主要依赖于调查数据,例如密歇根大学的消费者信心调查或专业经济学家的预测数据。这些指标尽管在经济预测中扮演了重要角色,但在时间和空间的覆盖范围上存在明显局限。首先,传统的情绪调查多集中于近几十年,无法捕捉长时段的经济波动;其次,这些指标往往缺乏细化的区域层面分析,难以反映地方经济情绪的差异。

在这一背景下,本文引入了一种新的研究思路:通过分析美国地方报纸的历史文本数据,构建一个覆盖170年的经济情绪指标。地方报纸作为反映区域经济状况的重要媒介,能够捕捉到不同地区经济情绪的动态变化,从而弥补全国性媒体数据的不足。此外,使用机器学习技术自动生成情绪词典,能够在更大范围内细化情绪测量,提供前所未有的时间和空间粒度。这一创新不仅延展了经济情绪的测量维度,也为理解地方与国家经济之间的互动提供了新视角。

本文的研究方法结合了自然语言处理技术与大规模文本分析,创新性地构建了一个长期、细粒度的经济情绪指标。通过这一指标,研究不仅能够分析情绪在长时间内的变化趋势,还能够探讨其对未来经济基本面的预测能力,特别是对GDP、就业、消费等关键经济变量的影响。研究发现,地方经济情绪的变化能够有效预测地方经济增长,且各州之间的情绪差异对全国经济增长也产生了重要影响。与传统的经济情绪测量相比,本文的方法在时间跨度、空间粒度和预测能力方面具有显著优势,为经济学研究提供了新的工具和方法。

方法与数据

02

本研究采用了机器学习和自然语言处理(NLP)技术,基于美国170年间的地方报纸文本数据,构建了一个全新的经济情绪指标。通过对历史文本的大规模分析,能够从新闻报道中提取出与经济活动相关的情绪变化,并用这些情绪指标来预测未来的经济基本面。以下是研究方法与数据的具体介绍。

1. 数据来源

本文的数据来源于数字化的美国地方报纸文本,覆盖了自1850-2020年间13000家地方报纸,总计2亿页的报纸页面。这些报纸文本经过数字化处理后,形成了一个包含约10亿篇文章的大型语料库。这一语料库规模相当于《华尔街日报》语料库的95倍,且覆盖范围广泛,涵盖美国所有50个州及其地方新闻报道。因此,研究不仅可以从国家层面分析经济情绪,还能够深入到州和县的层面,进行更精细的情绪测量。

2. 文本分析与情绪测量

为了测量经济情绪,研究采用了基于机器学习的Word2Vec算法,这是一种能够捕捉单词语义和上下文信息的神经网络模型。具体来说,研究使用Word2Vec技术生成了一个经济相关的词汇词典,该词典不仅包括常见的经济词汇如“增长”“衰退”等,还自动识别大量与经济活动相关的短语和上下文含义。

与传统的二元情绪分类(积极/消极)方法不同,本文的方法通过词向量技术为每个词赋予一个情绪极性分数。这意味着,不同的词根据其在上下文中的使用方式,被赋予了不同的情感强度。例如,类似“扩张”这样的词汇会被赋予较高的正面情绪分数,而“衰退”则会被赋予较高的负面情绪分数。此外,研究还克服了传统词频统计方法中否定词处理的难题,能够更准确地捕捉到新闻中潜在的情绪变化。为进一步提高情绪测量的精确度,研究还通过一个自动化的机器学习过程生成了特定主题的词典,确保所捕捉情绪与经济内容密切相关。例如,“盈利”“裁员”等词语会与经济新闻紧密关联,而与非经济内容相关的词汇则被排除在外。

3. 当前与未来情绪的区分

为了更好地理解情绪对未来经济活动的预测能力,本文将新闻报道中的情绪分为两类:当前情绪与未来情绪。当前情绪捕捉的是新闻对当前经济状况的报道,而未来情绪则侧重于新闻对未来经济前景的展望。为此,本文根据文本内容创建了与未来事件相关的特定词汇词典,旨在区分新闻中关于当前事件的报道和未来经济预期的分析。

这种情绪分解方法能够揭示新闻中潜在的预测性信息。例如,研究发现,与未来事件相关的新闻情绪对GDP增长的预测能力更强,而与当前事件相关的情绪对经济变量的预测作用较弱。这一发现进一步证明了未来情绪在新闻文本中的重要性,反映了新闻报道对市场预期和未来经济活动的影响。

4. 研究方法

在数据处理和模型构建方面,本文使用了如下的核心方法:

(1)文本处理与情绪词典构建。利用Word2Vec技术训练一个特定于经济领域的词汇词典。该词典通过捕捉历史文本中词汇和短语的使用方式,赋予每个词汇一个情绪极性分数,从而自动生成经济情绪的度量。

(2)情绪指标构建。将报纸页面的文本与经济情绪词典进行匹配,计算每个页面的经济情绪分数。然后,将这些分数聚合到州、县和国家层面,生成不同地区和不同时间段的经济情绪指标。这些指标经过标准化处理,使其具有一致的尺度和可比性。

(3)回归分析与预测模型。使用线性回归模型来分析经济情绪与宏观经济变量(如GDP增长、就业、消费等)间的关系。通过将情绪变化作为预测变量,研究者能够测试情绪对未来经济增长的预测能力。为了控制其他经济变量的影响,模型还纳入了传统的经济预测指标,如收益率曲线斜率、GDP增长滞后值等。

(4)情绪与政策互动分析。为了评估经济情绪对货币政策的影响,引入泰勒规则规范,通过分析经济情绪对联邦基金利率的预测能力,揭示了情绪在货币政策制定中的作用。

03 

经济情绪的预测能力

这项研究的核心在于其创新性地从大规模地方报纸文本中提取经济情绪,并分析情绪与经济变量之间的关系。通过构建一个覆盖170年的情绪指标,研究不仅揭示了经济情绪与国家和州层面的经济基本面密切相关,还展示了其对未来经济活动的显著预测能力。

1. 情绪的区域差异与经济影响

除了美国国家层面的分析,研究还揭示了经济情绪在州际存在巨大的截面差异。数据显示,情绪的全国性成分仅占各州情绪差异的35%,这意味着65%的经济情绪差异来源于各州的地方性经济状况。这一发现对理解区域经济波动具有重要意义,因为它揭示了地方性情绪对经济增长的独特影响。

研究通过分析2002年互联网泡沫和2008年全球金融危机期间各州的情绪变化,发现加利福尼亚州和纽约州等经济中心的情绪波动明显大于其他州。下图中(a)描绘了互联网泡沫破裂期间(2002年第4季度)的地方经济情绪变化,尤其是加州经济情绪的显著下滑;图(b)则展示了全球金融危机(2008年第4季度)期间纽约州经济情绪的变化,反映了纽约州作为金融中心受到的重大影响。这些发现表明,不同州的经济活动、产业结构和新闻报道风格都会影响地方性经济情绪的动态,进而影响到该州的经济表现。

2. 经济情绪与GDP增长的关系

研究发现,经济情绪在预测国家GDP增长方面具有极强的前瞻性。具体而言,情绪的波动能够准确预测接下来季度的GDP变化。例如,经济情绪上升一倍标准差,通常对应未来一个季度GDP增长的0.25%~0.42%。这一预测能力在多个时间跨度内表现稳定,涵盖了从1850年至2017年的全样本期。在更长的样本周期中,经济情绪的一个标准差变化甚至可以预测未来一年GDP增长的2%。

通过回归分析,研究者发现,即使在控制了其他重要的经济预测变量(如收益率曲线斜率)之后,经济情绪仍然具有独立的预测能力。这说明,情绪指标所捕捉的经济信息是其他指标难以替代的。值得一提的是,经济情绪不仅对经济增长具有显著影响,还能够预测GDP组成部分如消费和就业的变化,而对投资和工业生产的预测能力较弱。

 

3. 经济情绪与就业、消费的预测能力

经济情绪对不同经济变量的影响也存在显著差异。研究发现,情绪波动对就业和消费增长具有较强的预测能力,而对投资和工业生产的影响较弱。具体来说,情绪每上升一个标准差,通常对应就业增长0.15%~0.16%,且这一影响在多个季度中都有所体现。情绪对消费的影响则主要体现在服务业和非耐用品消费的增长上,这两者与情绪波动之间存在较强的相关性。

值得注意的是,情绪对投资和工业生产的影响较小。这表明,虽然情绪可以通过劳动力市场和消费市场影响经济增长,但在资本投入和工业生产等方面,其影响相对有限。本文推测,这可能是因为企业的投资决策和工业生产活动更多受到长期经济基本面和政策因素的驱动,而非短期情绪的波动。

4. 当前与未来事件相关情绪的分解分析

进一步的分析揭示,经济情绪的前瞻性主要源自与未来事件相关的情绪,而不是当前事件的报道。本文通过构建与当前和未来事件相关的特定词汇词典,将报纸的情绪指标分解为“当前经济情绪”和“未来经济情绪”两部分。结果显示,未来情绪对GDP增长的预测能力尤为强大,而当前情绪则对经济变量几乎没有预测能力。

这一发现说明,媒体在报道未来经济前景时传达的情绪,对预测未来经济活动具有更强的解释力。这可能与媒体对未来经济状况的解读、专家访谈或对政策预期的讨论有关。这一前瞻性的新闻内容反映了市场参与者对未来经济活动的看法,并通过影响预期和行为,推动了经济周期的变化。

5. 对政策的影响:情绪与货币政策

本研究还分析了经济情绪与货币政策之间的互动,发现情绪变化对美联储政策制定过程的影响。

(1)情绪对利率制定的影响。研究发现,经济情绪在美联储制定政策利率时起到了重要作用。尤其是在经济衰退期间,经济情绪的下降通常会促使政策利率下降。例如,情绪每下降一个标准差,联邦基金利率就会下降25个基点(表11列III)。这表明情绪的变化对货币政策具有显著影响,尤其是在经济不景气的时期。

(2)与宏观经济变量的相对重要性。研究通过与其他宏观经济变量(如GDP增长、通货膨胀和失业率)的对比,评估了经济情绪对货币政策制定的重要性(表11中列)。研究结果显示,经济情绪的变化对政策利率的影响程度与GDP增长、通货膨胀等传统宏观经济指标相当,甚至在某些情况下更加显著。具体而言,当加入前两个季度的经济情绪滞后变化时,模型的调整R方增加了2%~4%(见表11列I至列III)。相比之下,纳入失业率后,R方仅增加1%(列I、列V),而加入通货膨胀后,R方增加2%(列I、列X)。这进一步凸显了经济情绪对货币政策制定过程中的巨大影响力。

(3)情绪影响货币政策的渠道。研究提出了两个主要渠道解释经济情绪如何影响货币政策。一方面,情绪的变化通过对GDP增长的预测作用影响利率决策;另一方面,情绪可能会促使美联储偏离传统的泰勒规则,更多地依赖市场情绪进行政策调整。研究通过估计修正后的泰勒规则发现,即使控制了情绪对GDP的预测能力,情绪本身仍然显著影响利率决策(图12)。

笔者注:泰勒规则(Taylor Rule)由美国经济学家约翰·泰勒(John B. Taylor)于1993年提出,是一种用于指导中央银行设定短期利率(如美联储的联邦基金利率)的经济学公式。泰勒规则试图通过将通胀率和产出缺口(即实际产出与潜在产出之间的差距)纳入考量,来调节利率,以实现经济稳定。

本文对经济学研究带来的启示

04

总体而言,这项研究通过提取美国170年间地方报纸中的经济情绪,展示了新闻情绪在预测经济基本面中的独特作用。研究不仅揭示了情绪在经济活动中的前瞻性功能,还证明了媒体在塑造公众经济预期和市场行为方面的重要性。通过这项创新的情绪测量,学术界获得了一个新的分析工具,能够更准确地追踪经济周期的波动,同时也为政策制定者提供了有价值的情报支持,有助于优化宏观经济政策的制定。此外,企业决策者也可以利用这一情绪指标更好地理解市场情绪的变化趋势,从而做出更加精准的战略调整。

尽管该研究已取得了显著的突破,但情绪测量的未来仍然充满潜力与挑战。随着自然语言处理技术的不断进步,情绪指标的构建方法将进一步提升。更先进的模型,如BERT和ChatGPT,有望被应用于处理更大规模、更复杂的历史文本数据,进一步提高情绪测量的精确度和广泛适用性。未来的研究还可以探索将情绪指标与更多的宏观经济变量相结合,以提高其预测能力。通过整合这些技术,能够更深入地挖掘文本数据中的细微情感变化,捕捉更加精确的市场情绪信号。这种多维度的结合或可使情绪指标成为更为全面的经济分析工具,为学术研究与政策实践提供更有力的支持。

 Abstract 

Using text from 200 million pages of 13,000 US local newspapers and machine learning methods, we construct a 170-year-long measure of economic sentiment at the country and state levels, that expands existing measures in both the time series (by more than a century) and the cross-section. Our measure predicts GDP (both nationally and locally), consumption, and employment growth, even after controlling for commonly-used predictors, as well as monetary policy decisions. Our measure is distinct from the information in expert forecasts and leads its consensus value. Interestingly, news coverage has become increasingly negative across all states in the past half- century.

声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点。

话题:



0

推荐

香樟经济学术圈

香樟经济学术圈

1665篇文章 1天前更新

香樟经济学术圈由中国社科院、哈佛大学、多伦多大学等国内外青年经济学者发起。此平台主要推送国外经济学领域经典前沿论文,发布国内外经济学相关资讯,以及香樟经济学者圈的相关活动公告。 期待能够对中国经济学研究和国家政策产生一定影响。微信订阅号:camphor2014。

文章