财新传媒 财新传媒

阅读:0
听报道

图片来源:ChatGPT-4 DALL·E

文献信息:Obaid, K., & Pukthuanthong, K. (2022). A picture is worth a thousand words: Measuring investor sentiment by combining machine learning and photos from news. Journal of Financial Economics, 144(1), 273-297.

原文链接:

https://doi.org/10.1016/j.jfineco.2021.06.002

01

导读

在当今快速发展的金融市场中,分析师常利用新闻文本预测市场趋势,但往往忽视了新闻图片这一关键数据源。新闻图片以其独特的即时性和直观性,提供了关于市场情绪的宝贵线索(Nelson et al., 1976)。针对这一研究空白,本文利用深度学习模型从大量新闻图片中提取情绪信号,构建了名为“PhotoPes”的日度市场情绪指数。该指数有效揭示了新闻图片中的负面情绪与市场波动之间的关系,为深入理解投资者行为和市场动态提供了新的数据支持和洞察。

02

指数构建

2.1数据说明

考虑到《华尔街日报》主要面向对经济和金融市场有深度兴趣的读者群体,作者选择其2008年9月至2020年9月发表的超过14万篇文章的图片、标题及摘要。这些文章主要分布在商业、经济、市场、政治以及观点五个板块,涵盖了各种对金融市场具有重大影响的事件。通过分析这一大量且丰富的数据集,作者旨在深入理解市场情绪如何通过视觉媒介传达,并探索这些视觉信息如何影响市场动态和投资者决策。

2.2迁移学习

鉴于卷积神经网络技术在图像识别领域的优异表现,本研究选择Google Inception (v3)模型进行图片分类,这是一种高效的深度学习框架,特别适合处理高维度图像数据。它能够精准地识别图片中的多种视觉元素,如对象、色彩和面部表情等,这些元素对于分析图片中的情绪倾向至关重要。通过迁移学习,替换该模型最后一个全连接层以专用于分类新闻图片中的正面和负面情绪。使用经过MTurk验证的DeepSent数据集进行模型训练,测试集中可达到76.0%的准确率,显示出较高性能(You et al., 2015)。通过使用验证集减少过拟合并利用测试集评估模型的最终表现,保证了模型从新闻图片中识别投资者情绪方面的可靠性和科学性。

2.3情绪指数

作者精心设计了两个悲观度指数以精确测量市场情绪。图片悲观度定义为每天被模型识别为悲观情绪的新闻图片比例,这反映了视觉媒介中的市场情绪。相较于图片,文本悲观度则通过先进的文本分析技术,评估新闻标题和摘要中的悲观情绪,以量化文章内容情绪。两个指数共同提供了一个从视觉和文字双重维度解读市场情绪的综合视角,使得研究能够更全面地捕捉到影响投资者行为的潜在因素。

 

其中,其中是一个指标变量,表示第t天的图片i是否会产生负面情绪。其中是CoreNLP模型中第t天文章i的悲观分数, 分母指的是t日的图片数量。PhotoPesTextPes进行了1%水平缩尾处理。

表1 描述性统计

由表1可知,PhotoPes的平均值为0.228,意味着平均每天约22.8%的图片被预测为负面;TextPes的平均值为0.686,表明文本中悲观情绪的普遍存在。此外,两个指数之间的相关性为0.079,表明图片和文本中在一定程度上相关,但二者信息具有一定的独立性。

03

实证结果

为检验PhotoPes与美国主要股指和ETF的关系,构建如下回归模型:

其中,表示CRSP市值加权(VWRETD)指数、标普500指数(SPX)、SPDR标普500的ETF(SPY)、道琼斯工业平均指数(INDU)和SPDR道琼斯工业平均指数ETF(DIA)的日度对数收益率。将变量转换为由该变量的五个滞后组成的行向量;是一组外生变量,包括截距、星期几指标(周一除外)以及时间t是否处于衰退期的指标变量。

表2 图片悲观度与市场收益

通过两种方式计算PhotoPes,面板A的PhotoPes基于每日被预测为负面情绪的图片比例,面板B的PhotoPes则基于图片被预测为负面情绪的概率。表2面板A与面板B均发现PhotoPes与次日市场收益呈显著负相关,表明负面情绪图片比例较高则次日收益率通常较低。该结果突出了市场情绪对股市短期表现的重要影响,尤其是视觉媒介中传达的情绪。

本文比较了PhotoPesTextPes的预测能力,以及图片和文字是互补还是替代。具体而言,新闻媒体是否使用图片增强文本中嵌入的情感?或者是否使用图片传达文本的替代信息?鉴于新闻媒体日益多元化,这是一个需要解决的重要问题。回归模型如下:

表3的回归结果揭示了PhotoPesTextPes对市场收益的综合影响。具体而言,PhotoPes与次日市场收益率显著负相关,TextPes和次日市场收益率之间不显著,表明图片在传达市场情绪时强于文本。此外,PhotoPesTextPes的交互项显著为正,表明二者之间存在替代关系而非互补关系(Siggelkow, 2002)。

表3 图片悲观度和文本悲观度与市场收益

04

总结

本文通过深度学习技术分析新闻图片,构建了日度市场情绪悲观度指数,有效揭示了新闻图片中的负面情绪与市场波动之间的关系。图片悲观度与市场收益率显著负相关,而文本悲观度影响较弱,显示图片在传递市场情绪时的优势。进一步的分析发现,图片悲观度和文本悲观度之间存在替代关系,图片中的情绪信息在市场反应中起到了更直接的作用。这些发现强调了在市场分析中,综合视觉与文本信息的重要性,为金融预测提供了新的视角和工具。

05

参考文献

Nelson, D. L., Reed, V. S., & Walling, J. R. (1976). Pictorial superiority effect. Journal of experimental psychology: Human learning and memory, 2(5), 523.

Siggelkow, N. (2002). Misperceiving interactions among complements and substitutes: Organizational consequences. Management science, 48(7), 900-916.

You, Q., Luo, J., Jin, H., & Yang, J. (2015). Robust image sentiment analysis using progressively trained and domain transferred deep networks. In Proceedings of the AAAI conference on Artificial Intelligence, 29, 1.

推文作者:吕志冲,西南交通大学应用经济学硕士,研究方向为大语言模型与金融预测,欢迎学术交流。推文内容若存在错误与疏漏,欢迎邮箱批评指正!

个人邮箱:zhichonglyu@ieee.org

 Abstract 

By applying machine learning to the accurate and cost-effective classification of photos based on sentiment, we introduce a daily market-level investor sentiment index (Photo Pessimism) obtained from a large sample of news photos. Consistent with behavioral models, Photo Pessimism predicts market return reversals and trading volume. The relation is strongest among stocks with high limits to arbitrage and during periods of elevated fear. We examine whether Photo Pessimism and pessimism embedded in news text act as complements or substitutes for each other in predicting stock returns and find evidence that the two are substitutes.

声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点。

话题:



0

推荐

香樟经济学术圈

香樟经济学术圈

1687篇文章 3小时前更新

香樟经济学术圈由中国社科院、哈佛大学、多伦多大学等国内外青年经济学者发起。此平台主要推送国外经济学领域经典前沿论文,发布国内外经济学相关资讯,以及香樟经济学者圈的相关活动公告。 期待能够对中国经济学研究和国家政策产生一定影响。微信订阅号:camphor2014。

文章