重塑价格趋势预测：基于图像分析的深度学习革命-香樟经济学术圈的财新博客-财新网

图片来源：ChatGPT-4 DALL·E

原文信息：

Jiang, J., Kelly, B., & Xiu, D. (2023). (Re-) Imag (in) ing price trends. The Journal of Finance, 78(6), 3193-3249.

导读

技术分析在资产定价研究中一直占据重要地位，尤其是在通过历史价格数据预测市场走势方面。然而，传统方法通常依赖预定义的价格趋势模式，如动量效应和反转效应，可能忽略了价格数据中更深层的复杂信息。为了突破这一局限，本期推送一篇发表在《The Journal of Finance》期刊上的前沿研究(Re-)Imag(in)ing Price Trends。本文通过引入卷积神经网络（CNN），将价格数据转化为图像，并从中直接提取最具预测能力的特征，显著提升了预测准确性，并展现出超越传统技术分析策略的强大优势。

该文通过灵活的深度学习方法，重新考虑了基于趋势的可预测性，旨在识别与收益高度相关的价格模式，而不仅仅局限于动量或反转等预定义模式。研究使用股票层面的价格图表，并通过机器学习的图像分析技术提取最具预测性的价格模式。与传统的趋势信号相比，这些新模式能够产生更为准确的收益预测、更具盈利性的投资策略，并表现出更强的稳健性。尤其值得注意的是，这些价格模式展现出一定的独立性，如短期价格模式在长时间尺度上同样表现出色，且从美国股市学习到的模式在国际市场中同样有效。

这一创新方法不仅为学术界提供了全新的研究视角，也为市场分析和投资策略的制定带来了新的可能。通过深度学习技术，研究者能够捕捉价格数据中隐藏的复杂模式，为理解市场行为提供了更为全面的工具。希望这篇文章能够为资产定价和市场分析领域的专业人士带来新的启发，推动价格趋势预测研究的进一步发展。

图像生成与处理

本文采用了OHLC（开盘价、最高价、最低价、收盘价）条形图来构建价格图像，黑色条形图显示每日价格变动，最高价和最低价通过中心垂直条表示，开盘价和收盘价则通过条形左右两侧的小水平线标示。每日数据占据三个像素宽的区域，分别对应中心条、开盘标记和收盘标记。本文主要生成了连续5天、20天和60天的价格图像，分别对应每周、每月和每季度的价格轨迹。通过使用CRSP调整后的收益率替代原始价格数据，本文确保了开盘价、收盘价、最高价和最低价在相对比例上的一致性，消除了股票分割和股息发行带来的影响。

为增强图像的预测能力，本文参考了Fama和French（1988）以及Kelly和Pruitt（2013）的方法，在OHLC主图像中加入了移动平均线和每日交易量柱状图。移动平均线为长时间尺度上的价格分析提供了参考，而每日交易量则显示在图像底部五分之一的区域。为确保视觉效果的统一，本文对交易量数据进行了缩放处理，使得所有交易量柱在图像中的比例合理分布。这种设计确保了图像能够有效地展现价格趋势、波动性、日内与隔夜回收益模式等关键信息。

图1 生成图像示例

图1展示了最终生成的图像示例，这些图像通过精心设计，在丰富的信息内容和存储效率之间取得了良好的平衡，为卷积神经网络的输入提供了高质量的数据集。研究所使用的数据覆盖了1993年至2019年间在NYSE、AMEX和NASDAQ上市的所有公司，为本研究的价格趋势分析提供了坚实的数据基础。

实证分析

3.1模型构建

CNN是基于原始图像数据构建预测的主力模型，该模型的优势在于施加了跨参数限制，与标准前馈神经网络相比，大大减少了参数化，使其更易于训练；而且该模型在使用相对较小的数据集进行预测时更有效，并且嵌入了许多工具，使模型能够适应图像中重要对象的变形和重新定位。本文考虑复杂程度不同的三种主要CNN规范，模型架构如图2所示。图2显示了5天（左）、20天（中）和60天（右）CNN模型图。

图2 CNN模型架构

预测分析之前将时间序列数据嵌入为图像，这使得卷积滤波器可以捕获各种价格曲线之间的非线性空间关联，图3是对其工作原理的说明：

图3 CNN模型架构

图3左侧的“1D”图显示时间序列价格片段，左侧的“2D”图形将此时间序列转换为黑白图像。右侧为三个3×2卷积滤波器，分别用于检测价格是否变化、小幅上涨和大幅上涨。该图像会自动将有关价格变动、相对于移动平均趋势的变动、价格波动和交易量等信息组合到一起。以图像形式表现数据使模型能够获取时间序列方法难以检测到的数据关系。

该文遵循Gu等（2020）的基本流程，完成了训练、模型调参以及预测部分。作者从整体数据样本前八年（1993年-2000年）中随机选择70%的图像作为训练集，另外的30%作为验证集（随机选取训练集和验证集有助于平衡分类问题中的正、负标签，从而减轻由于长期看涨或看跌市场波动而导致的分类潜在偏差）；将2001年至2019年的十九年数据作为测试集。

作者将预测分析视为分类问题，如果后续收益为正，则图像的标签定义为y=1，否则为y=0。交叉熵损失函数被定义为：

其中ŷ是CNN模型的最终Softmax函数输出，如果预测结果与标签ŷ=y完全对应，则损失函数为零，否则为正。

3.2收益预测

价格趋势分析侧重于通过使用收益构建价格序列，根据公司行为调整收益。作者将每个图像中的第一天收盘价标准化为1，并根据收益（RETt）构建后续每日收盘价。每天的开盘价、最高价和最低价水平与当天的收盘价水平成比例。

本文将过去5天、20天或60天的市场数据图像作为输入，对于其后5天、20天或60天内的正或非正收益，图像标签取值1或0。在构建新预测的每个时期（周度、月度或季度），根据样本外CNN模型对后续正收益概率的估计将股票分类为十分位投资组合，还构建了一个多空利差投资组合（“H-L”），其多头十分位是十，空头十分位是一。投资组合的持有期与模型的预测期限一致，“Ix/Ry”表示该模型使用x天图像预测之后y天持有期收益。基于图像收益预测所构成的技术价格趋势信号，可能在相对较短的时间内最有效，因此作者开始讨论的重点是周度收益预测。

表1 短期（周度）投资组合表现

表1显示了CNN模型以持有五天的收益为目标时的预测能力，重点关注年化平均收益率和五天持有期收益率的夏普比率。按样本外预测的正收益概率等权重（上表）和市值加权（下表）十分位投资组合的表现排序。仅基于十分之一股票的多头策略在CNN模型中的夏普比率就超过1.8。基于5天、20天和60天图像的CNN模型，多空H-L策略的年化夏普比率分别为7.2、6.8和4.9，优于MOM、STR、WSTR和TREND等基准模型。

图4 等权重投资组合的累计波动率调整收益

图4为CNN模型和竞争模型价格趋势信号的周度H-L策略累积波动率调整收益。CNN策略在H-L投资组合十分位的低、高两侧均优于竞争模型。

图5 十分位预测精度

图5左图为等权重十分位数投资组合的平均收益，为了说明预测的精度，右图显示了平均十分位数收益的时间序列标准差。CNN更准确的预测会单调地转化为更高的平均收益。MOM、STR、WSTR和TREND同理，只是斜率相较CNN稍微平坦一些。不同于基准模型，CNN十分位投资组合的年化波动率均低于20%。

表2 月度及季度策略表现

表2上表展示了一个月持有期等权重策略的投资组合表现。CNN策略的换手率与STR和WSTR基本相同，但夏普比率是STR的三倍以上，是WSTR的近两倍。MOM的换手率远低于CNN月度策略，但其夏普比率相比CNN小一个量级。表2下表报告了持有60天CNN模型的季度策略，其与MOM模型的换手率大致相当。此时，I5/R60产生的H-L夏普比率远远超过MOM模型。月度和季度交易策略的结果表明，基于图像的策略能以和MOM相同的换手率进行交易，同时获得更高的总夏普比率。

表3 R20等权重投资组合业绩剖析

为解答长期表现是否仅源于第一周收益的可预测性，以及图像是否可以帮助预测第一周之后的收益等问题。表3将月度重新平衡的CNN策略及竞争模型的表现分解为重新平衡后第1至5天的收益（上表）和第6至20天的回报（下表）。虽然大部分基于图像的策略收益确实来自第一周，但很大一部分是在交易第一周后获得。第6至20天的年化夏普比率分别为0.4、1.2和0.8。CNN策略在第6至20天的平均收益率均达到10%及更高水平。

表4 市值最大股票投资组合业绩

参考Jensen等（2022），作者通过将策略限制在每月市值最大的500只股票分析股票规模的影响，表4说明在等权重策略（上表）和价值权重策略（下表）中夏普比率显著高于1.0。

3.3 CNN识别的预测模式解释

由于CNN的递归非线性结构，使得其难以被解释。作者采用两种方法解释CNN识别的预测模式。首先，将 CNN拟合与文献中广泛研究的相关（价格、风险和流动性）信号的集合联系起来。其次，使用CNN图像输入背后的数据，研究基于回归的CNN逻辑近似。

表5 CNN预测与股票特征的相关性

表5报告了每个特征与每个基于图像的预测之间的单变量相关性。作者估计了各变量之间逐周期横截面相关性，并展示测试样本期间的时间序列平均相关性。分析可知CNN模型能从以图像形式抽象表示的数据中辨别有意义的预测信息。在不需要手工制作趋势信号的情况下，CNN仍然能够识别原始图像中的趋势特征和流动性特征。

表6 基于图像缩放市场数据的Logistic回归

表6的第（1）至（3）列追求CNN预测本身的逻辑近似；第（4）、（7）和（10）列报告仅使用样本外CNN的收益预测回归；第（5）、（8）和（11）列展示使用图像缩放的市场序列直接预测收益的方法；第（6）、（9）和（12）列通过回归CNN预测的已实现收益的符号，同时控制图像规模的市场数据，将CNN非线性预测与简单逻辑模型的预测进行比较。分析可知CNN预测的非线性部分包含了有用的附加信息，这些信息在相对于逻辑模型而言来自底层图像的较短时间范围内最为明显。

3.4迁移学习

最后，作者探讨了迁移学习在数据有限的情况下构建准确的基于图像预测的可能性。迁移学习使用在上下文中识别的模式，进行不同上下文中的分析或预测。结果表明，CNN根据每日美国股票数据确定的预测模式可以很好地转移到国际市场和其他时间尺度。另外，可以将应用在美国数据中估计的CNN模型，在其他无法直接训练CNN的环境中构建有利可图的投资组合。

表7 国际迁移与投资组合夏普比率（I5/R5）

对于26个国家中的21个，迁移学习比本地再训练模型（针对等权重投资组合）产生了夏普比率增益，其中20个国家的增益在统计上显著，从美国模型迁移而来的夏普比率增益超过0.5（希腊为0.34除外）。平均而言，从美国模型迁移而来的夏普比率为3.6，比本地再训练模型的平均夏普比率2.3高出50%以上。

图6 迁移模型的夏普比率

图6通过绘制表7中报告的夏普比率增益与每个国家的股票数量的关系图，总结了国际迁移学习的好处。大多数国际市场都很小，因此集中在图的左侧。在这些国家，针对于本地训练的CNN模型，投资组合夏普比率往往不如美国迁移模型。但对于图右侧较大的市场，预期收益（基于最佳拟合线）很小或约为负值。以上结果表明，当数据量足够时，模型再训练是有益的，这可能是由于迁移学习没有考虑到各国预测模式存在的一定程度异质性。

总结

该文通过引入卷积神经网络（CNN）对传统技术分析进行了创新性改进，利用价格图像来直接提取最具预测能力的特征，克服了传统方法中对预定义模式的依赖。通过将股票价格数据转化为图像，并结合移动平均线与交易量信息，研究者构建了一个高效的深度学习模型。这一方法不仅提升了价格趋势预测的准确性，还能产生更具盈利性的投资策略，并展现出在不同市场和时间尺度上良好的稳健性与适应性。

通过该文的研究，价格趋势分析得到了一个全新的视角，即通过图像分析的深度学习方法，可以更深入地挖掘价格数据中的复杂模式。这一创新性研究为未来的市场预测与投资策略提供了新的工具和思路，展示了机器学习在金融领域的巨大潜力。

参考文献

Fama, E. F., & French, K. R. (1988). Dividend yields and expected stock returns. Journal of Financial Economics, 22(1), 3-25.

Gu, S., Kelly, B., & Xiu, D. (2020). Empirical asset pricing via machine learning. The Review of Financial Studies, 33(5), 2223-2273.

Jensen, T. I., Kelly, B., & Pedersen, L. H. (2023). Is there a replication crisis in finance?. The Journal of Finance, 78(5), 2465-2518.

Kelly, B., & Pruitt, S. (2013). Market expectations in the cross‐section of present values. The Journal of Finance, 68(5), 1721-1756.

推文作者

吕志冲，西南交通大学管理科学与工程博士，研究方向为大语言模型与金融预测，欢迎学术交流。推文内容若存在错误与疏漏，欢迎邮箱批评指正！

个人邮箱：

Abstract

We reconsider trend-based predictability by employing flexible learning methods to identify price patterns that are highly predictive of returns, as opposed to testing predefined patterns like momentum or reversal. Our predictor data are stock-level price charts, allowing us to extract the most predictive price patterns using machine learning image analysis techniques. These patterns differ significantly from commonly analyzed trend signals, yield more accurate return predictions, enable more profitable investment strategies, and demonstrate robustness across specifications. Remarkably, they exhibit context independence, as short-term patterns perform well on longer time scales, and patterns learned from U.S. stocks prove effective in international markets.

声明：推文仅代表文章原作者观点，以及推文作者的评论观点，并不代表香樟经济学术圈公众号平台的观点。

话题：