CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名基于深度学习的量化投资模型研究
作者许浩楠
答辩日期2023-05-16
文献子类硕士
关键词量化投资 深度学习 股票趋势预测
英文摘要

随着互联网和智能科技的发展,金融行业正在进入一个快速发展的新时代。 近年来,量化投资的相关研究持续火热,并成为市场投资的新方式。量化投资是 相对于主观投资而言的,其投资过程往往由具有数据处理和分析能力的程序或 者机器执行。在欧美,量化投资发展成熟,已有庞大的市场规模和机构数量。国 内起步较晚,但发展迅猛,相关资产已突破万亿关口。近年来,以机器学习模型 为基础的量化投资策略在国内迅速发展。深度学习作为机器学习的重要分支,在 图像理解和自然语言处理等多个任务中取得不错的成绩。在金融领域,深度学习 算法处在快速发展的阶段,并已经应用于欺诈检测、市场监管等多个方面。

在真实的交易市场中,金融数据往往含有巨大的噪声,并且具有非平稳性和 非线性的特点。传统的计量经济学方程在分析复杂的金融市场数据时表现不佳, 一些反映市场变动情况的指标,也会出现延迟大,准确度低的问题。基于深度学 习的模型成功地避免了上述缺点,深度学习在特征筛选和信息挖掘方面具有独 特的优势,有可能获得更准确的结果。本文中,我们基于深度学习理论提出了两 种创新型算法模型,股票趋势预测是现代量化投资系统中的难点和重要任务之 一,所以我们以模型在该任务上的表现作为评价标准,具体工作内容如下:

1. 融合因子特征的时空图神经网络模型。考虑到当前的研究工作大多基于 原始特征,缺乏对专家知识的充分使用,而且针对关系型数据的挖掘较为简单, 因此我们提出了融合因子特征的建模方法。利用因子数据,将专家知识融入股票 特征之中,丰富信息源。同时为了弥补当前关系型数据的不足,该模型设计了因 子生成图模块和异质图神经网络模块,借此挖掘股票间的潜在关系,同时最大程 度上提取多种关系的有效信息。为了有效地完成时间域、空间域和知识域的融 合,我们利用时空图神经网络的模型架构,先用时序模块挖掘因子特征和原始特 征的时序信息,然后将输出作为空间模块的输入,两部分信息融合完成最终的预 测。在真实股市数据集上的实验证明,该模型具有较好的性能。

2. 融合多粒度数据的对比预训练模型。考虑到现有工作大多依赖日频数据 特征,缺乏对高频数据的使用。高频数据往往含有更加丰富的语义信息,但因其 信噪比低且有效地完成多粒度数据融合较难,所以很少有相关的深度学习算法。 因此我们提出了一个对比预训练模型,对比学习的优势在于它可以利用数据之 间的依赖关系来构造训练目标,捕捉数据特征的本质,并最有效地挖掘信息。该 模型基于数据粒度、股票关系和趋势变化三个方面构建了对比损失函数,以预训 练的方式完成多粒度数据的特征嵌入。预训练之后,将训练好的特征输入到注意 力模块完成多粒度数据融合,利用收益率损失函数监督完成最后的微调。在真实 股市数据集上的回测实验表明,该模型较于基准模型可以获得更高的收益。

语种中文
页码78
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/51948]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
许浩楠. 基于深度学习的量化投资模型研究[D]. 2023.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace