用什么模型可以最好地预测未来股票定价模型有哪几种价格走势?


基于cbam和cnn的股市预测模型构建方法技术领域1.本发明涉及金融技术领域,尤其涉及基于cbam和cnn的股市预测模型构建方法。
背景技术:
2.股票市场预测是金融市场最重要的课题之一,许多研究者针对这一领域进行了大量的研究。由于其本身具有的数据量大、非线性和非平稳性的特征,从而仅使用传统的统计学方法来进行股票市场预测的有效性不够。随着基于深度学习的模型预测开始成为在各个领域应用中实现最佳性能,其表现优于bp等经典计算智能方法。并且,基于计算机视觉的图像处理问题体现出这些深度学习模型优于其他技术的应用类型。3.近年来,许多深度学习技术,如递归神经网络(rnn)、卷积神经网络(cnn)和长短期记忆(lstm)已经应用在股票市场的研究中以提高预测精度。4.但是:(1)上述提到的传统的统计学算法有效性不够。股票市场具体表现为多个价格交量随时间变化的序列,这属于基于数理统计时间序列问题。部分研究人员将时序预测模型应用到股票预测中,包括向量自回归模型(vector autorcgressive,var)、自回归条件异方差模型(autoregressive conditional
heteroscedasticity,arch)等都被应用到股市预测研究中,并取得了一定的效果。然而其缺点也比较明显,该类模型依赖合理的假设件,实际操作中很难满足。当股市数据波动较大时,模型预测结果可能会较大地偏离真实数据,所以传统的统计学算法并不能取得较好的预测效果;(2)基于深度学习的方法中,大多都是将深度学习算法融合来预测股票的价格的,模型融合可以实现在模型之间的取长补短,优化模型在具体问题上的表现。而用深度学习融合模型来预测股票的买入点、卖出点和持有点的研究不多,所以进行这一方面的研究很有必要;(3)上述深度学习预测股票买入点卖出点、持有点容易出现过拟合、特征提取不合理等问题。容易导致出现许多虚假的买入点卖出点、持有点,这种情况很容易被忽略掉,所以合理的构造数据集,提取更有效的特征因子也是值得注意的方面。5.针对深度学习预测股票买入卖出点、持有点容易出现过拟合、特征提取不合理等问题,本发明提出了基于cnn与cbam相结合的模型来进行预测。实现发现更多的买卖点和持有点的目的。首先,将一维的时间序列转化为高维的图像数据集作为深度卷积神经网络的输入;其次,首先,在卷积层和池化层之间引入bn层,降低过拟合,加速收敛;其次,在bn层后引入cbam模块,提取到更重要特征;最后,以三只典型的股票为例,验证cbam-cnn模型的泛化性能。
技术实现要素:
6.本发明的目的是提供基于cbam和cnn的股市预测模型构建方法,用于解决深度学习预测股票买入卖出点、持有点容易出现过拟合、特征提取不合理等问题。7.为了实现上述目的,本发明采用了如下技术方案:8.本发明提供一种基于cbam和cnn的股市预测模型构建方法,包括以下步骤:9.所述预测模型包括输入层、cnn层、池化层和全连接层;10.将一维的时间序列转化为高维的图像数据集作为输入层的输入内容,输给cnn层;11.在cnn层和池化层之间引入bn层,降低过拟合,加速收敛;12.在bn层后引入cbam模块,提取重要特征。13.进一步地,所述cnn层输入向量与输出向量之间对应关系为:[0014][0015]式中:yi为输出向量,xi为输入向量,n为输入到神经元j的向量总数;*表示为卷积;输入向量x,与神经元j连接的权重参数;bj为偏置参数;f()是激活函数。[0016]进一步地,所述cbam模块包括通道注意力模块和空间注意力模块。[0017]进一步地,所述bn层的算法如下:[0018][0019]式中,表示一层中某个神经元的输入,e[xi]表示对该神经元在随机梯度下降法中一个批次的所有输入数据求均值,表示该神经元的一个批次的所有输入的标准差。[0020]本发明至少具备以下有益效果:[0021]本发明通过对cnn网络进行有效改进,在卷积层和池化层之间加入bn层,并且在bn层后面加入cbam模块,卷积层提取输入的不同特征,bn层能提高训练速度且降低过拟合风险,cbam模块提取重要特征,池化层降低模型参数量可以优化工作量。本发明通过实验结果证明,本发明构建的模型具有较高的分类预测精度,因为能模型可以识别大多数的买卖实例因而具有比较好的效果。附图说明[0022]为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。[0023]图1为cbam结构图;[0024]图2为本发明整体模型框架图;[0025]图3为消融实验结果图;[0026]图4为模型loss图(dao 30)[0027]图5为模型loss图(shh 50)。具体实施方式[0028]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并pooling,gmp),以及空间注意力sam模块,弥补了空间信息在迁入时的不足之处,对后续提高预测精度有较大帮助。[0039](3)bn层:[0040]深度学习算法的一个重要缺陷就是网络训练困难,使用梯度下降法会出现收敛到局部最优值的情况,使用sigmoid激活函数会出现梯度消失,并且随着网络层数的加深,训练中的超参数会对训练的过程和结果产生很大影响。为此,将批量归一化算法加入到本发明设计的网络中,使其对网络输入的图像进行批量归一化处理。bn算法的公式如下:[0041][0042]式中,表示一层中某个神经元的输入,e[xi]表示对该神经元在随机梯度下降法中一个批次的所有输入数据求均值,表示该神经元的一个批次的所有输入的标准差。[0043](4)cbam-cnn:[0044]本发明cbam-cnn是对cnn网络进行的有效改进。cbam-cnn(在cnn网络模型基础上构建基础模型,基础模型包括输入层、卷积层、池化层和全连接层)包括输入层、卷积层、bn层、cbam、池化层和全连接层,如图2所示。在卷积层和池化层之间加入bn层,并且在bn层后面加入cbam模块,卷积层提取输入的不同特征,bn层能提高训练速度且降低过拟合风险,cbam模块提取重要特征,池化层降低模型参数量可以优化工作量,dropout增加网络稀疏性且缓解过拟合,全连接层连接所有特征和将输出值送入分类器进行分类。[0045]模型所涉及的超参数主要包括卷积层的卷积核个数、大小,dropout层的神经元保留比例,通用的深度学习训练参数如学习率、batch大小、权重初始化方式等,各超参数的取值将在训练集中进行调整优化。[0046]由此,本技术带来的技术效果如下:[0047](1)性能评估指标与消融实验[0048]本发明以滑动窗口训练方式,通过对训练集进行交叉验证获得模型的最佳超参数,取卷积层的卷积核大小为3*3,padding为same,stride为1。dropout层的保留比例为0.5,同时设置学习率为0.001,batch大小为60,并采用adam优化器进行训练。为衡量模型的预测效果,对于机器学习中的分类问题,最简单粗暴的衡量指标就是准确率(accuracy),但是对于样本标签分布极其不均衡的数据,准确率就会出现误导。本发明采用混淆矩阵、加权f1分数和kappa系数等作为分类精度评价指标。[0049]在wmt数据集下的消融实验结果如图3所示,分别验证了cnn、cnn+cbam、cnn+bn+cbam三种模型在平均准确率、precision、f1score、kappa系数四种指标的对比结果。从图中可以看出,bn层和cbam模块的增加在个性能指标上均有不同程度的提升,验证了本发明cbam-cnn模型的有效性。[0050](2)实验结果[0051]利用建立的cbam-cnn网络模型,为了验证所提出方法的适用性和优越性,选择道琼斯30指数和ssh 50指数对交易点和持有点进行预测。分析了该模型的预测性能。虽然每个股票的表现都是单独考虑的,但由于空间限制,将显示汇总结果。值得注意的是,在整个数据集的实际预测过程中,迭代预测是以窗口移动的形式进行的。统计模型的混淆矩阵、加权f1分数、kappa系数和其他指标如表1-表4所示:[0052]表1:道琼斯30指数测试数据的混淆矩阵[0053][0054]表2:道琼斯30指数测试数据的评估[0055][0056]表3:道琼斯30指数测试数据的混淆矩阵[0057][0058]表4:道琼斯30指数测试数据的评估[0059][0060]表1列出了dao30测试数据的混淆矩阵。表2说明了道琼斯30的混淆矩阵获得的结果的性能评估。买入点和卖出点的精度值比持有点差,对于股票交易系统来说,准确的预测买入点和卖出点对于交易算法的整体成功非常重要。在我们的实验中,大多数“买入和卖出”点都被cbam-cnn模型正确捕获。由于买入点和卖出点出现的频率比持有点低得多,这导致产生了很多虚假的买入卖出点,因为当持有点靠近买入卖出点的时候,深度学习神经网络很可能会无法区分开买卖点和持有点,所以用深度学习算法找到少部分的买入卖出点是有挑战的。kappa系数为基本都属于moderate的范围里,证明了本实验数据集的合理性。表3提供了shh
50测试数据的混淆矩阵,表4说明了对shh 50测试数据的混淆矩阵的评估,对比shh 50和dao 30的实验结果表明这个cbam-cnn模型很好地解决了网络最优规模的确定问题,从而缩小了网络规模又提高了网络的泛化性能。[0061]为验证本发明所采用引入cbam注意力机制模块的网络在dow 30和ssh
50数据集上的高效性和准确性,本发明将训练阶段验证集准确率和验证集loss的变化进行了可视化,如图4、图5所示。由图可知,val_f1越来越大最后趋于稳定,val_loss越来越小最后也趋于稳定。cbam-cnn采用了更高效网络特征提取模块,其网络收敛较快,并且有较高的准确率,对未来应用于股票买卖策略研究有一定现实意义。[0062]另外,本发明对比了cnn和cbam-cnn在测试集上的准确率和模型大小,结果可以发现,加入cbam注意力机制后,虽然模型参数量有所增加,但是计算速度却降低了近1%,并且准确率提升了2.5%,证明了cbam-cnn在dow 30和ssh 50数据集上的有效性。[0063]由此:本发明重点是分析了金融时间序列数据,并将这些数据转换为二维图像。我们主要是预测盈利交易的时间序列值的进入点和退出点,如“买入”、“卖出”和“持有”标记。针对股票买入点卖出点、持有点的预测问题,结合了cbam模块和卷积神经网络各自的特点,建立了cbam-cnn模型,并通过dao30和shh50两类的股票指数进行验证。[0064]本发明cbam-cnn是对cnn网络进行的有效改进。cbam-cnn包括输入层、卷积层、bn层、cbam、池化层和全连接层。在卷积层和池化层之间加入bn层,并且在bn层后面加入cbam模块,卷积层提取输入的不同特征,bn层能提高训练速度且降低过拟合风险,cbam模块提取重要特征,池化层降低模型参数量可以优化工作量,dropout增加网络稀疏性且缓解过拟合,全连接层连接所有特征和将输出值送入分类器进行分类。实验结果证明,本算法具有较高的分类预测精度,因为能模型可以识别大多数的买卖实例因而具有比较好的效果。[0065]模型的训练流程如图6所示。模型所涉及的超参数主要包括卷积层的卷积核个数、大小,dropout层的神经元保留比例,通用的深度学习训练参数如学习率、batch大小、权重初始化方式等,各超参数的取值将在训练集中进行调整优化。[0066]以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。}

我要回帖

更多关于 股票定价模型有哪几种 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信