当前位置:主页 > 经济论文 > 经济发展论文 >

基于文本挖掘和机器学习算法的股票投资研究

发布时间:2025-06-06 00:42
  作为资本市场的一个重要组成部分,股票市场在整个金融领域中有着十分重要的地位。一直以来,无论是在学术领域还是在资产管理行业,都有很多人希望能够找到一种能够正确地预测股票市场变动方向的方式。过去人们在进行股票价格走向的预测分析时,大部分是从股票市场自身的角度出发,利用证券价格的历史价格,交易量或者是和公司相关的收益指标来分析股票未来价格的变动,很少会从经济新闻、财经自媒体文章、股市评论等文本信息的角度来分析股票未来的价格变动,而随着互联网特别是移动互联网在百姓生活中的普及,越来越多的投资者开始接触到各种财经新闻,并且以此来辅助自己进行投资,因此研究这些财经文本信息对股市的影响,以及如何从这些文本信息中挖掘出有效的特征来对股票市场的走势进行判断有着重要的现实意义。本文的研究是利用财经新闻文本数据,从文本挖掘的角度来分析财经新闻对股票价格的影响及利用从文本数据中抽取的特征来对股票市场的未来走势进行预测。与市场上常见的技术性指标、基本面指标等结构化数据不同,文本信息属于一种非结构化的数据,要想让模型能够理解这些信息并从中挖掘出一些有用的特征,必须先对收集到的财经新闻进行转换处理,本文首先运用了Py...

【文章页数】:58 页

【学位级别】:硕士

【部分图文】:

图2.1支持向量机如图2.1所示,SVM在样本点线性可分时,会在样本点之间寻找一个超平面

图2.1支持向量机如图2.1所示,SVM在样本点线性可分时,会在样本点之间寻找一个超平面

兰州财经大学硕士学位论文基于文本挖掘和机器学习算法的股票投资研究14图2.1支持向量机如图2.1所示,SVM在样本点线性可分时,会在样本点之间寻找一个超平面将所有样本点分开。SVM的特点是对超平面的好坏有着自己的评价标准,只有距离分隔平面最近点的距离最大的那个分隔平面才是最好的超....


图2.2XGBoost模型

图2.2XGBoost模型

兰州财经大学硕士学位论文基于文本挖掘和机器学习算法的股票投资研究16关系,大大降低了计算量。在支持向量机中,常用的核函数有四种:线性核、多项式核、高斯核与Sigmoid核函数。(1)线性核函数:K(x,x’)=xx"(2)多项式核函数:K(x,x")=((xx")+c)d(3)高....


图2.3包含一个隐藏层的神经网络

图2.3包含一个隐藏层的神经网络

兰州财经大学硕士学位论文基于文本挖掘和机器学习算法的股票投资研究20图2.3包含一个隐藏层的神经网络人工神经网络是现在最为流行的一种机器学习算法,由于其强大的非线性拟合能力,还有各种优化算法的出现,使得神经网络在图像识别、语音识别甚至是无人驾驶能人工只能领域中得到广泛运用。神经网....


图2.4神经网络常用激活函数在穿越过所有的隐藏层后,会进入到输出层,得到输出值:y=σ(z)θ+b

图2.4神经网络常用激活函数在穿越过所有的隐藏层后,会进入到输出层,得到输出值:y=σ(z)θ+b

兰州财经大学硕士学位论文基于文本挖掘和机器学习算法的股票投资研究21图2.4神经网络常用激活函数在穿越过所有的隐藏层后,会进入到输出层,得到输出值:y=σ(z)θ+b1从输入层到输出层的过程属于神经网络的前向传播,在这之后需要通过反向传播算法来改变参数值。反向传播算法包括两个要素....



本文编号:4049525

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjifazhanlunwen/4049525.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e1317***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com