基于投资者关注和社交网络的选股模型研究
发布时间:2021-09-23 04:26
随着互联网的发展,网络成为人们生活中的重要部分,一方面人们通过互联网获取自己关注的信息从而对自己的决策产生影响;另一方面互联网成为人们表达自己态度,传播自己观点的重要途径。与之对应,搜索引擎和社交网络正是基于人们这两种需求衍生出的互联网产品。和过去不同,在大数据时代下人们的一切行为都会被记录,而这些数据都能够在保护个人隐私的前提下用于分析,更准确的反映个人行为。因此,行为金融学的研究者使用人们的互联网行为进行了卓有成效的研究。其中通过互联网搜索行为研究投资者有限关注的研究和使用舆论平台反映投资者情绪从而预测股票市场变化的研究成为了行为金融学的研究热点。此外,随着人工智能技术的发展各种深度学习和机器学习方法也被广泛应用于各种问题的研究。正是在这些基础上,本文首先通过爬虫获取股票相关百度指数和以新浪股吧为代表的投资者网络评论数据,以及股票历史交易相关数据。对于非结构化数据进行结构化处理,对文本数据建立股票情感语料库进行情感分类;按照前人对于投资者关注度的处理方法对百度指数进行处理;之后构建基于LSTM的深度学习网络完成对股票市场的预测。最后使用行业中性策略和多空策略对模型预测结果进行筛选构...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
研究路线图
图 2-1 情感分析流程图的学习方法大多采用聚类的方法,无论是 K-Means,基还是层次聚类方法[42],特点都是不需要标注数据,完全进行判断。优点是不需要大量的认为标注就可以自动学率较低,调试过程复杂。有监督的学习方法[43],则是基于机器学习方法,例如最,朴素贝叶斯方法都被证明是较为有效的方法,但是这数据标注,即使结果很好,但效率往往不高。上特点,本研究采用基于词典的分类方法。所谓基于词感词典,一般主要分为正向情感词和负向情感词,情感定了分类的准确率。该方法首先需要对原始数据进行预停用词等,之后判断正向情感词和负向情感词数量的多则文本正向;如果负向情感词数量多则文本判定为负向。该类方法有点事判断高效,准确率相对较高,问题则的信息,如果词典不够完备则会影响分类结果。
哈尔滨工业大学管理学硕士学位论文变种,由于其能够在后续变量的处理股票数据。设计STM 网络的前身,起源于 Saratrk[45]。局限于当时的计算机计算算机基础技术的发展,越来越多掘数据中的时序信息的深度内容当前数据与之前数据的关联,某利用之前网络的输入信息。下文
【参考文献】:
期刊论文
[1]基于Copula函数尾部相关性的股票交易策略[J]. 张凯,魏子凯. 统计与决策. 2014(16)
[2]浅谈基本面分析和技术分析在股票市场的应用[J]. 扈香梅. 新西部(理论版). 2014(05)
[3]货币政策与股票收益率的非线性影响机制研究[J]. 张小宇,刘金全,刘慧悦. 金融研究. 2013(01)
[4]基金业绩、投资者有限注意力与基金申购[J]. 邹富. 上海金融. 2011(12)
[5]货币政策对股票市场的冲击[J]. 王曦,邹文理. 统计研究. 2011(12)
[6]股票基本面分析在实战中的应用[J]. 张秀云,郭树. 中国证券期货. 2011(05)
[7]互联网知道的更多么?——网络开源信息对资产定价的影响[J]. 张永杰,张维,金曦,熊熊. 系统工程理论与实践. 2011(04)
[8]中国网络字频波动与股票市场关系研究[J]. 张旭. 统计与决策. 2011(07)
[9]我国货币政策对股票市场流动性风险的影响——基于流动性波动性的风险测度方法[J]. 王明涛,何浔丽. 经济管理. 2011(03)
[10]网络讨论、投资者情绪与IPO抑价[J]. 林振兴. 山西财经大学学报. 2011(02)
博士论文
[1]关注异质性与媒体效应对股票市场的影响研究[D]. 刘先伟.哈尔滨工业大学 2016
硕士论文
[1]技术分析在股票投资中的应用[D]. 李江一.华中科技大学 2009
[2]从基本面分析万科企业股份有限公司的投资价值[D]. 吴光翩.西南交通大学 2007
本文编号:3405037
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
研究路线图
图 2-1 情感分析流程图的学习方法大多采用聚类的方法,无论是 K-Means,基还是层次聚类方法[42],特点都是不需要标注数据,完全进行判断。优点是不需要大量的认为标注就可以自动学率较低,调试过程复杂。有监督的学习方法[43],则是基于机器学习方法,例如最,朴素贝叶斯方法都被证明是较为有效的方法,但是这数据标注,即使结果很好,但效率往往不高。上特点,本研究采用基于词典的分类方法。所谓基于词感词典,一般主要分为正向情感词和负向情感词,情感定了分类的准确率。该方法首先需要对原始数据进行预停用词等,之后判断正向情感词和负向情感词数量的多则文本正向;如果负向情感词数量多则文本判定为负向。该类方法有点事判断高效,准确率相对较高,问题则的信息,如果词典不够完备则会影响分类结果。
哈尔滨工业大学管理学硕士学位论文变种,由于其能够在后续变量的处理股票数据。设计STM 网络的前身,起源于 Saratrk[45]。局限于当时的计算机计算算机基础技术的发展,越来越多掘数据中的时序信息的深度内容当前数据与之前数据的关联,某利用之前网络的输入信息。下文
【参考文献】:
期刊论文
[1]基于Copula函数尾部相关性的股票交易策略[J]. 张凯,魏子凯. 统计与决策. 2014(16)
[2]浅谈基本面分析和技术分析在股票市场的应用[J]. 扈香梅. 新西部(理论版). 2014(05)
[3]货币政策与股票收益率的非线性影响机制研究[J]. 张小宇,刘金全,刘慧悦. 金融研究. 2013(01)
[4]基金业绩、投资者有限注意力与基金申购[J]. 邹富. 上海金融. 2011(12)
[5]货币政策对股票市场的冲击[J]. 王曦,邹文理. 统计研究. 2011(12)
[6]股票基本面分析在实战中的应用[J]. 张秀云,郭树. 中国证券期货. 2011(05)
[7]互联网知道的更多么?——网络开源信息对资产定价的影响[J]. 张永杰,张维,金曦,熊熊. 系统工程理论与实践. 2011(04)
[8]中国网络字频波动与股票市场关系研究[J]. 张旭. 统计与决策. 2011(07)
[9]我国货币政策对股票市场流动性风险的影响——基于流动性波动性的风险测度方法[J]. 王明涛,何浔丽. 经济管理. 2011(03)
[10]网络讨论、投资者情绪与IPO抑价[J]. 林振兴. 山西财经大学学报. 2011(02)
博士论文
[1]关注异质性与媒体效应对股票市场的影响研究[D]. 刘先伟.哈尔滨工业大学 2016
硕士论文
[1]技术分析在股票投资中的应用[D]. 李江一.华中科技大学 2009
[2]从基本面分析万科企业股份有限公司的投资价值[D]. 吴光翩.西南交通大学 2007
本文编号:3405037
本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/3405037.html