基于网络文本挖掘的投资者情绪对股票市场风险的预警研究
发布时间:2022-01-04 00:42
海量的互联网金融信息在金融市场中拥有着举足轻重的地位,对网络金融文本信息的挖掘工作存在明显的实践价值。投资者在进行投资活动的过程中存在主观性偏好和认知偏差,市场并非是完全有效的,由此资产定价不能忽视投资者心理因素的作用。随着社交网站和金融理财互动平台的涌现,投资者更倾向于通过便捷性的网络途径关注股票市场信息,并可以不受时间、空间的限制与其他投资者互动交流心得。如果可以有效地结合互联网金融信息测度出投资者情绪,并能够进行风险预警研究,这给股市实践带来的价值是尤为显著的。在现代资产理论的框架下,本文首先从心理学和外部环境分析投资者情绪对股票市场风险的影响机理;其次,以2017年3月17日至2018年5月3日期间东方财富网上证指数股吧554186条发帖信息为研究对象,对投资者情绪特征进行全面刻画,并应用基于词典的情感分析方法实现金融文本挖掘和情感识别;与此同时,设计一套股票市场风险预警系统,将市场表现指标和投资者情绪指标应用到核函数为径向基函数、惩罚系数为4、γ参数为2-5的SVM模型,并以预警精度、查准率、召回率及F1指数科学评估预警能力,最终引入投资者情绪的回测精度...
【文章来源】:江苏大学江苏省
【文章页数】:101 页
【学位级别】:硕士
【部分图文】:
基于情感词典的金融文本挖掘过程
图 3. 2 常见中文分词工具的受众度对比图文本分词关键在于分词工具的选择。因为不同的分词工具采用的分词算法并非一致,这会直接导致分词效果差别化。Github 作为全球程序员发布开源项目的重要代码仓库,不乏也聚集许多文本分词工具,其 star 值可以被用来反映程序的受众度。图 3.2 展示了目前常见中文分词工具的受众度对比图,其中 jieba 分词库遥遥领先。观察表 3.3,比较如下 8 种分词工具对同个示例的分词效果,jieba分词的分词效果不亚于其他分词工具,而且也 供词性标注功能。于是,最终选择 python 中 jieba 中文分词库作为文本分词工具。它囊括中文分词、词性标注、命名实体识别、新词识别、支持用户自定义词典等功能,由此被广泛地应用于中文词法分析。具体示例如下:指数没有补跌调整下来绝对不要进,市场底还早呢
出 TF 值和 IDF 值。TF 即词频,是各个词在 个文本逆向文档频率,可以衡量各个词语重要性。各个特定(3.1),其中,All_Num表示文本文件总数,Conta的文本文件数。 = 10( _ _ ) 误率,本文运用 TF-IDF 技术进行特征表示。网络领文本信息,保留文本中出现频率较高的关键词,并整个文本的话题和主旨。集合所有分词后的标题文本图 3.3)。从词云图上观测出,“大盘”、“A 股”数” 出现的频次较高,印证标题文本是对金融领域状况密不可分。而“股灾”、“下跌”此类形容股市者的情感。
【参考文献】:
期刊论文
[1]市场操纵与股价崩盘风险——基于投资者情绪的路径分析[J]. 李梦雨,李志辉. 国际金融研究. 2019(04)
[2]投资者情绪与股价崩盘风险:来自中国市场的经验证据[J]. 赵汝为,熊熊,沈德华. 管理评论. 2019(03)
[3]基于SVM的碳金融风险预警模型研究[J]. 谷慎,汪淑娟. 华东经济管理. 2019(03)
[4]企业内部控制与机构投资者羊群行为:“反向”治理效果及异质性分析[J]. 张向丽,池国华. 财贸研究. 2019(01)
[5]基于动态无标度网络的信息策略与羊群行为演化研究[J]. 王宗润,潘城城. 中国管理科学. 2018(12)
[6]央行外汇干预、投资者情绪与汇率变动[J]. 司登奎,李小林,江春. 统计研究. 2018(11)
[7]基于实验经济学的投资者情绪对股票流动性影响研究[J]. 尹海员,华亦朴. 中央财经大学学报. 2018(11)
[8]基于股市投资者情绪的非理性投机泡沫模型研究[J]. 黎超,胡宗义,施淑蓉. 财经理论与实践. 2018(05)
[9]投资者信息能力:意见分歧与股价崩盘风险——来自社交媒体“上证e互动”的证据[J]. 丁慧,吕长江,陈运佳. 管理世界. 2018(09)
[10]网络投资者情绪与股票市场价格关系研究——基于文本挖掘技术分析[J]. 孟志青,郑国杰,赵韵雯. 价格理论与实践. 2018(08)
本文编号:3567300
【文章来源】:江苏大学江苏省
【文章页数】:101 页
【学位级别】:硕士
【部分图文】:
基于情感词典的金融文本挖掘过程
图 3. 2 常见中文分词工具的受众度对比图文本分词关键在于分词工具的选择。因为不同的分词工具采用的分词算法并非一致,这会直接导致分词效果差别化。Github 作为全球程序员发布开源项目的重要代码仓库,不乏也聚集许多文本分词工具,其 star 值可以被用来反映程序的受众度。图 3.2 展示了目前常见中文分词工具的受众度对比图,其中 jieba 分词库遥遥领先。观察表 3.3,比较如下 8 种分词工具对同个示例的分词效果,jieba分词的分词效果不亚于其他分词工具,而且也 供词性标注功能。于是,最终选择 python 中 jieba 中文分词库作为文本分词工具。它囊括中文分词、词性标注、命名实体识别、新词识别、支持用户自定义词典等功能,由此被广泛地应用于中文词法分析。具体示例如下:指数没有补跌调整下来绝对不要进,市场底还早呢
出 TF 值和 IDF 值。TF 即词频,是各个词在 个文本逆向文档频率,可以衡量各个词语重要性。各个特定(3.1),其中,All_Num表示文本文件总数,Conta的文本文件数。 = 10( _ _ ) 误率,本文运用 TF-IDF 技术进行特征表示。网络领文本信息,保留文本中出现频率较高的关键词,并整个文本的话题和主旨。集合所有分词后的标题文本图 3.3)。从词云图上观测出,“大盘”、“A 股”数” 出现的频次较高,印证标题文本是对金融领域状况密不可分。而“股灾”、“下跌”此类形容股市者的情感。
【参考文献】:
期刊论文
[1]市场操纵与股价崩盘风险——基于投资者情绪的路径分析[J]. 李梦雨,李志辉. 国际金融研究. 2019(04)
[2]投资者情绪与股价崩盘风险:来自中国市场的经验证据[J]. 赵汝为,熊熊,沈德华. 管理评论. 2019(03)
[3]基于SVM的碳金融风险预警模型研究[J]. 谷慎,汪淑娟. 华东经济管理. 2019(03)
[4]企业内部控制与机构投资者羊群行为:“反向”治理效果及异质性分析[J]. 张向丽,池国华. 财贸研究. 2019(01)
[5]基于动态无标度网络的信息策略与羊群行为演化研究[J]. 王宗润,潘城城. 中国管理科学. 2018(12)
[6]央行外汇干预、投资者情绪与汇率变动[J]. 司登奎,李小林,江春. 统计研究. 2018(11)
[7]基于实验经济学的投资者情绪对股票流动性影响研究[J]. 尹海员,华亦朴. 中央财经大学学报. 2018(11)
[8]基于股市投资者情绪的非理性投机泡沫模型研究[J]. 黎超,胡宗义,施淑蓉. 财经理论与实践. 2018(05)
[9]投资者信息能力:意见分歧与股价崩盘风险——来自社交媒体“上证e互动”的证据[J]. 丁慧,吕长江,陈运佳. 管理世界. 2018(09)
[10]网络投资者情绪与股票市场价格关系研究——基于文本挖掘技术分析[J]. 孟志青,郑国杰,赵韵雯. 价格理论与实践. 2018(08)
本文编号:3567300
本文链接:https://www.wllwen.com/weiguanjingjilunwen/3567300.html