基于机器学习的网络舆情情感倾向分析研究
发布时间:2021-08-02 08:19
近年来,随着移动终端技术的不断发展,人们可以愈发便捷地通过微博、论坛等载体来表达个人的情绪及观点。用户通过这些载体发布的信息中往往包含着一定程度的情感倾向、意见倾向特征,通过情感倾向分析技术挖掘这些特征对于舆情分析、舆情监控等有着十分重要的意义。本文以论坛文本数据为研究对象,使用基于机器学习的情感倾向分析方法进行了相关研究,具体研究内容如下:首先,介绍了针对论坛数据进行舆论倾向性研究的背景及意义,阐述了业内使用机器学习技术进行情感分析的相关研究现状。同时,针对情感倾向分析的流程和相关技术进行了介绍,包括文本采集技术、文本预处理技术、文本表示技术、性能评估指标等。而后,研究使用朴素贝叶斯技术以及字典法针对论坛文本进行情感倾向性分析,经过算法适用性比较,最终选择了效果更优的字典法。通过扩充分词库、扩充极性词库、构建面向突发事件的情感倾向词典等方式对算法进行了四次优化,最终平均准确率达到了87%,平均召回率达到了81%,能较好地反映文本针对突发事件的意见倾向数值。
【文章来源】:南京邮电大学江苏省
【文章页数】:109 页
【学位级别】:硕士
【部分图文】:
中国网民规模和互联网普及率
1.1 研究背景及意义1.1.1 互联网现状随着社会的进步和信息技术的发展,社会信息化、网络化程度的急剧增高,互联网已渗透到人们生活的点点滴滴,起到无法替代的作用。人们使用的互联工具也越来越多,包括 PC、手机、Pad 等。如图 1.1 所示,根据 CNNIC 的调查数据[1],截至 2018 年 6 月,我国网民规模已达 8.02 亿,互联网普及率达到了 57.7%。可见今后数年,我国网民数量、网站规模、数据容量都将持续增长,互联网渗透率将不断提高。随着 4G 网络的广泛普及、上网资费的不断降低,目前中国手机用户的规模连年呈上升态势,截止 2018 年 6 月,已达 7.88 亿,且手机网民占整体网民比例高达 98.3%,如图 1.2所示。通过移动手机终端,人们可以随时随地地在论坛、微博、朋友圈等载体上浏览信息、抒发情感、表达对某人某事某物的看法和意见。
图 4.5 实验 1 与实验 2 结果对比表图由图 4.5 可知,加入了程度词和否定词之后,正确率和召回率都有所提升。同时,对后的情感值数值进行观察发现,情感值提升较为明显,更新后的算法能更好地反映情感的变化,原先判断错误的语句也得到了有效的纠正,将文本编上序号后使用两种算法进感值计算,绘制情感值对比图,如图 4.6 所示。图 4.6 实验 1 与实验 2 正向情感值对比图123
【参考文献】:
期刊论文
[1]基于空间自相关的网络舆情话题演化时空规律分析[J]. 王璟琦,李锐,吴华意. 数据分析与知识发现. 2018(02)
[2]融合主题与情感特征的突发事件微博舆情演化分析[J]. 安璐,吴林. 图书情报工作. 2017(15)
[3]基于动态博弈的媒体参与下网络舆情机制分析[J]. 张立凡,程楠,朱恒民. 情报科学. 2017(01)
[4]网络舆情的知识网络结构、趋势与演化分析[J]. 李永忠,胡洪宇. 现代情报. 2016(06)
[5]基于知识库和主题爬虫的南海舆情实时监测研究[J]. 丁晟春,龚思兰,周文杰,王曰芬. 情报杂志. 2016(05)
[6]基于表情符的社交网络情绪词典构造[J]. 马秉楠,黄永峰,邓北星. 计算机工程与设计. 2016(05)
[7]面向网络舆情数据的异常行为识别[J]. 郝亚洲,郑庆华,陈艳平,闫彩霞. 计算机研究与发展. 2016(03)
[8]群体极化视域下网络舆情的演化机制研究——以微博网民讨论“浙江温岭杀医案”为例[J]. 辛文娟,赖涵. 情报杂志. 2015(02)
[9]突发事件网络舆情传播规律与预警阶段研究[J]. 兰月新,曾润喜. 情报杂志. 2013(05)
[10]中文微博情感分析研究综述[J]. 周胜臣,瞿文婷,石英子,施询之,孙韵辰. 计算机应用与软件. 2013(03)
博士论文
[1]基于语义统计分析的网络舆情挖掘技术研究[D]. 万源.武汉理工大学 2012
[2]自动文本分类若干基本问题研究[D]. 宋枫溪.南京理工大学 2004
硕士论文
[1]基于网络评论的情感分类技术的研究及应用[D]. 郭捷.电子科技大学 2018
[2]基于爬虫与文本挖掘的“985”高校图书馆微信公众号的调研[D]. 周海晨.安徽大学 2017
[3]基于网络爬虫技术的企业社交媒体情报获取分析[D]. 吴虎.黑龙江大学 2017
[4]基于情感倾向性的网络舆情分析及演化预测研究[D]. 孙培星.吉林大学 2016
[5]互联网评论文本情感分析研究[D]. 崔连超.山东大学 2015
[6]基于向量空间模型的文本相似度算法研究[D]. 谭静.西南石油大学 2015
[7]基于机器学习的中文文本主题分类及情感分类研究[D]. 樊小超.南京理工大学 2014
[8]文本情感分析在产品评论中的应用研究[D]. 魏慧玲.北京交通大学 2014
[9]面向微博短文本的情感分析研究[D]. 杜振雷.北京信息科技大学 2013
[10]基于因子分解机的社交网络关系推荐研究[D]. 余秋宏.北京邮电大学 2013
本文编号:3317226
【文章来源】:南京邮电大学江苏省
【文章页数】:109 页
【学位级别】:硕士
【部分图文】:
中国网民规模和互联网普及率
1.1 研究背景及意义1.1.1 互联网现状随着社会的进步和信息技术的发展,社会信息化、网络化程度的急剧增高,互联网已渗透到人们生活的点点滴滴,起到无法替代的作用。人们使用的互联工具也越来越多,包括 PC、手机、Pad 等。如图 1.1 所示,根据 CNNIC 的调查数据[1],截至 2018 年 6 月,我国网民规模已达 8.02 亿,互联网普及率达到了 57.7%。可见今后数年,我国网民数量、网站规模、数据容量都将持续增长,互联网渗透率将不断提高。随着 4G 网络的广泛普及、上网资费的不断降低,目前中国手机用户的规模连年呈上升态势,截止 2018 年 6 月,已达 7.88 亿,且手机网民占整体网民比例高达 98.3%,如图 1.2所示。通过移动手机终端,人们可以随时随地地在论坛、微博、朋友圈等载体上浏览信息、抒发情感、表达对某人某事某物的看法和意见。
图 4.5 实验 1 与实验 2 结果对比表图由图 4.5 可知,加入了程度词和否定词之后,正确率和召回率都有所提升。同时,对后的情感值数值进行观察发现,情感值提升较为明显,更新后的算法能更好地反映情感的变化,原先判断错误的语句也得到了有效的纠正,将文本编上序号后使用两种算法进感值计算,绘制情感值对比图,如图 4.6 所示。图 4.6 实验 1 与实验 2 正向情感值对比图123
【参考文献】:
期刊论文
[1]基于空间自相关的网络舆情话题演化时空规律分析[J]. 王璟琦,李锐,吴华意. 数据分析与知识发现. 2018(02)
[2]融合主题与情感特征的突发事件微博舆情演化分析[J]. 安璐,吴林. 图书情报工作. 2017(15)
[3]基于动态博弈的媒体参与下网络舆情机制分析[J]. 张立凡,程楠,朱恒民. 情报科学. 2017(01)
[4]网络舆情的知识网络结构、趋势与演化分析[J]. 李永忠,胡洪宇. 现代情报. 2016(06)
[5]基于知识库和主题爬虫的南海舆情实时监测研究[J]. 丁晟春,龚思兰,周文杰,王曰芬. 情报杂志. 2016(05)
[6]基于表情符的社交网络情绪词典构造[J]. 马秉楠,黄永峰,邓北星. 计算机工程与设计. 2016(05)
[7]面向网络舆情数据的异常行为识别[J]. 郝亚洲,郑庆华,陈艳平,闫彩霞. 计算机研究与发展. 2016(03)
[8]群体极化视域下网络舆情的演化机制研究——以微博网民讨论“浙江温岭杀医案”为例[J]. 辛文娟,赖涵. 情报杂志. 2015(02)
[9]突发事件网络舆情传播规律与预警阶段研究[J]. 兰月新,曾润喜. 情报杂志. 2013(05)
[10]中文微博情感分析研究综述[J]. 周胜臣,瞿文婷,石英子,施询之,孙韵辰. 计算机应用与软件. 2013(03)
博士论文
[1]基于语义统计分析的网络舆情挖掘技术研究[D]. 万源.武汉理工大学 2012
[2]自动文本分类若干基本问题研究[D]. 宋枫溪.南京理工大学 2004
硕士论文
[1]基于网络评论的情感分类技术的研究及应用[D]. 郭捷.电子科技大学 2018
[2]基于爬虫与文本挖掘的“985”高校图书馆微信公众号的调研[D]. 周海晨.安徽大学 2017
[3]基于网络爬虫技术的企业社交媒体情报获取分析[D]. 吴虎.黑龙江大学 2017
[4]基于情感倾向性的网络舆情分析及演化预测研究[D]. 孙培星.吉林大学 2016
[5]互联网评论文本情感分析研究[D]. 崔连超.山东大学 2015
[6]基于向量空间模型的文本相似度算法研究[D]. 谭静.西南石油大学 2015
[7]基于机器学习的中文文本主题分类及情感分类研究[D]. 樊小超.南京理工大学 2014
[8]文本情感分析在产品评论中的应用研究[D]. 魏慧玲.北京交通大学 2014
[9]面向微博短文本的情感分析研究[D]. 杜振雷.北京信息科技大学 2013
[10]基于因子分解机的社交网络关系推荐研究[D]. 余秋宏.北京邮电大学 2013
本文编号:3317226
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3317226.html