当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于属性挖掘的树形结构情感词典在情感计算问题中的研究

发布时间:2020-08-03 09:06
【摘要】:情感计算是计算机技术领域中一项新兴的研究方向,人们在这一方向进行了大量的研究,情感计算的目的是让计算机也能够像人类一样去理解情感。目前情感计算最常用的方法就是基于情感词典的方法,但是目前普遍使用的几个情感词典都是一维的,它们只是简单地将情感词以及它的情感倾向性以链式的结构进行存储,但是同一个情感词在不同的评价对象类别或属性下可能会表现出不同的情感倾向性,这种情况是这些常见的情感词典无法解决的。为了解决这个问题,本文利用树形结构的特点提出了一种树形结构情感词典。在树形结构中同一个父结点下的子结点具有相似性,并且随着层次的加深和树分支的细化,这种相似性会变得越来越大;不同父结点下的子结点间的相似性很小,并且随着公共的祖先结点的减少,相似性会锐减。本文利用这个特点,将评价对象类别和评价对象对应的属性用树形结构存储,并将情感词添加到这个树形结构中,组成一个树形结构情感词典。这样在这个树形结构情感词典中每个情感词都对应一个属性或者评价对象类别,解决了同一个词在不同的评价对象或属性下可能会有不同的情感倾向性这个问题,并且由于在树形结构情感词典中每个子结点都是其父结点的一个属性或者一个子类别,父结点与子结点是包含的关系,所以每个结点都将它存储的情感词向它的父结点进行传递,这样就解决了在树形结构情感词典中对应属性或者评价对象下搜索不到情感词的问题。本文实验利用贝叶斯定理构建出一个具体的树形结构情感词典和一个链式结构情感词典,利用这个树形结构情感词典进行情感计算得到的结果与链式结构情感词典相比,在准确率上平均提升了9.78%;识别正向情感文本的精确度平均提升了10.40%,召回率平均提升了4.78%,F值平均提升了7.72%;识别负向情感文本的精确度平均提升了4.87%,召回率平均提升了20.84%,F值平均提升了12.99%。利用树形结构情感词典进行情感计算得到的结果优于传统的链式结构情感词典。本文的主要创新点是为了解决同一个情感词在不同的评价对象类别或属性下会表现出不同的情感倾向性的情况,提出了树形结构情感词典。本文重点研究了树形结构情感词典的构建和基于树形结构情感词典的情感计算这两大部分。在树形结构情感词典的构建部分,本文首先介绍了如何利用评价对象类别之间的关系构建一棵评价对象树,然后介绍了利用句法分析和关联规则的方法进行属性挖掘和情感词提取,最终构建了树形结构情感词典。在基于树形结构情感词典的情感计算这部分,首先介绍了在树形结构情感词典中搜索情感词的方法,然后介绍了如何判断情感词的情感倾向性,最后介绍了判断文本情感倾向性的方法。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;TP18
【图文】:

项集,交易数据库,关联规则挖掘,频繁项集


图 2.1 “我今天很高兴”的分析结果则问题在 1993 年由 Agrawal 等[41]提出,它研究的是挖掘个频繁项集间的关联关系。所谓关联是指两个以及两以发现的规律。从此以后,很多人都开始进行与关联中有许多的相关概念,其中最基本的一个概念就是项分析时,含有项的集合,其中项就是具体的研究对象包含 K 个项的项集就被称作 K-项集。关联规则是在在的某种依赖关系,而关联规则挖掘是从交易数据库同项集间潜在的并且很有价值的关系。

存储结构,示例,结点,评价对象


图 3.6 左孩子-右兄弟存储结构示例.2 树形结构情感词典的结点结构树形结构情感词典中的结点共有两种,一种是评价对象结点,另一种是,本节构建的评价对象结点和属性结点在图 3.2 所示的基本结构的基础些信息,每个结点都需要包含以下信息:(1)结点名称:代表该结点所存储的具体内容,评价对象结点的名称价对象的类别,属性结点的名称为属性的名称;(2)结点 id:结点的标识,它可以唯一代表该结点;(3)结点类型:结点的类型分为评价对象结点和属性结点;(4)正向出现次数:该结点所代表的评价对象或属性在正向训练文本现次数;

运行速度,笔记本电脑,句法分析,属性


本电脑的运行速度很快,但价格非常高。”在使用关联规则挖掘方法进行属性挖掘时,如果“速度”和“价格”共同出现的次数足够多,则“速度价格”就会被识别成属性,但通过如图3.8所示的这句话的句法分析结果发现,该句的属性为“运行速度”和“价格”,由此可以看出,通过使用句法分析,可以避免提取出“速度价格”这种错误的属性。图 3.8 “这款笔记本电脑的运行速度很快,但价格非常高。”的句法分析结果

【相似文献】

相关期刊论文 前10条

1 李俊飞;陈皓;赵卫东;;树形结构数据输入输出控件的设计与实现[J];计算机工程与设计;2011年09期

2 徐德良;树形结构图在生理学教学中的应用[J];卫生职业教育;2003年10期

3 王跃进,杨晓盆;日本设施果树的树形结构与光能利用研究进展[J];山西农业大学学报;2001年02期

4 白英彩;;采用树形结构的分布式计算机系统[J];计算机研究与发展;1982年12期

5 赵炜;酒少武;;基于金树形结构单元的超材料制备(英文)[J];稀有金属材料与工程;2015年12期

6 刘舒;树形结构在生产管理信息系统中的应用[J];信息技术;2001年09期

7 周清桂;金红苹果的丰产树形结构与负载量的探讨[J];中国果树;1985年04期

8 王文举;;基于ShareMind灵活建立树形结构模型[J];电脑编程技巧与维护;2012年21期

9 汪华斌;;Tree View在主从表关系处理中的应用[J];计算机与现代化;2006年03期

10 赵国程;高学勇;;基于角色的树型权限管理[J];电脑编程技巧与维护;2011年23期

相关会议论文 前4条

1 袁海峰;乐慈;季圆圆;;树形结构稳定性分析[A];第十五届全国现代结构工程学术研讨会论文集[C];2015年

2 洪伟;周国祥;;基于.NET的汽车试验集成系统设计与实现[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

3 朱禹风;朱朵娥;张相勇;;唐山勒泰中心树形结构铸钢节点设计[A];第五届全国建筑结构技术交流会论文集[C];2015年

4 陶遵适;孙若萍;徐淑霞;;基于树形结构的远程教育系统的教育质量管理[A];提高全民科学素质、建设创新型国家——2006中国科协年会论文集[C];2006年

相关重要报纸文章 前1条

1 北京 阮晓华;在PB中快速实现数据库树形结构[N];中国计算机报;2001年

相关博士学位论文 前1条

1 韦星星;基于结构化信息的图像内容分析与理解[D];天津大学;2015年

相关硕士学位论文 前10条

1 董骁阳;基于属性挖掘的树形结构情感词典在情感计算问题中的研究[D];吉林大学;2019年

2 王双;树形结构数据的向量化表示方法研究[D];哈尔滨工业大学;2018年

3 董亚东;基于模型空间的树形数据分类和回归[D];中国科学技术大学;2016年

4 成俊;基于语义划分的非自发事件探测方法研究[D];辽宁大学;2013年

5 张考;面向电子商务的虚假评论检测的关键技术研究[D];解放军信息工程大学;2015年

6 马振亮;基于拓扑划分的配电网短路故障隔离系统[D];浙江大学;2012年

7 张新波;污水管网的优化设计[D];天津大学;2004年

8 张晓东;基于自适应算法和并行计算的类关联规则挖掘研究[D];青岛理工大学;2016年

9 肖振宇;面向武警部队数据传输应用的流式分发及断点续传技术[D];国防科学技术大学;2009年

10 刘p苊

本文编号:2779411


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2779411.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户af0c8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com