当前位置:主页 > 科技论文 > 软件论文 >

弱监督的端到端观点挖掘模型

发布时间:2025-04-23 03:18
  在互联网中,用户原创评论广泛存在于各大社交媒体、电商网站中。这些评论中包含着巨大的信息和潜在的应用价值。例如,消费者可以通过其他用户的观点来指导消费;企业或商家们可以通过分析用户反馈指导商业决策。随着自然语言处理技术的发展,学者们提出了许多方法自动的从大规模评论数据中总结用户的观点。一条评论中完整的观点包括产品特征以及相应的情感倾向两个部分,分别对应着评价点抽取(Aspect Extraction)和情感分析两个子任务。然而,现有的大多数方法集中在某一个子任务的研究,因此无法得到完整的观点,实用价值大大降低。尽管一些工作对两个任务联合建模,但仅仅是机械的将两个过程连接,忽略了任务的整体性。此外,Aspect级别的数据标注十分昂贵,限制了许多监督方法的应用。基于以上问题,本文分别对两个子任务进行了研究并提出了相应的模型,随后将两个模型融合,提出了弱监督的端到端观点挖掘模型。本文的研究内容归纳为以下三点:(1)无监督的评价点(Aspect)抽取的方法研究。主题模型是该任务的主流解决方法之一,本文使用效果更优的神经主题模型代替了传统的LDA风格主题模型,并结合任务特性,提出了多空间神经主题模型...

【文章页数】:66 页

【学位级别】:硕士

【部分图文】:

图2-1自动编码器(左)和变分自动编码器(右)结构图

图2-1自动编码器(左)和变分自动编码器(右)结构图

图2-1自动编码器(左)和变分自动编码器(右)结构图主题模型题(文档)模型使用VAE的基本框架对文本进行建模2-2所示。在该类模型中,隐变量z被赋予了更加直接代表某一个主题,其值则代表了该主题在文档中的权人[36]在2016年首先提出了NVDM(Neural....


图2-2MS-NTM结构图

图2-2MS-NTM结构图

出的多空间神经主题模型不仅选择了更加合理的先验分布,同时修改了模型结构,使其更适合于评价点提取任务。2.3多空间神经主题模型本章提出了一个改进版的神经主题模型,该模型采用变分自动编码器作为基本框架,与其他神经模型不同之处在于,该模型在不同的空间中学习不同类型的语义分布,因此我们....


图2-3游戏(左)和餐厅(右)数据集的连贯性得分

图2-3游戏(左)和餐厅(右)数据集的连贯性得分

图2-3游戏(左)和餐厅(右)数据集的连贯性得分2.5.2.2句子级别Aspect分类上一个评价任务的结果表明MS-NTM能够很好地提取评价点实体,接下来我们评估模型在句子级别的评价点识别(AspectCategoryIdentification)任务上的表现。....


图3-1AG-LSTM结构图

图3-1AG-LSTM结构图

3.2模型结构3.2.1问题定义给定一个评论=12,其中L代表评论的长度,代表评论中的第i个单词;不失一般性,我们用=12来表示Aspect特征,其中k代表特征数量,对于ACSA问题,特征为一个类别,k=1,而对于AT....



本文编号:4041134

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/4041134.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户598ad***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com