当前位置:主页 > 科技论文 > 软件论文 >

微博文本的细致情感分析研究

发布时间:2023-11-25 01:13
  现如今,人们通过网络社交平台进行信息分享和交流变得越来越普遍。微博所发出的内容蕴含的情感信息反应出中国民众的社会行为和情感极性倾向,已成为自然语言处理中的热门研究话题之一。鉴于此,本文以微博数据为基础开展了对于微博这一领域的用户表达的情感进行分析。本文的研究内容如下所示:在基于情感词典的研究中,仍存有大量没有录入情感词典的新词,现存的词典对微博中情感极性词包含得不够全面。本文在建立的微博基础词典上构建了一个拓充情感词典,同时基于SOPMI算法实现对词典的扩充,构建专属于微博的领域情感词典,并设计了一种将情感词与特定的语义规则相结合的权重算法。传统机器学习的情感分析挖掘出的情感特征不全面。通过提出基于分类器的特征挖掘算法,在特征的选取与组合、特征的维度设定与分类算法的选取进行实验,获得最佳分类器,以得到最好的细致情绪分类准确率。如今花费大量时间进行人工特征提取已难以实现。本文提出了一种运用词向量结合深度学习混合模型的算法来训练数据内容。首先应用Word2vec神经网络语言模型生成词向量代替人工提取的特征信息,随后进入本文提出的深度学习混合模型LChybrid模型的主体,提取词向量中包含的...

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景
        1.1.1 选题背景
        1.1.2 理论意义和应用价值
    1.2 研究现状及发展趋势
    1.3 课题主要研究内容
    1.4 内容组织安排
2 相关技术和理论概述
    2.1 文本预处理技术
    2.2 特征选择
    2.3 机器学习分类模型
    2.4 Word2vec词向量语言模型
    2.5 分类评估性能
    2.6 本章小结
3 数据的收集与预处理过程
    3.1 微博数据的收集
    3.2 微博数据的清洗
    3.3 微博数据的筛选
    3.4 本章小结
4 基于SOPMI扩充词典的语义权重算法
    4.1 微博基础词典
    4.2 拓充情感词典
        4.2.1 同义词词典的扩充
        4.2.2 网络情感词典的扩充
        4.2.3 微博表情词典的扩充
    4.3 基于SOPMI算法的情感词典扩充
        4.3.1 SOPMI算法
        4.3.2 领域情感词典
    4.4 基于扩展词典的语义权重算法设计
        4.4.1 算法主体设计思路
        4.4.2 算法设计与实现
    4.5 实验结果及分析
        4.5.1 实验数据来源
        4.5.2 实验设计与结果
        4.5.3 结果分析
    4.6 本章小结
5 基于LChybrid模型的情感分析算法
    5.1 基于Word2vec模型的词向量表示技术
    5.2 基于LSTM模型的情感分析
    5.3 基于CNN模型的情感分析
    5.4 基于LChybrid模型的情感分析
    5.5 基于分类器的情感分析
        5.5.1 分类的基本流程
        5.5.2 基于特征选择的分类算法
        5.5.3 实验结果及分析
    5.6 基于LChybrid模型的情感分析实验
        5.6.1 实验数据来源及平台搭建
        5.6.2 实验设计及结果展示
        5.6.3 实验结果分析
    5.7 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢



本文编号:3866975

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3866975.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8d97b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com