当前位置:主页 > 经济论文 > 电子商务论文 >

基于不平衡数据处理的电子商务垃圾评论识别研究

发布时间:2021-01-09 10:08
  随着互联网的快速发展,垃圾评论不断产生,垃圾评论对消费者参考购物产生了极大的干扰,同时扰乱了网络环境的正常秩序。有效识别电子商务垃圾评论对于消费者和商家来说都是一项迫切的需求。近年来,随着电商模式和电商法律的不断完善,商品评论数据的内容也在发生着变化,为了有效识别垃圾评论,在电子商务垃圾评论指标选取方面应当有所改善。同时受电商法的制约,垃圾评论数据数量较之前会大大减少,数据的不平衡也是本文需要解决的影响电子商务垃圾评论识别效果的一个问题。本文就电子商务垃圾评论识别研究做了如下四方面的工作:第一,确定了合理的垃圾评论识别指标。在充分研究国内外关于电子商务垃圾评论识别指标选取的基础上,总结最具权威的现有学者所选取的指标后,结合电子商务法律和法规出台政策,提出了产品名称、产品属性、评论文本的长度、评论文本中的正(负)情感词、评论内容的投票数、评论用户的信誉经验或信用等7项最能识别电子商务垃圾评论的可信度指标,将本文所选取的指标与现有学者所选指标分别在不同分类器下进行对比验证,得到了较好的验证结果。第二,对电子商务垃圾评论数据进行预处理。本文垃圾评论数据来源于聚数力大数据平台下的公开数据集,A... 

【文章来源】:山西财经大学山西省

【文章页数】:82 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 电子商务垃圾评论识别国内外研究现状
        1.2.2 不平衡数据处理国内外研究现状
        1.2.3 研究述评
    1.3 本文的研究内容和研究思路
        1.3.1 研究内容
        1.3.2 研究思路及方法
    1.4 主要工作和创新
    1.5 论文结构
第2章 电子商务垃圾评论识别相关理论与技术
    2.1 文本处理相关技术
    2.2 文本相似性度量方法
    2.3 不平衡数据抽样技术
        2.3.1 不平衡数据特点
        2.3.2 不平衡数据抽样技术
    2.4 文本分类算法
    2.5 本章小结
第3章 电子商务垃圾评论指标的选取及数据预处理
    3.1 电子商务垃圾评论的特点
    3.2 电子商务垃圾评论指标选择的依据
    3.3 基于可信度的电子商务垃圾评论指标选取
    3.4 电子商务垃圾评论数据预处理
        3.4.1 数据的获取
        3.4.2 垃圾评论内容中情感词的提取
    3.5 指标选取有效性的检验
        3.5.1 实验设置
        3.5.2 结果分析
    3.6 本章小结
第4章 基于改进混合采样的垃圾评论不平衡数据处理方法
    4.1 电子商务垃圾评论数据的不平衡性
    4.2 改进混合采样算法的设计依据
    4.3 改进混合采样算法的基本思想
        4.3.1 改进的K-means聚类欠采样算法
        4.3.2 改进的Borderline-SMOTE过采样算法
    4.4 改进混合采样算法在电子商务垃圾评论识别中的应用
        4.4.1 改进算法的有效性度量
        4.4.2 垃圾评论识别参数设置与结果分析
    4.5 本章小结
第5章 基于异构个体组合分类器的垃圾评论识别
    5.1 异构个体组合分类器的设计依据
    5.2 异构个体组合分类器的基本思想
    5.3 异构个体组合分类器在电子商务垃圾评论识别中的应用
    5.4 综合改进算法在其他电子商务垃圾评论数据上的应用
        5.4.1 实验数据集
        5.4.2 有效性验证
    5.5 本章小结
第6章 总结与展望
    6.1 总结
    6.2 展望
附录
参考文献
致谢
攻读硕士学位期间发表的论文和其它科研情况


【参考文献】:
期刊论文
[1]一种基于质心空间的不均衡数据欠采样方法[J]. 金旭,王磊,孙国梓,李华康.  计算机科学. 2019(02)
[2]基于混合采样的不平衡数据集算法研究[J]. 张明,胡晓辉,吴嘉昕.  计算机工程与应用. 2019(17)
[3]一种改进过采样的不平衡数据集成分类算法[J]. 张菲菲,王黎明,柴玉梅.  小型微型计算机系统. 2018(10)
[4]一种基于卡方检验的不平衡数据分类方法[J]. 浮盼盼,潘正高,王胜,高亚兰.  宿州学院学报. 2018(07)
[5]《2017-2018年中国电子商务法律报告》发布[J]. 姚建芳.  计算机与网络. 2018(11)
[6]面向不平衡数据集分类模型的优化研究[J]. 温雪岩,陈家男,景维鹏,徐克生.  计算机工程. 2018(04)
[7]改进Smote算法在不平衡数据集上的分类研究[J]. 易未,毛力,孙俊,吴林海.  计算机与现代化. 2018(03)
[8]基于卷积神经网络的虚假评论识别模型[J]. 韩俣谈.  科学技术创新. 2018(06)
[9]面向产品评论识别的研究[J]. 武雅萱,王悦欣,李洋,王博晨.  科教文汇(中旬刊). 2017(06)
[10]基于样本权重的不平衡数据欠抽样方法[J]. 熊冰妍,王国胤,邓维斌.  计算机研究与发展. 2016(11)

硕士论文
[1]产品评论挖掘的观点抽取和分类技术研究[D]. 李培.重庆大学 2009



本文编号:2966444

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/2966444.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户98459***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com