当前位置:主页 > 管理论文 > 领导决策论文 >

面向粒计算的动态邻域不平衡数据分类算法

发布时间:2021-10-25 22:53
  数据分布不平衡问题是机器学习和数据挖掘领域的研究热点,在许多现实世界的实际应用中人们往往更关注那些数量稀少的少数类数据。为了改进不平衡数据分类算法的分类效果,通常从数据采样和分类算法这两个方向上进行完善。但是数据采样方法大多数只能在全局层面上改善数据集的不平衡程度,而无法改善在局部中的数据分布。因此近邻算法、邻域粗糙集理论以及三支决策等理论需要不断改进以更适应数据的不平衡分布。本文使用一种新的邻域构建方法,构造动态均等查询邻域,通过生成动态邻域判别稀疏程度,调整正向后验概率估计细化分类决策。该方法提高了对稀有数据的灵敏度,并为所有数据提供相同的查询机会,而不会过于偏向稀有类。利用邻域粗糙集理论对极端分布情况进行处理,消除缺乏稀有类数据的不确定性。根据细化后实例分布情况再分类决定后,基于邻域粗糙集的动态均等近邻分类算法可以将查询实例更准确地分类到类别中。本文还提出一种基于三支决策的动态均等近邻分类算法,首先构建动态均等查询邻域,之后利用三支决策理论更准确细致的对待测样本进行分类。利用正域和负域确定性信息先对一部分确定性高的样本进行分类,然后在边界域中细化局部邻域数据分布情况。调整后验概率... 

【文章来源】:大连海事大学辽宁省 211工程院校

【文章页数】:59 页

【学位级别】:硕士

【部分图文】:

面向粒计算的动态邻域不平衡数据分类算法


图5.1?ROC曲线图??Fig.?5.1?ROC?graph??

【参考文献】:
期刊论文
[1]一种基于质心空间的不均衡数据欠采样方法[J]. 金旭,王磊,孙国梓,李华康.  计算机科学. 2019(02)
[2]不平衡数据分类预测的阈值优化算法ε-KSVM[J]. 金鑫,葛国青,陆旭,赵永彬.  计算机应用与软件. 2018(01)
[3]基于图和改进K近邻模型的高效协同过滤推荐算法[J]. 孟桓羽,刘真,王芳,徐家栋,张国强.  计算机研究与发展. 2017(07)
[4]基于随机森林和欠采样集成的垃圾网页检测[J]. 卢晓勇,陈木生.  计算机应用. 2016(03)
[5]自动发音错误检测中基于最大化F1值准则的区分性特征补偿训练算法[J]. 黄浩,徐海华,王羡慧,吾守尔·斯拉木.  电子学报. 2015(07)
[6]基于邻域粗糙集的多标记分类特征选择算法[J]. 段洁,胡清华,张灵均,钱宇华,李德玉.  计算机研究与发展. 2015(01)
[7]不平衡情感分类中的特征选择方法研究[J]. 王志昊,王中卿,李寿山,李培峰.  中文信息学报. 2013(04)
[8]不平衡数据分类方法及其在入侵检测中的应用研究[J]. 江颉,王卓芳,GONG Rong-sheng,陈铁明.  计算机科学. 2013(04)
[9]一种SVM不平衡分类方法及在故障诊断的应用[J]. 王德成,林辉.  电机与控制学报. 2012(09)
[10]类别不平衡的分类方法及在生物信息学中的应用[J]. 邹权,郭茂祖,刘扬,王峻.  计算机研究与发展. 2010(08)



本文编号:3458316

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3458316.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户387f0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com