基于概率图的非平衡数据的再平衡算法研究
发布时间:2021-04-29 14:29
在非平衡数据中,分类结果常偏向于多数类,降低了分类器的分类精度.基于此,对非平衡数据提出了一种基于高斯混合模型-EM算法(GMM-EM)的概率图再平衡算法.首先,通过GMM与EM算法得到少数类、多数类数据的概率密度函数.之后,根据数据集的概率图(μ-σ图),对少数类数据进行安全性的划分,并根据安全性的高低赋予少数类数据的生成权重.然后,运用新提出的算法进行过采样.该算法不仅考虑数据的生成方向,而且保证了数据在平衡前后概率分布的一致性.最后,使用决策树分类器对平衡后的数据进行分类.实验结果表明,新提出的算法比现有的其它算法更有效.
【文章来源】:数学的实践与认识. 2020,50(21)北大核心
【文章页数】:9 页
本文编号:3167699
【文章来源】:数学的实践与认识. 2020,50(21)北大核心
【文章页数】:9 页
本文编号:3167699
本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3167699.html