当前位置:主页 > 科技论文 > 软件论文 >

基于近邻图分析的谱聚类算法的研究

发布时间:2023-11-20 17:50
  谱聚类算法(Spectral clustering)是基于谱图理论的经典聚类算法之一,而属于K-way谱聚类算法的NJW(Ng-Jordan-Weiss)算法因其框架简单而广受关注。该算法可通过欧氏距离建立样本间的相似性度量矩阵W;虽然欧氏距离的度量方式简单,容易理解,可用于大多数据类型。但是,欧氏距离是基于每个独立的样本,样本间的关系都是直接获取,所建立的样本度量也是基于样本全局。样本之间的关联比较单一,不能充分描述样本间的局部特征,使建立的相似性特征描述不完整,不能完全反映样本之间的关系。除此之外,传统的K近邻算法中的K值都是通过多次实验获得的经验值,很难证明其为最佳值,所以容易陷入局部最优。为了解决以上问题,本文基于近邻图分析,对谱聚类算法进行研究,主要作了以下工作:第一,针对欧氏距离相似性度量方法的不足,提出一种基于K阈值的相似性度量的谱聚类算法;算法充分参考了各种样本区域的特性,利用K阈值的方式建立局部样本之间的联系,并在这些局部关联的基础上用最短路径建立全局连通图,然后以局部样本标准差作为高斯核的取值。该算法很好的克服了以欧氏距离建立联系时,对样本局部细节特征的忽视。第二,...

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景
    1.2 国内外研究现状
    1.3 本论文的研究成果和章节安排
第2章 基本理论
    2.1 聚类
        2.1.1 聚类定义
        2.1.2 聚类分析的概况
    2.2 谱聚类
        2.2.1 谱聚类算法中的割集准则
        2.2.2 谱聚类算法中的参量
        2.2.3 谱聚类算法的分类
        2.2.4 谱聚类算法的实现步骤
    2.3 k-均值算法
    2.4 K近邻
    2.5 最短路径
    2.6 本章小结
第3章 基于K阈值的相似性度量的谱聚类算法
    3.1 距离度量
        3.1.1 基于K近邻的距离度量
        3.1.2 基于K近邻的阈值选取
    3.2 基于阈值筛选的高斯核
    3.3 基于阈值筛选的加权项
    3.4 实验以及结果分析
        3.4.1 NEW-SC的算法框架
        3.4.2 实验数据
        3.4.3 性能测量
        3.4.4 人工数据集实验结果
        3.4.5 对UCI数据集的聚类分析
    3.5 本章小结
第4章 自定义K值的相似性度量的谱聚类
    4.1 基于自定义的K近邻
    4.2 实验以及结果分析
        4.2.1 算法框架
        4.2.2 人工数据集实验结果
    4.3 对UCI数据集的聚类分析
    4.4 本章小结
第5章 总结与展望
    5.1 文章总结
    5.2 未来与展望
参考文献
致谢
攻读硕士学位期间的科研成果



本文编号:3865538

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3865538.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a3be2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com