当前位置:主页 > 科技论文 > 软件论文 >

基于自动特征工程的软件缺陷预测模型

发布时间:2025-07-18 23:05
  早期的软件缺陷预测通常使用的是数据挖掘的技术,后来人们从度量元、挖掘算法等方面对软件缺陷预测模型在不同方面进行了改进,如提出新的度量元特征、优化数据挖掘算法等来提高预测模型的性能。设计了基于自动特征工程的软件缺陷预测系统,从特征工程层面对软件缺陷预测模型进行改进,通过实现特征工程的自动化而完成软件缺陷的自动预测。特征构造和参数学习是特征工程的两个重要阶段,在特征构造阶段提出一种基于AdaBoost的组合法来实现特征线性组合构造、提出了一种基于提升树的组合法来实现特征非线性组合构造。通过线性组合和非线性组合方法不仅实现了特征构造自动化,而且构造的新特征能更好的提升模型训练效果。特征构造生成了一系列原始特征的线性组合和非线性组合。特征构造形成基本方案后,传统参数调整方法通常是由人工完成的,费时费力且缺乏理论依据,对此设计了一种通过贝叶斯优化学习实现参数自动调整的方法,进一步提高调参效率和模型训练效果。给出了基于自动特征工程的软件缺陷预测系统的详细设计。在使用软件缺陷预测领域的权威数据集MDP训练基于自动特征工程的软件缺陷预测模型后,通过与未使用自动特征工程的缺陷预测模型在预测准确率、查准率、...

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

图3-6模型预测的准确率比较

图3-6模型预测的准确率比较

华中科技大学硕士学位论文将实验数据集进行预处理后输入道特征构造模型中得到了线性组合特征和非线性组合特征。然后分别两类特征进行回归预测模型实验,为验证实验效果,同时行了两组对比实验,分别是使用原始特征训练的模型和使用全部特征训练的模型模型的评估指标为预测的正确....


图3-7特征权重大小比较

图3-7特征权重大小比较

线性组合对特征间是非线性关系的特征无法进行准确描述。图3-7中权重最高的两个特征都是组合特征且权重值远高于其他原始特征,表明了特征组合方法产生的新特征相比于原始特征具有更高的权重,在建立预测模型的过程中重要性更大。由此可知两种特征征组合方法在特征工程中是行之有效的。3.8本章....


图3-6表明,使用组合特征建立模型与使用全部特征建立的模型预测效果相差不大,并且相比与原始特征建立的模型性能有明显提升

图3-6表明,使用组合特征建立模型与使用全部特征建立的模型预测效果相差不大,并且相比与原始特征建立的模型性能有明显提升

图3-7特征权重大小比较图3-6表明,使用组合特征建立模型与使用全部特征建立的模型预测效果相差不大,并且相比与原始特征建立的模型性能有明显提升。另一方面,非线性组合特征比线性组合特征在训练效果上略好,原因在于线性组合方法并不一定适用于所有的特征之间的关系,线性组合对特征间....


图4-9系统主界面

图4-9系统主界面

图4-9系统主界面4.4.2文件读取模块文件读取模块的功能是将树形结构展示在系统软件界面上。通过双击文件目录或者单击选中目录再点击打开按钮的方式都可以读取文件或目录。因为文件目录是一个树形结构,所以本模块使用了递归函数实现模块功能。图4-10展示了一个已读取的文件夹目录....



本文编号:4057573

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/4057573.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户465a8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com