当前位置:主页 > 管理论文 > 货币论文 >

基于混合特征提取和集成学习的个人贷款违约预测研究

发布时间:2025-07-03 03:17
  随着互联网金融的不断发展,许多小贷公司因风险控制能力不足,接连暴雷。借款人违约风险评估模型作为一种有效的风控手段,可以利用借款人的个人信息和社会活动数据发现用户潜在的违约风险,在小贷企业中发挥着显著作用。本文针对借款用户数据类别不平衡、特征维度高的特点以及企业接入数据成本高的问题,对信贷数据进行特征选择和均衡化处理,并在此基础上建立了基于集成学习的借款人违约风险概率预测模型。具体研究内容和贡献如下:(1)本文提出了一种分层的特征选择框架。首先使用ReliefS算法,通过在特征筛选阶段给与少数类样本更多关注,选择出对少数类样本区分能力强的特征,提高模型在不平衡样本集的预测效果,结合Pearson相关系数法对复杂且高维的信贷特征进行快速的特征初筛,然后对剩余特征使用精筛算法。相比于直接进行特征精筛,在保证模型效果的前提下,分层特征选择显著提升了筛选效率。(2)针对不同预测模型特点提出了针对性的特征精筛算法。因逻辑回归模型效果受信贷特征影响大,本文提出了IKPLasso特征筛选算法,从多个角度评估信贷特征,避免了单一评价指标造成信贷特征多方面信息被忽...

【文章页数】:84 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究工作的背景与意义
    1.2 国内外研究历史与现状
        1.2.1 贷款违约预测的的研究现状
        1.2.2 非平衡分类算法的研究现状
        1.2.3 特性选择算法的研究现状
    1.3 本文的主要贡献与创新
    1.4 本论文的结构安排
第二章 相关理论知识与关键性技术
    2.1 不平衡分类算法
        2.1.1 数据层面
        2.1.2 算法层面
    2.2 特征选择
        2.2.1 过滤式(Filter)算法
        2.2.2 包裹式(Wrapper)算法
        2.2.3 嵌入式(Embedded)算法
    2.3 逻辑回归(Logistic Regression)算法
        2.3.1 逻辑回归的预测函数
        2.3.2 逻辑回归的损失函数
        2.3.3 逻辑回归梯度下降法求解
    2.4 LightGBM算法
        2.4.1 GBDT算法基础
        2.4.2 XGBoost算法基础
        2.4.3 LightGBM算法基础
    2.5 深度神经网络(DNN)算法
        2.5.1 神经网络的基本结构
        2.5.2 DNN前向传播
        2.5.3 DNN反向传播
    2.6 本章小结
第三章 分层特征筛选算法
    3.1 特征处理与筛选框架
    3.2 特征初筛
        3.2.1 改进的Relief算法(ReliefS)
        3.2.2 皮尔森相关系数法
        3.2.3 特征初筛算法流程
    3.3 针对不同预测模型的个性化特征筛选算法
        3.3.1 逻辑回归的特征筛选算法
        3.3.2 LightGBM的特征筛选算法
        3.3.3 深度神经网络的特征筛选算法
    3.4 本章小结
第四章 构建信贷评估模型中的工程实现
    4.1 小贷场景数据集介绍
    4.2 探索性数据分析
    4.3 特征处理
        4.3.1 缺失值处理
        4.3.2 连续特征离散化
        4.3.3 WOE转化
    4.4 特征构建
    4.5 本章小结
第五章 实验结果与分析
    5.1 实验设置
    5.2 分层特征筛选算法效果对比
        5.2.1 实验设计
        5.2.2 实验结果
    5.3 结合特征选择的逻辑回归模型
        5.3.1 实验设计
        5.3.2 实验结果
    5.4 结合特征选择的LightGBM模型
        5.4.1 实验设计
        5.4.2 实验结果
    5.5 结合特征选择的DNN模型
        5.5.1 实验设计
        5.5.2 实验结果
    5.6 模型融合与比较
    5.7 RP+LightGBM-RRFE通用数据集的结果与分析
        5.7.1 数据描述与处理
        5.7.2 实验设计
        5.7.3 实验结果
    5.8 本章小结
第六章 总结与展望
    6.1 本文总结
    6.2 展望
致谢
参考文献



本文编号:4055681

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/huobilw/4055681.html

上一篇:金融危机对中国胶合板产业的影响研究  
下一篇:没有了

Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户265d0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com