当前位置:主页 > 经济论文 > 银行论文 >

基于随机森林的兴农卡农户用信预测模型及应用研究

发布时间:2020-07-19 09:06
【摘要】:近些年,农户生产经营活动不断发生变化,越来越多的农户逐渐由原始的自给自足的生产经营模式转变成了承包大面积土地的专业种植养殖户或家庭加工小作坊。为了解决这些农户的资金困难,很多设立在农村的商业银行的小支行也逐渐由办理单一的存取款业务,发展到目前提供形式多样的贷款理财产品业务,“兴农卡”作为一种类似于信用卡的小额自助类贷款产品,主要服务于广大农户,为农户或农村集体种植,养殖等农村作业经营活动提供有效的资金保障。本文在分析研究“兴农卡”农户的历史存款统计信息,交易统计信息以及相关征信信息的基础上,构建基于随机森林的“兴农卡”农户用信预测模型,然后对“兴农卡”农户的特征数据通过提取,清洗及特征选择后,对农户用信预测模型进行验证分析,结果表明,在保证准确率的前提下,基于随机森林的“兴农卡”农户用信预测模型预测农户用信行为的时间效率最高,最后应用局部可解释性模型LIME对模型的预测结果从业务逻辑上作可视化解释,增强机器学习模型的可信度,给该银行的其他业务产品乃至银行业相关产品的农户用信行为预测提供借鉴,提高银行的收益,在银行农户关系维护与营销方面都具有重要意义。
【学位授予单位】:中南林业科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F832.43
【图文】:

变化曲线,变化曲线,特征对,农户


n表示类别数量,p(xi)为第i个类别的样本所占集合x的比例,本文逡逑中,x即为所有农户信息,i为用信或不用信两类。逡逑如图2.1所示,熵把特征概率转换成了特征对结果的说明程度,例如,一位逡逑“兴农卡”农户是否会用信,当p=0.5表明这个特征针对是否会用信的概率是逡逑0.5,也就相当于这个特征对是否会用信的度量相当于投硬币,正反概率都是0.5,逡逑说明程度很差,此时熵H0c)为1,达到最大,所以说熵H00的值越小,x的纯度逡逑越高。逡逑9逡逑

模型图,森林,模型,训练集


当问题所属的范畴是分类问题时,依赖单一的决策树组合投票,进行筛选,最终逡逑获得最具有欢迎度的分类,利用这种算法能够大大提高预测模型的精度,对于预逡逑测新数据有着十分重要的意义,如图2.2所示为随机森林模型。逡逑Feature(J)逦Feature(f)逡逑P^(c\f)逦V逦P?(c\f)逡逑^逦逡逑PW)邋=邋^邋Pn(c\f)逡逑n=l逡逑%煎义贤迹玻菜婊帜P湾义希疲椋珏澹玻插澹裕瑁邋澹停铮洌澹戾澹铮驽澹遥幔睿洌铮礤澹疲铮颍澹螅翦义细ㄒ桓鲅盗芳疦B二:^:^“^^其响应变量为丫二力七广^化设反复抽逡逑取的袋装次数为B,随机筛选数据作为训练集样本的代替样本数据集合,对于b邋=逡逑1,…,B。逡逑(1)

结构图,前馈神经网络


图2.4前馈神经网络逡逑Fig邋2.4邋Feedforward邋Neural邋Network逡逑图2.4所示,该图为神经网络的经典结构图,该图由不同的层组成,它有一逡逑个输入层,任何数量的隐藏层和输出层,从理论的角度来看,每一层神经元的数逡逑量是不受约束的,但是由于受到样本数据和任务的约束限制,输入和输出节点的逡逑数量是有一定约束条件的,因此,其实只有隐藏层的节点数不受限制,节点数量逡逑可以取任意常数值并且具有多种类型的图层,神经元的输入是表示要解决的任务逡逑的输入值和分配给该连接的权重,在不断修正权重值的过程中,神经网络最终能逡逑够实现最优的预测效果。逡逑(2)反馈型网络[43,(FeedbackNetwork),反馈回路存在于该网络中是可逡逑接许的,这种网络的使用条件主要是用于内容可寻址的存储器。逡逑^逦误差逆向传播逦逡逑Input邋Layer逦Hidden邋Layer逦Output邋Layer逡逑逦信息正向传播逦?逡逑图2.5反馈型神经网络逡逑Fig邋2.5邋Feedback邋Neural邋Network逡逑如图2.5所示

【参考文献】

相关期刊论文 前3条

1 郭丽丽;丁世飞;;深度学习研究进展[J];计算机科学;2015年05期

2 董师师;黄哲学;;随机森林理论浅析[J];集成技术;2013年01期

3 姚登举;杨静;詹晓娟;;基于随机森林的特征选择算法[J];吉林大学学报(工学版);2014年01期

相关博士学位论文 前2条

1 潘传快;农业经济调查数据的缺失值处理:模型、方法及应用[D];华中农业大学;2017年

2 张永锋;个性化推荐的可解释性研究[D];清华大学;2016年

相关硕士学位论文 前4条

1 宋鑫;随机森林优化算法在农户信用风险评估中的应用[D];云南师范大学;2018年

2 邱伟;基于随机森林的电信客户流失预测应用研究[D];华南理工大学;2018年

3 阳志梁;基于新型信任模型的自适应推荐方法研究[D];上海师范大学;2018年

4 汪静波;Logistic回归模型中缺失数据的处理[D];南京大学;2015年



本文编号:2762212

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/2762212.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户57803***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com