登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 理工学类 > 统计学 > 正文

基于决策树算法的信用卡违约预测研究开题报告

 2022-01-14 08:01  

全文总字数:4089字

1. 研究目的与意义及国内外研究现状

随着互联网技术的高速发展,世界上每时每刻产生的数据呈指数爆炸式增长,现如今数据就像是一种隐形的财富,谁拥有它并且从中探索出潜在的信息,谁就会得到巨大的价值。然而,这些海量的数据中大部分都没有被开发出其价值但却又需要巨大的存储空间,从而形成了巨大的资源浪费。数据挖掘工具则使挖掘隐藏在数据背后的信息变得可以实现。

随着全球金融一体化与自由化,金融行业和计算机技术的联系日益紧密,银行业正在面对着巨大的竞争和来自各方面的挑战,但同时也存在着很多机遇。中国市场中涌入了大量的外资银行,银行业之间的竞争日益激烈,信用卡业务作为一种便捷高效的信贷服务,符合现代人超前消费的需求,其用户群体不断壮大,消费额与透支额也不断增长。在给社会带来刺激消费,拉动内需等益处的同时,也产生了一定的风险。如果大批用户拖延还款,会导致银行资金运作出现异常乃至瘫痪,信用卡风险甚至影响到整个社会经济发展的秩序和金融体系的稳定,所以风险管理则是信用卡业务中非常关键的工作。

就银行这种数据密集型产业而言,要在市场竞争中屹立不倒就必须拥有关键的数据。传统的信用卡风险评估方式是靠人工审核申请者所提交的个人资料,如今随着用户的猛增,仅靠人工已经无法胜任,传统分析技术也无法对庞大的消费数据进行有效的利用,越来越多的人了解到,利用数据挖掘的方法可以从海量的客户数据中提取出有巨大利用价值的隐含知识,发挥好这些所隐含信息的价值,往往会达到事半功倍的效果。利用数据挖掘技术可以为建立信用卡风险评估控制机制提供帮助。因此,如何有效利用信用卡数据,预测用户的违约可能性,并采取相应措施降低风险率具有重要的现实意义。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容

本文主要研究数据挖掘在信用卡客户违约预测中的应用,根据数据集的特征以及各分类算法的优缺点选择最优的分类算法;研究两种算法的基本理论以及优缺点、把分类算法应用于信用卡客户下月是否违约的分类,以及如何对数据做处理使其更好地应用于现实生活中普遍存在的非平衡数据集。对所涉及的问题进行背景意义分析、研究现状分析、对分类算法进行介绍。对银行信用卡违约问题进行分析、准备所需数据、对数据进行描述与预探索。首先用传统决策树算法建立模型,提出分类规则,进行测试评价然后得出结论,然后对数据进行平衡处理,使模型实际应用能力提高。使用boosting集成算法对数据集进行建模,对比两种算法的拟合与预测效果,选择更适合此问题的方法。

3. 实施方案、进度安排及预期效果

  1. 方案:

查阅文献与资料,确定选题,构建论文框架,然后搜寻实验所需数据,阅读大量文献,进行实例研究,撰写论文。

2)进度:

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]杨九七.大数据研究现状概述[j].计算机产品与流通,2019(04):94-96.

[2]韩家炜.裴健.数据挖掘概念与技术[m].机械工业出版社,2015.

[3]陈莹,宋建华.中国城市居民信用卡违约行为的影响因素[j].金融论坛,2017,22(09):27-38.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图