美国网贷平台Prosper贷款数据分析
本文主要描述了如何用Python对数据集进行评估,整理,清洗。
完成这一过程后,再通过Tableau对问题 “Prosper违约客户具有哪些特点” 进行探索,分析和可视化。
最后,用随机森林算法对2009年7月后数据进行建模分析,并对仍在进行中的贷款进行违约与否的预测。
Prosper是美国第一家P2P借贷平台。此数据集来源于Udacity上的Prosper 2005~2014年的贷款数据。本文希望能通过对已完成贷款的分析,判断出什么类型的客户更容易违约,并预测还未完成的贷款是否会违约。
原始数据集共包含81个变量,113937条数据,下面对部分重要变量进行说明,其他变量含义可参考 变量词典 。
首先加载库和数据。
然后用df.describe(),df.info()观察数据。
此次主要分析1.什么类型的借款人更容易违约。 2.预测未完成的贷款是否会发生违约。所以去掉无关列。
从2009年7月开始,Prosper调整了对客户的评估方式,此次我们只对2009-07-01后的贷款进行分析。
去掉意义重复列:
Prosper对于新客户的评分和老客户有所区别,此次仅针对新客户数据进行分析。
首先查看下,各变量数据缺失情况。
平台把借款状态分为12种:Cancelled(取消)、Chargedoff(冲销,投资人有损失)、Completed(正常完成,投资人无损失)、Current(贷款还款中)、Defaulted(坏账,投资人有损失)、FinalPaymentInProgress(最后还款中,投资人无损失)、Past Due(逾期还款,投资人无损失)。
本文依据交易是仍在进行中还是已关闭,以及已关闭交易中投资人有无损失将所有数据分成以下三组:
Current(包含Current,Past Due)、
Defaulted(包含Defaulted,Chargedoff)、
Completed(包含Completed,FinalPaymentInProgress)。
为了便于后续分析计算,再将“Completed”改为1,“Defaulted”改为0。
已完成的贷款的违约率为defaulted_ratio_finished =26.07%
此数据集有多个特征体现了贷款用户的信用情况。其中,信用等级(ProsperRating)是Prosper根据自身模型建立,是用于确定贷款利率的主要依据,而信用评分(CreditScore)则是由官方信用评级机构提供。
由图5-1可以看到,随着信用等级(ProsperRating)的不断升高,违约率呈现明显的下降趋势。
而在信用评分(CreditScore)中,低分段(640-700),违约率处于比较高的位置,且没有太大变化。大于720的部分,随着信用评分的升高,违约率明显下降。
说明整体而言,借款人的信用水平越高,违约可能性越低。
在不同年收入(IncomeRange)中,Not employed的借款人,违约率最高,随着收入增加,违约率不断降低。
在不同贷款状态下(Status),违约用户的整体月收入(MonthlyIncome)明显低于未违约用户。
根据图5-4的左图,违约用户与未违约用户的整体负债收入比差异不大。
再根据负债收入比(DebtToIncome)的四分位点,将所有数据分成数据量接近的四组。从图5-4的右图可以看到低比例(负债收入比0-0.12)与中等比例(0.12-0.19)的违约率都较低。较高比例(0.19-0.29)的违约率略高于前面二者。但高比例(大于0.29)的用户违约率显著升高。
根据银行卡额度透支率(BankcardUtilization)的四分位点,将数据分成 '未使用','较低透支(0,0.3]','中等透支(0.3,0.7]', '较高透支(0.7,1]','严重透支(1,5]'五组。
可以看到,严重透支的借款人,违约率最高。
其次是未使用的用户,这也是为什么金融机构对于“白户”会格外关注的原因。
近半年征信查询次数(InquiriesLast6Months)可以反应出借款人近期向金融机构申请借款的频繁程度,间接体现了借款人近期的资金状况。
图5-6中,绿线表示不同查询次数下的借款笔数。可以看到,绝大部分在7次以下。
而在查询次数0-7区间内,违约率随着查询次数的增加而升高。
当前逾期(CurrentDelinquencies)可以很好的反应出借款人的信用情况。
由图5-7,可以看到大部分借款人的当前逾期在2次以内。而在0-6的区间内,违约率随当前逾期数的增加而升高。
为了避免某些数量极少的分类对违约率排序的影响,首先筛选出借款笔数在30以上的分类。
由图5-8可以看到,数量最多的是1- Debt Consolidation(债务整合)。
而违约率最高的依次是15- Medical/Dental(医疗),13-Household Expenses(家庭开支),3-Business(商业),均高于30%。
根据贷款金额(LoanAmount)的四分位点,将数据分为数量接近的四组。比较有意思的是,中等借款(3100,4750)的违约率最高,而高额借款(大于8500)的违约率反而最低。
这很可能是因为能申请到高额借款的用户,各方面条件都不错,从而降低了违约率。
由图5-11可以看到,在0-30区间内,随着持续时间的增长,违约率逐渐降低,而这一区间也包含了一半左右的数据。
当持续时间继续增长,违约率看不出有明显变化规律。
在不同地区之间,违约率也存在比较明显的差异。LA,SD等城市,违约率较高。UT,CO等城市,违约率较低。
整体而言,有房产的借款人,违约率要明显低于无房产的借款人。
导入相关库。
将数据中的字符串变量,均转换为数字。
按照测试集30%,训练集70%的比例划分数据集,并使用随机森林算法,建立模型。
该模型测试集预测准确率为:accuracy=73.99%
对于随机森林算法,可以查看在这个模型中,每个特征的重要程度。
如图6-2所示,StatedMonthlyIncome和EmploymentStatusDuration两个特征最为重要。
根据此模型,对目前仍在进行中的贷款进行违约与否的预测。
仍在进行中的贷款违约率为defaulted_ratio_predict =3.64%
本文详细描述了对于Prosper贷款数据,从数据探索到建立模型,并进行预测的完整过程。
发现月收入(StatedMonthlyIncome)以及受雇佣状态持续时间(EmploymentStatusDuration)对是否会违约的影响程度最大。主要是因为这二者是体现借款人稳定性的重要因素。
而在模型建立方面,还可以调整此模型的参数,来进行改进从而提高准确率,也可以尝试使用其他算法,如逻辑回归等,建立新的模型进行比较。
美国有什么软件可以贷款吗?
有的,NowFi是一款专属于留学生的借款app,公司成立于2019年,具体当地贷款资质的金融服务机构;
当天提交就可以下款,整个流程不超过一个小时吧,专为在美留学生提供金融服务,不需要抵押也不需要担保,平台也不收取任何手续费。需要提交的资料就是你的学籍信息证明你是留学生,只要通过了就会立刻打款。借款金额最高可以申请2万美金,可以分期,全程都是在APP里操作的,还很人性化的。
有需要的可以看看
美国提供次贷是哪两家金融机构啊
美国最大的两家住房抵押贷款融资机构,联邦国民抵押贷款协会(房利美)、联邦住房贷款抵押公司(房地美)上周爆出财务状况恶化的消息,公司股价出现大跌。美国政府也紧急展开“救火行动”,除了为房利美和房地美提供资金支持外,还接管了另一家倒闭的房贷机构,加州印地麦克银行。房贷机构危机将进一步拖累本已疲弱的美国经济,并将对美元反弹、美国及全球资本市场信心造成冲击。一时间,美国经济似乎又完全笼罩在次贷危机的阴影之下。 房利美和房地美分别设立于1938年和1970年,这两家机构在美国住房融资体系中扮演着核心角色,是美国国会为保证住房贷款市场资金流动而立法设立的机构。两家公司的主要业务是从抵押贷款公司、银行和其他放贷机构购买住房抵押贷款,并将部分住房抵押贷款证券化后打包出售给其他投资者。这两家房贷机构拥有或提供担保的抵押贷款总值约5万亿美元,相当于美国所有房屋抵押贷款债务的近一半。房利美和房地美遭遇的困境引起外界极大担忧。由于房利美和房地美主要从事次贷以外的住房抵押贷款业务,投资者担心,它们陷入困境显示,由美国住房市场泡沫破裂引发的次贷危机有可能向更为广泛的“住房抵押贷款危机”演变,而这将进一步加大美国乃至全球金融动荡的风险。影响全球经济的各种不确定因素,如次贷危机、高油价以及高通胀等仍在持续中,下半年世界经济增长将继续放缓,新兴市场国家尤其要关注经济波动的风险。
还有什么贷款平台跟360借条一样?这几款别错过
; 360借条是一款纯信用消费贷,由360金融负责运营,具有门槛低、放款快、还款灵活等优势,算的上是良心平台了。其实,除了360借条外,市面上还有很多类似的贷款平台,今天就来给大家盘点盘点。
还有什么贷款平台跟360借条一样?
1、有钱花:度小满旗下纯信用卡贷款,由7大银行合作放款,和360借条一样,是个门槛低,放款快的平台,年满18~55周岁,提供本人有效身份证+借记卡,完成实名认证后出了额度就能借钱,最快3分钟审批到账。
2、国美易卡:美国金融纯信用贷款平台,能提供1000~15万元的贷款额度,借款期限最长3年。和360借条一样,都是由系统自动审批放款的,最快5分钟就能出结果,年满18-45周岁,征信良好,有稳定收入的上班族可以试试。
3、万e贷:万达普惠一款门槛低、利息低的信用贷款,只需要提供手机号+身份证+银行卡,完成个人基本信息后就能借款,最高有5万元的额度,日利率低至借款成功后支持提前还款,可减免剩余利息。
4、招联好期贷:招联金融信用贷款,最高有20万元的额度,在申请上和360借条一样,都是直接网上办理的,并且同样由系统自动审批放款,要求年满22-55周岁,芝麻分600,信用良好。
小结:这些贷款平台都和360借条一样,贷款门槛低、最主要的是比较安全,能快速放款。但是门槛再低也不是完全没有要求的,至少得满足申请条件,具备还款能力,还要有良好的信用,才比较容易通过。
对于美国金融是什么贷款平台和美国金融上征信吗的总结分享本篇到此就结束了,不知你从中学到你需要的知识点没 ?如果还想了解更多这方面的内容,记得收藏关注本站后续更新。
还没有评论,来说两句吧...