本文已参加 “新人创作礼活动” ,一起开启掘金创作之路。 中小企业的信贷决策*
摘要*
由于中小微企业规模相对较小,也缺少抵押资产,因此银行通常是依据信贷政策、企业的交易票据信息和上下游企业的影响力,向实力强、供求关系稳定的企业提供贷款,并可以对信誉高、信贷风险小的企业给予利率优惠。我们根据对中小微企业的实力、信誉对其信贷风险做出评估,然后依据信贷风险等因素来确定是否放贷及贷款额度、利率和期限等信贷策略。
对于问题一:
针对问题一1中123家企业的信贷风险进行量化分析,以贷款信用额度,贷款利率,贷款期限三个指标作为银行对不同评级的企业的信贷策略。采用财务分析法来确定同一等级不同营业收入企业的贷款信用额度的波动范围,并将测算贷款信用额度映射在10到100万的范围,使用线性回归法求出A、B、C三级企业贷款年利率与客户流失率的函数关系。在保证银行最大利益的前提下,求得评级为A、B、C的企业的贷款利率分别为0.0705、0.0745、0.0785。
针对问题二,对其302家没有信贷记录的企业,在银行贷款总额为I亿元时,.以贷款信用额度、贷款利率、及贷款期限三个指标作为银行对不同的企业的信贷策略。使用Z -score模型,将求解评分映射到问题一中的A、B、C、D信誉评级模型,算出预测的等级,在此基础上,利用最优信誉评级做出最佳的信贷策略。
针对问题三,增加突发因索的影响,银行针对不同的企业的信贷策略做出调整,使其具有较强的应对突发事件风险的能力。由于不同企业、不同行业对突发事件的应对能力不同,对无信贷记录的企业进行分类,分为个体工商户类、商贸类、服务类、生产类及其他种类:在面对突发事件时(例如:新冠病毒疫情),以上行业抗风险能力较低,银行针对以上:行业降低其信贷额度,同时降低贷款利岁,缓解企业压力。优化问题二的z -score模型,其中加入突发风险影响因子和不确定度因子两个指标,做出最佳的信贷策略。对受疫情影响且信誉评级为A的企业,我们给予45万元- 100万元的贷款额度:对受疫情影响且信誉评级为B的企业,我们给予25万元-50万元的贷款额度:对受疫情影响且信誉评级为C的企业,我们给予10万元25万元的贷款额度。
关键词: 大数据,线性规划模型,信贷策略,财务分析法,Z -score评分模型,
\
一、 问题重述****
1.1问题背景
金融业市场的萎缩,促使商业银行不断转型发展,在“互联网+”时代下,大数据必将成为推动银行对中小微企业服务变革的重要引擎。长期以来,小微企业融资难以及银行信息的不对称,造成中小微企业银行业务贷款效率较低,但是事实上,许多经营规模小的企业收入稳定且应对外部风险能力也不差,是非常好的客户群体。
现实生活中,银行通常是依据企业的规模、交易票据判断的盈亏情况和上下游企业的影响力,向生产规模大,实力强的企业提供贷款。银行对这些企业进行信贷风险评估,依据评估结果决定是否放贷,以及决定对信誉评级越高的企业,在贷款利率方面给予--定的优惠政策等内容的信贷策略。
已知,某家银行对每一-家放贷的企业的贷款额度稳定在10万到100万,贷款年利率稳定在4%到15%,贷款期限为1年。依据所给的不同企业的相关数据,以及贷款年利率与客户流失率的关系表,通过建立数学模型,对不同中小微企业的贷款做出最佳决策,提供信贷策略。
1.2提出问题
问题一:对信誉评级和是否违约这两个条件己知的123家企业,通过他们近三年的交易发票相关数据,以及2019年银行贷款与客户流失率的关系,进行量化分析,给出在银行总年度信贷总额- -定时,123 家企业的信贷策略,包括贷款额度、贷款利率、贷款期限。
问题二:在问题一-的基础 上,对信誉评级和是否违约这两个条件未知的302家企业,通过他们近三年的交易发票相关数据,以及2019年银行贷款与客户流失率的关系进行量化分析,进行评级和确定是否违约,给出在银行总年度信贷总额为1亿元时,这302家企业的信贷策略,包括贷款额度、贷款利率、贷款期限。
问题三:由于企业的生产规模、盈亏情况总是会受到- -些不同方面和不同程度的风险因素的影响,而且这些风险因素对不同行业、不同类别的企业的影响程度不尽相同。结合问题二中的302家企业信贷风险和不同的风险因素,对这302家企业的信贷策略进行调整。
二、 问题分析
2.1对于问题一的分析
主要是对附件一中的123家企业的不同信誉评级和他们是否违约的数据进行量化分析,以贷款信用额度、贷款利率、及贷款期限三个指标作为银行对不同评级的企业的信贷策略。
银行在年度信贷总额固定时,首先筛选信誉评级为D以上的企业,从评级为A到B到C依次排序,信誉评级为D的企业原则上不给予放贷。其次,筛选“是否有违约”记录,假设凡是有违约记录的企业也不给予放贷。综合上述两种情况,筛选出符合贷款前提的企业。
在符合要求得企业中,首先需要测算贷款信用额度。中小微企业的贷款信用
额度需要与企业实际的经营规模相匹配,根据附件一中的企业进项发票和销项发票,计算企业的营业收入并衡量企业的资金周转能力,采用财务分析法计算,贷款信用额度原则上不得超过营业收入的50%,以此来确定同一等级不同营业收入企业的贷款信用额度的波动范围,并将测算贷款信用额度绝对化,保持在10到100万的范围内。
对附件三的贷款年利率和不同信誉评级的客户流失率的关系进行相关性分析,从表中可以看出利率越高,对信誉分别为A、B、C的客户影响是不同的,评级高的客户的利率弹性明显高于评级低的客户,可见评级低的客户更不容易获得贷款,对利率变化敏感度差。使用线性回归法求出A、B、C三级企业贷款年利率与客户流失率的函数关系。
构建不同评级企业数量、贷款信用额度、贷款年利率制约下的最优信贷策略模型,给出一定信贷总额时,企业的相对贷款信用额度、贷款年利率。
2.1.1对于附件一中信誉评级与企业数量的变化
对于不同客户信誉与企业的数量之间的关系,如下。将附件中的数据和企业的数量进行划分。
由上图可知,信誉评级为A的企业数量有27家,信誉评级为B的企业数量有38家,信誉评级为C的企业数量有34家,信誉评级为D的企业数量有24家,由此可以看出不同信誉评级和企业的占比。
2.1.2对于银行可以放贷的企业分析
在银行贷款额度一定的前提下,对于有信贷记录的企业可以直接通过信誉评级和“是否违约”来决定银行是否可以放贷,我们将企业评级为D的,且有违约的不与放贷。
上图可知,信誉评级为A的企业数量有27家,信誉评级为B的企业数量有37家,信誉评级为C的企业数量有32家,信誉评级为D的企业数量有0家,由此得,不同信誉评级得企业数量总体上占比比重相同。
2.1.3对于不同信誉等级和违约率之间得占比
从附件一给出的信誉评级和“是否违约”,讨论不同客户信誉评级与违约率之间的关系。
违约率=各个评级中违约的企业/不同信誉评级得企业个数
得出违约率为:
由此可以看出,信誉等级为A得企业违约率0%,信誉等级为B得企业违约率3%,信誉等级为B得企业违约率6%,信誉等级为D得企业违约率100%,可以看出评级越高,违约率越低。反之越高。
2.2对于问题二的分析
首先使用excel对不同信誉等级进项筛选,然后对其一些无用数据进行剔除,如无效发票,和总体偏差较大的数据。然后使用Z-SCROE评分模型对不同公司信誉等级之间进行等级评分,最后通过不同等级评分与其不同信誉等级所占的权重进行资金的分配。
纽约大学斯特恩商学院教授爱德华·阿特曼(Edward Altman)在1968年就对美国破产和非破产生产企业进行观察,采用了22个财务比率经过数理统计筛选建立了著名的5变量Z-score模型。Z-score模型是以多变量的统计方法为基础,以破产企业为样本,通过大量的实验,对企业的运行状况、破产与否进行分析、判别的系统。Z-score模型在美国、澳大利亚、巴西、加拿大、英国、法国、德国、爱尔兰、日本和荷兰得到了广泛的应用。
2.2.2
2.3对于问题三的分析
三、 符号说明与模型假设
3.1基本假设
(1)凡是有违约得企业不予放贷。
(2)对于信誉评级为D的企业不予放贷。
(3)作废发票全部收回,已经注明“作废”字样。
(4)相对贷款信用额度等于营业收入得50%
四、模型的建立与求解
4.1问题一的模型建立与求解
4.1.1模型的分析
对于问题一
对已有信贷记录得企业做信贷策略,以,NA,NB,NC分别表示符合贷款前提得A、B、C信誉评级得企业数量,IA,IB,IC分别表示对A、B、C信誉等级企业的贷款利率,LA,LB,LC分别表示对A、B、C信誉等级企业的客户流失率。我们以贷款信用额度D,贷款利率I,以及贷款期限为一年,三个指标为银行对不同等级的企业的信贷决策影响因子模型。
4.1.2模型的建立
(1)对于符合贷款的前提下,对于A,B,C信誉评级的企业的数量之间的关系如下:
NA+NB+NC=N总
其中N总、NA、NB、NC的值已知,NA=27,NB=37,NC=32,N总=96,一共有96家企业符合贷款。
(2)对于贷款的年利率和不同信誉等级的客户流失率之间的关系,我们通过matlab对数据进行分析得到关系:
不同信誉评级与客户流失率的相关性
由上图的结果和相关数据,可以得到一元线性回归方程求得贷款年利率和不同信誉评级的客户流失率之间的函数关系:
LA=a1*IA+b1
LB=a2*IB+b2
LC=a3*IC+b3
解得:
| a1 | a2 | a3 |
|---|---|---|
| 7.524 | 7.351 | 7.648 |
| b1 | b2 | b3 |
| -0.098 | -0.118 | -0.138 |
LA=7.524*IA-0.098
LB=7.351*IB-0.118
LC=7.468*IC-0.138
可以看出利率,对于信誉分别为A、B、C的客户影响是不同的,评级高的客户的利率弹性明显高于评级低的客户,可见客户评级低的用户更不容易获得贷款。
(3)采用财务分析方法进行营业收入分级
财务分析法测算授信额度采用的是微企业财务报表,这与本题所给的用附件一中的进项发票和销项发票数据计算企业的营业收入额相吻合,设Mi为第i个企业的营收入额,计算所有企业的营业收入额度。贷款信用额度应与企实际经营规模相匹配,原则上不得超过营业收入额度50%。以营业收入额度乘以50%作为临界值。
对不同客户的信誉评级的量化分析由于附件一给出的有信贷记录的不同企业的信誉评级为A、B、C、D四级,评级原则较为模糊,只能对贷款额度进行定性分析,无法进行较为准确的定量分析研究,会影响银行的信贷策略的精确度。所以首先对不同客户信誉评级进行量化分析。
以企业进项发票和销项发票中的数据为依据,提取出影响量化分析的因子,为不同的因子赋予不同的权重,权重之和为1,采用迭代算法,将加权量化分析因子与信誉评级拟合,在置信度≥95%时,认为量化分析符合模型要求。
以量化后的信誉评级为特征向量,求取特征值数量级发生变化的营业额度作为分级标准。
我们利用特征值数量级变化的值,确定同一等级不同营业收入企业的贷款信用额度分为五个等级,为:十亿级、亿级、千万级、百万级、万级,在每一级中,按照信贷评级对不同企业给予相同的额度,映射到10-100万元的区间。
映射关系:
将同一信誉评价的企业的额度取平均值,作为该营业收入级别的贷款额度,计算结果如下:
不同营业收入级别的贷款额度
| D(A,1)=100 | D(A,2)=84 | D(A,3)=56 | D(A,4)=27 | D(A,5)=16 |
|---|---|---|---|---|
| D(B,1)=0 | D(B,2)=81 | D(B,3)=54 | D(B,4)=27 | D(B,5)=13 |
| D(C,1)=0 | D(C,2)=81 | D(C,3)=51 | D(C,4)=26 | D(C,5)=11 |
营业收入分级中各个信贷等级企业个数
| N(A,1)=1 | N(A,2)=10 | N(A,3)=10 | N(A,4)=5 | N(A,5)=1 |
|---|---|---|---|---|
| N(B,1)=0 | N(B,2)=5 | N(B,3)=13 | N(B,4)=13 | N(B,5)=13 |
| N(C,1)=0 | N(C,2)=4 | N(C,3)=12 | N(C,4)=12 | N(C,5)=4 |
其中N(A,i)、N(B,i)、N(C,i)表示i=(1,5),五级企业中信贷评级为A,B,C的企业数量。
与之对应的贷款额度。
4.1.3模型的求解
在银行贷款总额一定的前提下,贷款信用额度,贷款利率,不同信誉评级的企业的数量,客户流失率之间的关系为:
其中MAX为银行所能获得的最大利益值。
最佳信贷策略数值
| A | B | C |
|---|---|---|
| LA=0.49763445 | LB=0.508718692 | LC=0.513660239 |
| IA=0.0705 | IB=0.0745 | IC=0.0785 |
以MAX 的倒数作为信贷风险因子,因MAX越大,银行收益越大,所能信贷风险越小,银行对企业贷款额度和年利率的确定就越合理,以此最优解作为最佳信贷策略。
4.2对于问题二的分析
4.2.1模型的分析
因为302家企业无信贷记录,问题一中建立的模型无法直接求解这些未知信贷记录的企业的信贷策略,所以除了考虑企业的营业收入,还要加入其它的影响指标,针对问题一中的单变量分析法的缺陷,现提出多变量分析法,以此优化问题一的决策模型。
Z-Score标准化是数据处理的一种常用方法。通过它能够将不同量级的数据转化为统一量度的Z-Score分值进行比较。所以Z-Score通过(x-μ)/σ将两组或多组数据转化为无单位的Z-Score分值,使得数据标准统一化,提高了数据可比性,削弱了数据解释性。Z-Score标准化是数据处理的方法之一。在数据标准化中,常见的方法有如下三种:
Z-Score 标准化
最大最小标准化
小数定标法
本文主要运用第一种数据标准化的方法,Z-Score标准化。
数据分析与挖掘中,很多方法需要样本符合一定的标准,如果需要分析的诸多自变量不是同一个量级,就会给分析工作造成困难,甚至影响后期建模的精准度。
举例来说,假设我们要比较A与B的考试成绩,A的考卷满分是100分(及格60分),B的考卷满分是700分(及格420分)。很显然,A考出的70分与B考出的70分代表着完全不同的意义。但是从数值来讲,A与B在数据表中都是用数字70代表各自的成绩。而Z-Score就可以解决这一问题。
Z-Score的目的
Z-Score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性。
Z-Score的理解与计算
在对数据进行Z-Score标准化之前,我们需要得到如下信息:
1)总体数据的均值(μ)
在上面的例子中,u可以是不同信誉等级数据的平均数,也可以是整个的平均数
2)总体数据的标准差(σ)
.这个总体要与1)中的总体在同一个量级。
3)个体的观测值(x)
通过以上分析,可以使用不同信誉等级的评分得出不同的信誉评分
通过将销项发票中x最终金额值代入Z-Score的公式,即:
Z=(x-u)/ σ
我们就能够将不同的数据转换到相同的量级上,实现标准化。
并且根基标准化后根据A,B,C,D不同的信誉等级分配其相应的权重w
4.2.2模型的建立
这种方法基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。将A的原始值x使用z-score标准化到x。
z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。
新数据=(原数据-均值)/标准差
用zscore函数
可以把数据进行z-score标准化处理。
用法为:
Y=zscore(X)
其中,X为标准化之前的数据,Y为标准化后的数据
特点:
(1)样本平均值为0,方差为1;
(2)区间不确定,处理后各指标的最大值、最小值不相同;
(3)对于指标值恒定的情况不适用;
(4)对于要求标准化后数据 大于0 的评价方法(如几何加权平均法)不适用。
映射关系
Z-score评分表映射后评分
采用z—score评分模型
通过excle提出无用发票,筛选出有效发票,并且对齐进行Z-SCORE进行评分
并且对齐求出平均值,并且对齐进行权重分配,然后取整
| 信誉等级 | 均值 | 标准差 | aveZ | |A/w/n| | | ------ | ---------- | ---------- | ----------- | --------- | | A | 118180.7 | 260394.1 | -44.9393 | 1/2 | | B | 87583.5 | 177307.1 | -46.1 | 3/8 | | C | 32868.98 | 18616.49 | -194.992 | 1/8 |
其中aveZ为信誉等级评分的平均数
4.2.3模型的求解
对已经算出信誉评级的302家无信贷记录企业使用问题一得出的MAX模型求解,由于问题一中银行具体放贷总额未知,问题二中求解具体的放贷总额时,需要在问题一的基础上,增加贷款总额限制模型。
数据标准化的方法:有很多种,常用的有“最小—最大标准化”、“Z-score标准化”和“按小数定标标准化”等。经过上述标准化处理,原始数据均转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,可以进行综合测评分析。
因为信誉等级为D的信誉度太低,所以分配金额为0;
所以在一亿元时进行分配为
| 信誉等级 | 分配等级 | 分配占比 | 分配金额 |
|---|---|---|---|
| A | 1 | 1/2 | (1/2)Z |
| B | 2 | 3/8 | (3/8)Z |
| C | 3 | 1/8 | (1/8)Z |
| D | 4 | 0 | 0 |
其中z为企业的平均信誉评分所占所有信誉评分的权重
四、 模型的评价
5.1模型的优点
Z-Score最大的优点就是简单,容易计算,本文通过excel对数据进行分析,仅仅凭借最简单的数学公式就能够计算出Z-Score并进行比较。此外,Z-Score能够应用于数值型的数据,并且不受数据量级的影响,因为它本身的作用就是消除量级给分析带来的不便。
5.2模型的缺点
因为估算Z-Score需要总体的平均值与方差,但是这一值在真实的分析与挖掘中很难得到,大多数情况下是用样本的均值与标准差替代。而本文就是用样本均值与样本方差,而没有使用总体均值与总体方差,其次,Z-Score对于数据的分布有一定的要求,正态分布是最有利于Z-Score计算的。最后,Z-Score消除了数据具有的实际意义,A的Z-Score与B的Z-Score与他们各自的分数不再有关系,因此Z-Score的结果只能用于比较数据间的结果,数据的真实意义还需要还原原值。而且本文只是简单的剔除了无效发票,因为电脑配置原因,并没有对其进行拟合,而导致没有剔除一些偏差较大的数据,而造对最终结果造成了影响。