干货 | 信贷风控模型搭建及核心风控模式分类-法财库

干货 | 信贷风控模型搭建及核心风控模式分类

发布者：luoge

2018-05-02 19:17 7742

近年来，信用风险管理发展呈现出数据化、模型化、系统化、自动化和智能化的特点。传统的人工专家经验正逐步被模型与算法替代。

因此，科技较为领先的金融服务公司会选择采用模型方式完成对借款人的自动评估与审批。目前，对于信贷审核来说主要基于的风控模式为IPC、信贷工厂、大数据三种，每一种都有自己不同的侧重点。
IPC模式

IPC模式起源于德国邮储银行，该模式重视实地调查和信息验证，主要通过对客户经理调查走访、信息交叉验证等方面。需要对客户经理进行至少2个月以上的专业技术培训，提升客户经理辨别虚假信息能力和编制财务报表的技能，从而防范信用风险。

IPC公司信贷技术的核心，是评估客户偿还贷款的能力。主要包括三个部分：一是考察借款人偿还贷款的能力，二是衡量借款人偿还贷款的意愿，三是银行内部操作风险的控制。每个部分，IPC都进行了针对性的设计。

运用
主要运用于数据缺失、不具备财务管理环境、银行流水不完整，信用记录空白等的小微企业，其中，信贷员负责整个过程，从接受客户的申请到信用检查、现场信用、风险评估再到匹配贷款、付款催收和逾期付款。对信贷员的专业技能要求较高，信贷员对贷款全流程把关，一定程度上确保了项目的真实性。但又因为是以信贷员为核心，以信贷员的判断为依据，有一定的操作风险与道德风险。
信贷工厂模式

信贷工厂模式是新加坡淡马锡控股公司(Temasek Holdings)为解决小微企业信贷流程的弊端,推出了一种改善小微企业信贷流程的“信贷工厂”模式，“信贷工厂”意指银行像工厂标准化制造产品一样对信贷进行批量处理。

具体而言，就是银行对中小企业贷款的设计、申报、审批、发放、风控等业务按照“流水线”作业方式进行批量操作。在信贷工厂模式下，信贷审批发放首先要做到标准化，每个流程都有确定的人员分工，如客户经理、审批人员和贷后监督人员专业化分工。并且为了监控风险采用产业链调查方法，从不同角度对借贷企业进行交叉印证。

信贷工厂模式的特点是效率高，可以进行量化审核。过程之间环环相扣，对每个环节都有专人把控具体的把控。正因为这样，意味着需要消耗大量的人力成本，每个流程都需要对口的人员做支撑。
大数据模式

大数据风控模式是指通过对海量的、多样化的、实时的、有价值的数据进行采集、整理、分析和挖掘，并运用大数据技术重新设计征信评价模型算法，多维度刻画信用主体的“画像”，向信息使用者呈现信用主体的违约率和信用状况。

大数据模式是基于互联网的兴起，该模式利用互联网数据的连通性，对触及到的风险的数据进行筛选，大大减少了人工审核的时间成本，同时也保证了数据结果的真实性。

在新时代的发展中，大数据俨然成为了像能源一样重要的战略资源，壹诺信用借助自身的资源优势，为风控流程提供全面的数据支撑，为信贷人员打造专业移动信贷管理工具。
P2P公司个人信贷评分卡模型的建立

我们先讨论下如何从实际业务出发，以怎样的开发流程才能建立一个有效、有用、有价值的模型，希望读后能给你一定的启发。

在互联网金融风控体系中，量化分析需要贯穿始终，评分卡模型是其中非常重要的一环。

在互联网金融评分卡开发过程中，我们仔细研究了企业风控操作流程，反复推敲了模型构建步骤，最后我们认为从业务应用角度，评分卡开发应用应遵循：

业务定义➡️风险定义 ➡️风险分解➡️风险策略

业务定义
为什么把业务定义放在最底层呢？
从商务智能的角度说，模型，评分，策略等都是为业务服务的，脱离了业务场景的模型和评分是无本之木，无源之水。脱离了业务场景谈模型的准确性，没有意义。

不同的业务场景，产生了不同的数据，不同的数据包含的规律，体现在数据分析中就是不同的模型、不同的参数和不同的评分。

比如，同样是网上的个人信用贷款，主要包含个人和企业主两大类客群。在中国，由于小微企业贷款困难，如果小微企业有了贷款需求，一般都是企业主以个人名义在网上贷款，但是这类客户显然是和普通个人信用贷款客户是不同的，所以这类客户的属性信息一般都包含了一些企业的信息，如资产，对公、对私流水等等。我们在做模型的时候，就会把他们分开：个人消费信贷模型和企业主信贷模型，企业主模型会包含一些反应小微企业财务状况的变量。

但是互联网金融所包含的业务种类远不止这两个，单纯的信用贷款类，就有专门放贷给学生的学生贷；在朋友圈之内贷款的朋友贷；给外企白领贷款的白领贷……

如果你拿学生贷的模型给农民贷客户来用，或者拿给上海白领开发的模型给甘肃、西藏的白领用会怎么样呢？我不说你也明白了。

业务定义之后，还有一个要求，即业务模式的稳定性。即在一定时间范围内，用于构建模型的数据依赖的业务模式是相对没有变化的，前后一致的。只有满足这个条件，历史数据模拟出来的模型，和后面的数据才是匹配的。这在学术上有个术语，稳定性，Stationary/stability.

同理，我们也假设，符合同一类属性特征的个体，其表现行为也是一样的，即打分相同的人，表现也相同。这也回答了有人提出的另一个问题“我以前从没贷过款，也没信用卡消费记录，能用你的模型打分么？”

风险定义
简单地说就是判定哪些是好客户，哪些是坏客户。

互联网金融业务模式的多样性，导致了对好客户和坏客户的定义标准也不尽相同。这里有人会问：“怎么会呢？欠钱不还的不就是坏客户么。”好吧，我来举个例子。

在我们清洗数据的时候，看到对客户信用评价中有这么一类“少量逾期”，这个类别占了相当大的比重，而且在模型中作用也比较显著，和其它类别“信用好”“信用差”等比肩。

一开始我们的技术人员对这个“少量逾期”这个分类很疑惑，不能理解这个分类到底是好还是坏。直到我们和某P2P公司的风控经理实际交流后才明白这其中的含义。在传统银行信用卡业务中，是很喜欢这类少量逾期的客户的，因为他们能给银行创造罚息，但是又不是恶意违约那种客户。但对于P2P公司来说，是不敢养这类客户的,一旦有了逾期情况，就必须马上采取措施……

说到这里您可以明白了吧，“少量逾期”是传统银行信用卡业务中经常出现的一个分类，而且算一个银行比较喜欢的类别，但是你把它也用到互联网金融试试？

风险分解
风险分解，就是用模型把目标客户分类。

举个例子：
某跨国IT北京研发的总裁，提到发生在自己身上的案例：由于家里有急事，临时用钱，想申请某行的信用卡多给5万额度，但是某行不批。为什么呢? 因为刘总用这个卡主要是发工资的，每月到账后，夫人就会把钱拿去购买理财产品。因此卡上一般没多少钱。但是刘总是不是高风险客户呢？

显然，依据某行简单的分类方法，刘总被划为不能多给5万额度的类别了。长此以往，类似刘总这类高质量、低风险客户就有可能流失。

因此，选择正确的方法，合理分类，才能为进一步采取合理的商业策略提供正确有力的数据支持。评分卡是其中一个比较有效的工具。

在信用风险管理领域，评分卡是简便易行的风险管理工具。

什么是评分卡？
评分卡是综合个人客户的多个维度信息（如基本情况、偿债能力、信用状况等，重点关注偿债能力、还款意愿），基于这些信息综合运用数学分析模型，给个人综合评分，判断违约的可能性的工具。

生活中存在许多“显性”或“隐性”的“评分卡”。

例如：选购汽车--综合价格、油耗、安全系数、性能、外观等来因素。-> 买？还是不买？

就分析方法发而言，现在分类算法有很多种，决策树，逻辑回归，支持向量机，神经网络等等，都可以实现这个目的。在以后的文章中，青苔会详细讲解一下数据和模型的匹配性。数据决定了用什么模型。
风险策略
在给客户正确分类之后，即准确地风险分类。我们就可以采取相应的商务策略，优化业务：

- 流程简化：通过模型对客户分层，降低审核人员的工作量，提高审批速度。

- 风控优化：以客观分数代替主观评断，保证审批标准及风险偏好一致性。

- 风险定价：按照模型计算的违约率进行产品的定价。
风控模型的应用场景和流程

风控模型的应用场景非常广泛，只要牵扯互联网金融的行业就缺少不了风控模型的存在，从借贷的角度来看，平台要评估借贷者的个人征信和还款能力从而保证投资者的收益；从投资者的角度，要保证平台的资金安全，从而保证自己的投资或者本金获得合理的收益和保护。

另外，风控模型在不同的阶段体现的方式和功能也不一样。从资金的角度来看，风控模型是为了评估用户还款能力和还款意愿，反欺诈反作弊，防止用户薅羊毛和保证平台安全等功能；从行业的角度，互联网风控模型体现在消费金融／供应链金融／信用借贷／P2P ／大数据征信等方面。

风控模型的设计纬度
风控模型的设计其实就是多维度和多角度的设计方式，这里我们就简单的通过一个对于线上借贷用户进行资质审核的模型进行举例子；从下面的流程我们可以看到，风控模型的审核流程一般都是要经过机器审核和人工确认的相结合的方式。机器的模型审核同时大致分为三个阶段，它通过用户提交的数据，对用户的资质进行审核，最终得到一个评分卡的分数。

一般情况下风控模型需要过滤高危地区的黑名单，因为在市场上永远存在着这么靠金融欺诈而获利的人群，对于这类人群只要存在疑虑统统过滤掉；其次通过系统设置的评分规则对用户提交的个人信息进行评定，最后辅助一些其他的输入资料进行分数的微调，最终得到一个最终的评分卡的分数。

另外，很多金融公司的风控模型的设计不管是对于最终高评分的用户还是对于存疑的进见，都需要最后的人工进行确认。所以说，风控模型的计算策略和机制在一个公司属于绝密，规则出了核心的员工，其他人是不能知道风控规则的。

如果说金融产品的核心是风控，那么风控的核心是什么?
答案其实就是：信用评估 + 模型规则。

信用评估的基础来自于用户本身的个人信息和数据，这也就是为什么很多信贷APP需要定位用户的位置，需要用户访问个人的通话和通讯录记录，需要用户上传和填写海量的个人信息资料；另外在获取这些资料之后对于这些资料的权重处理，分配不同的权重审核也是风控模型要处理的事情。

总体来说风控模型的设计主要可以分为以下的几个步骤：

第一步就是获取数据

信用评估来自于用户数据，模型规则其实就是用户数据规则，信息的纬度也比较广泛，大致可以分为基本信息／行为信息／信用信息／社交信息和消费信息等。

当然获取信息的方式也是千奇百怪，主要的来源有用户提交／接口用户授权／爬虫／信息购买／黑白名单等方法。

第二步：确定用户数据的变量

分配变量的计算权重确定用户变量和分配权重，这个阶段其实是在获取数据之前就要考虑的事情，因为我们需要去定义用户去填写哪些个人信息。从而通过人工的定义规则对这些信息的权重和变量进行确认，当然这些权重和变量并不是一个人去口头决定的，这些变量和权重一般都是公司的某个权威和专家进行确认。

这个方面，一两句话讲不明白，下面几张图是某个金融机构的一些权重和变量列表，贴图大家看看吧！

第三步：调整指标分数，给出评分

在风控模型建立的后期，我们必须要输入个人信息进行模型的测试，前面我们建立每个指标的评分规则，但是我们并不知道这些规则是否真的适用于市场。这个时候我们就必须要进行模型规则的自测，通过反复调试指标分，保证模型准确性。

第四步：产品上线，进行验证

产品上线进行验证其实是很有风险的，这个时候是对风控模型的终极检测，很多金融产品在上线后大部分都不会进行产品的运营宣传。很可能产品的初期都会吸引一部分攻击者进行疯狂的进件攻击，我当时负责设计的产品当时突然有一个很大的并发量，最后不得不对产品进行下架处理，所以在金融产品上线的初期我们就必须要考虑到可能出现的危机，一般来说活体检测是能够过滤到一大部分恶意欺诈人群的。

产品上线后，对于真实的用户，有很多信用记录会明显影响个人信用评分，如延迟付款额度变化、拖延付款时间的严重程度、信贷账户数目增减、信贷余额变化、账龄、最近的查询记录等。当个人信用评分模型工作时，它会从个人信用档案中抽取不同因素来评价消费者的信用状态，一旦信用记录中有瑕疵出现，评分模型就会度量出瑕疵的大小，直接从现有的分数中扣除, 从而使信用评分的分值减小一些。

申明：感谢作者的辛勤原创！若在本网站转发过程中涉及到版权问题，敬请与管理员联系！以便及时更改删除，谢谢！
另：法财库目前成立了多个行业微信群【银行高管群】【商业银行群】【信托群】【券商群】【理财师群】【投行群】【私募群】【基金群】【股权投资群】【期货群】【现金贷】【第三方支付】【金融高管群】【总裁群】【互联网高管群】【汽车金融群】【融资租赁群】

扫码加群主申请入群

1. 姜超：货币超发的时代结束了！——兼论资管新规的长期意义
2. 我国“独角兽”企业发行上市路径解析
3. 上市公司2017年报出炉，最新透视、榜单
4. 吴敬琏谈中兴事件：不惜一切代价发展芯片产业是危险的
5. 为什么我们从来没有在投资上赚过大钱？
6. 600亿惊天骗局背后的P2P，今年"阵亡"140家(名单)!多部委发声:打击非法集资
7. 从1亿到1万：中國式投资陷阱全梳理
8. 重磅！首个住房租赁资产证券化文件出台！
9. 论新经济背景下，发行与投资CDR的重要性
10. 家族上市公司治理：转型时期家族企业独特的治理需求

法财网