风控数据分析中的规则与模型

2024-05-15

1. 风控数据分析中的规则与模型

风控数据分析里面有两种方法(我自己划分的不知道对不对),就两类方法,我做了一个大致的总结,如下
  
 1.规则:某个用户的某个行为,一天最多20次,一小时最多10次,类似这种。
   优点:数据分析工作较为简单,短平快,在接口防刷,批量行为
   等类场景性价比高
   缺点:1)这种策略容易被试出来并绕过
   2)往往为了解决精确率的问题而无法兼顾召回率
  
 2.模型(数学/机器学习):
   优点:分类效果往往更好,解决复杂场景更有优势
   缺点:依赖大量的数据标注和较为复杂的数据分析工作,需要一定的数据分析基础,收益慢更新迭代不及前者。
  
 个人认为,如果只会第一种方法,并不能很好的解决所有的尤其是复杂的数据分析问题。因为这种规则的局限性非常大(可以认为是把线性回归模型的系数矩阵置为0,只有常数项的数学模型,也就是模型的极端特例。既然是特例解决的问题肯定不是特别好)。最大的一个问题是,为了解决精准率的问题没法同时保证召回率,如下图的例子:
                                          
 上图的黑色虚线是规则的效果,橙色实线是模型效果,我们可以看到,规则为了保证最上方的红色圆点不被误伤,阈值选择非常靠上,导致大量蓝色圆点无法被召回,也就是为了保证精准率牺牲了召回率。但是模型就好一些,因为它可以通过复杂的矩阵运算在二维甚至多维空间内分出出相对复杂的两部分。
   当然两者也并不是泾渭分明的,比如大名鼎鼎的决策树模型其实就是一系列复杂的阈值规则组成的,随机森林模型又是由决策树模型投票产生的。
   在处理相对复杂的数据分析问题时我更倾向于通过模型来解决,而相对简单快捷的阈值规则也有其一定的用武之地。

风控数据分析中的规则与模型

2. 大数据风控方案?

总的分为征信大数据挖掘和风控运营两部分:

征信大数据挖掘:
互联网海量大数据中与风控相关的数据
       电商类网站大数据:阿里、京东、苏宁等;
       信用卡类网站大数据:我爱卡、银率卡等;
       社交类网站大数据:新浪微博、腾讯微信等;
       小贷类网站大数据:人人贷、信用宝等;
       支付类网站大数据:易宝、财付通等;
       生活服务类网站大数据:平安一账通等...

     在进行数据处理之前,对业务的理解、对数据的理解非常重要,这决定了要选取哪些数据原料进行数据挖掘,在进入“数据工厂”之前的工作量通常要占到整个过程的60%以上。
   在数据原料方面,越来越多的互联网在线动态大数据被添加进来。例如一个虚假的借款申请人信息就可以通过分析网络行为痕迹被识别出来,一个真实的互联网用户总会在网络上留下蛛丝马迹。对征信有用的数据的时效性也非常关键,通常被征信行业公认的有效的动态数据通常是从现在开始倒推24个月的数据。
     通过获得多渠道的大数据原料,利用数学运算和统计学的模型进行分析,从而评估出借款者的信用风险,国内典型的企业是神州融大数据风控平台。用大数据分析进行风险控制是益博睿的核心技术。他们的原始数据来源非常广泛。
     他们的数据工厂的核心技术和机密是他们开发的多个个基于学习机器的分析模型,对每位信贷申请人的超过3000+维度原始信息数据进行分析,并得出可对其行为做出测量的指标,而这一过程在5秒钟内就能全部完成。

风控运营:
贷前营销:1、已有客户开发、新客户开发;2、预审批、申请评分 3、预审批,客户准入、预授信额度估算。
贷中审批:1、欺诈甄别、反欺诈监测; 2、申请再评分; 3、授信审批;4、贷款定价。
贷后管理:1、行为评分模型; 2、额度管理; 3、风险预警、预催收;4、催收评分、催收策略。    
      目前贷款审批线上速度实现了突破,贷款获批率也得到了显著提升,同一类用户,用抵押物、收入流水证明等粗放式的传统风控方式,贷款获批率在15%左右,而使用大数据模型结合人工后获批率可以达到30%以上。至于贷款的逾期率,以12个月违约风险举例,通过神州融线上信贷审批模型筛选的用户,逾期率比没有经过筛选的低一半。
      神州融是第一家在大数据风控系统上发力的互联网金融企业,同时蚂蚁金服旗下的芝麻信用、一些P2P网贷平台都在陆续开始研发大数据信用评估模型。

3. 大数据风控方案

分为征信大数据挖掘和风控运营两部分


一、征信大数据挖掘:
互联网海量大数据中与风控相关的数据
       电商类网站大数据:阿里、京东、苏宁等;
       信用卡类网站大数据:我爱卡、银率卡等;
       社交类网站大数据:新浪微博、腾讯微信等;
       小贷类网站大数据:人人贷、信用宝等;
       支付类网站大数据:易宝、财付通等;
       生活服务类网站大数据:平安一账通等...

     在进行数据处理之前,对业务的理解、对数据的理解非常重要,这决定了要选取哪些数据原料进行数据挖掘,在进入“数据工厂”之前的工作量通常要占到整个过程的60%以上。
 在数据原料方面,越来越多的互联网在线动态大数据被添加进来。例如一个虚假的借款申请人信息就可以通过分析网络行为痕迹被识别出来,一个真实的互联网用户总会在网络上留下蛛丝马迹。对征信有用的数据的时效性也非常关键,通常被征信行业公认的有效的动态数据通常是从现在开始倒推24个月的数据。
     通过获得多渠道的大数据原料,利用数学运算和统计学的模型进行分析,从而评估出借款者的信用风险,国内典型的企业是神州融大数据风控平台。用大数据分析进行风险控制是益博睿的核心技术。他们的原始数据来源非常广泛。
     他们的数据工厂的核心技术和机密是他们开发的多个个基于学习机器的分析模型,对每位信贷申请人的超过3000+维度原始信息数据进行分析,并得出可对其行为做出测量的指标,而这一过程在5秒钟内就能全部完成。

二、风控运营:
贷前营销:1、已有客户开发、新客户开发;2、预审批、申请评分 3、预审批,客户准入、预授信额度估算。
贷中审批:1、欺诈甄别、反欺诈监测; 2、申请再评分; 3、授信审批;4、贷款定价。
贷后管理:1、行为评分模型; 2、额度管理; 3、风险预警、预催收;4、催收评分、催收策略。    
      目前贷款审批线上速度实现了突破,贷款获批率也得到了显著提升,同一类用户,用抵押物、收入流水证明等粗放式的传统风控方式,贷款获批率在15%左右,而使用大数据模型结合人工后获批率可以达到30%以上。至于贷款的逾期率,以12个月违约风险举例,通过神州融线上信贷审批模型筛选的用户,逾期率比没有经过筛选的低一半。

大数据风控方案

4. 大数据风控是如何得出的?

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据风控主要是通过建立数据风险模型,筛选海量数据,提取出对企业有用的数据,再进行分析判断风险性。

5. 揭秘点滴身边大数据风控模型构造

揭秘点滴身边大数据风控模型构造
近日来,继央行及地方政府的几个指导意见的下发与征求之后,一度火热的互联网金融又被推举至舆论的风口浪尖,一时间有关第三方支付与互联网金融平台的资金托管问题成了热议焦点。其实,不论是第三方托管还是银行存管,这些方式的转换无非只是为互联网金融平台平添了一层信用背书、丰富了整个风控体系的外在表现形式而已,论其根本,决定互联网金融稳健运营的真正基础其实是大数据风控体系构建。
  大数据风控必然性
  当下社会,数据即是资产,如果可以广而深的获取数据、处理数据、分析数据、应用数据,那么便可以在激烈的商场鏖战中脱颖而出。互联网的快速发展一方面为我们生活提供了便利,引导我们任何行为动作都在互联网的辅助下快速进行,另一方面也为企业积攒了海量数据,机构方只要对数据进行适当分析并将其应用在合适领域,即可激发巨大的商业价值,而互联网金融正是其中一隅。另外,从多年征信体系构建情况来看,传统风控模式发展速度慢、审核效率低、时空两界覆盖面窄,以及掺杂许多人为主观性,而利用大数据契机不仅可以使效率大大提高,而且可以使审查结果更为精准,因此,大数据风控时代来临是为必然!
  大数据风控的成功运用
  中国的互联网金融有其名而无其意,迫于长期以来的观念影响以及大数据技术人才的短缺,风控审核仍然是依托传统线下。但也有机构已经开始布局大数据风控,近期以来,一家名为点滴身边的互联网金融平台吸引了大众眼球,而且作为一家近期运营的平台,一经上线便引起各界关注,颇受投资者喜好,究其原因,这一方面正是基于其完善的大数据风控体系构建,另一方面也是基于其独特的产品框架。
  于大数据风控模型构造而言:
  首先,自创鹰眼风控系统。整个模型基于对中国实际信用情况的深入研究和多维度的可信数据分析,结合团队多年实地信审经验,在FICO评分模型和信用卡打分卡基础上构建而成。
  其次,多渠道数据收集、挖掘用户信息。采用用户授权、合作接入及网络公开数据抓取等多种手段,掌握借款人的淘宝、京东、信用卡消费及还款、跨平台借款和投资、水电煤缴费、社保、学信、职业资格、通讯、住址等多维度数据,并接入中国人民银行征信系统、居民身份系统等多个官方数据系统。
  最后,数据分析与评估计算。通过已设置好参数与维度,对借款人触网过程中的34类近2000项变量进行筛选及智能比对,分析其在购物网站、社交网站、日常生活网站上的行为和关系,计算出借款人的信用等级,从而给出授信额度。
  与产品而言:
  第一,产品独特,期限短,利率高。主要有新手标、短期标、高收益标三种产品,新手标期限为15天左右,利率8%以上,完胜宝宝类产品;短期标期限为1个月,利率为14%左右;高收益标期限为3个月左右,利率18.4%左右,且借款金额普遍在1000元左右,借款者还款能力强,此外,预计8月中旬点滴身边将上线T+N模式活期产品,随存随取。
  第二、安全性能高。不仅有完善的大数据风控体系,还有风险准备金,使得投资者可以安心投资。
  此外,点滴身边上线初期的送钱揽客活动力度也是非常大。新手注册即送20元投资红包,首次投资再送30元现金红包。短期标的再加上红包奖励,100元起投,门槛低,操作便捷,这促使该平台能够很快一周内吸引了近上万粉丝,总成交额也呈高歌猛进之势。
以上是小编为大家分享的关于揭秘点滴身边大数据风控模型构造的相关内容,更多信息可以关注环球青藤分享更多干货

揭秘点滴身边大数据风控模型构造

6. 如何构建大数据风控体系

传统的风控系统比较简单, 一套简单的IT系统结合线上线下征信,征信数据来源局限,原理简单,风险较大。
相对于大数据风控系统来说,由于大数据征信评分原因,IT系统相对完善,数据来源来源征信机构及互联网各种平台相关数据。
大体有四部分功能:
1、评分建模,风控部分;
2、IT系统:业务系统、审批系统、征信系统、催收系统、账务系统;
3、决策配置工具,即信dai决策引擎;
4、征信大数据的整合模块。
大数据风控系统优势是大数据驱动,兼容手动、自动审批、决策、dai后管理。

7. 怎么做大数据风控方案?

创建方案:1、评分建模:风控部分;
2、IT系统:业务系统、审批系统、征信系统、催收系统、账务系统;
3、决策配置工具:即信贷决策引擎;
4、征信大数据的整合模块。
大数据风控系统的优势是大数据驱动,兼容手动、自动审批、决策、后台管理。
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。    
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。
大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

怎么做大数据风控方案?

8. 怎么做大数据风控方案?

创建方案:1、评分建模:风控部分;
2、IT系统:业务系统、审批系统、征信系统、催收系统、账务系统;
3、决策配置工具:即信贷决策引擎;
4、征信大数据的整合模块。
大数据风控系统的优势是大数据驱动,兼容手动、自动审批、决策、后台管理。
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。    
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。
大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
最新文章
热门文章
推荐阅读