目录
反欺诈模型体系和模型在策略中的应用
申请反欺诈评分卡模型
欺诈传导模型
欺诈团伙识别模型
GPS评分卡模型
如何在贷中应用贷前模型
反欺诈模型体系和模型在策略中的应用
反欺诈横型体系主要包括识别个体欺诈和识别团伙欺诈的两类模型。在贷前,常用的识别个体欺诈的模型主要有申请反欺诈评分卡模型、欺诈传导模型等,识别团伙欺诈的模型主要有欺诈团伙识别模型、GPS评分卡模型等。接下来对上述模型进行简单说明。
申请反欺诈评分卡模型
申请反欺诈评分卡模型即我们常说的百卡,该模型主要基于客户授信申请时点前一段时间的关联关系数据(如同一客户近一段时间关联设备“指纹”数、关联申请电话数等)、行为异常数据(如GPS短时间跳转距离较远)等构建,用来预测客户欺诈的可能性。申请反欺诈评分卡模型的目标变量通常为是否欺诈(若坏样本较少,则目标变量可基于首逾信息确定),模型结果通常以欺诈评分的形式输出,模型分越低,欺诈可能性越低,模型分越高,欺诈可能性越高。申请反欺诈评分卡模型主要在授信审批策略中作为审批规则使用,审批规则的阈值可使用单维度策略分析方法进行确定,在应用规则时,通常,某个阈值以上的进件被拒绝,阈值及以下的进件被通过。
欺诈传导模型
欺诈传导模型属于图模型,该模型是基于“物以类聚,人以群分”的原理设计的。在构建欺诈传导模型时,通常是先基于客户与客户的联系(如联系人电话一致、互为联系人等)构建社交网络,该社交网络通常只有客户I这一个节点,再基于社交网络中的欺诈节点推断与欺诈节点联系紧密的节点的欺诈可能性。在构建本模型时,主要使用的是节点协同分类算法,通常要用到截至某个时点的所有客户关联关系数据和客户欺诈标签数据。欺诈传导模型构建完成后能够预测当前社交网络中已有的未确定欺诈的客户的欺诈概率。
在具体使用欺诈传导模型时,通常是将欺诈可能性比较大的客户加入欺诈黑名单,在授信审批策略中对这些客户进行准人拦截。需要注意的是,因为客户之间的关系和欺诈节点更新较快,所以该模型通常需要频繁迭代,以便更好地进行风险管控。
欺诈团伙识别模型
欺诈团伙识别模型也属于图模型,该模型与欺诈传导模型类似,只不过在构建完社交网络后,该模型主要识别的是欺诈团伙。在构建欺诈团伙识别模型时,常用的是Louvain算法,该算法主要基于客户节点、设备“指纹”节点、电话节点等构建社交网络,在社交网络构建完成后,基于模块度指标将构建的大网络切分成一个个小的“社区”,若某个社区中欺诈节点占比较大,则认为该“社区”为欺诈团伙的可能性较大。
在具体使用该模型时,通常是将疑似欺诈“社区”中涉及的节点加入欺诈黑名单,在授信审批策略中对这些客户进行准入拦截。与欺诈传导模型类似,欺诈团伙识别模型也需要经常进行迭代,以便更好地识别欺诈团伙。
GPS评分卡模型
GPS评分卡模型主要用来识别具有地域集中度的欺诈团伙,该模型以GPS点为单位对观察点(通常为切面时间点)前一段时间授信申请客户的信息进行整合,基于整合后的信息构建模型,模型的目标变量可基于该GPS点表现期内的欺诈率或首逾率来确定,欺诈率或首逾率超过某个阈值,则为坏,小于或等于该阈值则为好,模型最终输出的结果为GPS点对应的模型分,模型分越低,该GPS点越可能存在团伙欺诈,模型分越高,该GPS点越正常。
在正常情况下,客户的GPS点信息精度很高,经度和纬度通常精确到小数点后很多位,若直接用获取的CPS点进行信息汇总,那么加工的变量通常是很稀疏的,基本上无法用来建模。如何对这些CPS点进行处理呢?很简单,如可将经度和纬度分别截取至小数点后3位,然后拼接在一起,则可将方圆数百米的授信申请客户归集在同一GPS.点上,然后就可以对同一GPS点上的申请客户信息进行汇总,并进行变量衍生和建模了。在进行建模时,为了确保建模样本的有效性,通常选取近一段时间内授信通过且用信的客户数大于某一阔值(如大于20)的GPS点进行建模,因为如果一个GPS 点在近一段时间内只授信中请通过且用信了极少(如1.个)的客户,这个GPS 点就是无效的样本,基于该GPS 点建模时很难挖掘出欺诈团伙。
待GPS评分卡模型构建完成后,主要基于模型结果设计准入规则,对欺诈评分小于或等于某个阈值的GPS点进件进行拦截,让欺诈评分大于该阈值的GPS点进件通过。
如何在贷中应用贷前模型
在贷前,我们会开发很多模型,这些模型只能在贷前风控场景使用吗?当然不是,在贷中,同样可以使用贷前开发的模型进行风险管控。以贷前申请评分卡模型为例,在模型开发完成后,我们通常基于客户授信申请时点前一段时间的行为数据对客户进行评分,然后基于评分结果对客户进行风险管控,此时,模型分的观察点是授信申请时点,假如现在观察点变了,变为用信申请时点,我们基于客户用信申请时点前一段时间的行为数据使用贷前申请评分卡模型对客户进行评分,模型没有变,模型分的观察点变了,但是基于不同观察点的模型分仍然是有效和可用的。
在贷中,尤其是对于一些循环额度类产品,贷前的大多数模型其实都是可用的。在应用模型的时候,模型的观察点变了,观察点对应的客户的行为数据也变了,但是基于最新的数据得到的模型结果对目标客户的识别仍然是有效的。通过贷前和贷中的联动,将已经开发好且有效的贷前模型在贷中应用,可降低模型重新开发的成本,提升模型使用效能,更快、更好地进行风险管控。
print('要天天开心呀')