本文会分上、下两篇,介绍各种风控与反欺诈相关的数据来源,包括其主要的数据维度和产品服务形态。
目录:
人行二代征信
持牌征信机构数据
司法大数据
航旅大数据
铁路大数据
税务大数据
交通大数据
电力大数据
保险大数据
人社大数据
一、人行二代征信
二代征信指中国人民银行征信中心面向社会公众和金融机构提供的第二代新版征信系统。这个相信大家都比较熟悉了,这里就不过多展开,简单介绍一下其主要的产品服务:
1、个人信用报告
记录信贷用户与金融机构间发生业务关系时相对客观的信息。主要由报告头、个人基本信息、信息概要、非信贷交易信息、公共信息及查询记录六大核心模块组成。
2、个人业务重要信息提示
该产品主要起到贷后风险用户行为提示的功能,利用个人征信系统即时更新的数据,每周一将各机构客户在其他机构出现重要事项的信息,主动推送给该机构。主动推送的提示信息有以下5种情况:
1)用户贷款业务“五级分类”中新增“不良”的信息;
2)贷款或信用卡业务新增“当前逾期总额”大于300元的61-90天逾期或90天以上逾期信息;
3)信用卡业务“账户状态”新增“呆账”
4)提示日期前30天之内在“其他机构”有贷款或信用卡申请的;
5)被法院列为失信被执行人等。
3、企业信用报告
记录信贷企业与金融机构间发生业务关系时相对客观的信息。主要包括报告头、信息概要、信贷记录明细、非信贷记录明细、公共记录明细、评级信息、声明及异议标注信息等模块。
4、信贷资产结构分析产品
以企业征信系统中的信贷信息和借款人基本信息为基础,反映本机构各信贷业务产品余额、发放额、不良率在信贷市场的集中度、份额,以及在同类型机构中所处位置的征信汇总数据。
5、关联查询产品
挖掘贷款申请人之间、贷款申请人与贷款机构之间、贷款机构之间的经济或股权关联关系,采用关联图谱的形式。
6、贷后服务——对公业务重要信息提示产品
利用企业征信系统实时更新的数据,将各机构企业客户在征信系统出现异常业务(贷款、贸易融资、票据贴现、保理、信用证、银行承兑汇票、保函七项)的信息,主动推送给该机构。
二、持牌征信机构数据(以百行为例)
我国持牌征信机构分为个人征信和企业征信两类,由中国人民银行征信管理局统一管理。目前个人征信只有百行征信和朴道征信2家获得牌照,此外钱塘征信目前在申请第3张,还处于备案受理审核阶段。已备案企业征信机构目前有134家,还有44家企业征信机构被注销。
以百行征信为例,其有四大类型数据报送机制,分别是申请信息报送、单笔贷款数据报送、循环授信合并账单报送、循环授信借据逐笔报送,其中后三者包含批核、用款、还款、逾期、展期信息。
其主要的产品服务形态也和人行征信类似,主要是以个人信用报告、小微企业信用报告为主。此外,在个人端会辅以多种多样的增值征信服务产品,如特别关注名单、反欺诈系列产品、多头申请监测产品、信贷行为标签产品、百行智绘产品及共债预警产品等;在小微企业端则会辅以风铃风险类产品(包括企业关联方探查、人企关联核验、空壳企业识别、红黄绿通道、受益所有人识别、企业模糊匹配、企业关联方风险信号、企业关联方综合画像、小微企业反欺诈及小微企业多头检测10类产品)和经营分析类产品(企业税票征信产品、企业电力征信产品)。
三、司法大数据:中国法研
中国司法大数据研究院(简称“中国法研”)隶属于最高人民法院信息中心,是最高人民法院信息中心唯一授权的可对外的司法数据服务单位。其汇聚了全国各级人民法院海量审批执行信息,现存案件量已达1.4亿件;对接全国3000多家法院,现存数据覆盖所有法院案件审批流程信息。
其数据维度涵盖:
1)民事相关数据维度
2)民事破产相关数据维度
3)刑事相关数据维度
4)行政相关数据维度
5)执行相关数据维度
6)强制清算数据维度
7)失信被执行人相关数据维度。
主要的产品形态包含七大类数据画像产品:
1)执行公开信息
2)失信老赖名单
3)限制高消费名单
4)限制出入境名单
5)民商事裁判文书
6)民商事审批流程
7)罪犯及嫌疑人名单
适用于反欺诈、信贷风控、票据查验、资产追溯、企业法律风险评估等业务场景。
四、航旅大数据:中航信
中国民航信息网络(简称“中航信”)是隶属于国务院国资委的中央企业,其掌握了除春秋航空外的国内95%以上的航旅用户数据,包括乘客的每次票务购买、值机、登机、到达等所有信息。
其数据主要来自于目前中航信航班控制系统(ICS)、计算机分销系统(CRS)和离港系统(DCS),常用的数据维度有:
收益数据、SCH数据、航班数据
PNR数据(销售)
PNR数据(成行)
CKI数据(详细)/CKI数据(汇总)、LDP数据
BIDT数据
MIDT数据
其主要的产品形态包括基础标签类产品(优质客户标签、民航风险人员名单等)和航旅分(航旅人群评分系统,由消费能力、品牌认知度、价格敏感度、成长值4个细分维度和“航旅分”共同组成)。
五、铁路大数据:12306网站
中国铁路客户服务中心(简称“12306网站”)是铁路服务客户的重要窗口,集成了全路客货运输信息,为客户提供客货运输业务和公共信息查询服务。
12306网站现有一套完整的铁路客运用户画像体系,包含以下10套系统与数据来源:
铁路客票发售和预订系统
铁路12306互联网售票系统
铁路旅客运输管理信息系统
铁路旅客运输清算系统
12306客户服务系统
铁路财产保险信息系统
短信平台
电子支付平台
延伸服务系统(互联网订餐、广告和站车Wi-Fi运营服务等)
外部系统
其主要的产品服务形态可以分为:
身份核验服务:目前铁路互联网售票系统注册用户近6亿,全部旅客信息都是通过实名制核验的。用户数据真实可靠,可以打包成产品对第三方服务平台提供核验服务。
用户资质核验服务:支持验证用户性别、是否学生身份、是否社会新人、是否高端商旅人士、常住地是否二线城市或三线城市、是否旅游达人等。
标签类服务:
账户属性:年龄层、关联身份证个数、关联手机号个数
乘车决策数据统计:作为乘车人购票总次数、作为乘车人退票总次数、作为乘车人改签总次数、行程变化比例、车票挂失次数、车票挂失比例、乘车总次数等
乘车时间数据统计:总旅行时长、工作日乘车比例、最近出发时间段、最近到达时间段
乘车消费数据统计:乘车消费总金额、GDC列车消费总金额、普通列车消费总金额
乘车等级、席别数据统计:GDC等级列车乘车比例、普通列车乘车比例、高端席别(软卧、高级软卧、特等软座、商务座)乘车次数、普通席别乘车数量、高端席别(软卧、高级软卧、特等软座、商务座)乘车比例、普通席别乘车比例
购票行为数据统计:线下购票比例、互联网购票比例、手机购票比例、提前024小时购票比例、提前2448小时购票比例
订单交易数据统计:交易未支付总张数、作为购票人的退票数量、作为购票人的改签数量、孩票数量、残军票数量、孩票比例、残军票比例
由于篇幅限制,关于税务大数据、交通大数据、电力大数据、保险大数据、人社大数据相关的信息会放到下篇,欢迎感兴趣的朋友持续关注后续的文章。
本文内容整合自李可顺老师《金融数据风控:数据合规与应用逻辑》以及互联网公开资料,版权归原作者所有。