做风控模型时用到了哪些数据源?

270 阅读5分钟

我正在参加中秋创意投稿大赛,详情请看:中秋创意投稿大赛

解析:

征信数据运营商数据埋点数据平台自有数据用户手填数据数据有很多,每家都各有不同,小心点也可能问你数据来自哪家平台哦。ps:见过很多小型公司都喜欢用运营商数据,因为便宜,很多都是免费的。

下面举个详细的例子:

1、反欺诈模型:

身份信息四要素验证(准入要求:一致) 手机在网时长验证(准入要求:长于一年) 家庭地址核验(准入要求:一致)

学历信息核验(准入要求:一致)

社保信息核验(准入要求:一致)

夫妻核验(准入要求:一致)

紧密联系人核验(准入要求:联系人无失信等黑名单信息)

通话类 :通话活跃天数、短信活跃天数、充值次数、通话次数、通话号码数目、通话号码归属地总数、主叫次数、被叫次数、主叫号码数、被叫号码数、短信次数、通话时长、主叫时长、被叫时长、流量套餐、流量套餐使用量、平均时长、无呼出天数、无呼出天数占比、无通话天数、无通话天数占比、最大连续开机天数、关机天数、关机天数占比、连续n天以上关机次数、单次通话最长时长、单次通话最短时长、时长在1分钟内的通话次数、时长在1分-5分内的通话次数、时长在5分-10分内的通话次数、时长在10分以上的通话次数、白天(7:00-0:00)通话次数、夜晚(0:00-7:00)通话次数、白天(7:00-0:00)通话时长、夜晚(0:00-7:00)通话时长、本机号码归属地通话次数、本机号码归属地以外通话次数、本机号码归属地通话时长、本机号码归属地以外通话时长。

黑名单( 黑名单命中数量、黑名单机构汇报数量、手机号击中黑名单、身份证号码击中黑名单、黑名单种类、直接联系人黑名单数量、身份证与其他姓名组合个数、身份证与其他手机号组合个数、灰度值、主动联系黑名单个数、被动联系黑名单个数、引起黑名单一级联系人个数、一级联系人引起黑名单百分比)

设备指纹:7天内(以及1个月、3个月)同设备关联较多注册(IP注册、手机号)。具体根据产品设定准入标准。(7天、1个月、3个月)同手机号关联较多出现(设备出现、IP出现) 。具体根据产品设定准入标准。10分钟(及1小时内、1天内、7天内)同设备操作极多、10分钟(及1小时内、1天内、7天内)同手机号操作极多、10分钟(及1小时内、1天内、7天内)同IP操作次数。具体根据产品设定准入标准。

多头借贷:查询机构数量、查询总次数、一周内查询次数、两周内查询次数、1个月内查询次数、2个月内查询次数、3个月内查询次数、4个月内查询次数、5个月内查询次数、6个月内查询次数、注册贷款机构数量、贷款申请和拒绝次数、贷款放款总次数、贷款逾期次数、贷款逾期欠款金额区间。

2、信用评分模型变量策略:

年龄、学历、性别、地域、职业收入区间、工作时间、婚姻情况、贷款用途、工作地经济水平、家庭地经济水平、工作稳定性、是否有房(房产价值)、是否有车(车辆价值)、社保金额、公积金金额

征信查询次数:近一个月、三个月、六个月。人行征信贷款类变量 信用卡变量等5000多个变量。

银联卡(390个维度):工资卡、信用卡的390个维度数据。芝麻信用分。

多头借贷:近三个月内多头查询次数、最长三笔的注册时间与申请时间差、最长三笔的申请时间与放款时间差、申请总金额与放款总金额差、放款总金额、放款笔数、驳回笔数、驳回比率、逾期笔数、逾期总金额

平均每月还款能力计算(利润-每期还款额)

资产总额减去负债总额

异地漫游指数、夜间活跃度、职业画像、手机一周浏览偏好(金融理财类APP操作指数、贷款类APP操作指数、新闻数、直播短视频类操作指数、视频网站操作指数、外卖类操作指数、地图类操作指数、微信类操作指数、淘宝天猫操作指数、其它社交类操作指数、京东操作指数、其它电商操作指数、地图类操作指数、招聘类操作指数、市内出行类操作指数、旅行类操作指数、炒股类操作指数、游戏类操作指数、教育类操作指数、育儿类操作指数)、实时多头借贷指数、特殊画像(赌和毒等)