信贷业务是商业银行的主要利润来源,对整个银行的经营举足轻重。信贷业务下沉的同时,其风险也在不断扩张,基于新技术和新场景的欺诈形式和手段不断衍生,欺诈方式更具场景化、专业化、智能化。
为了早一步拦截不法分子,商业银行往往也很重视反欺诈工作,那么反欺诈的方法有哪些呢?
一、申请人真实性验证
常用的特征模块有面部识别、身份证二要素、银行卡三要素等。这一步基本上是一切互联网信贷行为的基础,只有确认了“你”是“你”,才会开展后续的业务。
二、黑白名单
黑白名单是最原始的反欺诈手段,顾名思义,黑名单就是坏客户,白名单则指好客户。
举例:人行征信记录着每个信用卡持卡人的还款记录,如果你有信用卡逾期且拒绝还款,甚至直接从人间蒸发,你可能就上了人行的黑名单。一段时间后,你重新在江湖上复出,想着:申请新信用卡吧!银行在接到你的申请表后,在黑名单上一查,发现了你,于是乎,驳回!这就是黑名单的使用方式。
三、规则引擎
连续退货5次的用户,拒绝其购买退货险;
退货比例超过80%,拒绝其再次购买退货险;
四、有监督学习
有监督学习需要大量的有标签数据来训练模型,以此来预测还未被标注的数据。拿垃圾邮件举例,假设你把5000封已经由人工确认过的垃圾邮件输入到了模型,模型通过对标题的识别,对邮件内容句子的分割,关键词的识别等各种分析方法,找到了其中的内在关系,但却难以说明。
举例:
标题里有“福利”二字的,有90%的可能性是垃圾邮件;
内容里有“汇款账号:xxxxxx”的,有10%的可能性是垃圾邮件;
一次性发送超过200封的,有60%的可能性是垃圾邮件;
回复率低于10%的账户,有70%的可能性是垃圾邮件;
这里,百分比被称为权重。
当模型处理一封新的邮件,模型通过检测以上各个子项,并对每一个子项乘以权重后相加,就得出一个分数,得出:这封有80%的可能性是垃圾邮件。以上就是一个有监督学习抽象理解的过程,其中一个重要的步骤就是通过不断的迭代计算每一个子项应该被赋予的权重值。当权重值计算好后,就可以说这个模型训练好了。
有监督学习的好处也十分明显,它可以帮我们分析隐层关系。无需知道有监督学习的隐藏关系,每一个子项被赋予了多少权重,直接就知道符合某个规则的是坏客户。此外,有监督还有助于处理多维数据。由于规则是人凭经验产生了,当面对巨量的数据字段时,人显然是无法通过经验来直接操作的。此时,有监督就可以解决问题了。
但有监督也有一个明显的弊端,每一个模型都需要大量的训练数据,训练一个模型也需要较长的时间。常常出现你的模型还没有训练好,欺诈分子们就可能已经完成欺诈活动寻找下一个目标了。如此,有监督便无法应对复杂多变,诡计多端的欺诈者了。
五、无监督学习
无监督学习反欺诈的主要方式有聚类和图形分析。无监督无需任何训练数据和标签,通过发现用户的共性行为,以及用户和用户的关系来检测欺诈。
有这样一群用户注册事件,通过聚类发现其几个小群符合某些共性:例如:注册时间集中,都使用了某操作系统,某一个浏览器版本等。这个用户任何一个单独拿出来分析,看上去都是极其正常的用户,而如果其符合某种超乎寻常的一致性就十分可疑了。例如,一群人在凌晨2点-3点,采用chrome浏览器注册了某产品,其ip的前20位相同,GPS定位小于1公里,且注册后都去修改了昵称和性别。如果一个人这么做,问题不大。而如果一群人这么做显然就是不正常的。
无监督算法应用于反欺诈检测,通常还有一个优势,那就是提前预警。现在的欺诈分子都有潜伏期,以免太容易被发现。而由于其在潜伏期的行为依然符合某种规律,具有某些一致性,所以还是会被无监督算法捕捉到。
六、网络图谱
一种思路是通过识别紧密关联的社群结构找出潜在的欺诈客群,常用的社会感知分析方法有Walktrap算法、InfoMap算法、FastGreedy算法等。
一般来说,识别欺诈团伙需要用到设备指纹,比如:设备关联多少个手机号,设备关联多少个身份证,手机关联多少个设备,IP是否是异常IP,登陆IP数等;
另一种思路是通过好坏用户的网络关系进行传播,可以使用标签传播算法(Label Propagation),传染病学模型(SIR Model), 以及概率图模型(MRF, CRF等)。比如团伙中有多少个逾期,一度联系人里面有多少个预期,二度联系人有多少预期,一度联系人里面黑名单数量,二度联系人黑名单数,团伙中是否命中黑中介。
END
联系客服