BT
您现在处于全屏预览
关闭全屏预览

大数据复杂风控模型在PayPal Risk的应用
录制于:

| 作者 张彭善 发布于 2016年1月26日 | 道AI风控、Serverless架构、EB级存储引擎,尽在ArchSummit!
41:12

概要
随着第三方支付的迅猛发展,PayPal的风险控制也面临着日新月异的挑战。PayPal风险控制部门一直致力于利用基于大数据的机器学习的模型和灵活的规则检测欺诈交易和欺诈用户。我们利用自主研发的大数据机器学习系统,不仅能满足盗号(Account take over)、盗卡(Stolen financial)等传统欺诈用例的模型自动化构建,亦能服务于新兴的同谋(Collusion)、洗钱(Money laundry)、信用(Credit)等等用例。同时,此系统还可以提供规则的自动学习、自动化的特征类型识别、自动化的特征选择、标准化的模型输出(PMML)等等一站式功能。利用该系统大大缩短PayPal离线风控模型的开发周期,我们已经成功将以前一周的工作周期减少为一天的时间。

个人简介

张彭善, PayPal大数据研发工程师, 2008年硕士毕业于上海交通大学,从2010年起开始关注Hadoop的发展,2012年初加入PayPal Risk Data Science。刚加入PayPal主要使用Hadoop计算各种风险控制模型的变量;2013年初开始研发基于Hadoop的机器学习框架,以满足PayPal日益增长的风控大数据的需要。在这个机器学习框架中,本人主要负责如何使用Hadoop实现分布式的神经网络、逻辑回归等算法。经过不懈的努力,不仅完整实现了这个机器学习的框架,而且实现了一套基于Hadoop(包括MapReduce和YARN)的内存迭代式计算框架用以支持分布式的神经网络和逻辑回归等算法。今年四月份这两个项目分别以Shifu和Guagua命名对外开源.

QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、上海、旧金山召开。自2007年3月份首次举办以来,已经有超万名高级技术人员参加过QCon大会。QCon内容源于实践并面向社区,演讲嘉宾依据热点话题,面向5年以上的技术团队负责人、架构师、工程总监、高级开发人员分享技术创新和最佳实践。

BT