BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

功夫贷首席科学家黄利舟:90 亿放款、1000 万用户背后的Fintech 数据服务实践

| 作者 黄利舟 关注 0 他的粉丝 发布于 2018年4月23日. 估计阅读时间: 8 分钟 | Google、Facebook、Pinterest、阿里、腾讯 等顶尖技术团队的上百个可供参考的架构实例!

导语:3 月 29 日,TGO 鲲鹏会杭州分会会员、功夫贷合伙人兼首席科学家黄利舟作为 TGO 线上分享第六季的嘉宾,以直播的形式分享了 数据在 Fintech 中的应用 。本文根据当天直播内容整理。



大家好,我是功夫贷的合伙人兼首席科学家黄利舟,在 2015 年加入大树网络开始做功夫贷产品,目前主要负责后台作业、运营相关技术线。功夫贷是一款纯线上的信用贷款 App ,旨在为用户提供安全、快捷、方便的信用贷款。我们自研的风控引擎,可快速确定用户风险等级并给出相应授信结果,产品主要满足短期以及长期资金周转需求。后面我将从几个方面来给大家展现,我们是如何应用数据实现普惠金融理念的。

FinTech 的本质

先讲个故事,是我们公司一位从银行信贷部门出来的同事说过的。有对刚来杭州的夫妻租了个店面,早上卖豆腐脑、中午卖盖浇饭,家里的老母亲突然脑溢血进医院抢救,花了很多钱,碰上要交店面租金,实在没方法想借点钱度过难关,所以去银行贷款。银行有很多审核要求,那位同事只能默默送走这对夫妻。这是真事。从这里就看出了问题:那些不能被银行顾及的人,他们的资金需求怎么满足?



之前普惠金融一直被妖魔化 —— 谈到普金,就是在说高利贷。其实一家正经的贷款公司,肯本不会去做这些事情。我们理解的 FinTech ,最最基本的特质,就是商业模式上的创新:通过技术,补足授信信息不足的短板,让人更容易借到钱。

第二点是风险控制。风险是金融永远不能回避的话题。很显然,数据是支撑风险水平的关键,FinTech 中,Tech( Technology ) 的很大一部分就是加强风险控制。

第三点是场景式营销。不管做什么产品,本质上都是为了把它卖出去。线上的贷款产品离不开营销。而从场景切入是最自然的方式 —— 不局限于营销入口,而应该贯穿整个营销过程。

有哪些数据可以用



回顾我们所理解的 FinTech 本质,再看看我们可以有哪些数据可以用。很不幸,我们国内的整个征信体系还很不完善,除了人行征信,我们其实很难获得一个比较全面的征信信息。

为了解决这些问题,我们通过技术手段获取用户的金融信息、网络行为、社交行为。通过这些信息,我们逐渐构建出一个模型,再通过外部数据辅助 —— 外部数据包括黑名单、工商学历等 —— 对用户一个个进行评分,判断欺诈风险。

通过不断积累这些用户信息,随着数据集的扩大,不同特征的用户表现会逐渐收敛,通过这些用户表现,我们会不断调整我们的风控模型,让我们能够获得更好的逾期表现和利润表现。

技术上我们怎么使用数据



为了建立用户画像,我们需要存储很多的数据,从技术角度来说,就是建立一个数据仓库。

在这方面我们主要是用了一些开源框架去做整个数据仓库的搭建。原始数据是存在各个数据库里,通过 kafka + connect 套件,来完成数据的抽取和入库,这些原始数据通过 spark 来进行数据清洗,然后提供给更上层的 Hbbase 或者 Hive 来应用。同时,大家可以在图中看到 phoenix ,我们使用 phoenix 的原因也是因为它对数据分析师比较友好。最后也顺便提一下 Hive 。其实我们使用 Hive 的场景不太多,主要用在风险分析,做一些离线查询任务。



除了数据仓库,我们还需要创建用户的关系网络。大家可以看到上图中的 neo4j ,我们使用它主要是为了创建用户关系网络。一方面,通过用户关系网络,我们会发现一些团伙欺诈;另一方面,用户关系网络所带来的社交属性,也可以提供给营销等业务使用。



我们的第二个业务目标 —— 通过用户的历史表现去体现它的风险特征和渠道特征。所以我们在特征分析方面做了一些技术上的尝试,建设了一个自研的特征分析平台 —— 火眼,寓意火眼金睛。

通过 sqoop 从我们的原始数据里把数据拉出来,然后通过 spark进行数据处理并最终交给 hive使用。我们将影响用户风险评分的特征进行挖掘和分析,不断调整我们的风控模型。这些技术手段帮助风控分析人员快速的找到影响模型的一些显著特征。图中最下角的截图就是我们线上在使用的火眼系统。



  1. 加强 IT 的安全建设,保证用户信息安全;
  2. 逐渐用征信机构数据代替用户授权获取数据;
  3. 合规相关业务改造。

我们始终相信整个网贷行业有序和合规是必须的准入准则。像去年那样野蛮生长,一个可能连风控都没有的公司都可以做贷款产品的时代已经过去了。接下来拼的更多的将会是内在,是技术本身和数据。

新技术实践



最后讲讲我们正在做的一些事,AI 场景落地是我们目前在考虑和投入的事,通过 AI 的场景落地,实现对风控决策,反欺诈,渠道投放等等方面的优化。未来,通过我们积累的几百万用户数据,可以做更多场景的数据应用,同时也可以考虑做数据变现的尝试。

Q & A

Q:可以具体讲一下场景营销吗?

A:场景营销是这样的过程:用户从注册到提供数据会通过很多环节,但在每一个环节上都会流失。在用户流失之前,我们可以去做一些动作挽回他们。另外,这些用户可能是导入过电商交易信息,通过这些信息,我们可以发现用户行为。比如用户可能买汽车用品比较多,那我们就会分析这类用户的分布,然后对投放渠道做调整。

Q:催收方面有何措施?

A:我们的 CRM 平台就可以做催收。因为现在的用户行为是被我们清洗出来的,在用户还款或是快要到还款日的时候,我们就可以提醒他们。另外,我们也有自己的风控引擎,会通过一些风险特征做特定的挽回。针对这些挽回,我们会加强推送频率。

Q:功夫贷的用户增长的手段是什么?

A:因为我们是一个在线贷款平台,所以大部分情况会对接很多流量渠道。包括广点通、今日头条或其他很多这样的公司。接 CPC 的渠道,或者接 CPS 渠道是目前我们实现用户增长主要的方式。

Q:es怎么把数据推给 CRM ?

A:其实对 CRM这是一个拉的过程,并不是被动的过程。因为数据存到 es 里,后面剩下的还是通过定时任务从 ES 里去取,或者因为看到这种方式实时获得用户的行为。我们有很多埋点,通过这些用户行为主动做一些触发,从 ES 里取到数据后做主动的推送。

Q:可以分享一些安全方面的经验 / 措施吗?

A:安全方面一方面我们对用户的数据做全程加密,尽量不留存用户敏感信息,如果必须留存的也会做强加密避免数据被盗用。另外,我们整个服务全部都部署在金融云上,所以它的安全级别也会比正常要高。技术上,我们后台所有的服务,都会去做 token校验及加密工作,接口全是走 HTTPS 协议的。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT