BT

您是否属于早期采用者或者创新人士?InfoQ正在努力为您设计更多新功能。了解更多

架构师特刊:用户画像实践

| 作者 InfoQ中文站 关注 8 他的粉丝 发布于 2017年3月28日 ArchSummit社交架构图谱:Facebook、Snapchat、Tumblr等背后的核心技术

卷首语

易观CTO 郭炜

在2016年,王兴说,互联网已经进入了“下半场”,互联网人口红利的时间已经过去了,需要对用户的深耕细作获得更多的收入和利润。过去的一年里,各家将大数据从嘴上落到实际的运营体系当中, “用户画像”就是其中必不可少的一环。

无论是“增长黑客”还是“精益数据分析”,所有公司精细化运营者面对成前上万的用户,都会问那三个哲学上的终极问题:“你是谁?”(用户画像与特征),“你从哪里来?”(用户来源渠道与效果),“你到哪里去?”(用户流失与召回),其中用户画像系统会在业务和技术领域中不可或缺的组件。

由于产生用户画像会用到大量的数据挖掘算法,很多的CTO/CDO都认为将用户画像系统想当然的放置到挖掘团队来执行,而笔者认为,用户画像系统,是与大数据存储平台、大数据调度平台、元数据管理平台等平行的大数据基础业务组件,它执行力度层次应该以CTO/CDO执行领导的项目体系。一个优秀的用户画像系统存在以下几个挑战,需要CTO/CDO亲自重视。

用户画像系统的基础是用户统一ID系统:用户统一ID系统,在传统公司里叫做ECIF,它横跨了数据治理、数据整合、业务打通等几个难关;在互联网公司中叫用户跨屏唯一ID,对于跨屏ID整合算法,APP硬件设备指纹/防刷量等技术门槛有很高的要求,而做好这几点的业内公司少之又少。

用户画像标签体系是业务技术共同合作的结晶:在大数据融合的背景下,很多不同公司之间进行数据补全的工作,经常会遇到标签打通的难点。其实,一个公司好的标签体系与其业务是强绑定的,通用性较强的只有用户基本属性一层,越良好的标签体系越是和公司业务与运营密切相关,例如万达的线下品牌偏好度标签与易观线上APP TGI标签就是典型不同维度的指标体系分支。

用户画像系统与各系统打通:一个完备的用户画像系统,不仅仅为搜索推荐引擎服务,也会为数据分析BI展示、风控系统、数据挖掘引擎、数据元数据管理平台等提供有效的用户全生命周期的标签以及计算指标。技术和业务整合难度非常大,需要跨多个技术和业务部门进行协同,是一个技术“一把手”工程。

用户画像的时时并发挑战:一个优秀的画像系统经常会被各种系统时时访问,很多动态标签也需要实时更新,今日头条和一点资讯的时时推荐系统就是基于一个庞大的时时用户兴趣标签集群计算而得;而大量大数据Ad-hoc查询经常体现在这里,最常见的案例就是要求秒级的用户标签与用户行为的交叉查询(十亿级别用户 v.s. 千亿级别的用户行为),InfoQ中我和各位专家有很多类似文章,跟兴趣的同学可以去观看。

简而化之,用户画像系统的大致关系位置如下图:

综上,用户画像系统是一个涉及到各种知识体系的综合系统,本电子书中几个作者介绍一个公司如何从无到有的搭建用户画像系统,以及其中的技术难点与实际操作中的注意事项,实为用户画像的实操精华之选,推荐各位收藏阅读,也希望各位大数据从业人士在各自领域里有所斩获,算法精进,数据大成!

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT