BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

您现在处于全屏预览
关闭全屏预览

京东大数据R语言应用
录制于:

| 作者 刘思喆 关注 0 他的粉丝 发布于 2014年2月22日 | Google、Facebook、Pinterest、阿里、腾讯 等顶尖技术团队的上百个可供参考的架构实例!
51:19

概要
京东商城目前拥有遍及全国超过6000万注册用户,近万家供应商,在线销售家电、数码通讯、电脑、家居百货、服装服饰、母婴、图书、食品等12大类数万个品牌百万种优质商品,日订单处理量超过50万单,网站日均PV超过1亿。在如此庞大、复杂的业务逻辑下,京东商城生产了海量的结构化和非结构化数据,例如用户级别的购买、浏览、搜索、评论数据,以及商品、商户、供应链等数据信息。京东商城网站智能和商业化团队通过对自身业务、数据的理解和摸索,逐步形成、搭建了一整套基于开源R语言的数据挖掘框架,在此框架下支撑业务部门及产品部门的数据需求,试图精准化匹配京东商城用户和商品,优化供应链流程、提高用户满意度和忠诚度。本文将从京东商城的复杂的数据环境讲起,介绍在以R语言和Hadoop为核心的数据挖掘的技术框架,并简要分享一些使用R语言线上应用的案例。

个人简介

刘思喆,京东商城个性化推荐组负责人,微博: @刘思喆,个人主页:http://bjt.name。现就职于京东商城网站智能和商业化部推荐团队,主要负责用户行为,商品特征建模等内容。8年来,一直追求为服务企业提供高效、完备的数据解决方案,尤其在统计分析、预测分析、数据可视化、机器学习、文本挖掘、社交网络等领域。 在加入京东商城前,供职于亚信联创BOC、神州数码思特奇DSS,主要为电信运营商提供数据挖掘及业务咨询等顾问服务。 10年R语言使用经验,R语言企业级应用的践行者,中国R语言会议、数据科学沙龙联合发起人,中国最大的统计社区-统计之都常务理事,06年至今一直担任R语言版版主。 2005年毕业于中国人民大学统计学院,《153分钟学会R》的作者,《R in a nutshell》译者。

QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、杭州、旧金山召开。自2007年3月份首次举办以来,已经有包括传统制造、金融、电信、互联网、航空航天等领域的近万名架构师、项目经理、团队领导者和高级开发人员参加过QCon大会。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT