BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

您现在处于全屏预览
关闭全屏预览

Fregata: 基于Spark的无参数快速大规模机器学习算法库
录制于:

| 作者 张夏天 关注 0 他的粉丝 发布于 2017年1月22日 | Google、Facebook、Pinterest、阿里、腾讯 等顶尖技术团队的上百个可供参考的架构实例!
40:14

概要
大规模机器学习一直是目前机器学习研究和应用的前沿领域, TalkingData的业务也需要大规模机器学习能力的支撑。大规模机器学习主要的两个挑战是训练速度和调参。为了解决这个问题,我们在算法的优化上做了一些工作,找到了无参数的机器学习优化方法,并且对于大多数问题,基本可以做到过一遍数据收敛。基于这两个特点我们在Spark上实现了并行Logistic Regression和Softmax算法,与Spark MLLib对应算法相比,精度和训练速度都取得较大的提升。

个人简介

张夏天,TalkingData首席数据科学家,TalkingData首席数据科学家,12年大规模机器学习和数据挖掘经验,对推荐系统、计算广告、大规模机器学习算法并行化、流式机器学习算法有很深的造诣;在国际顶级会议和期刊上发表论文12篇,申请专利9项;前IBM CRL、腾讯、华为诺亚方舟实验室数据科学家; KDD2015、DSS2016国际会议主题演讲;机器学习开源项目Dice创始人。

全球架构师峰会(International Architect Summit,下简称ArchSummit)是由InfoQ中文站主办的一次全球性架构师峰会。ArchSummit专门针对架构师人群,讲述与架构和架构师相关的各方面趋势、技术和案例。这也是继QCon之后,InfoQ中文站主办的又一次高端技术盛会。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT