BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

40:14
他的粉丝

Fregata: 基于Spark的无参数快速大规模机器学习算法库

作者 张夏天  发布于  2017年1月22日 作者 张夏天 关注 0 他的粉丝  发布于  2017年1月22日

大规模机器学习一直是目前机器学习研究和应用的前沿领域, TalkingData的业务也需要大规模机器学习能力的支撑。大规模机器学习主要的两个挑战是训练速度和调参。为了解决这个问题,我们在算法的优化上做了一些工作,找到了无参数的机器学习优化方法,并且对于大多数问题,基本可以做到过一遍数据收敛。

46:35
他的粉丝

Spark 在 360 的实践及经验分享

作者 李远策  发布于  2016年9月21日 作者 李远策 关注 1 他的粉丝  发布于  2016年9月21日

Spark 平台作为新一代分布式计算平台在过去的两年中得到了飞速的发展,各大公司也逐渐将其引入到实际业务中来。奇虎 360 自 2015 年以来正式上线 Spark 平台,并在公司的搜索、安全、数据分析等业务线得到广泛的应用。

35:28
他的粉丝

最优化 Spark 应用的性能——使用低成本的层次化方案加速大数据处理

作者 俞育才  发布于  2016年8月30日 作者 俞育才 关注 0 他的粉丝  发布于  2016年8月30日

本演讲讲解了 Intel 技术团队如何通过收集 Linux 内核数据,展现 Spark 应用程序在不同阶段对磁盘操作的特征,定位性能瓶颈,进而优化 Spark Core 代码,设计出简单易用、高性价比的层次化设备存储方案。

54:57
他的粉丝

Spark展望 & Spark 应用开发

作者 费良宏  发布于  2016年8月5日 作者 费良宏 关注 4 他的粉丝  发布于  2016年8月5日

Spark 这个诞生了7年的开源框架已经成为了今天大数据市场上最炙手可热的词汇。而即将到来的Spark 2.0 将会成为这个项目的一个重大的里程碑。也许你会感兴趣新的版本中那些激动人心的特性:DataFrame、SparkR、StreamingML 以及Dataset API,那么我将在这个议题里面与你一同展望。

01:25:02
他的粉丝

IBM数据科学家集成开发工作台 预测模型与数据科学

作者 吴仲毓  发布于  2016年7月28日 作者 吴仲毓 关注 0 他的粉丝  发布于  2016年7月28日

究竟什么是大数据分析和数据科学?是不是人人都能成为“数据科学家”呢?有最好最便捷的学习路径和开源工具吗?来听这场满是干货、价值连城的讲座,不仅有大数据分析的案例分析和演示,更要教你如何快速提升大数据分析及数据科学的实战技能。

33:46
他的粉丝

采用Spark技术的SPSS机器学习算法的实现与应用

作者 范雷  发布于  2016年7月27日 作者 范雷 关注 0 他的粉丝 , 安欢 关注 0 他的粉丝  发布于  2016年7月27日

该主题立足于IBM SPSS数据分析团队的在企业级数据分析领域的产品和实践经验, 介绍了基于时间的事件序列数据分析方法的背景,挑战和解决方案,并通过实例演示了其在具体商业领域中的应用。

33:22
他的粉丝

Spark概要

作者 宋慧驹  发布于  2016年7月26日 作者 宋慧驹 关注 0 他的粉丝  发布于  2016年7月26日

此次视频主要分享Spark概要。

32:44
他的粉丝

Spark in GrowingIO

作者 付旗  发布于  2016年7月25日 作者 付旗 关注 1 他的粉丝  发布于  2016年7月25日

Spark In GrowingIO.主要内容就是首先介绍GrowingIO这家公司,然后说基于我们公司的业务模型讲我们遇到的一些问题。第二部分会根据这些问题讲一下GrowingIO是如何思考和选择组建、从而搭建自己的大数据平台。最后一部分,当平台搭建完之后,团队会遇到一些问题,团队会想办法怎么去优化,解决使用过程中的这些问题。

25:28
他的粉丝

在spark上构建硬件加速的、分布式神经网络框架

作者 王奕恒  发布于  2016年3月30日 作者 王奕恒 关注 0 他的粉丝  发布于  2016年3月30日

最近几年,神经网络算法得到业界越来越多的关注。基于神经网络的深度学习在计算机视觉、语音识别和自然语言处理等方面都取得了良好的效果。已有的神经网络框架(如Caffee,Torch等)往往是单节点的方案并使用昂贵的GPU卡进行加速。我们基于Spark构建了一个分布式的神经网络算法框架,使用户能够方便的在通用计算平台上,利用神经网络算法进行大数据的机器学习。

44:42
他的粉丝

Spark on Mesos详解

作者 Timothy Chen  发布于  2016年3月10日 1 作者 Timothy Chen 关注 0 他的粉丝  发布于  2016年3月10日 1

本次演讲会详细描述如何集成Spark和Mesos,以支持Spark作业的集群化,我们将介绍在典型的Spark作业生命周期间出现的事件序列。我们还将探讨一些优化性能和资源利用的建议,以及如何避免已知的一些问题。

44:42
他的粉丝

Spark on Mesos详解

作者 Timothy Chen  发布于  2016年1月23日 作者 Timothy Chen 关注 0 他的粉丝  发布于  2016年1月23日

在本次演讲中,我将分享Mesos和Docker集成的动机与架构,如何伸缩Docker容器,以及如何接入Apache Mesos和相关框架带来的丰富特性。

44:09
他的粉丝

Spark应用的GC调优

作者 王道远  发布于  2015年12月7日 1 作者 王道远 关注 1 他的粉丝  发布于  2015年12月7日 1

本次演讲主要讲述如何针对Spark应用程序配置JVM的垃圾回收器,并从实际案例出发,剖析如何进行GC调优,进一步提升Spark应用的性能。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT