BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

38:53
他的粉丝

Hadoop at 10: the History and Evolution of the Apache Hadoop Ecosystem

作者 Todd Lipcon  发布于  2016年8月22日 作者 Todd Lipcon 关注 0 他的粉丝  发布于  2016年8月22日

在这次演讲中,Todd将讨论硬件技术和特定案例的变化如何驱动过去十年Hadoop生态的路线图,并介绍商业厂商如Coudlera在生态中的角色,以及他们如何将传统商业模式和来自开源软件发展的快速创新结合起来。

45:53
他的粉丝

InfoQ在线课堂:《如何使用Amazon EMR和Redshift构建大数据解决方案》

作者 费良宏  发布于  2016年7月11日 作者 费良宏 关注 4 他的粉丝  发布于  2016年7月11日

本期InfoQ在线课堂将主要分享到如何使用Amazon EMR和Redshift构建大数据解决方案,并通过NTT DOCOMO、Nasdaq、SmartNews等知名企业的实际应用案例,了解到更为具体的最佳实践。

36:06
他的粉丝

SQL-on-Hadoop方案在FreeWheel的实践

作者 林明  发布于  2016年1月28日 作者 林明 关注 0 他的粉丝  发布于  2016年1月28日

FreeWheel是一家主要服务于北美和欧洲客户的视频广告技术公司,为大型电视媒体和优质内容供应商提供企业级的视频广告解决方案,每天完成近10亿次视频广告投放,积累了大量的视频观看和广告投放数据。

37:32
他的粉丝

Hadoop安全体系介绍以及实践分享

作者 杨威  发布于  2015年11月10日 作者 杨威 关注 0 他的粉丝  发布于  2015年11月10日

本次分享会剖析Hadoop集群的常见安全隐患和不规范的使用v方法,以及建议的解决办法和操作规范。其内容覆盖了安全的网络结构设计、系统安全和平台安全等方面。

51:19
他的粉丝

以Hadoop为核心的大数据开放平台建设

作者 孙利兵  发布于  2015年7月8日 作者 孙利兵 关注 0 他的粉丝  发布于  2015年7月8日

本次演讲将主要介绍如何建设以Hadoop为核心,以Avro为关键技术,融合Flume、Oozie、Hadoop、Spark、Storm、Solr等技术的大数据开放平台,并分享在分布式日志收集、基于大数据的统计分析方面的心得与经验,深入解读Doug Cutting的EcoSystem思想,剖析Avro技术的独到之处,探讨该怎样融合技术提供优秀的开发平台。

32:54
他的粉丝

Guagua:PayPal的Hadoop迭代式计算框架

作者 张彭善  发布于  2015年1月7日 作者 张彭善 关注 1 他的粉丝  发布于  2015年1月7日

在本次演讲中您不仅可以了解到Guagua如何通过改进Hadoop MapReduce用以支持大数据的数学模型的训练,您还可以了解到Guagua的整体设计架构(包括对Hadoop YARN的支持);在可扩展性方面,Guagua同时支持Hadoop MapReduce和Hadoop YARN,很容易扩展到其它计算平台。本次演讲中您还会了解到Guagua不同于Spark的一些高级的特性。

35:25
他的粉丝

Hadoop在营销数据挖掘的实践

作者 卢亿雷  发布于  2015年1月1日 作者 卢亿雷 关注 0 他的粉丝  发布于  2015年1月1日

介绍由于广告数据的多样化,包括有曝光、点击等被动获取的请求;微博、新闻、博客、论坛、行业网站等主动抓取的请求;问卷调查数据的补充;第三方数据的输入。

43:28
他的粉丝

Apache Tez: 下一代Hadoop上的执行引擎

作者 章剑锋  发布于  2014年12月24日 作者 章剑锋 关注 0 他的粉丝  发布于  2014年12月24日

Tez作为下一代hadoop的执行引擎与传统的MapReduce相比做了很大的改进和优化,将计算模型直接建立在DAG上面,比传统的MapReduce更加直接,灵活,在性能上有很大的提升。同时由于Tez从项目开始就集成了Yarn,从而对于整个计算资源的Context了解的更加清楚,这也有助于性能的优化。本次演讲将主要对Tez做一个Overview的介绍。

37:22
他的粉丝

Spark应用案例分析

作者 田毅  发布于  2014年12月17日 1 作者 田毅 关注 0 他的粉丝  发布于  2014年12月17日 1

在部署Spark集群、设计Spark应用时有哪些方面的问题需要考量?目前Spark适合应用在哪些场景? 哪些场景不适合Spark使用? 本演讲试图通过亚信科技在Spark平台上的应用案例与经验教训为上述问题提供参考。

43:18
他的粉丝

基于Hadoop生态技术构建阿里搜索离线系统

作者 任春德  发布于  2014年12月5日 作者 任春德 关注 0 他的粉丝  发布于  2014年12月5日

一、计算平台架构 二、支撑的搜索业务 三、YARN计算平台 四、未来发展

28:11
他的粉丝

HDInsight——云上的Hadoop之旅

作者 林默  发布于  2014年11月10日 4 作者 林默 关注 0 他的粉丝  发布于  2014年11月10日 4

本次演讲将介绍了微软公有云上的Hadoop平台HDInsight Service,包括Hive的性能提升,HBase、mahout和Storm等的功能点。

30:52
他的粉丝

Hadoop2.0应用 - 基于Yarn的淘宝海量数据服务平台

作者 曹龙  发布于  2014年2月15日 1 作者 曹龙 关注 0 他的粉丝  发布于  2014年2月15日 1

本议题介绍YARN及阿里巴巴云梯集群在YARN方面的尝试及目前的状态。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT