BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

他的粉丝

专访Saumitra Buragohain : Hortonworks数据平台3.0

作者 Rags Srinivas 关注 11 他的粉丝 ,译者 姚佳灵 关注 0 他的粉丝   发布于  2018年7月24日

InfoQ就Hadoop的总体情况,特别是HDP 3.0采访了Hortonworks的产品管理高级总监Saumitra Buragohain。

他的粉丝

国内首家!主导Apache Hadoop新版本发布的,是腾讯云这位小哥哥

作者 腾讯云 关注 0 他的粉丝 发布于  2018年6月13日

近日,腾讯主导的Apache Hadoop2.8.4最新版本发布,为国内科技公司在国际开源领域的探索迈出重要一步。

他的粉丝

Dataiku在最新版本的Data Science Studio中把深度学习集成进计算机视觉

作者 Alexis Perrier 关注 1 他的粉丝 ,译者 谢丽 关注 12 他的粉丝   发布于  2018年4月18日

Dataiku在其协作式数据科学平台Data Science Studio的最新版本中包含了预训练深度学习模型用于图像处理。这个DSS平台实现了数据科学项目从数据获取和可视化到生产环境部署的所有步骤。其机器学习模型支持标准库,并集成了Hadoop和多种Spark引擎。

他的粉丝

ZeroStack发布了DevOps Workbench

作者 Helen Beal 关注 4 他的粉丝 ,译者 姚佳灵 关注 0 他的粉丝   发布于  2018年1月17日

私有云供应商ZeroStack发布了一项自助服务功能,开发人员可以从中创建自己的Workbench。DevOps Workbench的用户现在可以通过ZeroStack的智能云平台使用来自开源和商用供应商的40个开发工具。

他的粉丝

大数据和Hadoop时代的维度建模和Kimball数据集市

作者 Uli Bethke 关注 1 他的粉丝 ,译者 杨雷 关注 4 他的粉丝   发布于  2017年10月24日 1

Uli Bethke发表的这篇文章,介绍了数据建模到维度建模,以及数据仓库和反规范化一系列知识。比较了MPP和Hadoop的不同,并对如何在大数据和Hadoop平台上进行维度建模,给出了很好的建议和方案。

他的粉丝

数据科学团队管理实战

作者 SeattleDataGuy 关注 0 他的粉丝 ,译者 谢丽 关注 12 他的粉丝   发布于  2017年8月22日

了解算法,知道如何使用Hadoop,并不足以让我们拥有一个高效的数据团队。数据科学团队建设也是一个重点。

他的粉丝

HBase 1.3 发布,性能大幅提升

作者 Alexandre Rodrigues 关注 1 他的粉丝 ,译者 魏星 关注 0 他的粉丝   发布于  2017年2月10日 1

性能测试报告显示,Apache HBase 1.3.0中预写日志(WAL)特性在纯SATA磁盘里运行的平均延时减少了20%;在SATA-SSD磁盘里运行的延时减少了40%。这些改进有助于提高Apache Phoenix、OpenTSDB以及其他依赖HBase引擎做数据持久化和快速查询功能的软件项目的性能。

他的粉丝

Hadoop创始人Doug Cutting寄语2017:五种让开源项目成功的方法

作者 Doug Cutting 关注 0 他的粉丝 ,译者 杨雷 关注 4 他的粉丝   发布于  2017年1月12日

开源技术日新月异,作为一个刚接触开源的新人,该如何着手工作并获得成功?Doug Cutting在2017年初,为有兴趣参与进来的每个人准备了5条建议,鼓励大家在新的一年投身开源、拥抱开源。

他的粉丝

Julien Le Dem对使用Apache Arrow进行面向列的数据处理的未来的看法

作者 Alexandre Rodrigues 关注 1 他的粉丝 ,译者 王纯超 关注 0 他的粉丝   发布于  2016年12月23日

Apache Arrow项目的项目管理委员会(PMC)主席Julien Le Dem在Data Eng Conf NY上对面向列的数据处理的未来作了介绍。Apache Arrow是在内存中执行列式计算的开源标准。InfoQ采访了Le Dem,以了解Arrow和Parquet的区别。

他的粉丝

使用PolyBase将SQL Server与Hadoop相结合

作者 Jonathan Allen 关注 611 他的粉丝 ,译者 谢丽 关注 12 他的粉丝   发布于  2016年6月8日

最近发布的SQL Server 2016让开发人员可以使用SQL查询Hadoop和Azure blob存储,不仅不再需要编写map/reduce操作,而且还可以在一个查询中连接关系型和非关系型数据。

他的粉丝

云中巨象——作为一种服务的Hadoop

作者 Srini Penchikala 关注 37 他的粉丝 ,译者 侠天 关注 5 他的粉丝   发布于  2016年5月16日

Hadoop和其他大数据技术已经彻底改变了机构处理和运行分析数据的方式。但是机构仍然面临运行上和使用这些为了对数据进行处理的技术而产生的扩张成本,所带来的挑战。Ashish Thusoo 最近在Enterprise Data World Conference上谈到Hadoop作为一种服务方式,用这些能力帮助企业缩小差距。

他的粉丝

Google云端机器学习和Tensor Flow的Alpha测试版本发布

作者 Dylan Raithel 关注 8 他的粉丝 ,译者 薛梦迪 关注 0 他的粉丝   发布于  2016年5月7日

上个月末,为回应不断增长的大规模在Google云端平台(GCP)运行Tensor Flow库的需要,Google发布了alpha版本的TensorFlow(TF)集成云端机器学习服务。Google描述了一些有关建立TF规模化使用的新功能,其中集成了一些GCP的模块,例如Dataproc,是一个托管的Hadoop和Spark服务。

他的粉丝

Hadoop Summit 2016会场回顾(最终篇)

作者 李扬 关注 0 他的粉丝 发布于  2016年4月27日

2016年4月13日,都柏林的Liffey河畔,Hadoop Summit 2016在Convention会展中心盛大开幕。大会主要议程历时2天,有100多场演讲,与会者超过1400人。本文就Apache Kylin在大会上的内容做一个简单回顾。

他的粉丝

Hadoop Summit 2016会场回顾(三)

作者 李扬 关注 0 他的粉丝 发布于  2016年4月23日

2016年4月13日,都柏林的Liffey河畔,Hadoop Summit 2016在Convention会展中心盛大开幕。大会主要议程历时2天,有100多场演讲,与会者超过1400人。主要内容包括Apache Committer洞察、数据科学、运营管理、开发技术、数据商务、物联网、Hadoop未来几大系列。本文就Apache Committer洞察、开发技术、Hadoop未来这三方面的一些内容做一个简单回顾。

他的粉丝

Hadoop Summit 2016会场回顾(二)

作者 李扬 关注 0 他的粉丝 发布于  2016年4月21日

2016年4月13日,都柏林的Liffey河畔,Hadoop Summit 2016在Convention会展中心盛大开幕。本文是Kyligence CTO李扬在现场为我们带来的Keynote回顾第二篇。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT