BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

rss
他的粉丝

Airbnb架构要点分享

作者 谢丽 关注 11 他的粉丝 发布于  2015年9月22日 1

近日,The Platform编辑Timothy Prickett Morgan就Airbnb的架构要点对Airbnb工程部门的副总裁Mike Curtis进行了采访报道。驱动Airbnb站点和分析的核心数据平台是Hadoop,所有东西都存储在Hadoop分布式文件系统中。去年,他们已经迁移到Cloudera的企业级Hadoop上。

他的粉丝

腾讯大数据之TDW计算引擎解析——Shuffle

作者 腾讯 关注 0 他的粉丝 发布于  2014年9月19日

腾讯分布式数据仓库(Tencent distributed Data Warehouse, 简称TDW)基于开源软件Hadoop和Hive进行构建,并且根据公司数据量大、计算复杂等特定情况进行了大量优化和改造,目前单集群最大规模达到5600台,每日作业数达到100多万,已经成为公司最大的离线数据处理平台。为了满足用户更加多样的计算需求,TDW也在向实时化方向发展,为用户提供更加高效、稳定、丰富的服务。

他的粉丝

Hive未来两年的路线图

作者 马德奎 关注 0 他的粉丝 发布于  2014年9月15日

Hive是一个基于Hadoop的数据仓库平台,它是SQL-on-Hadoop框架的代表项目。但传统观点认为,它处理交互式查询的速度不够快。不过,今年4月,Hortonworks完成了Stinger项目的目标,不仅改进了Hive的功能,还将其性能提升了100倍。9月3日,Hortonworks宣布开始下一阶段的工作,即Stinger.next。

他的粉丝

网易的Spark技术实践

作者 王健宗 关注 0 他的粉丝 发布于  2014年4月12日

对于大多数的大数据而言,实时性是其所应具备的重要属性,信息的到达和获取应满足实时性的要求,而信息的价值需在其到达那刻展现才能利益最大化,例如电商网站,网站推荐系统期望能实时根据顾客的点击行为分析其购买意愿,做到精准营销。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT