BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

您现在处于全屏预览
关闭全屏预览

百度MPP数据仓库Palo开源架构解读与应用
录制于:

| 作者 牟宇航 关注 0 他的粉丝 发布于 2018年3月5日 | 如何结合区块链技术,帮助企业降本增效?让我们深度了解几个成功的案例。
47:55

概要
业务量增加,数据量翻番,需要面对百TB ~ PB级别的数据量,且是结构化数据,同时需要达到毫秒/秒级分析。在这种情况下寻求新的解决方案选型:mpp(Impala)+ mesa的工程实现。这种选型在技术特性上可以支持MySQL、高并发小查询、大查询高吞吐、高容错、列式存储、物化视图、在线表结构修改等特征需求。实施后效果很明显,在演讲中会介绍百度内部使用情况,目前开源的使用情况,并会和GP、Impala+kudu的性能做些对比。

个人简介

牟宇航,百度大数据部工程架构团队经理,先后领导过数据平台团队,OLAP 团队、在线数据团队。目前负责大数据基础工程技术和产品的研发,涉及数据传输、批量和流失数据处理、在线数据服务、数据挖掘等技术领域。所负责的产品中,百度MPP数据仓库 Palo,百度版Elasticsearch 均已对业界开源。

全球架构师峰会(International-Architect--Summit,下简称ArchSummit)是由InfoQ中文站主办的一次全球性架构师峰会。ArchSummit专门针对架构师人群,讲述与架构和架构师相关的各方面趋势、技术和案例。这也是继QCon之后,InfoQ中文站主办的又一次高端技术盛会。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT