BT

你的观点很重要! 快来参与InfoQ调研吧!

SAP的云端战略与常驻内存运算装置共同发展

| 作者 Jeevak Kasarkod 关注 2 他的粉丝 ,译者 王恒涛 关注 0 他的粉丝 发布于 2011年6月8日. 估计阅读时间: 6 分钟 | ArchSummit社交架构图谱:Facebook、Snapchat、Tumblr等背后的核心技术

A note to our readers: As per your request we have developed a set of features that allow you to reduce the noise, while not losing sight of anything that is important. Get email and web notifications by choosing the topics you are interested in.

在最近举行的SAP SAPPHIRE 2011大会上,SAP发布了高性能分析装置(HANA)软件,将运行在与Dell和Intel合作的云平台上。这种伙伴关系可以让SAP的用户把他们的SAP应用部署到Dell的虚拟集成系统(VIS)数据中心平台。 SAP的CTO和执行理事会成员Vishal Sakka也描绘了未来的HANA应用云的预想: 将让用户能够访问SAP的Business Intelligence OnDemand,Carbon Impact和Sales & Operations Planning以及其他的应用。除了迁移他们自己的应用, SAP还会在HANA上认证第三方的应用。

去年一年中,自从HANA在SAP Sappire 2010首次发布后,它就占据了SAP的战略路线图的首要位置。 据猜测SAP的在内存常驻运算方面的作为是对Oracle的Exadata产品的响应,因为多数的SAP的用户使用的是Oracle数据库,并且会把Oracle的Exadata视为一个走向下一代数据处理平台的步骤。和只能运行在Oracle产品线上的Exadata不同,HANA装置获得了厂商的广泛支持,包括IBM、富士通、Dell、思科以及惠普都会销售这款产品。

根据ZDNet的Dennis Howlett的说法, SAP投资把HANA结合到云端是出于更加充分的理由:

这不是简单的收入问题,SAP已经做出过统计,显示存储是运行他们的系统最大的成本,远远超出了运行SAP应用服务器的成本。 运行测试系统比实际系统更加昂贵, 而运行在云端则可以大大消减总拥有成本。

从技术角度来说,IBM的SAP顾问和优秀的SAP博客作者Vijay VijayaShankar提出几点疑问:

HANA云端版的大问题是“你要怎么执行ETL, 它会是实时的吗?”。细节还有待披露——但我特别担心的一个用例是云端的Sales and Operations Palnning模块,一般来说这是个ETL集中的活动,就算是对常驻内存的解决方案来说速度也是一个可预见的问题。再加上访问云端的带宽问题和安全性与基础数据私密性的担心,我总体觉得S&OP对多数用户来说更适合自主维护而不是按需使用。也许有那么几家不需要那么大的数据量等等的可以这样用——但还是难以想象这个会在SAP的大商店里受到欢迎。对于在近期内把HANA放到云端我还有一个关心的问题就是SAP对应基础设施规模的能力。HANA还没有实际应用足够长的时间来获取关于规模的有效信息,SAP很有可能会低估或高估提供HANA服务所需的规模。 显然哪种情况的结果都很糟糕。

HANA应用了常驻内存、数据源无关的计算引擎, 要处理的数据存放在RAM中,而不是从二级存储设备中获取,这样提供了性能的提升。这个平台还提供了建模工作环境, 简单到业务用户也可以使用。根据与IBM合作,由WinterCorp审计的第一个官方的比较测试,HANA可以轻松地处理对1.3TB数据每小时10,000次查询,并在数秒内得到结果。这个测试在IBM x3850 X5服务器上实施,其装载了32核、0.5TB内存,以及一个RAID 5的磁盘系统,该磁盘系统结合SAP HANA软件可以处理最大1.3TB的数据,因为SAP HANA压缩数据并按列存储。HANA以线性方式升级,也就是说如果你需要更多的内核或内存,按SAP说法你只需要增加更多的节点。
Vijay VijayaShankar分享了关于HANA受到好评的实时性能的一些评论。

我认为说HANA存在严重的问题 ,更适当的词应该是“ 正确时机”(Right Time),就像Ray Wang在twitter上指出的——至少在现在,在HANA成为ECC和其他产品的支撑骨架之前。问题在于“用户会有实时的体验吗?”。多数用户不会坐在机房HANA机箱的旁边——他们会在广域网、VPN连接之类上面。事实是SAP不辞辛苦把HANA系统从实验室弄到展示厅,而不是远程连接过去,这让我知道HANA没法给使用者实时体验。

还有压缩能力:

我从头到尾读过Hasso的书的PDF版,也在推特上说过我对它有些失望。其中一个就是HANA的压缩问题。就算是在宣讲会上,它也给人一个印象,好像用户可以看到10倍的数据压缩。我觉得这很难让人相信,因为DB2、ORACLE这些产品都在压缩数据方面做的很好。所以如果DB2只能压缩数据到5倍,HANA能再把它压缩10倍吗?Hasso跟我解释说他指的是平均可以压缩原始数据10倍,而不是已经压缩过的数据。但要知道,用户“看到”的是已经压缩过的数据,会用HANA的结果与之相比。还有,在宣讲会上提过,数据库不能根据这个压缩比来衡量大小—— 由于技术原因它还需要额外的空间。

Vijay VijayaShankar在PCWorld的访谈中分享了HANA体系结构的一些细节:

HANA构建在SAP具有悠久历史的技术的超集上,包括MaxDB数据库和TREX常驻内存引擎。根据一份SAP文档,HANA放在内存中的数据由一个记录事务并具有能创建数据库映像的保存点的持久化层提供支持,这让它能够从停电或其它的中断中恢复。 HANA与支持常用查询语言如SQL和MDX的BI(业务智能)应用兼容。

查看英文原文: SAP's Cloud Strategy Evolves With In-Memory Computing Appliance

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT