BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

专访:UCloud季昕华谈网络存储的局限性、SDN在云上的七大应用场景、以及为什么OpenStack还不适合做公有云

| 作者 杨赛 关注 3 他的粉丝 发布于 2013年12月18日. 估计阅读时间: 15 分钟 | CNUTCon 了解国内外一线大厂50+智能运维最新实践案例。

2013年12月11日,UCloud正式宣布已经将盛科的硬件SDN交换机应用在自己的线上公有云环境中。UCloud CEO季昕华在发布会中介绍了SDN在其公有云上满足的七个用户需求,并表示这是世界上第一款SDN硬件交换机在云计算中的应用。

InfoQ中文站对季昕华进行了专访,谈论了对公有云营收的观点、网络存储应用在关键业务上的局限性、SDN的应用场景、在应用商店方面的尝试、以及为什么UCloud不担心OpenStack在公有云上的竞争。盛科软件总监张卫峰对SDN的技术实现方面进行了补充介绍。

InfoQ:上周你也去了金山云的发布会,那天王育林有一个观点是只有大公司才能做公有云,原因之一就是IaaS的高成本。你也看到了他们的规模,单是存储就要有上亿的成本。但是你之前在4月份也提到过你的观点,就是利用跟IDC厂商、服务器厂商合作的方式,解决了重资产、高投入的问题,同时利用私有云获取更多短期收入。现在到了2013年底,你感觉这条道路是否能走得通?是否做到收支平衡?成本开支最大的几块是哪些,它们的比重是多少?服务器和其他硬件设备自己采购的和厂商合作提供的比例是多少?

季昕华:做公有云有三大门槛:资金门槛,运营门槛,以及技术门槛。比如Amazon,是资金、技术、运营能力三者皆有,所以做起来了。微软的Azure,有资金、有技术,但是因为运营偏弱,所以一直动静不大。

在三个门槛中,技术和运营更为关键,因为技术和运营需要长期的积累,而且是大型云平台实战的经验积累,在目前的国内外环境都不缺资金,大批的风投手中拿着大量的资金在找好的云计算公司。相反有资金也不一定做得好,为什么这么说?因为当你资源充足的时候,你可能会想通过资金解决问题,而不是靠技术来解决,比如用比较昂贵的存储设备等等,而这其实不是做云的正确道路,这时候你那充足的资源反而成了制约你长期发展的瓶颈。

对于收支平衡这块,目前我们还不是很在意。我把云计算的发展分为三个阶段:

  1. 替换服务器和IDC的阶段。这是一个用批发+虚拟化模式取代零售模式的阶段,利润相对不高。
  2. 取代软件公司和软件渠道阶段。当云计算成为软件渠道中心的时候,云计算公司自研和代理的软件利润就比较高了。
  3. 取代集成公司、咨询公司的阶段。在这个阶段,以前做集成、咨询的公司要么转而做云计算服务的集成和咨询,要么就被淘汰。

现在的美国云计算市场已经在第二个阶段,市场特征已经相当明显。比如AWS有了RDS服务之后,很多企业就不再会采购Oracle或者IBM的数据库了,因为RDS已经足够成熟。

中国的云计算市场现在还处在第一个阶段,当然我们UCloud也是,这个阶段主要靠规模化取胜,通过规模化来降低成本,提高利润率,更大的利润是在进入第二阶段之 后。

目前的成本方面,人员研发投入的比重最大,大概在四成多;网络和服务器设备方面的投入其次,在三成多;剩下的三成则用于销售、市场、技术支持方面。其中,服务器和其他硬件设备目前主要仍然是通过合作提供的,包括分成模式和租赁模式。未来肯定会更多的购入自己的服务器以实现更高的利润。

InfoQ:我注意到你们给客户提供了非常好的服务支持,比如,每一个注册用户都会打电话沟通需求,这是你们的一个亮点,在业界也有非常好的口碑。你们支持的成本和投入怎么样?

季昕华:设立专门的售前客户服务,给每一个注册用户打电话沟通,主要出于两点考虑:第一点是为了更多的了解用户需求,避免他们进行不合理的配置,浪费了资源;第二点则是用于做客户的筛选,因为我们目前主要还是以服务企业客户,尤其是游戏行业的企业客户为主。我们希望给这些客户创造一个干净、专业的环境,所以我们会做相应的过滤。

InfoQ:你们的UDisk产品推出一年多了,还处于测试试用阶段。请问,由于UDisk的弹性和分布式的特性,比如提升高冗余,如果我有重要的业务希望我的VM上的数据全部放在UDisk上,是否推荐我这么做?IOPS和吞吐量是多少?SLA是多少?是如何保证的?

季昕华:重要的业务要看场景。如果是IO高的业务则不推荐放在UDisk上,这是网络存储的实现所决定的,包括AWS EBS、阿里云,IO普遍都是30~40Mbps,对于此类业务普遍无法支持的很好。目前我们正在研发类似高IO的EBS的细分产品,希望未来可以解决这个问题。

对于非高IO类型的重要业务,都是可以放的。

UDisk的可用性是3个9,因为网络有很多不确定性。可靠性方面则是11个9,我们对UDisk的冗余机制很有信心。

InfoQ:本次跟盛科合作推出的SDN,什么时候能用上?SDN的核心用了哪些开源组件,自研了哪些组件?盛科提供了哪些技术?SDN底层是否使用了万兆交换机?SDN用于哪些应用场景,用户如何受益?

季昕华:跟盛科合作是从一年多前开始,具体投产的话,硬件SDN交换机其实从今年7月就开始用了,经历了几个试点客户测试、反馈、改进的周期,完成了逐步迁移、灰度变更,目前已经在全国四个机房完成了全面部署。

具体技术上的合作,我们主要做控制端的开发,其他都是盛科做的,万兆交换机有部分用到,主要仍是千兆交换机。详细的情况卫峰可以做一下补充。

张卫峰:我们负责数据转发面的工作,主要从这几方面做了创新和优化。

  1. 将OVS流表查找offload到TOR交换机,节省服务器CPU资源,提升查找性能
  2. 将GRE tunnel的封装、解封装offload到TOR交换机,让网卡仍然可以对TCP报文进行分片加速,大大提升网络性能
  3. 所有流表全部是proactive预先配置,有效减少未知报文广播和流表学习所带来的性能问题

后续还会继续做的,包括

  1. 将L3 gateway从一个集中的网络节点offload到TOR交换机
  2. 在TOR交换机上启用ARP代理,避免ARP广播

通过这些措施最终达到的目的是,将网络处理的部分工作从服务器移到TOR交换机,让服务器可以专注于计算,带宽损耗可以降低,CPU负载降低,一台物理服务器可以容纳更多虚机,帮云服务提供商降低成本,提升用户体验。

同时,由于GRE tunnel封装放在了TOR交换机上,TOR交换机可以直接看到用户数据,可以对用户数据进行统计,限速等策略应用,解决了纯软件方式带来的网络可视化问题,有助于云服务提供商对网络进行诊断和管理。

对于最终用户来说,他们看不到SDN,但是这并不代表他们没有享受到SDN带给他们的好处。公有云平台的用户希望是可以进行自助服务的(self-service),他们自己创建虚机,自己创建虚拟网络,自己创建虚拟路由器,自己创建防火墙等等,谁在底层支撑着这些动作的顺利执行?是SDN架构。没有SDN,就没有这一切。SDN的最高境界就是用户在享受着SDN带来的便利但却并没有意识到自己使用了SDN。

季昕华:SDN的应用场景和用户收益的方面,刚才在发布会中也讲到过。SDN更多是一种隐藏的特性,不是作为独立的服务提供的,但我们的VPN产品、安全产品、广播服务、混合云的实现,都是基于SDN来实现的;同时有了SDN之后,我们的自动化、隔离、物理机与虚拟机混合管理的方案也更加完善、更加智能、性能更高。对具体细节感兴趣的朋友可以查看这篇新闻

InfoQ:目前,Uhost、UDisk、UDB、ULB、UScan这几个方面的研发,各自需要投入多少人?图片存储跟又拍云合作,CDN跟网宿合作,测试方面与云测合作,域名解析与DNSpod合作,广播服务跟极光推送合作,这几块服务是否也需要投入研发人员,还是只留下一些客服人员即可?

季昕华:目前全公司总共80多位员工,其中技术研发占据一半以上。

合作方面其实都是轻度整合,包括SSO的打通、界面整合之类的,并不会涉及到很多研发工作,而且客户反馈也是转给合作伙伴去做的。我们主要是做好运营,以及协助合作伙伴做好客服工作。

InfoQ:我看到UCloud上现在提供了网店系统这个应用级服务,这是跟shopex的试点合作吧,现在的用户量多少?

季昕华:这是我们的一个试点项目,主要是想尝试软件渠道中心的思路,从目前来看,这样的合作,对用户来说还是非常方便的,后续还会继续扩大,但目前我们的核心还是在游戏行业。

InfoQ:您对于2014年UCloud的技术投入方面有哪些规划?未来还计划推出哪些服务?对于云平台提供应用这事未来是如何规划的,是否会推出类AWS marketplace的产品?又是否考虑PaaS?

季昕华:我们的核心主要还是两块:一个是聚焦我们行业客户的需求开发功能,在我们来说主要是游戏行业的客户;第二个还是我们自身产品的稳定性。

应用超市是可能会做的,可能做成一个用户自己提交应用的平台,然后可以像现在那个网店系统一样购买使用,但这个并没有具体的计划。

PaaS也是一样,如果有客户需求的话,我们会优先考虑找一个合作伙伴来一起做,而不会自己上。

InfoQ:在底层技术提升、将技术更好的产品化、为产品寻找更好的商品化道路、发展合作伙伴、发展客户这几项工作当中,您认为哪项是当前的您最为关注的?您和莫显峰、华琨现在是如何分工的?

季昕华:莫显峰是我们的CTO,负责技术这块;华琨主要负责销售和售后;我吗,就是做各种杂事儿的。

合作伙伴这块我沟通的比较多。关于产品反馈和合作伙伴沟通这一块,我们是这样一个流程:首先,华琨那边是负责跟用户沟通的,他那里收集到的反馈或需求会反馈给团队,看看这些需求中哪些是我们现在的产品无法满足的;我们很注重生态链的合作,会先去看这个需求有没有市场上成熟的产品可以满足的?如果已经有了,我们就不做了,跟这个成熟的产品供应方建立合作伙伴关系,将其引进到我们的平台;如果没有的话,就交给莫显峰去研发。

InfoQ:最后一个问题,担心OpenStack在公有云领域的竞争吗?

季昕华:由于有一系列大公司的支持,加上OpenStack本身的架构设计的非常不错,OpenStack最近几年社区很活跃,发展也非常快速,为云计算的落地推广起到了很大的作用。不过从我们来看,我们不担心OpenStack在公有云领域的竞争。我认为OpenStack目前更适合做私有云,不适合做公有云。原因有三点:

1、目前全世界没有特别成功的OpenStack公有云案例。

我们看到AWS、Google、Windows Azure、阿里云和我们UCloud都是用自己研发的产品体系,而使用OpenStack进行大规模部署的我了解到的只有HP Cloud,但HP Cloud目前还在早期发展阶段。

有人可能会说RackSpace也是使用了OpenStack的,但实际上我们看到的信息是OpenStack中的存储部分是RackSpace提供的,但并不表示Rackspace是用OpenStack的。

2、OpenStack是一个软件,不是服务,而公有云是服务。

OpenStack一出来,好像大家忽然觉得是个人都可以做公有云了。但实际上,做公有云,只有一个软件是不行的,你还需要强大的运营来做支撑。

做过互联网运营的人都知道,看到的功能只是互联网产品里面的20%,还有80%是用户看不到的,但是运营很需要的功能,比如多帐号体系,计费体系,安全体系、后台的自动化管理、灰度发布、扩容等等。

3、与开源项目协调的问题。

假设你将OpenStack放到公有云上跑起来了,这时候用户跟你说有一个需求,这个需求是OpenStack现有的功能无法解决的,那你要不要去开发这样一个功能?开发了之后,你是要提交给社区,还是自己留着呢?

如果你提交了这个功能,社区又接受了,那么你就把你辛苦建立的竞争优势拱手让人了。

如果你提交了功能,但是社区不接受;或者你不提交这个功能,那么你将面临升级、维护难的问题。将你自己研发的功能,跟社区发布的新版OpenStack进行融合,会是非常困难的事情,而这个难度会随着时间推移而越来越严重。

而如果是自己研发,就可以做到灰度发布,完全在自己掌握当中。AWS、RackSpace、微软、阿里云、腾讯云、我们UCloud,都是这样运作的。

嘉宾简介

季昕华(@benjurry),Ucloud.cn创始人,CEO。前盛大云CEO,曾任盛大在线首席安全官、腾讯公司安全中心副总经理、华为研发经理等职位。

张卫峰(@盛科张卫峰),盛科网络软件总监,数据通信和芯片设计领域资深专家,有十几年的网络实践经验,对SDN、传统二三层交换机、数据传输设备(PTN和IPRAN),从管理面到协议控制面一直到芯片转发面,都有着深刻的理解。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT