每年的开源基础设施峰会(Open Infrastructure Summit)都会有一场重头戏,就是“超级用户大奖”的评选。因为每次在5家候选企业中,只有一家能够获奖,所以最后赢得“超级用户大奖”的企业也被认为是OpenStack领域当之无愧的应用标杆。

11月4日,在上海举行的开源基础设施峰会上,作为“超级用户大奖”的候选者之一,浪潮InCloud OpenStack团队虽然与最终的奖项擦肩而过,不过浪潮在OpenStack大规模商业化应用方面的深入探索和成功实践还是非常值得肯定和借鉴的。

开源属于每一个人

OpenStack基金会官方资料显示,浪潮InCloud OpenStack团队采用OpenStack构建了混合云环境系统,目前为10万多个用户提供服务,其中包括80多家政府部门。目前,浪潮的政务云为用户提供了超过6万个虚拟机,以及40万以上的vCPU和超过30PB的存储,并托管了1.1万多个在线应用程序。

从2010年诞生至今,OpenStack正迈向第十个年头,虽然偶尔也有对OpenStack质疑的声音,但是OpenStack基金会始终坚定地推动OpenStack在更多行业的更多场景中落地,支持企业的数字化转型。以云化转型起步较早的大型互联网企业、电信运营商为例,它们的OpenStack系统规模非常大,通常会有数个集群,节点数以千计,但这毕竟是个例。大型互联网企业和电信运营商往往拥有一支庞大的专业技术人团,专门负责基于OpenStack的开发、部署和运维,这对于一般的传统企业用户来说则是可望而不可及的。

正如OpenStack基金会执行总监Jonathan Bryce所说:“开源是属于每一个人的。”OpenStack不仅仅是为少数大型客户服务,还是为了大多数行业和企业客户都能够享受到开源云的便捷、高效、可控和经济性等。因此,在促进OpenStack大规模商业化应用的过程中,实现OpenStack的可复制性,适配更多行业和企业的上云之旅就显得尤为重要。这也是很多OpenStack厂商的心声和其真正价值所在,浪潮就是其中的代表。

从小规模、尝试性、项目化到生产系统、大规模、可复制

OpenStack诞生的最初几年,虽然OpenStack社区版本一直保持着快速迭代的节奏,许多厂商都推出了自己的OpenStack商业发行版。但就像很多新技术、新产品刚推出时一样,用户从不了解到接受,从边缘和新兴的应用做起逐步延伸至企业核心应用,需要一个过程。OpenStack也是从一些小规模的,比如十几个或几十个节点起步,在一些测试和开发项目中率先尝试部署,而且在OpenStack产品化还不成熟的时候,厂商会优先采用项目制的模式,第一步先满足某一个客户的云化需求,然后再做第二个、第三个……因为每个客户的需求都不一样,定制化和技术服务的比重相对较大,OpenStack厂商的负担也比较重。

上述这种情况大多出现在OpenStack的萌芽期,OpenStack应用的特征表现为小规模、尝试性、项目化。如今9年过去了,OpenStack社区版本通过多次迭代,无论是技术功能还是可靠性、稳定性等都达到了一定水平和成熟度,通过不断的创新和优化,OpenStack得到了越来越多行业客户的认可,逐步进入企业的生产系统。

OpenStack已经成了中国私有云事实上的标准,并且步入成熟发展阶段。开源产业白皮书(2019)显示,超过半数的企业选择购买商业版OpenStack,并采用供应商的技术服务支持。中国排名前五的私有云服务商中,有四家采用的是基于OpenStack的解决方案。从OpenStack全球市场份额来看,中国占到20%~25%,基本与美国、欧洲三分天下,而且市场增速是最快的。Jonathan Bryce表示,中国市场正积极拥抱开源基础设施,并以其他地区少见的部署规模来解决实际生产中遇到的问题。OpenStack在中国不仅应用规模大、应用场景多,而且很多企业已将OpenStack大规模地用于生产系统。

浪潮云计算与大数据产品部副总经理刘晓欣

通过在不同行业中快速而有效的复制,加速OpenStack大规模商业化进程,这正是浪潮推动OpenStack应用走向行业纵深的切入点。数据证明,浪潮选对了道路。IDC(全球互联网数据中心)发布的2018年中国SDC(OpenStack、计算虚拟化、容器)产品市场报告显示,浪潮OpenStack同比增速167.1%,2.3倍于业界平均增速,排名中国市场增速第一。作为OpenStack基金会黄金会员,浪潮一直积极投入社区建设,在最新的Train版本中贡献处于社区领先位置,完成了5个BP申请,其中2个已合入Train版本当中。此外,浪潮还基于云海ICOS5.6完成了Train版本新特性测试。浪潮云计算与大数据产品部副总经理刘晓欣表示,浪潮将进一步巩固其云计算业务在中国OpenStack市场上的领导地位。

闯关500节点单一集群

浪潮很早便开始了大规模行业云建设,其中必须要突破的就是超大规模OpenStack云应用带来的部署、管理和可用性上的瓶颈。以广电行业为例,浪潮依托其云平台核心产品InCloud Manager、InCloud OpenStack、InCloud Sphere等搭建了单集群超过1000个节点、总规模超过1500个节点的云平台,满足了用户对高并发和可靠稳定的要求。在金融行业,也有银行借助浪潮InCloud OpenStack构建了超过1000个节点的金融云平台,从容应对超过6千万笔的日交易峰值。

当前,大多数用户部署的OpenStack系统节点规模从几十个到一两百个不等,一般情况下,单一集群的节点数量达200个,如果OpenStack解决方案不经过优化和调整,有可能会在高并发的情况下出现问题。有人质疑OpenStack的扩展性大概就是缘于此。

前不久,浪潮与英特尔合作,基于浪潮云海InCloud OpenStack 5.6(ICOS 5.6,Rocky企业发行版)成功完成500节点单一集群测试,验证了OpenStack在大规模集群下的性能以及可用性,为大规模OpenStack集群应用提供了硬件选型、调优等方面的参考建议。据记者了解,就在上周,红帽也刚刚完成了500个节点的OpenStack集群测试。由此可见,突破超大规模OpenStack部署的门槛将是下一个阶段的重要任务。

在本次开放基础设施峰会上,浪潮联合英特尔发布了《基于500节点大规模单一集群行业云部署和性能优化白皮书》,为社区成员和企业用户部署规模更加庞大的OpenStack单一集群提供了详细且经过实践检验的指导规范。

刘晓欣表示,当前,行业云普遍往大规模乃至超大规模方向发展,并且扩张速度有进一步加快的趋势。在大规模集群环境中,性能、可用性、功能性等方面出现的波动很有可能对整个行业云数据中心的运行带来影响。另外,集群升级扩容是否平滑、平台运行是否稳定高效、性能能否满足业务需求等都是用户关注的重要问题。500个节点的规模已经超出了OpenStack社区版本负载的峰值。因此,若想在500个节点上成功部署OpenStack,就必须进行大量复杂的测试和优化。

OpenStack的大规模部署面临诸多挑战,刘晓欣归纳出以下几点。首先,行业云基础设施要提供超高的数据处理与存储性能,同时要为数据管理、模型训练、模型部署等高负载应用提供支撑;其次,敏捷基础设施成为重要趋势,性能的持续优化、增强的成本控制能力至关重要,需要在软件定义层面实现性能、QoS、TCO的轻松调配;最后,基础设施要保持开放性,在积极利用开放社区成果的同时,也要贡献开源成果,打造活跃的开源生态。

基于开源打造的浪潮云海·云数据中心操作系统 (InCloud OpenStack, ICOS),考虑到大规模行业云的应用和运维特点,在功能性、可靠性、安全性和支撑工具等方面全面优化了OpenStack,并全面接入OpenStack各领域核心组件,同时自研了部分组件,以弥补 OpenStack开源架构下各种模块与组件的不足。

在真实的数据中心环境中,浪潮主要围绕3H(高效率、高性能、高可用)进行了测试,包括高并发压力测试、网络/磁盘IO与CPU/内存性能测试、稳定性与高可用测试等。在测试中,浪潮只用了10小时便完成了500个节点的全部机器上架和基础操作系统部署。

以前,浪潮曾顺利完成对200个节点单一集群的测试,现在又成功通过500个节点单一集群测试,这一系列创新之举为更大规模的OpenStack云部署提供了有益借鉴。

“平台+生态”,加速规模化应用

“我们真切地感受到了金融、广电、政务等行业客户对大规模云平台的迫切需要。”刘晓欣表示,“从目前情况看,200个节点以下的OpenStack单一集群不需经过特别优化,就能满足用户的需求,但是对于更大规模的业务场景,实际应用的客户还比较少,缺乏可借鉴的成功经验。我们成功地完成了500个节点OpenStack单一集群的测试,就是想进一步扩展OpenStack的应用场景,为大规模商用积累经验。我们预计,今明两年会有更多企业客户部署更大规模的OpenStack集群。”

在推动OpenStack规模化应用的过程中,浪潮创新性地推出了ICOS一体机,它是浪潮研发的下一代云数据中心软硬件系统,面向软件定义数据中心,基于硬件重构平台和软件定义的系统,具有去耦合、可重构、自动化、整体性、弹性化等特点,可以帮助客户快速构建云数据中心,降低整体拥有成本和复杂性,灵活、快速地交付一个智能化云平台。

提供商业化的开源云计算产品只是第一步,浪潮的目标是为客户提供可以持续演进的开放云平台。“‘平台+生态’是浪潮在云计算上的核心战略。我们将携手各类合作伙伴,为客户提供整体解决方案,以可快速复制的云平台满足用户规模化应用的需求。”刘晓欣表示,“未来,InCloud OpenStack(云操作系统)、InCloud Kubernetes(容器云平台)和InCloud Mangaer(云管平台)等将是我们重点投入的方向。”

从本次峰会来看,OpenStack基金会未来在开源基础设施方面会走纵、横结合的道路:纵向,不断充实和完善OpenStack平台,打造一个功能齐全、健壮的OpenStack开源基础设施,持续扩大OpenStack的应用规模和业务场景,这有点像我们常说的“Scale up”,是夯实根基之举;横向,不断吸纳新的技术进来,比如容器和编排、边缘计算、DevOps甚至人工智能,更接近应用层,这有点像我们所说的“Scale out”,旨在寻找更多新的商机,保证基金会的可持续发展。

信息化和软件服务网 - 助力数字中国建设 | 责编:左右