云计算已经无处不在。在过去的十年里,笔者作为一名云架构师和产品经理,近距离观察了这个领域的发展。所有这些变化对IT基础设施的发展意味着什么?笔者一直在认真思考这个问题,认为现在是制定新规则的时候了:

1.修改对你不利

当你听到供应商宣称他们能够通过发布基于上游项目的基础设施软件的“强化”版本,而以某种方式使开源项目“企业级就绪”时,你不感到局促不安吗?实际上,游戏已经结束了。例如,OpenStack的许多版本都是稳定的,并且能够在没有任何供应商干预的情况下处理最高级的用例和工作负载。

这是最重要的新规则,因为不遵守它就会给自己设限。为什么要通过引入下游补丁来限制能够在生产中使用你的平台工作、支持和创新的人数?开放式基础设施的整体目标是能够与更大的社区接触以获得支持,并为下一代基础设施平台上的招聘、培训和创新创建一个共同的基础。别失去这个优势。

2.标准化是王道

“手工制作”对酿啤酒来说更好,而不是基础设施。大规模实现毫无例外都基于组件的标准化和体系结构的简单性。确保集群知识可以转移到新团队或不受员工离职影响的唯一方法是避免引入“技术债务”的定制化参考体系结构。

3.为未来自动化

几乎所有的团队都没有达到应有的自动化程度。他们中的大多数人在某种程度上意识到了这一点,但没有采取行动。某些已经被运维人员广泛使用的工具很好地解决了前80%的自动化用例,但没有解决其余的问题。其结果是,生命周期管理事件(如升级、扩展等)仍然过于复杂和耗时。

在选择编排自动化时,假设技术堆栈将在硬件分期偿还期间(通常为5年)发生变化。今天的VMware可能是明天的OpenStack,可能会变成上面的Kubernetes集群,可能在裸机上与之共存,也可能甚至被它取代。期望一组特定的硬件在其整个生命周期中与特定的基础设施绑定是不现实的。

4.在本地以满容量运行,溢出时用公有云

如果在数据中心提供最佳的经济性是一个组织的首要目标,那么运行尽可能接近容量的内部基础设施是自然的。硬件应该被选择来提供最好的性价比,这可能不会总是导致最低的投资成本,但会带来最好的整体经济效益,特别是如果目标是实现与公有云可比的成本结构。

不过不要把这条规则误认为是指避免公有云。相反,与至少两个公有云提供商合作,加上有一个实现经济目标的可靠on-prem策略是明智的。拥有两个公有云合作伙伴可以带来良性竞争,并在运维中实施与云无关的自动化,这是成功的多云战略的一个关键。

5.升级

随着上游项目支持周期的缩短(例如,看看OpenStack和Kubernetes支持的发行版数目和维护窗口期),养成升级的习惯而不是引入技术债务是至关重要的。随着正确类型的自动化过程到位,升级应该是可预测的,并在合理的时间内解决问题。

6.工作负载怎么放很重要

云本质上是动态的,因此在调试有服务级别冲突会发生什么时,需要考虑基础设施的变化。所有大小合理的云都有这个问题,大多数运维团队忽略了保持裸机级别上发生的事情与虚拟和容器级别上发生的事情之间相关性的必要性。当有租户登录时,请考虑工作负载如何放置,并建立必要的遥测,以便在其上下文中捕获这些事件。这将导致预测分析,最终可能允许你将人工智能引入到运维中(云基础设施越大/越复杂,就越紧迫)。

7.别独立地考虑安全性

大多数云项目是开发人员和运维人员共同设计的,很少涉及到单独的安全团队。结果呢?安全专家面对的是“既成事实”,他们的反应大多是对这些计划泼冷水。安全性应该从一开始就考虑到,并作为需求分析的一部分持续被关注。安全性与集群必须满足的任何其他非功能性需求一样重要和关键。因此,尽早、经常地参与安全性工作,并密切关注。

8.拥抱新兴事物

开放式基础设施的整体目标是促进创新,并通过加快下一代应用程序的推出,使企业获得竞争优势。如果开发人员想要容器,为什么不呢?如果开发人员想要无服务器,为什么不呢?应该做的是,把新的技术堆栈作为解决方案的一部分,而不是嘲笑(这只会突显出对现有操作范式和自动化缺乏信心)。

通过遵守这八条新规则,企业应该能够在新的十年即将到来之际,为实现最大的效率和生产力做好准备。

信息化和软件服务网 - 助力数字中国建设 | 责编:莎莉