前几期文章,我给大家详细介绍了一下算力和算力网络的本质。今天,是算力系列的最后一期,我们详细看看算力网络的组网架构和技术体系。
算力网络的架构
之前我提到过,算力网络的作用,是为用户提供算力资源服务。它将算力资源彻底“融入”通信网络,以一个更整体的形式,提供最符合用户需求的算力资源服务。
这是一个高度灵活、高度智能的网络。
算力网络的核心特征,是它通过算力,实现了对算力资源、网络资源的全面接管,可以让网络实时感知用户的算力需求,以及自身的算力状态。经过分析后,算力网络可以调度不同位置、不同类型的算力资源,为用户服务。
我们可以把它理解成一个“万能水龙头”。它总能够按你的需要,提供合适强度、合适温度、合适酸碱度的水流,让你拥有最好的用水体验。
那么,我们自然会很好奇,这个“万能水龙头”的背后,究竟是一张怎样的“水网”?它是如何进行资源控制和调度的?
接下来,我们就看看算力网络的体系架构。
首先,我需要提前说明一下,算力网络目前还是一个研究中的技术,并没有完全定型。所以,我下面给出的,只是各个运营商和设备商的算力网络架构(设想)图,相互之间会存在一定的差异。而且,未来也很可能在发生变动,请大家知悉。
下面的这几张,就是运营商和设备商比较有代表性的算力网络架构(设想)图:
中国移动(来自《算力网络技术白皮书》,2022)
中国移动(来自《算力网络白皮书》)
中国联通(来自华为WIN-WIN创新周,2022)
中国联通算力网络架构(来自《算力网络架构与技术体系白皮书》)
中国电信云网融合目标技术架构
(来自《云网融合2030技术白皮书》)
华为(来自华为WIN-WIN创新周,2022)
这些图都有点复杂,相信大家都不太看得懂。我画一个简单的示意图,大家应该能看明白:
简单来说,还是信息通信的分层思想,按层级来看,就能理清思路。为了减轻阅读压力,大家可以先把右边的绿色低碳和安全防护先pass掉。
我们从下往上,一层一层来看。
算网基础设施
算力网络的最下层,依然是算网基础设施层,这个逃不掉的。在算力网络中,基础设施不再仅仅是算力资源(CPU、存储、GPU等),还包括了网络资源。
在算力资源这边,对算力基础设施的整合,依旧是以云技术为核心,包括云原生、虚拟化、容器等。
在这里,和算力有关的一些底层新技术创新,也值得关注,例如异构计算、无服务计算(Serverless Computing)、存算一体、算力卸载等。大家可以先不管,以后再专题介绍。
网络这边,变化比较大。前几期文章给大家介绍过,云网融合趋势下的网络变化,用一句话来解释,就是把封闭的网,变得更开放(解耦),让它变成像计算机一样,可以通过软件的方式(软件定义),去给它下“命令”。
网络的底层(物理层、数据链路层),在传输网这边,依旧是光(只有光,才能保证通信带宽和容量等基本硬指标)。光底层的技术,例如OTN、OXC、ROADM、C L频段、400G/800G啥的,都还是它们,没有什么区别。在接入网那边,5G NR、PON(50G-PON),也没有什么特别(除了边缘算力会有点关系之外)。变化大的,在网的上层。我们待会再讲。
算网一体(算力资源管理、网络资源管理)
再往上,开始有不一样了。因为算力网络要调度算力和网络资源,所以,需要对资源进行“预处理”和“衔接”。(这一层,其实很多架构里都归于编排管理层。我觉得单独拎出来,会比较容易理解一些。)
这一层,最值得关注的是算力路由。
算力网络和传统网络的最大区别,在于它所拥有三大特性。第一大特性,就是算力路由。在算力之前,先要说说算力感知。算力感知是网络对算力资源和算力服务的部署位置、实时状态、负载信息、业务需求的全面感知。中国移动的算力感知网络白皮书,就是站在算力感知的角度,进行分析的。算力感知网络的体系架构(来自中国移动《算力感知网络CAN技术白皮书2021》)一方面,各算力节点将算网信息度量建模后统一发布,网络通过对多节点上报的算网信息进行聚合,构建全局统一的算网状态视图。另一方面,网络完成对业务算网需求的统一解析,实现对业务的全面感知,为基于业务需求进行算力调度提供保障。
算力状态感知与通告(来自《算力感知网络CAN技术白皮书2021》)说白了,算力感知的目的,就是摸清手上到底有多少资源,用户到底有怎样的需求。
感知的对象,肯定需要进行度量和标识。于是,就有了算力度量和算力标识。
这两块,运营商目前非常重视。
算力这个东西存在多样性,也存在异构硬件芯片,所以,目前还没有形成统一的度量体系和标准。这会对建立统一的算力模型造成麻烦。很简单,度量单位都不一样,如何进行算力评估和计费?
算力标识的话,就相当于算力的身份证。用户通过算力标识指示所需服务,网络通过解析算力标识获取目标算力服务、算力需求等信息,为算力调度等提供基础。这个算力标识,必须是全局统一且可验证的。
好了,接下来,就是算力路由。在刚才那个中国移动的算力感知网络架构图里,在算力资源层之外,还单独划了一个算力路由层。
算力路由层是算力感知网络的核心功能层,支持对网络、计算、存储等多维资源、服务的感知与通告,实现“网络 计算”的联合调度。算力路由层,包括算力路由控制技术和算力路由转发技术,实现业务请求在路由层的按需调度。说到算力路由,肯定就要说到CFN(Computing First Networking,计算优先网络)。
CFN广义上有时候会被用来指代整个算力网络。但是,在这里,CFN是一种分布式路由协议,在不同边缘云之间,按需进行着算力的调度和均衡。
CFN技术架构(来自《算力感知网络技术白皮书》)
CFN这个东西其实很有意思。我们传统理解的路由,都是数据报文的路由。CFN这里的路由,是将计算资源状况和网络资源状况作为路由信息,发布到网络。然后呢,网络基于虚拟的服务ID,将计算任务报文,路由到最合适的计算节点。
目前,CFN协议主要通过在业务路由的BGP报文头中,以扩展字节信息的方式携带算力信息,将网络中计算节点的负载情况实时向全网进行扩散。
很显然,算力路由和CFN,是上一层进行算力调度的前提。
编排管理
再往上,就是算力网络的核心关键部分——编排管理。搞过核心网NFV(网元功能虚拟化)的同学,对编排一定非常熟悉。在NFV架构里,就有编排。这是一个很有意思的词,把你给“收编、安排”了。说白了,就是完全控制和调度。算力网络的第二大特性,就是算力调度。算力调度,就是基于算网大脑,进行全网算力资源的智能编排、弹性调度。更具体来说,是:完成算力运营及算力服务编排,完成对算力资源和网络资源的管理,包括对算力资源的感知、度量和OAM管理等;实现对终端用户的算网运营,以及对算力路由层和网络资源层的管理。算力资源被感知、标识和感知之后,为了进行管理,还有一个算力资源管理的逻辑过程(也有被单独称为:算力管理层)。主要包括算力注册、算力OAM(性能监控、故障管理)、算力运营(计费管理、服务合约等)。
算力管理层
(来自《算力感知网络CAN技术白皮书2021》)
这个功能划分就很麻烦。在有的运营商架构图里,这块被定义为算力管理层,单独存在。而在有的架构图里,没有这一层,划在了编排管理层。所以说,各个理解都不一样,很头大。反正大家要知道,有这么一个功能组。
想要实现它,肯定离不开一个控制网络的“神经中枢”。
调度和编排算力网络的核心控制部分,有的运营商把它叫做“算网大脑”。
这个“算网大脑”,有四个重要的作用:
- 获取全域实时的算、网、数资源,以及云、边、端分布情况,构建全域态势感知地图。
- 跨域协同调度,将多域协同的调度任务智能、自动地分解给各个使能平台,实现算、网、数的资源调度。
- 多域融合编排,针对多域融合业务需求,基于算、网、数的原子能力按需灵活组合编排。
- 智能辅助决策,基于不同业务的SLA要求、网络整体负载、可用算力资源池分布等因素,智能、动态地计算出算、网、数的最优协同策略。
算网管理编排层,维护全局静态的算力、服务和网络拓扑信息,并同步给各入口算力路由节点。算力路由节点维护算力服务的拓扑信息以及算力资源和网络的资源实时状态信息,通过分布式算力路由节点进行算网协同调度。
“算网大脑”是算力网络的神经中枢,统筹全局资源,重要性不言而喻。在“算网大脑”中引入AI人工智能,那肯定是不用说了。除了AI之外,现在,运营商和设备商还打算往里面塞“数字孪生”、“意图引擎”,极力提升“算网大脑”的智能化水平。
说实话,仔细看管理编排层,我就有一种感觉,算力网络就是SDN和NFV技术的升级加融合,处处都是这两个技术的影子。只不过,表面又加上很多其它的技术,形成了一个更完整、更庞大的体系。
服务运营
算力大脑之上,是不是就没有了?并不是,别忘了,我们还有服务运营层。
服务运营层,说白了,就是给上层应用提供管控算力网络的接口。算网大脑不是真正的老板,只是一个“大管家”。真正管控网络的,是上层用户和应用。
服务运营层的目的,就是向上提供算力网络的能力开放。重点技术包括:算力交易、算力并网、算力封装、意图感知等。
算力网络的第三大特性,就是算力交易。
路由、调度、交易,是算力网络三大特性
算力交易是算力网络的一个重要创新。
在算力和网络没有融合之前,用户使用谁家的云计算,就给谁钱,使用谁家的通信网络,就给谁钱。算网融合后,算力到处都是,调度来调度去,你到底该给谁钱?
算力交易,就是为了解决这个问题。
在算力交易场景中,会有一个可信泛在算力交易平台。
来自《算力网络——云网融合2.0时代的网络架构与关键技术》
大致过程是这样的:
首先,算力消费方提出详细的算力需求。然后,算力交易平台根据需求,将可用的资源整合,生成一个算力网络资源表。根据时延和成本等因素,会有对应的报价。接下来,算力消费方根据资源表,选择一个最适合自己的“套餐”。然后,就是在算力交易平台上签订交易合约。再然后,交易平台根据合约,通过算力网络调度资源,并且更新资源信息。最后,合约结束,服务终止,释放资源。
算力网络交易平台
(来自《整合多方算力网络,实现计算资源利用率最优》,雷波)
在21世纪,凡是提到交易模式,就一定会牵扯到一个词——区块链。
是的没错,算力交易平台,也是借助区块链技术,实现分布式账本、匿名交易等功能。
综上所述,算力网络紧密围绕用户的算力需求,覆盖了算力产生、调度、交易、消费的全生命周期。算力网络想要实现的,就是算随人动,算随“需求”动,达到极致完美的算力供给与需求匹配,一点也不将就,一点也不浪费。
算力网络的标准进展
这几年,算力网络在国内非常热门。不管是运营商还是设备商,都极为重视这个概念。
尤其是国内运营商,对算力网络简直就是到了狂热的地步。
原因很简单,国外运营商很少碰网,基本上就是搞搞通信,最多搞搞传统通信的云化。而国内运营商,既有网,又有云,特别希望把网和云的资源融合、盘活。而且,我们国家比较重视基础设施建设,算力网络是重要的数字基础设施,所以,运营商作为国企,也特别看重这块的积累。
一方面,为了掌握技术标准的主动权,另一方面,为了品牌宣传和形象造势,三大运营商在算力网络上就开始卷起来了。
2019年,是公认的算力网络元年。这一年的11月1日,中国联通率先行动,在北京PT展期间,发布了《中国联通算力网络白皮书》。这是国内第一本和算力网络相关的白皮书。
此后,国内运营商们争先恐后,陆续发布了多本白皮书,以及积极推动算力网络的标准制定。
在标准推进方面,我根据网上的资料,整理了一张表格,大致记录了各大标准组织在算力网络标准制定方面的情况,仅供参考:
综合自中信证券,各大白皮书,官网消息
试验进展:
来自中信证券
结语
从实际情况来看, 算力网络离我们还有很长一段距离。目前,我们处于云网融合的进展阶段,算网一体或算力网络,还在研究之中。
尽管如此,算力网络作为算力和联接力未来的发展趋势,是毋庸置疑的。算与网的融合一体,是必然的,也是整个通信行业的归途。传统通信作为“管道”,无法提升自己的价值,唯有全面投入云的怀抱,才是最好的出路。