​1.引言

全国性金融行业各地分支机构通过租用广域网专线连接总部数据中心,承载着如联机交易类生产系统、智能柜员、客服语音、协同办公、即时通讯、文件传输等种类繁多的业务,而不同业务对网络性能的要求有所不同。默认的网络转发规则是先进先出、尽力而为,如果不加以区分的对所有业务同等处理,就容易导致在业务高峰期因网络拥塞,重要生产业务得不到端到端的网络性能保障,对用户体验产生不良影响。所以在广域网部署区分服务的QoS技术,是十分必要的。

QoS是Quality of Service(服务质量)的简称,其目的是针对各种不同业务需求,为其提供端到端的服务质量保证。

2.QoS基本概念

QoS采用如下参数(网络特性)作为度量,为关键业务提供服务质量保证,使其获得可预期的服务水平。

  • 带宽(吞吐量)
  • 时延
  • 抖动(时延变化)
  • 丢包率

2.1带宽

带宽(Bandwidth)也称为吞吐量(throughput),是指在单位时间内(1s),从网络一端到另一端的传输的最大数据位数,也可以理解为网络的两个节点之间特定数据流的平均速率。带宽的单位是比特/秒(bit/s,简写为bps)。

带宽可以用城市的供水管网做比喻,来帮助理解它的含义:供水管道的直径好比是带宽,水就好比是网络传输的数据,管道的直径越大也就拥有更大的给排水能力,即带宽越大传输数据的能力越大。

           

 图1

随着金融业的快速发展,业务流量也随之激增,对网络传输能力的要求也越来越高。适应业务发展的最好办法当然是增加网络线路的带宽。但由于跨地域长途广域网带宽资费昂贵,从运营、维护的成本考虑,不可能无限扩充网络带宽。所以这就要求网络维护人员充分利用有限的广域网带宽线路资源,确保各项业务流量都能得到正常高效网络转发。

2.2时延

时延(Latency)也叫延迟,是指一个报文或分组从网络的一端发送到另一端所需要的时间。以语音传输为例,时延是指从说话者开始说话到对方听到所说内容的时间。若时延太大,会引起声音不连贯或破碎。

通常途径网络上各个节点都会引发延迟,有些点引发的延迟非常少,因此在实际环境中我们可以将其忽略不计;有些延迟就比较大,需要引起我们的重视。网络中的延迟主要有以下几类:

转发/处理延迟:指从路由器(或交换机)完全接收到一个数据包,到将它放入输出队列之间的处理时间。不同型号设备的内部处理能力各不相同,但在整体延迟预算的计算中,转发/处理延迟通常都是小到可以忽略不计的部分。

 队列延迟:队列延迟是指发生在路由器设备内部,数据包在等待设备优先发送队列中的其它数据包的时间。以做核酸检测的例子来说,事实上核酸咽拭子检测时间较短,但是检测的人多了就会发生排队的现象,所以队列延迟可以理解为在做核酸检测的时候,由于人多导致排队等待的时间长,那么这个等待从排队开始到开始做核酸的时间可以理解为队列时延。从路由器角度来看,通常队列延迟只是路由器的输出队列,因为路由器中的输入排队通常是忽略不计的。然而,排队的时间也可以达到上百毫秒或更长。

串行化延迟:指设备的物理接口对数据包中的比特进行编码的时间。若链路速度较快,将比特编码到链路上的速度就比较快;若链路速度较慢,就会花费更多的时间来将比特编码到链路上。同样地,相对于较大的数据包,将较小数据包中的比特编码到链路上的时间就更短。可以使用如下公式来计算数据包的串行化延迟:发送的比特/链路速度 。

传输延迟:指数据包在线缆上从一端到达另一端所花费的时间。电接口和光接口的传播速度接近光速,唯一会影响传输延迟的因素是链路长度。所以在实际中,常见的局域网链路传输延迟可以忽略不计,而达到几百公里甚至几千公里的广域网传输延迟就成为整体延迟中不可忽视的一部分了。

图2

2.3抖动

抖动(Jitter),即时延变化,是指同一业务流中不同分组所经历的不同延迟。在数据包网络中,延迟的组成多种多样,因此抖动总是存在的,但问题是抖动是否会严重到降低应用的服务质量。

通常来说,数据应用都会遇到一些抖动,但并不会降低服务质量。而某些业务类型,特别是音视频等实时业务对抖动的容忍度是很低的,分组到达时间的差异将在语音中造成断续。

2.4丢包率

丢包(Loss)是指数据包丢失,造成丢包的因素有多种,如设备硬件故障、线路故障、网络拥塞、帧校验序列(FCS)失败等等。

少量的丢包对业务的影响并不大,例如,在语音传输中,丢失一个比特或分组的信息,通话双方可能注意不到,或不影响意思的理解。使用传输控制协议(TCP)传送数据也能处理少量的丢包,因为TCP允许丢失的信息重发。但大量的丢包会影响传输效率。所以,QoS需要关注丢包的统计数据--丢包率。

丢包率是指在网络传输过程中丢失报文占传输报文的百分比。

3.QoS应用部署

由于不同的终端用户(业务)流量对网络性能的要求有所不同,且金融行业对不同业务有自己的关注级别,所以参考以上两方面,可以在广域网进行如下QoS部署:

首先将所有业务流量进行分类,主要分为客服语音(audio)、关键生产(critical)、一般生产(product)、视频(video)、办公(office)、其他业务(other)等。

然后对每一类业务流量进行相应的QoS处理。​

3.1客服语音业务

由于语音业务对时延和抖动的容忍度很低,即要求一致的低延迟;同时语音客服在金融业务的重要性等级序列中,也是属于最高的级别。于是将客服语音业务流量(audio)的队列调度优先级设置为最优先。这样就能保证客服语音流量总是优先得到转发,受带宽的影响降到最小,在可控制的范围内将时延和抖动始终保持在最低水平。

虽然客服语音业务非常重要,其队列调度优先级设置为最优先,如果在特殊情况下该业务流量非常大,占据全部带宽资源,就会导致其他业务因分配不到带宽资源而出现集体中断,显然这也是不合理的。于是还需要对客服语音业务流量进行一定的限速。

所以对客服语音业务可以进行如下的QoS处理:队列调度使用PQ(Priority Queue,优先级队列),并根据正常需要的速率,进行最大带宽限速。

3.2关键生产和一般生产业务

联机交易类生产属于关键生产业务,对带宽和丢包率有较高要求。于是将关键生产业务流量(critical)进行重点QoS带宽保障,确保关键生产业务流量始终都能享有足够的带宽来进行转发,不至于因网络拥塞而产生大量丢包。在实际部署时,我们还可以将关键生产业务细分成具体的几类重要业务。

一般生产业务是重要性仅低于关键生产的业务,所以也要进行一定QoS带宽保障,其保障的带宽比例略低于关键生产。

3.3视频业务

视频业务主要指视频会议业务,视频会议需要一致的低延迟和高吞吐量,所以对视频业务量流量(video)也需要进行一定QoS带宽保障,同时借助路由选路策略,将视频业务流量的广域网专线主选线路设置为第三条线路(生产主线和办公主线的备份线路),与生产、办公业务流量分流,能充分利用多条广域网专线的带宽资源。

3.4办公业务

办公业务种类较多,总体分配一定QoS带宽保障,同时借助路由选路策略,将办公业务流量(office)的广域网专线主选线路设置为第二条线路(生产主线和视频主线的备份线路),与生产、视频业务流量分流,能充分利用多条广域网专线的带宽资源。

3.5其他业务

其他业务是指未明确分类的剩余业务流量(other),业务重要性等级相对较低,为保证所有种类的业务流量都有被转发的机会,仍然对其他业务流量(other)给予相对较低比例的QoS带宽保障。

3.6QoS部署汇总

综上所述,我们可以对金融业务进行如下QoS应用部署。

表1

图3

4.小结

随着业务的发展,QoS策略也需要动态优化。传统网络基于分布式的协议实现,配置过程采用逐跳配置的形式,必然导致QoS策略部署及优化调整操作复杂,且容易出现差错。基于SDN技术的广域网,能够借助SDN自动化网络配置的特性,使QoS策略部署更加灵活敏捷;能够收集更加精确的全局网络流量状态信息,例如传输延迟,带宽,丢包率,使QoS网络流量调度更加精确;能够从全局网络视图对所有网络设备以及全网流量集中管控,保障全网QoS策略的一致性。总之,在金融行业的广域网中通过配置QoS策略,对网络流量进行调控,避免并管理网络拥塞,减少报文的丢失率,为不同的业务(语音、视频、数据等)提供差分服务,保障重要生产业务稳定运行。

网络并非生来如此,随着技术发展和应用场景变化,网络架构也在迭代演进,最终构成可靠稳健的数字经济网络基础设施底座。在此其中,我们通过剖析各类网络场景,为大家展现网络原来如此。​