2022-09-03 13:38:13 来源:C114通信网 阅读量:9018
昨天举行的第二届SmartNIC amp在技术创新峰会上,中国移动研究院数据中心网络技术经理王发表演讲,表示中国移动计算力网络的内涵是以中心为基础,以网络为基础,通过网络的优势,不断提高计算基础设施的能力。
这个过程分为三个阶段,第一个阶段是使用网络连接计算边缘计算力,中心计算力和末端计算力通过网络连接,实现用户的按需访问第二阶段是利用网络加强计算,通过网络资源调度突破单点计算能力瓶颈,实现计算能力规模供给第三阶段是算力和网络的融合,算力和网络的融合
王还指出,在未来,数据中心或智能计算中心将更加重视异构计算能力同时,数据中心还会有CPU资源,DPU资源甚至各种存储资源来实现计算能力输出
可是,计算能力与网络的增长不匹配据王介绍,目前存在四个问题:一是网络性能和计算能力下降,CPU不太适合数据处理希望DPU的智能卸载能够提高OVS的转发性能和流量二是裸机场景多,能力相对有限第三,当智能计算中心的规模变大时,高性能存储协议的性能受到限制第四,在用户平面中的网络元素虚拟化之后,基于x86的硬件的性能下降
面对这些挑战,王希望通过智能网卡实现应用加速和卸载的功能包括应用基础设施的能力增强,下一代网络的能力建设,以及网元加速业务功能的卸载
智能网卡的应用具有定制业务场景的特点王表示,运营商的采购模式和网间脱钩模式会影响方案的制定因为网络中有不同的SDN制造商,虚拟化制造商,服务器制造商,OS制造商和智能网卡制造商,所以需要一个完全解耦的方案
在软件层面,中国移动制定了相应的接口规范五个主要接口中,一个是CPU卡硬件类型,一个是OS,三个是存储,四个是网卡驱动和DPDK接口,都完成了相应的规范另外,外部运维接口需要读取网卡状态信息和故障信息,标准化工作还在做
运营商在引入智能网卡时面临的最大问题是标准化我们希望通过一些解耦规范的制定,将虚拟层的SDN引入智能网卡的方案能够成熟王对说道
硬件层面,中国移动单独购买了网卡和服务器智能网卡更像一台小型电脑,需要制定一些硬件规范一个是统一服务器的结构和供电,二,功耗要求,三是统一了边带信号的定义和带外管理的边界,四是统一运维
此外,中国移动还做了一项重要工作:端到端的网络协作,加速高性能计算网络的应用通过智能网卡卸载,拥塞算法,选择加入机制等,感知网络情况,解决网络拥塞问题,提高端到端网络性能
最后,王得出结论,x86服务器可以做很多事情当智能网卡被用来提高性能的时候,通用就变成了专用,服务器可能就变成了烟囱不同的业务使用不同的专用设备,网络架构和芯片处理逻辑也不一样如何让网卡承载不同的业务,保证高性能,普遍性和差异性之间存在博弈
使用智能网卡进行异构计算,主要原因是一般计算能力难以承载业务,需要引入异构计算来弥补一个场景是数据中心能力的提升,这是业界的共识,还有下一代网络能力的建设,中国移动在做的方向,然后是虚拟化网元的卸载和加速中国移动也在评估一些场景方案的可行性和性价比,以决定是否引入