主页 > www.token.im > 超融合数据中心网络CloudFabric 3.0,新以太释放新算力

超融合数据中心网络CloudFabric 3.0,新以太释放新算力

www.token.im 2023-05-29 06:59:27

简介:在工业时代,电力是机械文明的基石,而在今天的数字时代,计算能力正在成为智能世界的基础。 数据通过多场景连接汇聚到数据中心进行分析和应用,驱动产业升级和商业模式创新。 数据中心作为数据存储、分析、计算的唯一载体,贯穿于数据从生产要素到商业价值转化的全过程。 数据中心的计算能力成为新的生产力,数据中心的维度从原来的资源规模向计算能力规模转变。

以太坊算力查询平台_以太坊显卡算力表_以太坊显卡算力排行榜

华为数据中心网络领域总裁 王磊

算力关键在于数据流通和处理效率,融合是必然需求

数据中心的计算能力是服务器处理数据并实现结果输出的能力,是对计算、存储、网络三大资源的协同能力的综合衡量。 数据中心网络作为连接数据中心内各种资源的大动脉,承担着保障数据高效流动的重任。

以太坊显卡算力排行榜_以太坊算力查询平台_以太坊显卡算力表

根据连接资源的不同,数据中心网络分为: 1)通用计算网络:与外部用户终端连接,提供服务; 2)数据存储网络:连接存储节点,支持数据存储、读写和备份; 3)高性能计算网络:连接CPU/GPU服务器,支持高性能计算或AI训练。

在数据流通和处理过程中,这三个网络需要深度合作,以保证算力的最大释放。 通用计算网络一般采用开放的以太网协议,而传统的集中式存储领域和高性能计算领域多采用封闭式光纤通道(FC)和InfiniBand专网技术。 三套网络协议各不相同,结构碎片化以太坊算力查询平台,阻碍了数据跨节点、跨资源的流动。 融合已经成为算力提升的必然要求。

三大变革驱动数据中心网络全面以太网化,带来融合机遇

数据中心网络服务于云应用、计算资源和存储资源。 三大服务对象的转变正在推动数据中心网络向以太网演进:

云化升级:在加速云化的浪潮下,企业IT架构正在从本地集中式向云分布式,甚至多云分布式演进。 开放的以太网架构自然可以被云端灵活调用,具有良好的互操作性、弹性、敏捷性和多租户安全能力,成为通用计算网络的压倒性协议。

全闪存存储:随着机械硬盘向全闪存的升级,存储介质的读写性能提升百倍。 传统FC带宽高达32G/64G,不能满足全闪存存储的高吞吐需求。 高达400GE带宽的以太网已经成为新一代存储网络的事实标准。

计算单元上PCIe:业界CPU/GPU厂商通过上PCIe总线突破总线速度瓶颈,直接输出以太网口,提供更高的计算能力。

以太坊显卡算力表_以太坊算力查询平台_以太坊显卡算力排行榜

在三大变革的驱动下,以太化正在向纵深推进。 全球HPC TOP500统计显示,自2016年以来,以太坊已经超越IB成为主流。 2019年计算机行业巨头英特尔放弃了源自InfiniBand的Omni-Path高速互连网络技术,随后在2021年推出了面向HPC场景的以太网交换机,同时针对RoCE对HPC套件进行了优化升级. 随着全以太网网络技术的快速发展,相关测试规范和标准相继出台,融合时间窗口正式开启。

融合之路并不平坦,全以太网数据中心网络面临三大挑战

虽然业界普遍看好全以太网化的趋势,但从出色的网络性能到成熟的管理支持,实属不易。 数据中心网络全面以太网化面临三大挑战:

网络丢包挑战:以太网天生就存在丢包问题,无法满足通信密集型HPC和高端存储场景对性能的极致要求。

管理效率挑战:近年来,全球数据中心普遍采用集约化、规模化建设原则,中小型数据中心被大型、超大型数据中心取代。 随着管理规模的扩大,传统分散的多工具、多平台管理模式成为网络运维的效率瓶颈。

多云多场景挑战:一方面,为满足核心业务的稳定性和快速响应变化,企业数据中心基础设施通常采用公有云敏感业务和私有云的双重架构——稳定的业务; 丰富,不仅各行业对网络的要求差异很大,同一行业不同的业务场景也大不相同。 复杂的业务场景对网络的开放性和服务化能力提出了更高的要求。

华为超融合数据中心网络CloudFabric3.0实现数据中心网络三层融合

针对全以太网化网络的三大挑战,华为推出CloudFabric 3.0超融合数据中心网络解决方案。 核心部件包括CloudEngine数据中心交换机和iMaster NCE网络智能管控系统。 CloudFabric 3.0基于三层融合架构,可以最大限度地提高数据流通和处理效率,充分释放数据中心的计算能力:

全无损以太网架构:三网统一为零丢包以太网架构,实现流量承载融合,打破异构协议限制;

全生命周期自动化管理:实现网络管控分析一体化,打破多工具、多平台管理数据分离的局限;

全场景服务能力:实现多业务场景融合,打破跨地域、跨场景算力分割的限制。

以太坊算力查询平台_以太坊显卡算力表_以太坊显卡算力排行榜

全以太HPC网络,100%算力释放

传统以太网丢包带来性能瓶颈,0.1%的丢包会导致50%的算力损失。 40多年来,业界专家探索了很多解决以太网丢包的方法,但都以失败告终:通过流量控制和反压来控制流量的发送速度,但粗糙的反压机制会频繁停止发送数据包,导致吞吐量极低; 在网络应用流量日益复杂的今天,速度控制的时机很难把握。 华为创造性地将智能无损算法iLossless-DCN引入网络连接,用算法代替专家经验,实现实时精准控速,保证网络零丢包,保持规模不变,计算翻倍力量。

全以太网存储网络,存储性能提升87%

对于存储网络,金融双活数据中心场景对性能的要求最为苛刻。 同城数据中心之间的距离一般在30公里到70公里之间。 由于长距离光纤数据传输中存在静态延迟(5μs/km),距离越远,延迟越大。 与短距离场景相比,延迟增加,流量控制的复杂度呈指数增长。 为此,华为推出了长距离无损iLossless-DCI算法,在近距离无损的基础上增加了距离变量,基于大数据分析提前响应流量变化。 与FC网络相比,可降低90%。 在DC内和跨DC等距离场景下,IOPS较FC网络提升87%,时延降低42%。

全生命周期自动化,业务秒级部署,1-3-5智能运维

针对业界“依赖人工设计验证、自动配置交付”的SDN半自动化运维模式,华为将数字孪生方法论引入网管领域,实现建设全生命周期的自动化。 基于网络数字化建模,综合评估影响网络设计的400+因素,推荐最优网络设计方案,实现配置变更秒级验证。 基于网络知识图谱,实现1分钟故障感知、3分钟定位、5分钟修复。 通过大数据挖掘和建模,识别网络对象之间的关系和故障扩散规律以太坊算力查询平台,感知90%的潜在风险。

全场景服务体验,从月到日的跨云业务部署

多云场景下网络异构成为常态,多厂商设备往往配备多个控制器。 一方面,当跨云业务发生变化时,需要将需求分解为多个控制器; 如果控制器能力不满足,则需要依赖原厂商进行版本开发,周期3-6个月不等。 另一方面,企业云管理平台需要同时连接多个控制器,适配工作量巨大。 南北向的多接口模式使得跨云网络的部署耗时数月,成为算力跨地域流通的瓶颈。 为此,华为定义了统一的设备网元模型,构建了开放的南向框架,可以实现跨厂商设备的统一管理和设备驱动的动态加载。 同时,CloudFabric 3.0北向可提供上千种丰富的网络API服务,在云管理平台侧实现灵活的网络编排,将服务上线周期从数月缩短至一周。

新CloudFabric 3.0,新以太释放新算力

数据中心聚集了极其丰富的软硬件资源,从芯片到服务器,从存储设备到网络设施,从平台软件到应用软件等等。 打造强大的算力,需要各种资源高度协同、深度融合。 作为融合之路的先行者,华为推出超融合数据中心网络CloudFabric 3.0,是全以太网趋势下CloudFabric 2.0解决方案对无损以太网和自动驾驶网络能力的扩展和增强。 超融合数据中心网络CloudFabric 3.0基于三层融合架构,可实现数据高效流转和处理,100%释放算力,为数字经济和企业数字化转型打造坚实的算力基础。