• 尊龙时凯

    银狐病毒防御大作战 丨 揭秘最新攻击手段与体系化防护实战
    预约直播
    体验驱动校园网,数智彩光谱新篇 丨 尊龙时凯体验驱动下一代全光校园网建设研讨会
    预约直播
    尊龙时凯睿易 尊龙时凯官方商城

    中文

    • Global / English
    • France / Français
    • Germany / Deutsch
    • Indonesia / Indonesian
    • Italy / Italiano
    • Japan / 日本語
    • Kazakhstan / Pусский
    • Poland / Polski
    • Portugal / Português
    • Spain / Español (España)
    • Thailand / ภาษาไทย
    • Vietnam / Việt Nam
    • LATAM / Español
      (América Latina)
    • Türkiye / Türkçe
    • Brazil / Português(Brazil)
    产品
    < 返回主菜单
    产品中心
    产品

    交换机

    交换机所有产品
    < 返回产品
    交换机主页
    交换机

    园区网交换机

    园区网交换机所有产品
    • 核心交换机
    • RG-N18000-E(Newton)系列新一代融合核心交换机
    • RG-S7800C-X系列新一代融合核心交换机
    • RG-S7800C系列融合核心交换机
    • RG-S7600系列超聚合核心彩光交换机
    • 汇聚交换机
    • RG-S6150-X系列新一代融合万兆交换机
    • RG-S6120系列融合万兆交换机
    • RG-S6100系列多速率系列交换机
    • RG-S5760-X系列新一代融合千兆交换机
    • RG-S5750-X系列融合千兆交换机
    • RG-S5750-H系列千兆交换机
    • 接入交换机
    • RG-S5315-E系列2.5G多速率交换机
    • RG-S5310-E系列新一代千兆交换机
    • RG-S5310系列千兆交换机
    • RG-S5300-E系列新一代千兆交换机
    • RG-S5000系列千兆交换机
    • RG-S2910XS-E系列千兆交换机
    • RG-S2910-H系列千兆PoE交换机
    • RG-S2900G-E V3系列千兆交换机
    • 极简光交换机
    • RG-S5750-DP系列极简光汇聚交换机
    • RG-MUX彩光透明汇聚系列
    • RG-SF2920系列极简光交换机
    • RG-PF2920系列极简光入室交换机
    • RG-IF2920系列极简光入室交换机
    • RG-MF2920系列极简光入室交换机
    • RG-PDBOX集中供电主机
    • RG-SF2910系列极简光入室交换机

    数据中心与云计算交换机

    数据中心与云计算交换机所有产品
    • 核心交换机
    • RG-N18000-XH系列
    • RG-N18000-X系列
    • RG-S7800C系列
    • RG-S6990系列
    • RG-S6980系列
    • RG-S6930系列
    • RG-S6920系列
    • RG-S6910系列
    • RG-S6900AI系列
    • 接入交换机
    • RG-S6580系列
    • RG-S6520系列
    • RG-S6510系列
    • RG-S6200系列
    • RG-S6000系列
    • 400G/800G光模块
    • LPO系列光模块

    行业精选交换系列

    行业精选交换系列所有产品
    • 行业精选交换系列
    • RG-SG7008L多业务融合一体机
    • RG-S3000-RU系列一体机远端模块
    • M7000L-RU系列一体机远端模块
    • RG-S6120-L系列万兆交换机
    • RG-S5750V2-L系列千兆交换机
    • RG-S5300-L系列千兆接入交换机
    • RG-S2910-L系列千兆交换机
    • RG-S2906-L系列千兆交换机
    • XS-S1930J-P系列二层接入交换机

    工业交换机

    工业交换机所有产品
    • 工业交换机
    • RG-IS5200沙海系列工业以太网交换机
    • RG-IS5900系列一机双网工业交换机
    • RG-IS2900系列一机双网工业交换机

    SDN

    SDN所有产品
    • SDN
    • 数据中心SDN控制器
    • ServiceChain方案

    配件

    配件所有产品
    • 配件
    • 电源模块配件

    所有技术解决方案

    • 数据中心场景
    • AI-Fabric智算中心网络解决方案
    • AI-FlexiForce智算中心网络解决方案
    • 高速低碳云数据中心解决方案集
    • 极速X-Fabric数据中心网络解决方案
    • AIGC量化分析平台
    • RoCE智算网络专家

    路由器

    路由器所有产品
    < 返回产品
    路由器主页
    路由器

    核心路由器

    核心路由器所有产品
    • 核心路由器
    • RG-RSR77-XA系列多业务核心路由器

    汇聚路由器

    汇聚路由器所有产品
    • 汇聚路由器
    • RG-RSR50系列多业务框式汇聚路由器
    • RG-RSR30系列多业务盒式汇聚路由器

    接入路由器

    接入路由器所有产品
    • 接入路由器
    • RG-RSR20系列多业务接入路由器

    移动路由器

    移动路由器所有产品
    • 移动路由器
    • RG-RSR800系列移动路由器
    • RG-RSR10-01G系列4G路由器

    行业精选路由器系列

    行业精选路由器系列所有产品
    • 行业精选路由器系列
    • RG-RSR10-L系列路由器

    所有技术解决方案

    • 广域网
    • 尊龙时凯全新SD-WAN解决方案

    无线

    无线所有产品
    < 返回产品
    无线主页
    无线

    放装型无线接入点

    放装型无线接入点所有产品
    • Wi-Fi 7系列
    • RG-AP9861-R四射频Wi-Fi 7无线AP
    • RG-AP9850-R五射频Wi-Fi 7无线AP
    • RG-AP9751-R四射频Wi-Fi 7无线AP
    • RG-AP9520-RDX三射频Wi-Fi 7无线AP
    • RG-AP9220(V2)双射频Wi-Fi 7无线AP
    • RG-AP9220双射频Wi-Fi 7无线AP
    • Wi-Fi 6系列
    • RG-AP880-AR四射频Wi-Fi 6无线AP
    • RG-AP850-AR(V3)四射频Wi-Fi 6无线AP
    • RG-AP840-AR三射频Wi-Fi 6无线AP
    • RG-AP820-AR(V3)三射频Wi-Fi 6无线AP
    • RG-AP820C双射频Wi-Fi 6无线AP
    • RG-AP820-L(V3)双射频Wi-Fi 6无线AP
    • RG-AP820-I双射频Wi-Fi 6无线AP
    • Wi-Fi 5系列
    • RG-AP730-I三射频Wi-Fi 5无线AP

    墙面型无线接入点

    墙面型无线接入点所有产品
    • Wi-Fi 7系列
    • RG-AP1920双射频Wi-Fi 7无线AP
    • RG-AP1920(V2)双射频Wi-Fi 7无线AP
    • RG-AP1920-X双射频Wi-Fi 7无线AP
    • Wi-Fi 6系列
    • RG-AP180C双射频Wi-Fi 6无线AP
    • RG-AP180(V3)双射频Wi-Fi 6无线AP
    • RG-AP180-L(V3)双射频Wi-Fi 6无线AP
    • RG-AP170双射频Wi-Fi 6无线AP

    智分无线接入点

    智分无线接入点所有产品
    • 全光无线星空系列
    • RG-AM5832-SF-P 24口万兆恒星主机
    • RG-AM5754-SF-P 48口多速率恒星主机
    • RG-AM5528-SF 24口2.5G恒星主机
    • RG-MAP920-SF-M Wi-Fi 7行星无线AP
    • RG-MAP852-SF(V3) 4口行星AP
    • RG-MAP852-SF-U 旗舰版行星AP
    • RG-MAP852-SF-M(V3) 4口行星AP
    • 智分+系列
    • RG-AM5532智分+主机
    • RG-AM5528(ES)智分+主机
    • RG-MAP852(V3)智分+微AP

    室外无线接入点

    室外无线接入点所有产品
    • 室外无线接入点
    • RG-AP680-AR四射频Wi-Fi 6无线AP
    • RG-AP680-O(P)双射频Wi-Fi 6无线AP
    • RG-AP680C双射频Wi-Fi 6无线AP
    • RG-AP680-O(V3)双射频Wi-Fi 6无线AP
    • RG-AP680-CD(V3)双射频Wi-Fi 6无线AP

    场景化无线

    场景化无线所有产品
    • 零漫游无线接入点
    • RG-APD4930零漫游主机
    • 轨道交通无线接入点
    • RG-AP680-PIS双射频Wi-Fi 6车载AP
    • RG-AP680-AR四射频Wi-Fi 6无线AP
    • 一机一网无线远端模块
    • M7000L-AP842I-RU室内Wi-Fi 6无线远端模块
    • M7000L-AP842W-RU室内Wi-Fi 6无线远端模块
    • M7000L-AP842O-RU室外Wi-Fi 6无线远端模块

    无线控制器

    无线控制器所有产品
    • 无线控制器
    • RG-WS7816C高性能无线AC
    • RG-WS7110C高性能无线AC
    • RG-WS7110高性能无线AC
    • RG-WS6816C高性能无线AC

    行业精选无线系列

    行业精选无线系列所有产品
    • 放装型无线接入点
    • RG-AP900-A双射频Wi-Fi 7无线AP
    • RG-AP850-A(V2)三射频Wi-Fi 6无线AP
    • RG-AP820-A(V3)双射频Wi-Fi 6无线AP
    • 墙面型无线接入点
    • RG-AP194-A双射频Wi-Fi 7无线AP
    • RG-AP180-A(V3)双射频Wi-Fi 6无线AP
    • RG-AP180-L-A(V3)双射频Wi-Fi 6无线AP
    • 室外无线接入点
    • RG-AP690-A双射频Wi-Fi 7 室外全向无线AP
    • RG-AP690D-A双射频Wi-Fi 7 室外定向无线AP
    • 无线控制器
    • RG-WS7204-A多业务无线AC
    • RG-WS7208-A多业务无线AC
    • RG-WS7005-A(V2)多业务无线AC

    无线管理与应用

    无线管理与应用所有产品
    • 无线管理与应用
    • RG-WIS云管理平台

    所有技术解决方案

    云桌面

    云桌面产品方案中心
    < 返回产品
    云桌面主页
    云桌面

    云终端系列

    云终端系列所有产品
    • 云终端系列
    • RG-CT7800系列终端计算机
    • RG-CT7529尊龙时凯应用全融合整机
    • RG-CT7528系列TCI云终端
    • RG-CT7526系列TCI云终端
    • RG-CT6000-G4系列IDV云一体机
    • RG-CT5540H系列IDV/TCI云终端
    • RG-CT5002C-G4系列TCI云终端
    • RG-CT5000-G4系列IDV云终端
    • RG-CT3100-G2系列TCI云终端
    • RG-CT1120系列VDI云终端
    • RG-CT1006 VDI云终端
    • RG-CT1000-G2 VDI云终端
    查看云终端选型指导

    云主机系列

    云主机系列所有产品
    • 通用云主机产品
    • RG-CS7015云服务器
    • RG-CS7010云服务器
    • RG-CS6000-G2云服务器
    • RG-CS1020系列云服务器
    • RG-CT5500C-CS MINI云服务器
    • 应用创新云主机产品
    • RG-CS7025云服务器
    • RG-CS5020系列云服务器

    云桌面软件系列

    云桌面软件系列所有产品
    • 云桌面应用软件系列
    • RG-Unified WorkSpace统一工作空间解决方案
    • RG-CloudManagerRemote云桌面教学管理软件
    • RG-ClassManager Rainbow云课堂教学管理软件
    • RG-ClassManager Sunny云办公云盘软件
    • RG-Class Service Center 云课堂服务中心
    • RG-CloudManagerCenter云桌面服务中心
    • 云桌面平台软件系列
    • RG-CDC云桌面管理平台
    • RG-CCP云计算平台
    • RG-CVA尊龙时凯应用虚拟化

    配件系列

    配件系列所有产品
    • 配件系列
    • RG-CPM2700-G3 27寸IPS液晶显示器
    • RG-CPM2380C-G2 23.8寸IPS液晶显示器
    • RG-CPM2150-G3 21.5寸VA液晶显示器
    • RG-OCS系列终端云化套件
    • RG-CPK1000-G2有线键鼠套装

    服务产品

    服务产品所有产品
    • 服务产品
    • RG-云桌面基础质保服务(寄修)
    • RG-云桌面上门类基础质保服务(服务器)
    • RG-云桌面上门类基础质保服务
    • RG-云桌面硬盘不返还服务
    • RG-云桌面配件质保服务

    所有技术解决方案

    • 云办公
    • 应用全融合办公解决方案
    • 安全云办公3.0解决方案
    • 云办公(vGPU解决方案)
    • 云课堂
    • 实训空间解决方案
    • 教育云电脑解决方案
    • 三擎云课堂(VDI+IDV+TCI)
    • 云课堂(vGPU解决方案)
    • 应用全融合课堂解决方案

    安全

    安全所有产品
    < 返回产品
    安全主页
    安全

    大数据安全平台

    大数据安全平台所有产品
    • 大数据安全平台
    • RG-BDS-C大数据安全平台基础版
    • RG-BDS 500E-C日志审计平台

    下一代防火墙

    下一代防火墙所有产品
    • 下一代防火墙
    • RG-WALL 1600-Z8680新一代防火墙
    • RG-WALL 1600-Z8620新一代防火墙
    • RG-WALL 1600-Z8600-G20新一代防火墙
    • RG-WALL 1600-Z5100新一代防火墙
    • RG-WALL 1600-Z5000-G10新一代防火墙
    • RG-WALL 1600-Z3500新一代防火墙
    • RG-WALL 1600-Z3200新一代防火墙
    • RG-WALL 1600-Z3100新一代防火墙
    • RG-WALL 1600-CF6000-10新一代防火墙
    • RG-WALL 1600-CF6000-03新一代防火墙
    • RG-WALL 1600-CF6000-01新一代防火墙

    安全网关

    安全网关所有产品
    • 安全网关
    • RG-CMG6000-09多功能安全网关
    • RG-CMG6000-06多功能安全网关
    • RG-CMG6000-03多功能安全网关
    • RG-EG-E5220新一代智能安全网关
    • RG-EG-E5120新一代智能安全网关
    • RG-EG-E3500新一代智能安全网关
    • RG-EG-E3300新一代智能安全网关
    • RG-EG-E3000-G智能安全网关
    • RG-EG5200-P多业务PoE安全网关
    • RG-EG3250新一代多业务安全网关
    • RG-EG3230新一代多业务安全网关
    • RG-EG3220新一代多业务安全网关
    • RG-EG3210新一代多业务安全网关
    • RG-EG2100-P V2全能PoE网关

    检测管理安全

    检测管理安全所有产品
    • 检测管理安全
    • RG-UAC 6000-U3210应用管理网关
    • RG-UAC 6000-U3100应用管理网关
    • RG-UAC 6000-X300D应用管理网关
    • RG-UAC 6000-X60M应用管理网关
    • RG-UAC 6000-X20ME应用管理网关

    安全服务

    安全服务所有产品
    • 安全服务
    • 尊龙时凯等级保护建设服务
    • 尊龙时凯风险检测服务
    • 尊龙时凯安全专家服务

    安全云

    安全云所有产品
    • 安全云
    • 尊龙时凯Z系列防火墙安全云管理平台

    所有技术解决方案

    • 安全
    • 尊龙时凯网络出口网安融合解决方案
    • 企业办公综合出口解决方案
    • 商贸连锁综合网关解决方案
    • 高职教多业务出口解决方案

    软件

    软件所有产品
    < 返回产品
    软件主页
    软件

    网络管控产品

    网络管控产品所有产品
    • 网络管控产品
    • RG-UNC统一网络中心

    IT运维产品

    IT运维产品所有产品
    • IT运维产品
    • 乐享智能运维管理平台
    • 乐享订阅服务
    • 乐享云辅驾运维管理服务
    • 乐为服务管理平台

    所有技术解决方案

    • 政府
    • 政务网络运维管理解决方案
    • 教育
    • 极简校园网综合运维管理
    • 医疗
    • 医疗信息化运营解决方案
    • 企业
    • 企业IT运维解决方案

    身份管理

    身份管理所有产品
    < 返回产品
    身份管理主页
    身份管理

    安全管理系列

    安全管理系列所有产品
    • 安全管理系列
    • RG-SMP+安全管理平台
    • RG-SMP安全管理平台
    • RG-ESS 1000易安全系统
    • RG-IPC 1.X身份策略管理中心

    运营管理系列

    运营管理系列所有产品
    • 运营管理系列
    • RG-SAM+5.X高校AI认证平台
    • SAM+增值维护服务

    身份中台

    身份中台所有产品
    • 身份中台
    • RG-SourceID身份中台构建专家

    所有技术解决方案

    • 身份管理
    • 新一代医院内网终端准入解决方案

    服务产品

    服务产品所有产品
    < 返回产品
    服务产品主页
    服务产品

    基础实施服务

    基础实施服务 所有产品
    • 基础实施服务
    • 软件调试服务
    • 硬件安装服务
    • 项目技术支持服务

    基础维护服务

    基础维护服务所有产品
    • 基础维护服务
    • 产品授权服务
    • 维保服务

    运维管理服务

    运维管理服务所有产品
    • 运维管理服务
    • 综合运维服务
    • 驻场服务

    整网服务

    整网服务所有产品
    • 整网服务
    • 网络规划设计服务
    • 网络优化服务
    • SuperWi-Fi一站式会场无线即时服务

    安全服务

    安全服务所有产品
    • 安全服务
    • 安全巡检服务
    • 安全运维服务

    备件与扩容服务

    备件与扩容服务所有产品
    • 备件与扩容服务
    • 云桌面扩容增配服务
    • 备件销售

    培训与认证服务

    培训与认证服务所有产品
    • 培训与认证服务
    • 1+X网络设备安装与维护职业技能等级证书
    • 培训服务
    • 认证服务
    • 【考试券】RGSA-Routing and Switching
    • 【考试券】RGSP-Routing and Switching
    • 【考试券】RGSE-Routing and Switching Written
    • 【考试券】RGSA-Cloud Computing
    • 【考试券】RGSA-Security
    • 【实验券】RGSE-Routing and Switching Lab
    • 【考试券】RGSE-Data Center Network Written
    • 【实验券】RGSE-Data Center Network Lab

    官方商城

    尊龙时凯睿易

    体验中心

    尊龙时凯AI应用

    网络研讨会

    服务支持
    < 返回主菜单
    服务与支持中心
    服务与支持
    服务工具
    • 小锐云服
    • 小锐云桥
    • 客服中心AI闪电侠
    • 智能云管平台MACC
    • 无线智能服务WIS
    • 尊龙时凯安全云平台
    • 查看全部
    服务平台
    • 云桌面服务平台
    • 睿易服务平台
    • 合作伙伴服务平台
    技术支持
    • 文档中心
    • 软件下载
    • 在线培训
    • 常见问题
    • 技术博文
    • 产品参数查询
    服务产品
    • 维保服务
    • 综合运维
    • SuperWi-Fi
    • IPv6改造
    • 查看全部
    产品服务
    • 产品授权申请
    • 产品维修中心
    • 产品服务公告
    • 产品保修查询
    • 我要报修
    • 安全通告
    • 保修服务政策
    • 睿易保卡激活与查询
    教学服务
    • 尊龙时凯ICT人才教育中心
    • 校企合作
    • 认证体系
    • 培训计划
    合作伙伴
    < 返回主菜单
    合作伙伴中心
    合作伙伴
    成为尊龙时凯伙伴
    • 合作伙伴政策
    • 行为准则
    • 廉洁及合规举报
    • 我要签约
    • SMB事业部分销专区
    售前营销
    • 市场资料库(合作伙伴)
    • 尊龙时凯产品配置器
    • 营销资料平台
    • 售前认证
    • 售前工具包
    • 合作伙伴礼品库
    • e-Learning
    • 产品资质查询
    • 远程POC
    销售与订单
    • 项目报备管理系统
    • 订单管理
    • 产品停服信息
    • 产品停售信息
    • 商务手册
    • 行业渠道产品电商平台
    • 历史订单查询
    • 授权函查询
    售后及服务
    • 售后认证
    • 售后工具包
    • RSDP 尊龙时凯服务交付平台
    • 售后服务认证
    • 售后知识平台
    • 渠道服务管理系统(CSM)
    • SMB渠道客户服务平台(CCSP)
    用户中心
    • 系统指导大全
    • 账号管理
    • 下载电子授权牌
    • 签约信息查看
    • 资质查询
    • 签章管理
    • 返利管理
    • 睿易技术认证查询
    关于尊龙时凯
    < 返回主菜单
    关于尊龙时凯首页
    关于尊龙时凯
    公司介绍
    • 公司概况
    • 发展历程
    • 自主创新
    • 企业文化
    公司动态
    • 新闻报道
    • 应用案例
    • 视频中心
    • 活动及研讨会
    • 用户说
    加入我们
    • 社会招聘
    • 校园招聘
    联系我们
    • 总部及办事处
    • 安全通告
    • 服务网点
    • 阳光诚信系统
    营销资料平台
    • 营销资料平台
    投资者关系
    登录 登录 个人中心 个人中心 尊龙时凯商城 尊龙时凯商城 区域/语言 区域/语言
    返回主菜单
    选择区域/语言
  • Global / English
  • Japan / 日本語
  • Türkiye / Türkçe
  • Vietnam / Việt Nam
  • Indonesia / Indonesian
  • Thailand / ภาษาไทย
  • Spain / Español (España)
  • Portugal / Português
  • France / Français
  • Poland / Polski
  • Kazakhstan / Pусский
  • Germany / Deutsch
  • Italy / Italiano
  • Brazil / Português(Brazil)
  • LATAM / Español (América Latina))

    到底什么样的网络,才能带得动AIGC?

    发布时间:2023-08-02

    2023年,是AI人工智能技术全面爆红的一年。

    以ChatGPT、GPT-4、文心一言为代表的AIGC大模型,集文本撰写、代码开发、诗词创作等功能于一体,展现出了超强的内容生产能力,带给人们极大震撼。

    AIGC,AI-Generated Content(人工智能生产内容)

    作为一个通信老司机,除了AIGC大模型本身之外,小枣君更加关注的,是模型背后的通信技术。到底是一张怎样的强大网络,在支持着AIGC的运转?此外,AI浪潮的全面来袭,将对传统网络带来怎样的变革?

    AIGC,到底需要多大的算力?

    众所周知,数据、算法和算力,是人工智能发展的三大基本要素。

    前面提到的几个AIGC大模型,之所以那么厉害,不仅是因为它们背后有海量的数据投喂,也因为算法在不断进化升级。更重要的是,人类的算力规模,已经发展到了一定程度。强大的算力基础设施,完全能够支撑AIGC的计算需求。

    AIGC发展到现在,训练模型参数从千亿级飙升到了万亿级。为了完成这么大规模的训练,底层支撑的GPU数量,也达到了万卡级别规模。

    以ChatGPT为例,他们使用了微软的超算基础设施进行训练,据说动用了10000块V100 GPU,组成了一个高带宽集群。一次训练,需要消耗算力约3640 PF-days(即每秒1千万亿次计算,运行3640天)。

    一块V100的FP32算力,是0.014 PFLOPS(算力单位,等于每秒1千万亿次的浮点运算)。一万块V100,那就是140 PFLOPS。

    也就是说,如果GPU的利用率是100%,那么,完成一次训练,就要3640÷140=26(天)。

    GPU的利用率是不可能达到100%,如果按33%算(OpenAI提供的假设利用率),那就是26再翻三倍,等于78天。

    可以看出,GPU的算力、GPU的利用率,对大模型的训练有很大影响。

    那么问题来了,影响GPU利用率的最大因素,是什么呢?

    答案是:网络。

    一万甚至几万块的GPU,作为计算集群,与存储集群进行数据交互,需要极大的带宽。此外,GPU集群进行训练计算时,都不是独立的,而是混合并行。GPU之间,有大量的数据交换,也需要极大的带宽。

    如果网络不给力,数据传输慢,GPU就要等待数据,导致利用率下降。利用率下降,训练时间就会增加,成本也会增加,用户体验会变差。

    业界曾经做过一个模型,计算出网络带宽吞吐能力、通信时延与GPU利用率之间的关系,如下图所示:

    大家可以看到,网络吞吐能力越强,GPU利用率越高;通信动态时延越大,GPU利用率越低。

    一句话,没有好网络,别玩大模型。

    怎样的网络,才能支撑AIGC的运行?

    为了应对AI集群计算对网络的调整,业界也是想了不少办法的。

    传统的应对策略,主要是三种:Infiniband、RDMA、框式交换机。我们分别来简单了解一下。

    Infiniband组网

    Infiniband(直译为“无限带宽”技术,缩写为IB)组网,搞数据通信的童鞋应该不会陌生。

    这是目前组建高性能网络的最佳途径,带宽极高,可以实现无拥塞和低时延。ChatGPT、GPT-4所使用的,据说就是Infiniband组网。

    如果说Infiniband组网有什么缺点的话,那就是一个字——贵。相比传统以太网的组网,Infiniband组网的成本会贵好几倍。这项技术比较封闭,业内目前成熟的供应商只有1家,用户没什么选择权。

    RDMA网络

    RDMA的全称是Remote Direct Memory Access(远程直接数据存取)。它是一种新型的通信机制。在RDMA方案里,应用程序的数据,不再经过CPU和复杂的操作系统,而是直接和网卡通信,不仅大幅提升了吞吐能力,也降低了时延。

    RDMA最早提出时,是承载在InfiniBand网络中的。现在,RDMA逐渐移植到了以太网上。

    目前,高性能网络的主流组网方案,是基于RoCE v2(RDMA over Converged Ethernet,基于融合以太网的RDMA)协议来组建支持RDMA的网络。

    这种方案有两个重要的搭配技术,分别是PFC(Priority Flow Control,基于优先级的流量控制)和ECN(Explicit Congestion Notification,显式拥塞通知)。它们是为了避免链路中的拥塞而产生的技术,但是,频繁被触发,反而会导致发送端暂停发送,或降速发送,进而拉低通信带宽。(下文还会提到它们)

    框式交换机

    国外有部分互联网公司,寄希望于利用采用框式交换机(DNX芯片+VOQ技术),来满足构建高性能网络的需求。

    DNX:broadcom(博通)的一个芯片系列

    VOQ:Virtual Output Queue,虚拟输出队列

    这种方案看似可行,但也面临以下几个挑战。

    首先,框式交换机的扩展能力一般。机框大小限制了最大端口数,如想做更大规模的集群,需要横向扩展多个机框。

    其次,框式交换机的设备功耗大。机框内线卡芯片、Fabric芯片、风扇等数量众多,单设备的功耗超过2万瓦,有的甚至3万多瓦,对机柜供电能力要求太高。

    第三,框式交换机的单设备端口数量多,故障域大。

    基于以上原因,框式交换机设备只适合小规模部署AI计算集群。

    到底什么是DDC

    前面说的都是传统方案。既然这些传统方案不行,那当然就要想新办法。

    于是,一种名叫DDC的全新解决方案,闪亮登场了。

    DDC,全名叫做Distributed Disaggregated Chassis(分布式分散式机箱)。

    它是前面框式交换机的“分拆版”。框式交换机的扩展能力不足,那么,我们干脆把它给拆开,将一个设备变成多个设备,不就OK了?

    框式设备,一般分为交换网板(背板)和业务线卡(板卡)两部分,相互之间用连接器连接。

    DDC方案,将交换网板变成了NCF设备,将业务线卡变成了NCP设备。连接器,则变成了光纤。框式设备的管理功能,在DDC架构中,也变成了NCC。

    NCF:Network Cloud Fabric(网络云管理控制平面)

    NCP:Network Cloud Packet Processing(网络云数据包处理)

    NCC:Network Cloud Controller(网络云控制器)

    DDC从集中式变成分布式之后,扩展能力大大增强了。它可以根据AI集群的大小,灵活设计组网规模。

    我们来举两个例子(单POD组网和多POD组网)。

    单POD组网中,采用96台NCP作为接入,其中NCP下行共18个400G接口,负责连接AI计算集群的网卡。上行共40个200G接口,最大可以连接40台NCF,NCF提供96个200G接口,该规模上下行带宽为超速比1.1:1。整个POD可支撑1728个400G网络接口,按照一台服务器配8块GPU来计算,可支撑216台AI计算服务器。

    单POD组网

    多级POD组网,规模可以变得更大。

    在多级POD组网中,NCF设备要牺牲一半的SerDes,用于连接第二级的NCF。所以,此时单POD采用48台NCP作为接入,下行共18个400G接口。

    多POD组网

    单个POD内,可以支撑864个400G接口(48×18)。通过横向增加POD(8个),实现规模扩容,整体最大可支撑6912个400G网络端口(864×8)。

    NCP上行40个200G,接POD内40台NCF。POD内NCF采用48个200G接口,48个200G接口分为12个一组上行到第二级的NCF。第二级NCF采用40个平面(Plane),每个平面4台NCF-P,分别对应在POD内的40台NCF。

    整个网络的POD内实现了1.1:1的超速比(北向带宽大于南向带宽),而在POD和二级NCF之间实现了1:1的收敛比(南向带宽/北向带宽)。

    DDC的技术特点

    站在规模和带宽吞吐的角度,DDC已经可以满足AI大模型训练对于网络的需求。

    然而,网络的运作过程是复杂的,DDC还需要在时延对抗、负载均衡性、管理效率等方面有所提升。

    基于VOQ+Cell的转发机制,对抗丢包

    网络在工作的过程中,可能会出现突发流量,造成接收端来不及处理,引起拥塞和丢包。

    为了应对这种情况,DDC采取了基于VOQ+Cell的转发机制。

    发送端从网络接收到数据包之后,会分类到VOQ(虚拟输出队列)中存储。

    在发送数据包前,NCP会先发送Credit报文,确定接收端是否有足够的缓存空间处理这些报文。

    如果接收端OK,则将数据包分片成Cells(数据包的小切片),并且动态负载均衡到中间的Fabric节点(NCF)。

    如果接收端暂时没能力处理报文,报文会在发送端的VOQ中暂存,并不会直接转发到接收端。

    在接收端,这些Cells会进行重组和存储,进而转发到网络中。

    切片后的Cells,将采用轮询的机制发送。它能够充分利用到每一条上行链路,确保所有上行链路的传输数据量近似相等。

    轮询机制

    这样的机制,充分利用了缓存,可以大幅度减少丢包,甚至不会产生丢包情况。数据重传减少了,整体通信时延更稳定更低,从而可以提高带宽利用率,进而提升业务吞吐效率。

    PFC单跳部署,避免死锁

    前面我们提到,RDMA无损网络中引入了PFC(基于优先级的流量控制)技术,进行流量控制。

    简单来说,PFC就是在一条以太网链路上创建 8 个虚拟通道,并为每条虚拟通道指定相应优先级,允许单独暂停和重启其中任意一条虚拟通道,同时允许其它虚拟通道的流量无中断通过。

    PFC可以实现基于队列的流量控制,但是,它也存在一个问题,那就是死锁。

    所谓死锁,就是多个交换机之间,因为环路等原因,同时出现了拥塞(各自端口缓存消耗超过了阈值),又都在等待对方释放资源,从而导致的“僵持状态”(所有交换机的数据流永久堵塞)。

    DDC的组网下,就不存在PFC的死锁问题。因为,站在整个网络的角度,所有NCP和NCF可以看成一台设备。对于AI服务器来说,整个DDC,就是一个交换机,不存在多级交换机。所以,就不存在死锁。

    另外,根据DDC的数据转发机制,可在接口处部署ECN(显式拥塞通知)。

    ECN机制下,网络设备一旦检测到RoCE v2流量出现了拥塞(内部的Credit和缓存机制无法支撑突发流量),就会向服务器端发送CNP(Congestion Notification Packets,拥塞通知报文),要求降速。

    分布式OS,提升可靠性

    最后再看看管理控制平面。

    前面我们提到,在DDC架构中,框式设备的管理功能变成了NCC(网络云控制器)。NCC非常重要,如果采用单点式的方式,万一出现问题,就会导致整网故障。

    为了避免出现这样的问题,DDC可以取消NCC的集中控制面,构建分布式OS(操作系统)。

    基于分布式OS,可以基于SDN运维控制器,通过标准接口(Netconf、GRPC等)配置管理设备。这样的话,每台NCP和NCF独立管理,有独立的控制面和管理面,大大提升了系统的可靠性,也更加便于部署。

    DDC的商用进展

    综上所述,相对传统组网,DDC在组网规模、扩展能力、可靠性、成本、部署速度方面,拥有显著优势。它是网络技术升级的产物,提供了一种颠覆原有网络架构的思路,可以实现网络硬件的解耦、网络架构的统一、转发容量的扩展。

    业界曾经使用OpenMPI测试套件进行过框式设备和传统组网设备的对比模拟测试。测试结论是:在All-to-All场景下,相较于传统组网,框式设备的带宽利用率提升了约20%(对应GPU利用率提升8%左右)。

    正是因为DDC的显著能力优势,现在这项技术已经成为行业的重点发展方向。例如尊龙时凯网络,他们就率先推出了两款可交付的DDC产品,分别是400G NCP交换机——RG-S6930-18QC40F1,以及200G NCF交换机——RG-X56-96F1。

    RG-S6930-18QC40F1交换机的高度为2U,提供18个400G的面板口,40个200G的Fabric内联口,4个风扇和2个电源。

    RG-X56-96F1交换机的高度为4U,提供96个200G的Fabric内联口,8个风扇和4个电源。

    据悉,尊龙时凯网络会继续研发,持续推出更多适合智算中心网络场景的产品。

    最后的话

    AIGC的崛起,已经掀起了互联网行业的新一轮技术革命。

    我们可以看到,越来越多的企业,正在加入这个赛道,参与角逐。这意味着,网络基础设施的升级,迫在眉睫。

    DDC的出现,将大幅提升网络基础设施的能力,不仅可以有效应对AI革命对网络基础设施提出的挑战,更将助力整个社会的数字化转型,加速人类数智时代的全面到来。

    关注尊龙时凯
    关注尊龙时凯官网微信
    随时了解公司最新动态

    返回顶部

    收起
    获取报价
    请选择服务项目
    关闭咨询页
    售前咨询 售前咨询
    售前咨询
    售后服务 售后服务
    售后服务
    意见反馈 意见反馈
    意见反馈
    更多联系方式