GB200:关注铜缆、PCB、组装等环节边际变化
当地时间 3 月 18 日,英伟达 GTC(GPU Technology Conference)大会正式开幕,发布了新一代 AI 芯片 GB200。GB200 是由两块 Blackwell B200 GPU 和一块 Grace CPU 组成的芯片。其中 Blackwell B200 并不是传统意义上的单一 GPU,它由两个紧密耦合的芯片组成,通过 10 TB/s NV-HBI(英伟达高带宽接口)连接进行连接,作为单个芯片正常运行。GB200 算力性能大幅提升,能耗成本大幅降低。一方面,GB200 推理大语言模型性能比 H100 提升 30 倍;另一方面,过去训练一个 1.8 万亿参数的模型需要 8000 个 Hopper GPU 和 15 兆瓦的电力,如今 2000 个 Blackwell GPU 就足够完成,耗电量仅为 4 兆瓦。
GB200 NVL72机柜的几点变化在于采用铜缆达到 GPU与 NVLink之间的互联、NVLink Switch Tray 有望采用 HDI 方案以及组装环节格局的收敛。从 GTC 发布产品不难看出,这次直观感受到铜缆的用量大幅提升且是英伟达发布会重点提示的部分,本篇报告的重点也在于此,后文将重点探讨铜缆行业发展以及产业链情况。另外两点变化在于:1)此次 NVL72 架构的变化导致过去应用在 DGX 系列服务器中的传统 UBB 的消失,过去 UBB 采用多层板 PCB 方案,而新增 NVLink Switch Tray 有望采用 HDI 方案;2)NVL72 在售价及算力性能方面天然是针对需要迭代大模型的 IT 大厂准备的,因此此次 GB200 意向客户群体主要为云厂商,也就意味着云服务商配套的组装厂有望在 GB200 组装环节获得更多份额,此外我们判断 NVL72 的组装难度也会随着内部设计复杂度提升而加大,进一步使得组装环节格局收敛在头部组装厂。
GB200 NVL72:由 18 个计算 Tray 和 9 个 NvlinkSwitch Tray构成
NVIDIA GB200 NVL72是一款多节点、液冷的机架级系统,适用于计算密集型工作负载,GB200 是其中的关键组件。该系统拥有 36 个 GB200 Superchip,其中包括 72个Blackwell GPU 和 36 个 Grace CPU,它们通过第五代 NVLink互连。
➢ 该系统由 18 个 Compute Tray 和 9 个 Switch Tray两部分构成。
➢ 一个 Compute Tray 包含两个 GB200 Superchip,共计 4 颗 Blackwell GPU。
➢ 一个 Switch Tray 包含两个 Nvlink Switch 芯片,总带宽达到 14.4TB/s,即 1.8TB/s*8。
计算 Tray:由 2 个 GB200 超级芯片组成
具体来看,一个 GB200 超级芯片包含一颗 Grace 72 核的 ARM CPU 和 2 颗BlackwellGPU。不同于以往强调单芯片的性能表现,此次英伟达发布的 Blackwell系列更加注重系统的性能,GPU 代号统称为“Blackwell GPU”。
➢ Blackwell 架构的 GPU 集成了 2080 亿颗晶体管,采用台积电的 4NP工艺,作为由两个受光刻模板限制的 GPU die 连接在一块形成的“拼接芯片”,其两个 die之间的互联采用 10TB/s 的 NVHyperfuse接口。
➢ Blackwell 的又一关键改进在于引入了支持 FP4 和 FP6精度浮点运算,能够大幅提升在推理端的性能表现。
➢ 第五代 NVLink 为 GPU 提供每秒 1.8TB 的双向带宽,最多支持 576 个 GPU相互通信。
➢ Blackwell GPU 的高可靠、可用性和可服务性(RAS)引擎有助于提升系统的正常运行时间,降低运维成本,通过基于 AI的智能恢复能力来对可能出现的故障做出诊断和预测,从而减少停机时间延长系统持续正常运行的时间,可以节约时间、能源和计算成本。
➢ 此次 Blackwell GPU 的意向客户包括 AWS、戴尔、谷歌、Meta、微软、OpenAI、甲骨文、特斯拉、xAI 等厂商,相较于上一代 GH200 产品,GB200凭借高性价比优势意向客户数量大幅增长。
铜缆在 GB200 中的应用
新架构新方案,关注当前高速铜缆互联。据 GTC 发布会信息,英伟达GB200 NVLinkSwitch 和 Spine 由 72 个 Blackwell GPU 采用 NVLink 全互连,具有 5000 根 NVLink铜缆(合计长度超 2 英里)。英伟达官网对以太网 DAC铜缆产品的优势描述包括:成本最低的高速互联、功耗和延迟接近零、高度可靠无电子或光学连接器。
单颗 Blackwell 芯片具有 18 个 Port,每个 Port 对应 4 条差分信号线。考虑到 Blackwell芯片采用的是 224G Serdes,单个 sub-link 由 4 个差分对构成,意味着单个 sub-link传输速率为 200Gbps*4/8=100GB/s ,每个 B200 芯片具有 18 个 sub-link,合计100GB/s*18=1.8TB/s 带宽,从网络角度看相当于 9 个单向 400Gbps的接口。
根据 GB200 NVL72 的系统网络拓扑图,每颗 B200 芯片均需要和 NVSwitch互联,从而达到 B200 芯片相互通信的效果,由此可以计算出 GB200 NVL72所需的外部线缆中差分对的数量及价值量。
除了机柜外部的高速铜缆 DAC 外,在 NVSwitch 内部亦有大量应用,即图 10 中的蓝色线部分,在单个 NVLink 芯片周围共有 4 个铜缆 port,单个 port上连接大量铜缆。当然,除了高速铜缆 DAC 外,在计算节点内部也会存在大量高速跳线(overpass),减少信号从芯片近端口传输到外部端口时的损耗。
行业发展:DAC胜在短距成本,工艺难度伴随速率提升
种类:外部采用 DAC 高速铜缆,内部采用Overpass高速跳线
高速铜缆在计算、存储、通信领域应用多年,主要起到连接不同设备 I/O接口实现设备之间高速电信号传输互联互通的功能。从产品物理形态来看,高速铜缆为了实现高速差分信号传输,从过去的单芯同轴电缆(Coaxial cable)往双芯同轴电缆(Twinax cable)演变,而非双绞线的结构。双芯同轴电缆根据地线分布设计又可以分为单地线和双地线两种,单地线一般位于两根绝缘芯片的中间位置,双地线则分布在绝缘芯线两侧位置。
高速铜缆根据有源、无源可以分为 DAC(无源铜缆)、ACC(有源铜缆)、AEC(有源电缆)。ACC(有源铜缆)相比较 DAC(无源铜缆)而言主要为了弥补传输距离短的劣势,其在线缆 Rx 端加入线性 Redriver对信号均衡和整形中继从而延长铜缆的传输距离。而 AEC(有源电缆)则是在 ACC(有源铜缆)基础上演变而来,由 HiWire联盟发布标准,AEC 通过在线缆两端引入 CDR(时钟数据恢复)对电信号 Retimer(重新定时)和重新驱动,补偿铜缆损耗能力更强从而达到比 ACC更长的传输距离,过程中不涉及电-光-电转换。
在服务器系统外部短距离连接方面,高速铜缆 DAC 相比 AOC,其天然的稳定性优势和成本优势对数据中心内整体网络的稳定性和成本的影响是非常显著的。在接入层,可以多使用 DAC 这种更简单、更稳定、更低成本的硬件。
在服务器系统内部主要使用高速跳线(Overpass),以安费诺的产品方案为例,其高速跳线方案可以实现 CPU 或 ASIC 附近高速信号与系统任意位置的高速信号传输,ASIC发出高速信号后立即传输到双同轴电缆。在数据中心架构中,数据传输路径为从交换机通过高速电缆传输到服务器的外部端口(如 QSFP/SFP/QSFP-DD等),再通过高速跳线(Overpass)从外部端口传输至服务器内部的 PCB 板上芯片附近的端口(如SlimSAS/Mini Cool Edge/ExtremePort Flash等),从而实现信号高速传输,可以避免通过PCB 传输带来的损耗。
高速铜缆 DAC VS 有源光缆 AOC
在结构方面,高速铜缆没有激光器等昂贵元器件。高速铜缆的主要构成是镀银导体和发泡绝缘芯线,两端的连接器模块内没有激光器等昂贵电子元件,主要为铁壳、PCB、线扣、弹簧、铜箔等。因此在其所能覆盖的短距离传输范围中使用具备明显的成本和功耗优势,可以作为光模块的低成本替换方案。
在应用场景上,高速铜缆适用于传输距离较短的场景。由于高速铜缆在不同传输速率下都有着较为明显传输距离限制,如在 112G 的单通道传输速率下,DAC、ACC、AEC的最大传输距离分别为 2m、3m、5m。因此高速铜缆过去的应用多在同一机架内交换机、服务器、存储单元之间的连接,机架之间的连接多用 AOC光缆。
在市场规模方面,高速铜缆市场 2023-2027 年复合增速约 25%,27 年市场突破 12 亿美元。根据 LightCounting 预计全球市场 AOC 和铜缆 2023 年至 2027年的复合增长率分别为 14%、25%;预计 2027 年数通市场的 AOC 和铜缆的年出货量有望达到1000万、2000 万套(不包括工业和消费类应用电缆),AEC的出现也将加快铜缆的出货增长。
产业链:海外三巨头 AMT,国内供应商多配套
2022 年全球高速铜缆 DAC 市场前十强占有大约 69.0%的市场份额,其中安费诺市场份额最大。全球范围内高速铜缆 DAC 生产商主要包括 Amphenol Corporation、Molex、TE Connectivity、Juniper Networks、Volex、Nvidia CORPORATION、Panduit、Proterial,Ltd、JPC Connectivity、Luxshare Precision Industry Co., LTD等。
美国安费诺集团创立于 1932 年,在全球属于 TOP2 的连接器品牌商。安费诺公司的总部位于美国康涅狄格州,积极在全球各地实施本地化战略,安费诺在全球一共设立了超过 100 家工厂/办事处,为各个地区客户提供产品以及本地化服务,安费诺在中国设立的事业部超过 50 家。2023年,安费诺公司营业收入中工业、汽车、数通市场收入占比分别为 25%、23%、19%,数通市场收入约 23.8 亿美元,公司在亚洲收入占比约 38%,即 47.7亿美元。
国内高速线缆相关公司主要为立讯精密、兆龙互联、金信诺、电连技术等,但是在全球市场占有率仍较低,国内也有部分公司给如安费诺、莫仕、泰科等海外大厂做上游配套,如外部高速线供应商沃尔核材、内部高速线材玩家新亚电子以及镀银导体参与者恒丰特导,此外在连接器及组件方面也不乏优质玩家如鼎通科技、奕东电子等。此次英伟达GB200 NVL72机柜作为数据中心内部含铜量提升的重要推手,未来高速铜缆在数据中心内部应用有望伴随 GB200放量而加速,国内供应商以及相关配套厂商有望享受行业增长红利,看好高速铜缆全产业链发展机遇。
此为报告精编节选,报告PDF原文:
《电子设备-电子元件行业GB200铜缆行业深度:新架构新方案,高速铜互联产业发展加速-长江证券[杨洋,蔡少东,范超]-20240511【23页】》
报告来源:【价值目录】