在拉斯维加斯CES大展上,英伟达一口气推出三款GeForce RTX 40 SUPER系列显卡,向消费级市场发起一阵猛冲。这一系列专为AI PC设计,可驱动笔记本电脑、台式电脑,图像生成速度比上一代产品提升170%。
英伟达GeForce高级副总裁Jeff Fisher特别强调,英伟达的RTX笔记本电脑平台,过去四年增长五倍,增速业内第一。
生成式AI是技术发展的一大拐点,英伟达无可争议地位处这一重大转型的核心。三款消费级显卡发布之后,科技“七巨头”之一的英伟达股价又一次上涨,市值突破1.35万亿美元。
凭借DUDA生态这道护城河,英伟达成功将英特尔、AMD等挑战者挡在门外,主宰全球GPU市场。不过,美国政府的一纸禁令,却正把英伟达赶出中国区市场,使之遭受重大损失。
对芯片行业而言,地缘政治,永远是生意的一部分。
《福布斯》的一则报道说,英伟达创始人兼CEO黄仁勋正加大预算,雇用一线公关,试图通过一连串政治游说,打破半导体出口管制。
去年一年,英伟达股票上涨239%,在科技“七巨头”中名列榜首。2024财年三季报,英伟达营收181亿美元,同比增长206%;净利润94亿美元,同比增长1259%。
作为英伟达业务的核心,数据中心营收145亿美元,同比增长279%,在总营收中的占比提升至80%。黄仁勋说,英伟达的财报数据表明,行业的计算需求正由通用计算转向加速计算和生成式AI。
三季报发布之际的去年11月,英伟达发布“史上最强”AI芯片H200,进一步巩固领先地位。这是一款基于Hopper架构的超级芯片,与大红特紫的H100相比,内存更大,算力更强。训练700亿参数的Llama 2大模型,H200推理速度比H100快两倍,能耗降低一半。H200预计2024年二季度正式上市,早已引得微软、亚马逊、Google等科技巨头下单抢购。不过,受制于出口管制,中国客户无法下单。
发布会上,英伟达演示了H200“遥遥领先”的神奇功能,一是,训练世界上最大的万亿参数的大模型;一是,2D图片重建3D场景,或从3D场景生成2D图片,实现图像与视频的互转、编辑。
在去年的GTC大会上,黄仁勋放话,AI将创造无限可能性,彻底改变人类的生活、工作和娱乐方式。H200,又向前迈了一步。
英伟达对于GPU芯片的准垄断,主要得益于CUDA生态。CUDA是一种并行计算平台,通过软件定义硬件,实现软件调用硬件,将GPU串联起来形成大型计算集群。CUDA的划时代意义可用AI大神吴恩达的一句话表达:“CUDA出现之前,全世界能用GPU编程的人不超过100个;CUDA问世之后,用GPU编程变成了一件轻松的事。”
为建立CUDA生态,英伟达差不多努力了二十年。回顾世纪之初,GPU市场主要是英伟达、微软、ATI、AMD、英特尔五巨头混战,英伟达略占上风。2006年,AMD出资54亿美元收购ATI,一举改变行业格局,英伟达面临生存危机。紧急中,英伟达首席科学家David Kirk提出“GPU通用化”的思路,将原用于3D图形渲染的GPU应用于通用计算任务。
黄仁勋力排众议,支持Kirk的主张,投入巨资开发CUDA。十多年间,黄仁勋扛过多次金融风暴,累计向CUDA项目投入100亿美元,打造出一个开发者惯于使用、乐于使用的CUDA生态。
2020年,黄仁勋在接受《巴伦周刊》采访时大胆预言:“英伟达将推动下一次AI大爆炸。”2022年底,ChatGPT一炮打响,英伟达H100芯片,连带CUDA 12.0版也一夜窜红,置身于一场AI大变革的震中。
英伟达一战封神之后,GPU热得烫手。英特尔、AMD先后推出Gaudi系列、MI300系列GPU芯片,与英伟达PK。AMD的MI300X芯片与CUDA生态兼容,部分跑分上甚至超过英伟达H100,被视为后者最强劲的一大对手。
对于CUDA这条护城河,“芯片女皇”苏姿丰带领的AMD将ROCm架构升级至6.0版,与英伟达争夺开发者资源。Meta支持的开源学习框架PyTorch在大模型底层直接串联GPU,成功绕过CUDA,兼容英特尔、AMD等众多厂商的GPU、加速器。OpenAI不甘心被英伟达长期控制,也推出有“简化版CUDA”之称的Triton。一些评论人士惊呼,英伟达的CUDA堡垒正被攻破,高高拉起的吊桥,已然落下。
面对竞争,黄仁勋气定神闲。毕竟,连咄咄逼人的苏姿丰也不得不承认,AMD的AI芯片出货量,2024年仅为英伟达的10%,2025年为英伟达的30%。一些报道指出,在GPU领域,英伟达大约领先对手两年。
英伟达真正的对手,正是美国政府。2022年10月,美国商务部下属的工业和安全局(BIS)发布第一版《先进计算芯片和半导体制造设备出口管制规则》,英伟达A100/H100芯片“触线”,对华出口遭受打击,五分之一的生意受损。
2024财年三季报显示,英伟达来自中国大陆地区(含香港)的收入为40亿美元,占比总收入22.4%,为公司第三大市场。
为挽救收入占比五分之一的中国大陆市场,英伟达不得不主动“阉割”A100/H100芯片,推出A800/H800芯片,专为出口中国。尽管内存、带宽严重缩水,A800/H800仍公认为中国市场最佳AI芯片,赢得大批客户。
正当英伟达认为“过关”之际,去年10月,BIS又一次更新出口管制规则,A800/H800、L40/L40S,乃至消费级显卡RTX 4090系列,都在在被禁之列。逼到墙角的英伟达被迫第二次“阉割”芯片。
产业链人士爆料,这一次英伟达特供中国的是HGX H20、L20 PCle、L2 PCle三款改良版芯片。其中,H20为H100的“阉割版”,由于下刀够狠,算力只剩下不到15%。英伟达计划从2024年二季度起量产这三款AI芯片。
两次“阉割”之后,英伟达的特供芯片性能大打折扣,已不能满足百度、腾讯、阿里、字节跳动等大客户的大模型训练需求。这些大客户争相跳船,转投华为等本土供应商。《华尔街日报》的一则报道说,英伟达二次“阉割”芯片,造成的订单损失可能高达50亿美元。
据瑞杰金融(Raymond James)估算,英伟达H100每片成本仅3320美元,官方售价高达3.5万美元,毛利率高达1000%。市场人士估计,去年一年,英伟达共卖掉50万片H100芯片,价值数百亿美元。
作为世界上最赚钱的公司,英伟达却不得不屈服于一直禁令,沦为不折不扣的地缘政治牺牲品。英伟达两次被迫自废武功,推出“阉割版”芯片,正是国际贸易史上的荒诞一幕。
对于美国政府的芯片出口管制,英伟达一边不得不服从,一边又表示坚决反对。黄仁勋警告说,中国区占据美国科技产业三分之一的份额,实际已无可替代,由于出口管制,中国只好选择培育本土企业,自主研发芯片,对美构成竞争。
本来,英伟达在中国区的市占率高达90%,又有强大的CUDA生态保驾护航,本土企业很难与之较量。出口管制,让英伟达自废武功,眼巴巴看着订单喂饱华为等本土企业。
不能忍的黄仁勋决定行动。本来,英伟达每年用来政治游说的经费只有35万美元,而英特尔一年的游说费用高达500万美元。《福布斯》的报道说,黄仁勋正改变这一现状,打算动用政治游说,扳倒华盛顿的一纸禁令。
然而,面对进展飞速的华为910B,英伟达还来得及?