北京时间3月19日凌晨,英伟达GTC大会在美国加州圣何塞SAP中心举行。GTC大会俨然已是“AI界春晚”。英伟达CEO黄仁勋穿着黑色皮衣上场,介绍英伟达在AI芯片、机器人、汽车领域的最新成果。
“去年我们在这里办GTC,就像一场摇滚演唱会,今年GTC被描述为‘AI的超级碗’(美国职业橄榄球大联盟总决赛)。唯一的区别是,每个人都在‘AI超级碗’上获胜,因为AI能为更多行业和公司解决问题。”黄仁勋说。他还幽默地表示,GTC现在人满为患,要让GTC容纳更多人,需要建设圣何塞,开发更多土地。
去年,黄仁勋在GTC大会上发布了新架构Blackwell以及采用该架构的B200、GB200超级芯片。今年,黄仁勋介绍了今年下半年将推出的Blackwell Ultra以及后续的新架构Rubin和Feynman,发布了新的个人AI计算机,并将与谷歌DeepMind、迪士尼合作的机器人带到台上。
技术路线图更新
英伟达Blackwell的销售情况和新芯片架构规划是本届GTC最受瞩目的信息。黄仁勋在演讲开始后不久就披露了Blackwell架构芯片的市场需求情况。2024年,全球前四大云服务商(CSP)共采购130万片英伟达Hopper架构GPU。2025年,这四大云服务商又购买了360万片Blackwell架构GPU。黄仁勋介绍,英伟达正在全面生产Blackwell芯片。
从数据中心相关合作商看,黄仁勋在幻灯片中展示了使用 Grace Blackwell的数据中心机架,其中包括联想、戴尔、微软、亚马逊AWS、Meta、谷歌等品牌厂商。
此外,今年1月,黄仁勋在CES(全球消费电子展)的演讲中透露,英伟达计划开发一款名为Grace Blackwell NVLink72的巨型芯片,包含60万个零部件,重量达1.5吨,是有史以来最大的单一芯片。此次黄仁勋展示了Grace Blackwell NVLink72超级芯片的概念图,可以看到,72个Blackwell GPU集成在了一个晶圆上。
芯片架构迭代路线图也迎来更新。去年6月,黄仁勋首次透露英伟达芯片架构将“一年一更”,当时英伟达计划2025年推出Blackwell Ultra架构,随后推出Rubin架构。此次,黄仁勋补足了这个路线图的信息,包括Blackwell Ultra推出的时间是今年下半年、2026年下半年英伟达会推出Rubin、2027年下半年会推出Rubin Ultra、2028年推出Feynman。这是英伟达首次披露Feynman的信息,这个架构的名字取自著名物理学家理查德·费曼(Richard Feynman)。
具体而言,采用Blackwell Ultra架构的芯片包括GB300 NVL72等。Blackwell NVL72的算力(FLOPS)是GB200 NVL72的1.5倍,该架构还有1.5倍更快的存储和2倍更大的带宽。Rubin NVL144将有更大算力、更大带宽和更大内存,搭载HBM4内存。Rubin Ultra NVL576将搭载HBM4e内存,算力是GB300 NVL72的14倍,内存速度是8倍。随着架构迭代,黄仁勋表示, AI工厂的算力成本将得到相应降低。
计算量还在增长
今年以来,业界热议人工智能是否还需要大量算力。1月,DeepSeek-R1发布,该模型被认为训练成本偏低,可能不需要很大量的算力支撑。1月27日,英伟达美股股价跌超16%,随后英伟达股价继续波动。即便英伟达放出一份营收超市场预期的最新季度财报,英伟达股价仍未回归历史高点。3月18日收盘,英伟达股价115.43美元/股,跌3.43%,市值不及3万亿美元。
黄仁勋需要证明,市场对算力的需求依然强劲。2月,黄仁勋首次回应DeepSeek冲击波时称,市场对DeepSeek-R1的反应存在一些误解,R1的发布本质上利好AI市场,R1能加速AI被采用,市场仍然需要计算资源。此次GTC大会上,黄仁勋继续表达对算力需求增长前景的看好。
去年AI业界曾掀起一波关于Scaling Law(缩放定律)是否放缓的讨论,引起了对于AI演进放缓和算力需求不再坚挺的担忧,黄仁勋则认为,Scaling Law继续有效,DeepSeek等厂商采用的推理技术带来了大量计算需求。“关于Scaling Law,去年几乎全世界都错了,实际上,Scaling Law变得更有弹性,还加速了计算量增长。由于推理技术的加入,代理AI(Agentic AI)动不动就需要高出上百倍的计算量。”黄仁勋说。
在此情况下,黄仁勋认为云厂商对GPU仍有较大需求。他表示,现在有了强化学习,业内有能力生成大量token,可以生成大量的合成数据去训练机器人,各种新变化给行业带来巨大的计算挑战,行业正在作出回应。例如大型云厂商正在采购GPU,“Blackwell开始出货的一年内,你能看到人工智能基础设施建设出现了难以置信的增长。”黄仁勋放出分析师对数据中心资本支出的预测,显示预期支出还将逐年增长,到2028年将增长至1万亿美元以上。
“我之前说过,预计到2030年,数据中心建设投入的金额将达到1万亿美元。现在我确信我们会很快实现这一目标。有两种动态同时发生,首先,绝大部分(数据中心建设投入)增长可能加速,计算方式转变的拐点正在发生,其次,人们越来越认识到,发展未来的软件也需要资本投资,计算机的计算方式原本基于搜索,未来将变成基于生成。”黄仁勋判断。
近期有市场分析机构和供应链厂商也判断,今年数据中心仍在大规模建设。TechInsights报告表示,顶级超大规模云厂商2025年将在AI上投资约3200亿美元,巨头数据中心资本支出增长。有供应链厂商则告诉记者,今年数据中心服务器需求仍然坚挺,需求增长的力度与去年大致相仿。
对于人工智能技术的演变,黄仁勋则谈到AI将从代理式AI向物理AI演变。“过去两三年内,计算的每一层都发生了变化,有了重大突破。人工智能最底层的进步可以说是代理式AI,指有代理能力的AI,能推理、计划并采取行动、使用工具。代理式AI已经出现了一些新技术,包括推理技术。此外,下一波变化已经在发生,也就是出现了机器人AI(Robotic AI)。机器人AI由物理AI(Physical AI)驱动,能理解物理世界的摩擦力、惯性、因果关系、物体永恒性等。”黄仁勋说。
多个新产品亮相
除了公布芯片架构路线图,此次英伟达还发布了多个产品并公布多个合作伙伴。
在汽车领域,黄仁勋表示,英伟达已经开发了三种计算机:训练计算机、模拟计算机和机器人计算机,所有软件堆栈、模型和算法都基于这些产品。英伟达宣布与通用汽车合作,共同开发自动驾驶汽车,双方将在以上三个领域合作构建人工智能,例如制造中用人工智能设计和模拟汽车、建造车内的人工智能等。此外,英伟达推出用于自动驾驶汽车的综合安全系统Halos,涵盖芯片和软件、工具等。
在机器人领域,黄仁勋宣布推出GR00T N1,这是全球首个用于通用人形机器人推理和技能的开放、完全可定制的模型框架。英伟达同时推出Simulation Frameworks,用于加速机器人开发。此外,黄仁勋透露,英伟达、谷歌DeepMind和迪士尼合作开发了一个名为Newton的机器人平台。由英伟达、谷歌DeepMind和迪士尼合作开发的一款机器人在台上行走,这款机器人名叫Blue,它与黄仁勋互动,还会发出电子音。
“机器人的优点是可以与物理世界互动。我们非常清楚地知道,未来世界上将缺乏人类工人,到目前这个十年的末尾,世界上将至少有5000万劳动力短缺,(机器人)将是一个非常大的产业。未来生产的基础设施将是机器人,每辆车也都是机器人。”黄仁勋表示。
英伟达还宣布开源由AI驱动的决策优化引擎cuOpt,该引擎可用于优化AI代理和大语言模型的决策任务。英伟达也发布了DGX Spark 和DGX Station两款个人AI计算机,由Grace Blackwell支持,这两款计算机面向开发者、研究人员、数据科学家等。其中,DGX Spark是世界上最小的AI超级计算机,搭载GB10 Grace Blackwell芯片。黄仁勋还表示,英伟达将与电信企业合作开发基于人工智能的6G无线技术,合作伙伴包括T-Mobile、Mitre、思科等。
(本文来自第一财经)
举报/反馈

第一财经

1448万获赞 212.5万粉丝
第一财经 专业创造价值
第一财经官方账号
关注
0
0
收藏
分享