作者:高飞
在GTC2025大会上,英伟达CEO黄仁勋在一场至顶科技等全球媒体共同参与的记者会上表示, AI正在成为一个全新的制造业。AI不是传统意义上的软件开发,而是一场需要基础设施、能源和资本投入的产业革命。
英伟达也正在经历一次转型,由一个AI芯片公司,转型为AI基础设施公司。这也是为什么他会在昨天的主题演讲中一次性公布未来三年产品路线图的原因,因为英伟达构建的是AI基础设施,一次部署可能就价值数千亿美元,需要给产业链更多的准备时间。
黄仁勋又再次强调了计算架构的突破方向,"在纵向扩展之前,应该先横向扩展。"为推动AI基础设施的极限,英伟达正在开发从单个芯片到超级计算集群的全栈解决方案。他预测:"这个行业将是万亿美元规模的大产业。"
提问 :我知道你通常不太谈论未发布的产品,不过你昨天谈到了Vera Rubin。我想问关于Feynman的问题。Vera Rubin似乎使用了台积电3纳米工艺,我想知道Feynman是否会使用环绕式栅极晶体管(gate-all-around transistors),这将应用不同的工艺。如果是,我们能期待从这种新型晶体管类型中获得什么样的性能和其他优势?
黄仁勋:如果我们使用新晶体管,性能就会提升20%。我们会接受这样的提升,但它不会改变世界。当然,我们会接受一切可能的优化,20%的提升在大数据量上确实很显著。
但正如你所见,在AI工厂、AI基础设施、这种规模的计算中,每个处理器都很重要,但在整体架构中,它的影响相对较小。原因是管理所有这些处理器的开销变得最为重要。这些处理器系统的扩展是最困难的事情,如果扩展不当,损失会非常大。
昨天我解释过,在纵向扩展(scale out)之前,应该先横向扩展(scale up)。在我们通过网络连接百万个GPU之前,应该先在一个计算架构(fabric)上连接数百个、也许是数千个GPU。这里有一个区别 - 计算架构(fabric)和网络(network)是不同的。(计算架构就像巧克力饼干)
所以NVLink是一种计算架构。网络通信协议的开销非常低,这意味着所有GPU可以作为一个整体工作。实际上,它们互相通信是在访问彼此的内存。通过NVLink连接的所有GPU本质上是一个巨大的芯片。
但NVLink在扩展方面有挑战,因为它只能覆盖有限距离。重要的是,你要尽可能地先纵向扩展,然后再横向扩展,这就是为什么NVLink的发明如此重要。我们现在已经到了NVLink交换机的第六代了。
这种架构技术从服务角度看非常具有挑战性,从单位能耗的性能角度也很有挑战性,因为大量数据持续不断地流动。而且因为我们在架构本身内部做了大量计算,这也很有挑战性。架构中流动着大量的算法、数学和逻辑,这样我们可以减少必要的工作量。这可能是行业关于”纵向扩展"重要性的最大发现之一,它之后才是“横向扩展”。
“横向扩展”也很有挑战性,不过现在我不会详细讲,除非有人提问。这就是我们发明Spectrum X的原因,这关系到所谓的"抖动"(jitter)问题。
举一个例子。当如果我们所有人一起工作,在某个时刻大家都开始发送答案。
我给每个人一个小项目,最后你们需要发回结果(我们称之为部分结果),(但是)你们必须发回所有结果。但当你们发送结果时,信息会互相竞争,导致一些信息没能及时到达,这就叫抖动。最后一个提交答案的人实际上拖慢了所有人。所以衡量标准不是答案传递的平均速度(这是以太网的设计目标),而是最长尾部答案的时间。谁最慢,谁就拖慢了整个系统。
以太网和InfiniBand工作方式的区别非常显著。InfiniBand设计用于低延迟、低抖动、低流量竞争和均等路由时间,尝试让所有人同时到达,而以太网则关注平均值。
提问:今天早上在CNBC节目上,你提到了关税。你说在短期内它们不会有实质性影响。我有点困惑,为什么在美国的(芯片)制造业尚未达到水平的情况下,会没有实质性影响?
黄仁勋:我们有一个非常灵活的供应商网络。它们不仅仅在中国台湾,也不仅仅在墨西哥,不仅仅在越南,或者其他单一地点——它们分布在很多地方。这取决于什么东西在美国生产,什么东西在美国购买,以及产品的最终目的地。所以有很多因素需要考虑,还取决于哪个国家被征收关税。
我认为在短期内,基于我们所知道的情况,我们预计不会对我们的展望和财务状况产生重大影响。长期来看,我们希望保持灵活性,但增加一个非常重要的部分,那就是境内制造。
最简单的理解方式是,我们现在的灵活性很棒,但缺少境内制造。如果到今年年底我们能增加这部分,我们应该会处于非常好的状态。
提问:我了解到,有一个趋势是定制基础芯片(base die)。英伟达如何看待这种模式?
黄仁勋:基础芯片的定制让你可以将原本位于主芯片上的一些逻辑移到基础芯片上。这只是一个工程优化。这是一件好事,它只是表明,既然我们有了堆叠硅和协同设计,就有很多不同的方式来移动组件。高带宽内存堆栈的基础芯片就是优化区域之一。
我认为这就像是把东西从这个抽屉移到那个抽屉。没什么大不了的,不需要为这种优化发新闻稿。这是个好主意,但就像是把东西从一个抽屉移到另一个抽屉。我是不是冒犯了提出基础芯片想法的人?这很好,基础芯片很好。但有没有基础芯片(你懂的)。
提问:看着英伟达的扩展战略,特别是Rubin Ultra和新的Kyber机架的刀片设计,你的客户现在基本上得到了一个完整的超级计算机集群(Super Pod),在单个机架中具有惊人的计算密度。展望未来,这是否会成为建造AI工厂唯一可行的方式?
黄仁勋: 是的。
提问:空气冷却最终会被淘汰吗?
黄仁勋: 是的。
听着,如果你问的问题完全成熟、自成一体、逻辑一致,没有大量需要礼貌拆解和反驳的复杂冲突,如果你像他那样精确提问,你就会得到一个"是的"回答。
提问:我来自韩国。我有一个问题,…有没有可能与三星合作生产HBM3内存?
黄仁勋: 是的。我认为希望是三星——如你所知,我们已经与他们一起制造了许多DGX内存、图形内存。三星在内存制造方面非常出色。说到基础芯片,三星将三星的基础能力和内存能力结合起来会非常好。对于半定制基础芯片,这将是一个很好的能力。我完全预期三星将参与HBM3芯片。他们做得很好。
提问:你对AI扩散技术限制的担忧程度如何,包括阿联酋、沙特阿拉伯、以色列、瑞士?这些都是英伟达的忠实客户和合作伙伴。
黄仁勋: 正如你所知,AI扩散政策不会产生短期影响。但从长远来看,我认为AI是每个国家都需要的技术,也是每个行业、每个公司都需要的技术。所以AI实际上是主流软件。今天我们谈论AI,好像它是一种神奇的技术,但它实际上只是软件,我们都知道。它是非常好的软件,但它就是软件。因此每个国家都将有能力运行软件。
我还认为,在可能的范围内,我们很乐意能够用美国技术和按照美国标准支持每个国家。因此,我认为对于社会所需的计算能力来说,让各国获得访问权限对两国都有利,对美国也有利。
提问 :随着你们每年推出新一代产品和加速器,内存制造商是否也保持同样的节奏?当你们设计每一代系统并获取所需供应时,这种关系有多紧密,尤其是当超大规模厂商扩大他们的AI工厂时?
黄仁勋: 答案是非常紧密。如果我向他们传达我们的路线图,这种关系会更紧密,这也是我向全世界公布英伟达未来三到四年路线图的原因。现在每个人都可以规划了,对吧?
我们正在构建的基础设施非常重要。昨天我做的一些事情本质上与这样一个想法有关:我们不再只是制造芯片了。那些是美好的旧时光。在旧时代,你制造芯片,有人买芯片,放进电脑,然后卖电脑。那是美好的旧时光。
而我们现在做的是构建AI基础设施,一次部署价值数千亿美元。所以你最好好好规划。AI基础设施不是今天决定购买、明天就部署的东西。它是你提前两年投资的东西,而且你要为整整两年做规划。然后希望能够快速搭建起来,这意味着每个人的信息必须保持一致。我们必须共同规划,为世界构建基础设施。
这很重要。第一点是,英伟达是一家AI基础设施公司。我们是一家基础设施公司,不只是买卖芯片。所以我的规划周期必须上游延伸数年,下游也延伸数年。
昨天我解释的第二件事是,我们现在是一家AI工厂。这意味着工厂帮助客户赚钱。我们的工厂直接转化为客户的收入。这不仅仅关于一个芯片或其他东西。整个工厂非常复杂,正如我刚才解释的,它处于物理极限。我们所做的一切都扩展到了最大限度。
通过这样做,通过将性能每瓦特、性能每能量推向物理极限,基本上意味着如果你受到功率限制——而每家公司都受到这个限制——那么你将实现的最大收入就取决于AI工厂是否具有最佳的性能功耗比。性能直接可转化为每秒生成的令牌(tokens)数量。
所以我们现在是一家AI工厂,商业门槛比以前高得多,竞争门槛比以前高得多,我们所有客户的风险容忍度比以前低得多。因为他们的收入直接与此相关。这是一个多年的投资周期,因为我们谈论的是数亿美元。这是一个基础设施业务,是一个AI工厂业务。
最后,我昨天说的是,AI是一项基础技术,不仅对我们如此,对每个行业的每家公司都是如此,这也是为什么这么多合作伙伴在这里的原因。我们这里有很多行业,从汽车公司到金融服务公司再到零售公司。每个行业都在这里,每个国家都在这里,每家公司都在这里,因为我们已经成为其他公司得以建立的基础公司。
这三个想法是过去一两年发生变化的内容。人们已经注意到GTC的感觉真的改变了。出席的人(能量场)真的改变了。我想这是因为这三件事。因为我认识到了这一点,我决定改变我们向其他人传达自身信息的方式。
我们是历史上第一家一次宣布四代产品的科技公司。这有点像今天我要宣布我接下来的四部手机。这没有意义,对吧?就像路易威登今天宣布2026年、2027年和2028年的产品一样。这种事情不会发生。但我们这样做了,因为我们是一家基础设施公司。我们是世界的工厂,我们是一家基础性的公司。
提问:我很好奇为什么英伟达能够如此频繁地推出新软件。我认为这是英伟达与其他芯片公司的区别之一。你能告诉我公司有多少软件工程师,软件工程师在所有工程师中占多大比例?
第二个问题是关于美国生产。台积电最近宣布在美国追加投资,他们说他们将在亚利桑那州生产AI芯片。有多少Blackwell或Rubin将在美国生产?
黄仁勋:英伟达制造芯片,但我们不是一家芯片公司。我们实际上是一家算法公司。我们是当今世界领先的计算机图形算法创造者。当DeepMind和迪士尼研究院想与某家公司合作研究物理算法、非常精细的物理算法时,他们与英伟达合作。机器人物理算法、计算光刻技术...英伟达是唯一一家与每家计算光刻公司合作的计算光刻公司。
我们是一家算法公司。计算光刻是逆向物理学。我们在物理学上非常擅长,在逆向物理学上也非常擅长,在计算机图形学和光线追踪方面也非常擅长。在这两种情况下,都涉及正向物理和逆向物理。我们非常擅长算法。
我们将所有算法知识提炼为一个称为CUDA的通用架构。然后我们在CUDA上构建芯片。所以从很多方面来说,我们从算法、从数学开始思考世界。这也是为什么当深度学习出现时,我们对此如此适应。我们有数百名AI研究人员,我们自己研究算法。我们在很早之前就开始研究,在扩散技术出现之前,你可能已经看到了我们在渐进式GAN方面的早期工作。扩散有点渐进性。你可能已经看到我们在变分自编码器方面的工作。
我们在做的工作是开创性的工作。原因是英伟达是少数几家现在思考整个计算系统的技术公司之一。从处理器一直到交换机和网络,网络的算法,网络的协议。我们非常擅长发明网络协议。所以我们可以发明自己的交换机,扩展以太网做成超级以太网。我们非常擅长做这些事情,因为我们拥有完整的系统能力。当你将这两点结合起来,我们就能够快速创新。但这是因为我们首先了解算法。
我认为芯片设计几乎是次要的。我们为此感到非常自豪,我们制造非常复杂的芯片。但我们擅长解决算法问题。
关于制造,我们有能力在美国制造很多产品。不是全部,但很大一部分。
提问:你提到你每次演讲最喜欢的幻灯片是英伟达的加速库,它使众多研究人员、科学家和工程师在各种不同领域的毕生工作成为可能。我想知道,当我们进入Blackwell时代,有没有一个你个人期待看到添加到那张幻灯片上的领域,或者你期待下一步加速的行业?
黄仁勋: 是的,我非常感谢这个问题。优秀的问题。
首先,加速计算不仅仅是顶层的软件和底层的芯片。它完全不是那样工作的。你必须关注中间的这一层。有点像AI,它不仅仅是关于提示框和底层的计算机。中间有一个模型。那个模型在AI中非常重要。模型不是AI,因为AI是模型和其他东西的系统。但模型对AI非常重要。
所以库不是应用程序,但该库使解决那个应用程序、那个应用程序的数学成为可能。该库可以是Spark中的数据处理,Pandas数据处理。它可以是计算光刻。它可以是计算数字生物学。它可以是地震处理。它可以是逆向物理,CT重建。它可以是各种有趣的东西——它可以是流体动力学,粒子物理学。它可以是我们刚刚用Newton做的事情。机器人——我喜欢Newton,针对刚体和软体的非常精细的物理学。
这些库中的每一个对它们来说都是必不可少的。
我超级兴奋并且非常期待的一个领域是计算机辅助药物发现。
我这一代人、我的行业是由电子设计自动化(EDA)这个理念成为可能的。如果没有Cadence和Synopsys以及随后出现的公司,以及因此而产生的所有工具,如Mentor Graphics和西门子。如果没有这些公司,我们就无法构想这些令人难以置信的东西,也无法在没有仿真和模拟工具(我们称之为数字孪生)的情况下建造这些惊人的机器。没有这些工具和库,就不可能做到我们现在所做的事情。
我认为,如果我们为生物学创建类似的工具,让医生和生物学家能够将蛋白质、细胞、器官和组织表示为数字孪生,并能够模拟从纳米到米、从纳秒到年的生物学,表示如此巨大的尺度范围,我认为我们将彻底改变药物行业的运作方式和医疗保健的思考方式。
我们最近与Arc Institute研究所合作的Evo2项目,从蛋白质到细胞,将细胞表示为数字孪生体,一个细胞的表示。然后到多个细胞。当我们能够达到这种表示和规模的复杂性时,我认为生物学将被彻底改变。所以我有点期待这个。
我要感谢大家今天的到来。这次GTC确实非常重要,它展示了我们公司从计算机技术公司到AI基础设施公司的转变。它展示了从数据中心(计算机访问数据并托管应用程序的地方)到AI工厂的转变。它展示了一个新行业的出现。这就是为什么所有这些公司都在这里,所有这些开发人员都在这里,初创公司都在这里,来自所有这些不同公司、国家和行业的原因。
提问:在正常情况下,英伟达在中国市场将有巨大的机遇。您能告诉我们您对英伟达和AI在中国的愿景吗,无论是否有贸易战或关税问题?
黄仁勋: 我们有根本性的义务来经营我们的业务,遵守法律,尽最大努力竞争和服务客户。这是每家公司的基础。我们不会改变。随着世界变得更加复杂,这些不是我们公司能够明智处理的考虑因素。我们只是明智地确保我们始终遵守法律,并尽最大努力在市场上服务客户。我认为你可以说这就是我们做的事情。这就是我们对这个问题所需要思考的全部内容。
我做了一个观察——也许这只是一个观察——是世界上50%的AI研究人员来自中国,这是迄今为止人数最多的群体,没有其他国家能接近。因此,可以推断,将会有大量AI研究贡献来自中国,仅仅因为50%的研究人员来自中国(巨大的基数),美国的每个AI实验室都有许多优秀的中国研究人员,每一个,没有例外。我找不到例外。所以无论中国如何培养这么多优秀的计算机科学家,无论这是如何做到的,请继续保持。
提问:关于与GM的合作伙伴关系公告,特别是关于Drive AGX将用于未来车辆,当然您与其他OEM如Rivian和Lucid也有合作关系,这些车辆已经上市。您是否认为有一天,消费者会因为车内搭载了英伟达技术而购买车辆,就像人们因为有英伟达显卡或英特尔芯片组而购买PC一样?
黄仁勋: 是,也不是。我的车里没有英伟达技术,我对此完全没问题。我的法拉利对我来说太重要了。然而,我的Rimac C Two有,我很感激。
所以是,也不是,我只是在开个玩笑。
让我告诉你为什么是也不是。首先,我认为汽车对人们来说非常个人化。它是一种反映他们性格和生活方式的方式。所以我认为这超越了技术。
另一方面,正如你所知,在自动驾驶汽车领域,这是机器人技术的一部分,对我们来说是一个非常重要的领域,是我们非常重要的计划。我们已经研究物理AI、机器人系统和机器人超过10年了。
我们的战略是三种计算机战略,不仅仅是汽车计算机的战略。我们的战略是三计算机战略:机器人的AI基础设施、机器人的AI模拟器和机器人的AI计算机。
因为首先,你必须训练AI。其次,在把它放到路上之前,你必须模拟AI。你把它放在虚拟道路上。你给机器人一个虚拟厨房。为什么要毁掉你的厨房?然后你使用一种叫做"Sim to Real adaptation"的技术,将AI放入机器人中。
我们与世界上几乎每家机器人公司和每家汽车公司在这三台计算机中的至少一台上合作。有时是汽车中的计算机。那只是——那很少见。主要是训练AI计算机,模拟AI和汽车计算机,或者可能只有数据中心和模拟。但我们正在与汽车公司和机器人公司合作,自主送货机器人、拾取放置机器人。不同机器人配置的数量相当大。我们在这三台计算机中的一台上与几乎所有人合作。
有时我们甚至开发了一整套软件。正如你最近看到的,昨天,我们宣布了世界上第一个通用机器人基础模型开源。我们称之为Groot-N1。我们创建了一个模型来合成物理正确的虚拟世界。我们称之为Cosmos。
有时我们只提供汽车内的软件堆栈,特别是与AI安全相关的部分。在机器人系统中实现AI安全非常困难。你必须在芯片系统、操作系统、算法、软件堆栈、工具和方法论甚至工程文化中实现多样性、冗余、透明度和可解释性。你必须以可访问的方式展示从芯片到人的整个系统,以保证安全。这与空中交通安全没有什么不同。
未来,人们将采用我们拥有的相同系统。我们在这方面非常严格。我们称这整个系统为HALOS。我们在该领域非常严格,世界级的机器人安全。我相信这种专业知识有一天会带来巨大回报。如果我们有机器人在各处运行,我们希望它们是安全的。我们在这个领域已经投资了10年。
所以三台计算机,汽车、四轮、两条腿、两轮、三条腿,都没关系。两个大的,没有腿,无论什么机器人系统,我们都有适合你的计算系统,计算架构。这对我们来说已经是一个价值数十亿美元的业务了。它已经超过五百万美元。我认为这将成为我们公司长期最大的业务之一,长期内最重要的AI应用之一。
提问:英伟达正在改变,对吧?你们不仅提供世界领先的芯片,还提供世界领先的算法、基础设施和软件。英伟达正成为AI的一站式商店,对吧?特别是企业AI。这令人兴奋。我真正想问的是,这对公司的未来意味着什么?因为使英伟达伟大的是,它也是一个成功的地方,是每个人的宠儿,对吧?现在你们正在进入你们客户的一些领域。如果你们在某种程度上成为他们的竞争对手,他们会如何反应?这意味着什么?
黄仁勋:我非常感谢这个问题。显然,我们在解释我们做什么方面做得非常糟糕。
实际上,我会这样解释。英伟达是唯一的这样一家AI公司:
英伟达无疑拥有云端AI、汽车AI、机器人AI和企业AI。正如你提到的,我们是全栈的。我们拥有整个基础设施、网络、交换机。现在我们有存储技术,当然还有计算技术。每种大小和形状,从小小的Spark到超级Super Pods。
所以从很多方面来说,我们在整个技术栈中、在所有这些行业中都拥有基础技术。然而,接下来是然而的部分。我们构建一切,但我们以他们希望采用的任何方式将其提供给世界。
原因是我们不是一家解决方案公司。我们不做那最后的——你决定多少百分比——那最后50%的价值创造。我们构建原始技术,并与我们的生态系统合作创建解决方案,这就是为什么思科是我们企业网络领域的合作伙伴。戴尔和HPE、联想与我们合作进行企业计算。DPN和NetApp等等。戴尔和EMC,名单很长。日立和IBM,都是我们存储领域的合作伙伴。
这就是为什么一方面,我们是一家AI公司,但Salesforce、ServiceNow、SAP、Cadence、Synops,它们都是我们在AI领域的合作伙伴。因为我们毫不费力地将我们创建的核心技术提供出来,让他们将其集成到他们的解决方案中,让他们将其推向市场。
因此,我们成为世界上唯一与世界上每家AI公司合作的AI公司。一方面,我可以为奔驰构建整个自动驾驶汽车技术栈。我可以为通用汽车做同样的事情。另一方面,丰田可以以他们的方式与我们合作。特斯拉可以以他们的方式与我们合作。Waymo等等,名单还在继续。他们可以以他们的方式与我们合作。
我们毫不费力地以任何人的方式与任何人合作。这就是英伟达的特别之处。我们毫不费力地以任何人的方式与他们合作。在几乎所有情况下,如果他们决定做更多,从我们这里拿更少,我没有问题。
所以这就是为什么我们在多个堆栈中构建我们的技术。只有芯片,只有系统,只有系统软件,只有算法,你决定。你可以从我们这里取两个、三个、四个、或者不取。我们的理念是,从我们这里买你想买的任何东西,只要——请从我们这里购买。
所以我们实际上是技术基础公司。我们构建了很多技术,但实际上是为了使他们能够发挥作用。我们希望使生态系统能够发挥作用。这就是为什么每家公司都在这里。
提问 :今天你宣布了英伟达将加入 xAI、黑石集团和微软等共同参与的 300 亿美元人工智能基础设施基金。我只想了解英伟达在联盟中的角色是什么。
另外,正如你昨天提到的,对能源供应有很大的担忧。例如在巴西,我们90%的能源来自可再生资源。我想知道这个联盟的角色是什么,以及你是否也为数据中心的全球能源供应提供咨询和支持?
黄仁勋: 是的。首先,我会倒序回答。
第一,AI是一个新行业。实际上,这是一个新的制造业。没有人认为软件是制造业,因为以前是人在打字。即使世界将纺织品视为制造业,他们也不将软件视为制造业。但软件是制造业,只是人工制造。一切都是手工制作的。
在AI的情况下,它是制造业,但是工业化制造业。产品是由机器制造的。但AI是一个行业,AI是制造业。制造业需要能源。
简单的问题不是人们是否想建造数据中心。思维往往转向错误的地方。问题是,国家是否想在这个新行业中进行制造?你想生产AI吗?如果你想生产AI,那么你需要使用能源。
现在问题是,在所有需要能源的事物中,你最希望生产什么?你是否更愿意使用能源来生产水泥?众所周知,生产水泥需要大量能源。你是否愿意使用能源来生产钢铁?是否愿意使用能源来进行农业生产?是否愿意使用能源来生产AI?这是一个简单的问题。但这是一个制造业,它需要能源。
我相信在10年内,这个行业将是万亿美元规模的大产业。它将是一个相当大的行业,我们将在全世界制造它。
你的第一个问题——关于合作伙伴关系。这是一个合作关系,因为我们都投入了资金。这是一个投资工具,用于为数据中心的能源建设提供资金,这需要相当多的资本。
所以这个行业需要相当多的资本,相当多的能源,但至少是相当多的资本。这种合作关系允许实体、合作伙伴关系帮助资助数据中心、AI工厂的开发、准备和资金支持。所以我们所做的部分是提供我们的专业知识,但我们做的部分事情是带来资本。这将需要资本。
提问:我们了解到,英伟达一直将中国台湾供应商视为关键组成部分,并致力于他们的成功。在过去几年里,英伟达加深了与许多合作伙伴的合作,如联发科和富士康。同时,你也在全球范围内投资越来越多的初创公司,你能分享这些合作伙伴关系和投资在这个阶段对英伟达的战略意义吗?您希望实现哪些目标?
黄仁勋: 我们与你提到的公司合作——台达电子、联发科,当然还有台积电和富士康以及其他公司。我们与他们合作是因为他们坦率地说是世界一流的。这始于敬佩和尊重。
当然,多年来,当你与某人合作30年,你会产生一些喜爱和友谊。这就是与我合作过的许多公司的情况,因为如你所知,我是世界上唯一工作这么长时间的科技CEO。
我可能解释一下为什么我今天有点累,昨晚有14个派对,我参加了其中13个。我还在工作。
(但)这就是它的真正来源。在技术投资方面,我们寻找创新的公司,创造新事物的公司,也许是在正常创新路径之外的事物。所以我并不认为这两者有真正的联系。
我们与供应链和生态系统中的公司合作,纯粹基于一个理念,那就是他们的卓越性。通过共同合作,将他们的卓越与我们的卓越连接起来,我们可以一起做一些伟大的事情。就是这样。这是100%。这是整个战略。
作为公司的理念,你也知道,我们是一家相当小的公司。我们只有36,000人。我们比硅谷这里几乎每家科技公司都小。我们这样做的方式是,我们只尝试做我们需要做的事情。关于之前问到的关于技术栈和我们所做的所有事情的问题,注意到我们所做的事情,它们看起来是必不可少的。但这是因为我们不做任何其他不必要的事情。如果我们能避免做某事,我们会避免。
我们不会为了竞争而战斗。那不是英伟达的风格。注意当你来和我们交谈时,没有一个员工会说,我们为市场份额而战。为什么要为市场份额而战?为了做什么?创造新事物。所以当我们致力于让我们的公司只做创造新事物的事情时,当然,它感觉像我们一直在创造很多东西。但那是因为其他所有事情我们都从其他人那里借用。
如果他们构建了非常出色的东西,我们会使用它。我不在乎是哪家公司。我们与AMD、英特尔、博通和Marvell合作。当然,我们最近宣布了与联发科的一项伟大合作伙伴关系,共同开发某些东西。我们尝试与每家公司合作,以便我们可以将我们非常稀缺的精力集中在世界上没有的东西上。
提问:清晰地阐述了为何要制定未来三年达到600千瓦机架功率的发展规划。我想了解,根据您从当前数据中心行业获得的反馈,他们认为在未来几年内能够实际支持的技术极限是什么?是否会受限于网络架构(一个网络还是多个网络)?
黄仁勋: 一个数据中心现在是250兆瓦。这是每个机架的某种限制,其余的只是细节。
如果你说一个数据中心是一吉瓦,那么我会说每个机架一吉瓦听起来是个不错的限制。但当然,其余的是工程上的实际性。有必要把所有东西都放在一个机架里吗?
如果没有理由扩展超过几千个处理器,因为纵向扩展和横向扩展的数学特性,以及纵向扩展和横向扩展的并行化是这样的,超过1,000或5,000个GPU后就有收益递减,那么之后我们可以用许多机架横向扩展。
但如果纵向扩展非常有效,比如在72和144和288和576之间,在这个水平上,扩展上去如此有效,我们应该尽可能地纵向扩展。这就是我们目前的情况。
有一天,我敢打赌我们会发现收益递减,在这种情况下,我们会扩展到我们的数字4,000,x千。之后,我们可以横向扩展。然后你不必将它们堆叠得如此密集。
提问:最近有报道称英伟达是收购英特尔的联盟的一部分。所以我想知道,你是否计划与台积电一起收购它?会发生什么?
黄仁勋: 我不知道这从哪里来的,但没有人邀请我们加入联盟。我不是说这不是新闻,但没有人邀请我。所以可能有其他人参与,但我不知道。可能有个派对,我没被邀请。
提问 :作为一名开发者和产品经理,我应该将时间和资源集中在物理AI这一波浪潮的哪个方向?
黄仁勋:AI的挑战仍然是数据战略和训练战略。这一点没变。例如,在过去几年中,有人说我们已经用完了数据。你记得吗?当然,这非常愚蠢。而且它也没有考虑到,实际上,我们现在有几乎无限的数据,因为有强化学习。
所以强化学习的发现和可验证结果和奖励,以及人类多年来通过数学和证明和定理已经解决了很多问题的事实,科学发现甚至有趣的游戏。你可以证明谁赢了国际象棋比赛。你可以一直玩到你赢。所以你可以证明谁赢得了奖杯。
这些是可证明的事情。因此,这意味着我们现在有无限量的数据来训练模型进行推理。我认为物理AI也有同样的挑战。我们必须弄清楚我们的数据战略和训练战略是什么。
你看到我谈到了其中的一些内容,即使用人类示范,然后使用生成式AI和模拟,我们可以生成无限数量的相关场景。这就像我们给AI一个代数问题。然后我们可以想出一大堆它必须解决的代数例子。它最终必须解决所有这些问题。
我们可以对物理操作做同样的事情。也许还有关于跑步的事情。然后最终,如何教AI如何做需要相当协调的操作和关节活动的体育活动?所以有数据战略,有训练战略。
然后还有最后一部分,即使用策略,关于如何最好地提示AI来产生答案。这是软件编程的现代版本。提示是软件编程的现代版本。所以我们在物理AI中也有同样的事情。我们如何提示AI进行物理推理?进行物理推理。所以物理推理显然非常重要。这些是富有成果的领域。
提问:你提供了硬件方面的四年展望,你认为未来四年产业内会如何发展?
黄仁勋: 我认为我们要做的第一件事当然是将推理能力放入一切之中。将推理放入一切的好处是,我们不必给AI非常具体的提示。我们可以更多地关注任务导向。我们可以连接具有某些技能的代理系统。然后我们只需给它一个目标。
你甚至可能只是——这是输入,这是输出,这是我希望你达成的输出。中间有很多转换、很多推理和很多问题解决,从这个到——例如,这是我的预测,这些是公司中的所有组件,这些是所有供应商。我的供应链是什么?我的预测是什么?物料清单和我如何预测一切?
那个优化系统相当复杂,因为它受到过多约束。所以它需要很多推理,很多优化,数学等等。但也许我可以给出两个端点,它就去解决了。
所以我认为下一代AI将非常能够应用推理,使用工具,使用访问信息,然后产生必要的结果,这是非常多步骤的,嵌套的多步骤。所以我对此感到非常兴奋。我几乎可以触摸到它。技术的各个部分将会非常好。
提问:你昨天介绍了你的路线图。其中的数字和在AI上的支出简直令人难以置信。我想知道,仅美国就将在"星门计划"(Project Stargate)上花费5000亿美元。欧盟刚刚宣布为AI超级工厂投入2000亿美元。中国也在花大笔钱。那么这是不是一个等式?谁花费最多,谁就首先获得AGI?这个等式正确吗?或者存在过度支出和资源错误分配的风险?
黄仁勋: 你们知道世界上最聪明的人是谁吗?你们在乎吗?我认为这就是答案。
我相信我们需要实现AGI,这样我们才能使AI有用,解决我刚才描述的问题。最聪明的AGI可能并不那么重要。我不知道我是否雇用了世界上最聪明的员工。我想我有。但我不完全确定,我也不相信这对我来说那么重要。我需要卓越的智能。
但我仍然相信,将智能应用于非常具体的目的,目的的选择,战略的选择,任务的选择仍然非常重要。领域专业知识仍然非常重要。我相信这是世界价值的99%,而不是第一部分,即我雇用了世界上最聪明的孩子。如果可以,那就雇用。
但我不认为其他人都有麻烦。所以第一,我不认为这关于谁先得到它,说实话。
我们已经拥有几万亿美元用于通用计算机。我们知道未来最重要的问题是基于机器学习的、基于科学计算的、基于AI的。
所以我认为我们应该做的第一件事是投资未来,建造尽可能多的数据中心和原生AI的计算机。今天这应该是多少?5000亿美元。这是世界今年花费的金额。当然,它增长得相当迅速。到2030年,比如说一万亿美元,我相信这一万亿美元的100%应该是原生AI的。
所以这是第一点。世界的计算资本支出应该以AI为重点。以上是第一点。
第二,正如我们早些时候提到的,AI不仅仅是数据中心。AI是制造业。你在制造什么?你在制造称为智能的东西,如果你重组它,它就变成了文字、故事、法律文件、分析报告。对吗?音乐、电影、广告、活动?如果你重组它,它会变成所有这些不同的——如果你重组它,它会变成机器人行动。如果你在方向盘激活方面正确地重组它,你必须以正确的方式重组它。
但这是关于制造tokens。世界应该将多大比例的120万亿美元用于制造智能?我认为是一个非常大的比例。那是我的希望。那是我的信念。如果今天看起来不合逻辑,只需回顾300年,问问世界GDP中有多少是能源生产?
就像我们今天,如果你想产生智能,就要更努力地思考。我们自己做到这一点。但显然,随着时间的推移,能源行业成为世界上最大的行业之一。它只是将两件事转化了。将物理转化为电子。现在我们将电子转化为数字。
因此,基于我刚才所说的,是每年将有多少资本支出用于这种我们称为GPU的机器、GPU基础设施?我认为会是数万亿美元。这是我的信念。我希望它会发生,因为我相信当有一个称为智能制造的行业时,我们都会更好。