云计算大厂接连觉醒,自研芯片决战算力时代!
编译 | ZeR0
编辑 | 漠影
芯东西2月14日报道,继亚马逊、华为、阿里巴巴、微软后,又一家云计算大厂的自研Arm服务器芯片提上日程。
知情人士称,谷歌在设计服务器处理器方面已经达到了一个关键里程碑。台积电可能会在2024年下半年开始量产谷歌的服务器芯片,这些芯片最早可能在2025年应用于谷歌服务器中。
两款芯片均采用5nm工艺,也就是说,等到投用时,估计它们会比当时市面上最先进的3nm芯片落后一代。相比通用x86芯片,基于Arm的定制服务器芯片能节省大量的功耗和成本。
01.
已交台积电试产,性价比超英特尔芯片
自研服务器芯片,对于谷歌的服务器租赁业务来说是势在必行,目的是降低运营数据中心成本,并与其云计算业务竞争对手亚马逊保持同步。
这些年来,在云计算市场,谷歌云一直被亚马逊AWS和微软Azure压着打。本来谷歌在底层算力方面下了一步先手棋TPU,然而很快AWS就通过收购在芯片布局上铺开阵仗,推出定制服务器芯片、AI训练和推理芯片、网络处理器芯片等。反倒是谷歌的第四代TPU迟迟未披露详细数据。
知情人士称,由前英特尔工程主管Uri Frank领导的谷歌服务器芯片设计团队,至少在过去两年里一直在开发两款基于Arm技术的服务器芯片,代号分别为Maple和Cypress。
谷歌已经完成了Maple处理器的设计,该处理器基于美满电子(Marvell)的现有设计。据知情人士透露,谷歌已将设计交给台积电进行试产。
Maple是作为以防Cypress失败的“替补”。Cypress采用以色列团队开发的内部设计,将于第二季度交付给台积电。
谷歌希望其初代Maple和Cypress处理器能够提供至少与英特尔和AMD服务器芯片相当的性能。一位知情人士称,这样谷歌就不再需要花零售价购买供应商的芯片,而是花钱生产自研定制芯片,其最终目标是实现自家芯片的性价比比英特尔的同类产品高出20%~40%。
此前多家云计算巨头均已自研Arm服务器芯片。亚马逊在2018年12月发布其首款自研Arm服务器芯片Graviton,华为在2019年1月发布其首款自研Arm服务器芯片鲲鹏920,阿里平头哥在2021年10月发布其首款Arm服务器芯片倚天710。此前微软也被曝出正在自研Arm服务器芯片。
Arm服务器芯片在数据中心的日益兴起,正对英特尔和AMD主导的x86服务器芯片市场产生越来越大的威胁。据市研机构IDC数据,基于Arm的服务器芯片占2022年出货的所有服务器芯片的4.5%,预计该数字将在2026年增至10.3%。
谷歌发言人表示不对传言发表评论。英特尔、台积电、Marvell、AMD的发言人均未置评。
02.
给数据中心开源节流,从自研芯片下手
据估计,谷歌可能需要长达十年的时间,才能逐步停用英特尔和AMD制造的服务器芯片。
一些云客户可能更喜欢使用与传统芯片配合得更好的软件,而谷歌的搜索、视频和广告等服务需要这些传统芯片来为云客户提供支持。
谷歌自研人工智能(AI)芯片TPU已经在为搜索、YouTube推荐、在线广告、语言翻译等业务提供AI加速支持。谷歌从2016年开始逐步淘汰它从英伟达购买的GPU,现在已经几乎完全使用自研TPU芯片来处理这些工作负载。同时谷歌仍然采购了大量的英伟达芯片来为其更想用英伟达软硬件来训练其AI模型的云客户提供服务。
服务器是迄今为止数据中心的最大成本所在,超过了电力、房地产和冷却。然而近年来,相对于性能的进步,服务器芯片及其他硬件正变得越来越昂贵,因为晶体管微缩日渐逼近物理极限。此外,随着芯片变得越来越大,它们也需要更多的功率和散热。在新冠疫情、基于AI的服务催化下,数据中心的需求一直上升。
谷歌母公司Alphabet在过去五年中平均每年花费 250亿美元用于资本支出,其中约一半可能用于数据中心及其内部的服务器。一位前雇员称,截至今日,它可能每年至少花费150亿美元用于维护数据中心的运营费用,包括服务器折旧。
随着谷歌推出对标ChatGPT的对话式AI服务Bard,其成本可能会上升得更快。
03.
结语:从专注特定需求到转向通用芯片
研究公司SemiAnalysis首席分析师迪伦·帕特尔 (Dylan Patel)认为,谷歌以前只为特定需求制造芯片,例如YouTube的视频编码或为需要机器学习的服务提供动力。谷歌最近将目光投向了服务器芯片等更通用的芯片,因为它拥有足够多的数据中心,这样的投资物有所值。
对于谷歌来说,仅仅自研服务器芯片是不够的,它还必须开发配套的软件,使其自研芯片在实际应用中能发挥出比英特尔和AMD x86芯片更好的性能。这样云计算客户才可能愿意转用由谷歌定制自研芯片驱动的服务。
来源:The Information