中国国家超级计算中心(NUDT)在2019年初推出了天河-3系统的原型,经过30家当地机构的测试后,该系统受到了广泛关注。中国科学院和中国空气动力学研究与发展中心是其中著名的评估机构。天河-2系统在全球超级计算机排名中位居第七,性能为33.86 petaFLOPS/s。然而,关于天河-3系统的内部构造一直是一个谜,直到《Next Platform》的作者Prickett Morgan透露了一些独家内部信息。
根据Prickett Morgan的报道,天河-3系统采用了广州实验室设计的MT-3000处理器。这一消息引起了广泛关注,因为NUDT由中国政府所属的国防科学技术大学管理。《Next Platform》此前多次披露了与中国科学突破相关的详细信息,其中包括国家超级计算中心(无锡)的“Oceanlight”系统。天河-3和Oceanlight将面临来自美国的“El Capitan”的竞争,后者是由劳伦斯利弗莫尔国家实验室与计算引擎供应商AMD合作建造的主力超级计算机。
据传闻,天河-3的峰值性能为2.05 exaflops,高性能LINPACK测试持续性能为1.57 exaflops。他还提到,无锡国家超级计算中心的Oceanlight系统是全球第二强大的计算机,峰值性能为1.5 exaflops,持续性能约为1.22 exaflops。不过,即将推出的美国El Capitan系统可能会超过这两个系统,预计其峰值性能将达到2.3 exaflops。
关于天河-3系统的硬件构造,过去的报道称其采用了基于ARM架构的“飞腾”CPU(FT-2000+)和“(更新的) Matrix-2000+ DSP加速器,也称为MT-2000+”。而完整版本的天河-3系统则采用了一组非常强大的内部硬件,并进行了一些重大设计修订。MT-3000处理器不再是加速器,而是一种混合设备,具备CPU和加速器计算功能,以及三种不同种类的内存。这使得MT-3000更类似于AMD的“Antares”MI300A CPU-GPU混合设备,而不是传统的离散CPU-GPU系统。
尽管目前我们还不能确定MT-3000的制造工艺,但可能是14纳米、10纳米甚至7纳米。如果中国本土的晶圆厂中芯国际能够制造出足够数量的优质MT-3000零部件,那么无论成本如何,NUDT都能够制造出这一系统。这些新的内部硬件设计使得天河-3系统在超大规模计算方面具备了突破性能。