昨天晚上,英特尔在年度架构日活动上,正式公开了第12代酷睿Alder Lake平台和Xe HPG锐炫游戏显卡的架构详情。下面,咱们就来简单了解一下来自2022年新品的特色吧。
第12代酷睿一门三剑客
第12代酷睿Alder Lake平台将衍生出3大序列产品线,分别是面向桌面平台的S系列(LGA1700独立封装,最多8大8小16核心24线程,集成32EU核显,功耗最高125W);低功耗版的UP3系列(BGA Type3整合封装,最多6大8小14核心20线程,集成最多96EU核显,功耗12W~35W);超低功耗的UP4系列(BGA Type4整合封装,最多2大8小10核心12线程,集成最多96EU核显,功耗低至9W)。
其中,UP3和UP4都是笔记本专用。UP3还会被进一步细分出U15和H35,取代现有的i5-1135G7和i5-11300H等老将。UP4则是Y系列,更加适合平板二合一设备。如果不出意外,2021年第12代酷睿Alder Lake平台还会增加面向游戏本的H45系列移动版,核心规模可以达到S系列的级别。
3大序列产品线的架构相同,而且都集成新一代GNA 3.0高斯神经加速器,它们的差异主要在于核心规模,以及对一些原生功能的支持。比如,只有移动版才标配IPU(图像处理器单元)、雷电4和Wi-Fi6,而且UP3提供4个雷电4端口,UP4则仅支持2个。
作为第12代酷睿Alder Lake平台的“皇帝”,最多将拥有8大核8小核,共计24个线程,三级缓存最高可达30MB。作为对比,第11代酷睿移动版的三级缓存最高为24W,桌面版更是仅有16MB。
第12代酷睿的移动版支持DDR5-4800、DDR4-3200、LPDDR5-5200(板载)、LPDDR4X-4266(板载)四种规格的内存,还支持内存的动态电压频率缩放,并强化超频。由于台式机平台大都采用标准的内存插槽设计,所以支不支持LPDDR5和LPDDR4X就不重要了。
第12代酷睿桌面版的CPU部分提供16条PCIe 5.0和4条PCIe 4.0通道,与其配套的芯片组(Z690)则最多支持12条PCIe 4.0和16条PCIe 3.0。移动版可能没那么多,但也足够满足高性能独显和PCIe 4.0 SSD的带宽了。
第12代酷睿通过三种高速通道将各个模块串联了起来。第一个是Compute Fabric,用于连接CPU和高速缓存,带宽可达1TB/s,支持动态缓存优化。第二个是Memory Fabric,用于连接内存和其他模块,带宽最高204GB/s,支持动态位宽和频率。第三个是I/O Fabric,用于输入输出,最高带宽64GB/s,支持基于需求的实时带宽控制。
Lakefield的接班人
英特尔曾在第10代酷睿时期推出过代号为“Lakefield”的混合酷睿平台——酷睿i3-L13G4和i5-L16G7这两颗处理器首发英特尔Foveros 3D封装技术和混合CPU架构(Intel Hybrid Technology),采用了类似ARM big.LITTLE大小核技术,内置1+4大小核组成的5核心,结合7W的TDP,可以帮助移动设备进一步瘦身。
可惜,与Lakefield平台搭档的Windows 10系统却不太给力,对大小核的优化不到位,以至于搭载这一平台的Windows设备没能发挥出能效比方面的优势,很多消费者甚至都不知道Lakefield到底是个啥。
第12代酷睿平台最大的特色,就是继承了来自Lakefield的衣钵,同样采用大小核混合架构设计。
大核名曰Golden Cove
英特尔将第12代酷睿内的大核称为“性能核心”(Performance Cores),又称“P核心”(P-Cores),采用全新的Golden Cove微架构,支持超线程技术、AVX-512指令集和DLBoost深度学习加速功能,最多8核心16线程。
Golden Cove微架构是此前第10代酷睿Sunny Cove、第11代酷睿移动版Willow Cove、第11代酷睿桌面版Cypress Cove的迭代升级版。Golden Cove微架构在大量基础模块都重构或升级,官方称其是近十年来的最大变革,堪比当年的Skylake,在提高速度、突破低时延和单线程应用程序性能的限制。该架构还支持AMX高级矩阵扩展指令,内置下一代AI加速技术,用于学习推理和训练,包括专用硬件和新指令集架构,可明显提高矩阵乘法运算。
英特尔表示,Golden Cove微架构相比于现在第11代酷睿桌面上的Cypress Cove实现了平均大约19%的IPC(同频性能)提升。
小核名曰Gracemont
英特尔将第12代酷睿内的小核称为“能效核心”(Efficiency Ccores),又称“E核心”(E-Cores),采用全新的Gracemont微架构,不支持超线程技术,最多8核心8线程。Gracemont是第一个支持AVX2指令集的能效核心,还支持整数AI操作新扩展、Intel控制流强制技术、Intel虚拟化重定向保护技术。
Gracemont微架构隶属于Atom凌动家族,是继Bonnell→ Saltwell→ Silvermont→ Airmont→ Goldmont→ Tremont之后的迭代升级版。Gracemont微架构的核心非常小,在1个Golden Cove大核心的空间里可以塞进4个Gracemont小核心,以及它们共享的4MB二级缓存。
英特尔表示,Gracemont微架构的IPC性能相比第6代酷睿Skylake提升超过40%,在同等性能下功耗则可降低40%。4核4线程的Gracemont对比2核4线程的Skylake,峰值性能可提升80%,而同等性能下功耗可降低80%。
第12代酷睿最爱Windows 11
上代Lakefield平台之所以没能掀起太大的波澜,除了其自身硬件规格偏弱以外,与其配套的Windows 10系统也玩不转大小核架构,无法发挥其应有的能效比优势。
为此,英特尔针对第12代酷睿大小核混合架构设计了全新的“Thread Director”(线程调度器),并与微软进行了深度调优,在Windows 11系统的任务调度器可更好地将合适的负载分配给不同核心/线程。
英特尔表示,Thread Director可以在最短30微秒的时间里确定一个线程的性质、归属,而传统的系统调度器需要上百甚至几百微秒,还可能分配错误。此外,Thread Director还会针对性地优化频率,尤其是在移动端,保证效率的同时还能提高能效,而且可以在微秒级别调整频率。
换句话说,只有Windows 11系统才能“拯救”和“玩转”大小核。
Xe HPG锐炫游戏显卡驾到
在《NVIDIA和AMD吓一跳!英特尔锐炫品牌独显真来了!》一文中,CFan曾报道了英特尔锐炫品牌独显的消息。在英特尔架构日活动上,官方还公布了Xe HPG架构的不少细节。
首先,英特尔锐炫显卡并没有采用自家的工艺,而是由台积电旗下的6nm工艺代工。
在过去,英特尔GPU(如UHD、锐炬Xe核芯显卡)的基本模块都是“EU执行单元”。在锐炫显卡时代,将改为“Xe核心”,每个Xe核心内都包含16个矢量单元(每个矢量单元还可进一步拆分成8个FP32 ALU单元),16个矩阵数学单元,零级和一级缓存、载入存储单元等等。
Xe核心的上一层级是“渲染切片”(Render Slice),专为DX12 Ultimate设计,每个包含4个Xe核心、4个光追单元、4个纹理采样器、几何前端、光栅前端、2个像素后端,支持DirectX光追和Vulkan光追。
英特尔锐炫品牌下的首款产品型号是Alchemist(DG2),包含最多8个渲染切片,共享大容量二级缓存,并首发支持DisplayPort 2.0。
英特尔表示,锐炫Alchemist显卡采用的Xe HPG微架构,相比已用于第11代酷睿核显的Xe LP微架构,可以实现1.5倍的频率提升、1.5倍的能效提升。目前,英特尔已经完成了内核显卡驱动程序组件的重新架构,特别是内存管理器、编译器,号称计算密集型游戏的吞吐量平均提高了15%,最多可达80%,而游戏加载时间缩短了25%。
在未来,锐炫显卡还会从Alchemist逐步迭代到Battlemage、Celestial和Druid。