英伟达的RTX 3070显卡现在已经解禁了性能评测,它能以RTX 3080 70%的功耗发挥出它80%的性能,能耗比提升了不少,并且售价只要3899元起,对于预算不足以买RTX 3080的玩家来说,RTX 3070是更好也是更实惠的选择。同样的,RTX 3070公版卡据目前的消息来说,也是不在国内市场卖的,所以我们迫不及待的想看看RTX 3070非公卡的情况。
本次拿来作为我们RTX 3070非公显卡首发的是七彩虹的iGame GeForce RTX 3070 Advanced OC显卡,不过在介绍这张卡之前让我们先来回顾一下RTX 3070核心的特性以及这一代安培架构具有的亮点和相关技术。
全新的GA104 GPU
GeForce RTX 3070与上个月发布的RTX 3090/3080不同,用的不是GA102核心,而是用了相对小一点的GA104 GPU,核心面积从628mm2缩小到392.5mm2,晶体管数量也从283亿变成了174亿,芯片面积和晶体管数量都缩小了40%左右,生产工艺依然是三星为NVIDIA定制的8nm工艺,更小的核心换来的当然是更低的发热量与更低的功耗。
完整的GA104拥有6组GPC,但每组的TPC数量从6组减少到4组,一共24组TPC,每组TPC包含2组SM,所以总共拥有48个SM单元,每组SM有128个CUDA,一共有6144个CUDA,8组32位的显存控制器组成256bit的显存位宽。
但RTX 3070所用的GA104-300核心屏蔽了两组SM单元,只启用了46组SM,5888个CUDA,GPU核心基础频率1500MHz,Boost频率1725MHz,显存位宽是完整的256bit,搭配8GB GDDR6显存,等效数据频率14Gbps,显存带宽和上代的RTX 2080/2070一样是448GB/s,显卡TGP是220W,比RTX 3080的320W低得多,比上代的RTX 2070的185W高出不少,介于RTX 2080和RTX 2070 SUPER之间。
NVIDIA Ampere架构简介
而RTX 30系显卡上的SM单元相比RTX 20系的,最大变化是加倍了针对传统计算的FP32单元、引入第二代RT Core以及第三代Tensor Core。
大家都知道在Turing架构中,NVIDIA整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算。不过现代游戏应用中最为常见的还是FP32,因此为了提高计算效率NVIDIA在NVIDIA Ampere 架构上引入了可同时支持INT32或FP32两种数据类型的新ALU。也就是说,现在有两条不同的数据路径,一条能够同时处理整数或者单精度浮点,另一条则单纯处理处理单精度浮点计算。
负责进行实时光线追踪运算的专用硬件单元RT Core在NVIDIA Ampere 架构上也更新到了第二代,最主要是增加了动态模糊的加速运算支持。NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率,官方表示最高可达8倍于上代的速度。另外在基础的BVH计算上,第二代RT Core也可以比第一代快2倍。
Tensor Core这个负责运行AI计算的硬件单元在NVIDIA Ampere 架构上也升级到了第三代。其实之前发布的A100计算卡上已经用上了新的第三代Tensor Core,它能够提供比第二代Tensor Core高出4倍的效能,不过游戏卡上面的Tensor Core进行了一定的精简,其FP16 FMA计算的吞吐量只有GA100核心中的Tensor Core的一半。
而第三代Tensor Core带来的更强劲AI运算有些什么用呢? 答案就是DLSS。随着RTX 30系显卡一同发布的,还有DLSS的更新版 - DLSS 8K。顾名思义,DLSS 8K就是通过深度学习技术将画面分辨率拉伸至8K的新版DLSS,具体来说就是把1440P的画面拉伸至4320P,像素数量跨越了整整9倍。
将不同类型的计算交给不同的单元去处理是从NVIDIA Volta架构就开始采纳的一种理念,当时引入的Tensor Core分流了很多AI相关的运算,而在其后引入的RT Core又将实时光线追踪相关的计算给分流了。但在Turing架构GPU上做不到全部运算都能够并行执行,到了Ampere架构上,NVIDIA提升了GPU内部各种单元之间的并行性,现在传统计算单元、RT Core和Tensor Core这三大单元可以同时工作,在原本基础上继续缩短帧渲染时间。
再之后就是HDMI 2.1这个备受期待的新输出端口了。在HDMI 2.1之下,显卡可以用单线材做到8K60Hz或者4K120Hz的输出。对于想用大尺寸电视打游戏的玩家来说是一个不错的福音。
最后当然就是NVIDIA新推出的RTX IO了。这项技术是NVIDIA借助微软此前推出的DirectStorage API来实现的,将会作为插件的形式与后者整合,可以让显卡绕开CPU直接读取SSD数据,从而降低CPU的占用率。不过由于RTX IO需要依靠Windows的DirectStorage API,并且还需要游戏开发商做针对性的优化,所以最快我们也要等到明年才能看到这项技术的具体应用。
NVIDIA Reflex
伴随RTX 30系显卡一同发布的,有一个对于电竞游戏,或者更仔细地说对于电竞选手来说很重要的新东西,那就是NVIDIA Reflex。那么这个NVIDIA Reflex到底是什么东西呢?其实它是分为两部分的,一部分是硬件,一部分是软件。
硬件部分是一个与我们这次使用的LDAT很相似的东西,叫Reflex Latency Analyzer,它其实可以视作为LDAT的一个进阶版本,是直接预安装在显示器里的,可以用来测量玩家从点击鼠标直到画面出现变化之间的时间差,也就是整套系统的所有延迟。
而软件部分则是NVIDIA Reflex SDK。这个NVIDIA Reflex SDK的作用是降低以及测量渲染延迟的,开发者可以直接整合到游戏内。而在开启其低延迟模式后,可以让CPU与显卡同步,大幅度减少渲染序列,从而降低渲染延迟。
NVIDIA Broadcast
NVIDIA Broadcast是为直播主们推出的,这用到RTX GPU的AI能力来对直播主的背景消除或替换,还有摄像头重构图,甚至帮助麦克风进行背景噪音消除。
在安装了NVIDIA Broadcast软件后,它会在摄像头、耳麦与直播软件之间建立一个中间者的角色,让外置设备可以利用到RTX GPU的AI能力来做一些AI增强效果,耳机和麦克风现在支持了降噪功能,AI会分析出哪些是主要音频,哪些是背景杂音进行降噪,给直播主和观众呈现清晰、有用的声音。
而摄像头现在有了自动重构图以及背景处理能力,从摄像头采集到画面,可以设置经过Broadcast进行处理,再传到OBS这些直播软件中,这可以让直播主的背景变得更为生动灵活,同时也可以降低直播场景的搭建成本。
七彩虹iGame GeForce RTX 3070 Advanced OC显卡规格
至于本次我们RTX 3070非公显卡首发的七彩虹iGame GeForce RTX 3070 Advanced OC,规格可以参考下表:
显卡外观及灯效:质感一流,灯效设计别出心裁
七彩虹iGame GeForce RTX 3070 Advanced OC这张显卡拿到手的第一感觉是质感非常好,导风罩的金属质感加上整卡非常稳固的结构让这张卡令人爱不释手。作为七彩虹的Advanced系列,该卡继续保持了未来工业感的设计风格,导风罩使用了简约化的镜面喷涂,与散热鳍片的颜色很相近,使得整张显卡外观上面非常的和谐与统一。
RTX 3070核心的发热量其实并不算太大,不过该卡正面仍然采用了3个风扇的设计,两端的两个风扇是9cm直径的,中间风扇是8cm直径的,中间风扇的外围还有一圈RGB灯效,出厂默认是七彩虹的标志性红色灯效,玩家可以通过七彩虹的配套软件对该部分灯效进行调节,具有多样的玩法。
GIF
七彩虹iGame GeForce RTX 3070 Advanced OC在这里的灯效设计非常别出心裁,它利用了人眼的视觉暂留效应,让中部风扇在高转速下仍保持仿佛静止状态或实现“无限”扇叶,非常有意思,比常见的彩虹RGB灯效要有趣的多。另外,在显卡的肩部,iGame的logo同样具有RGB灯效,并且它下面那一行细小的Advanced字样也是,显得非常精致。
在视频输出接口的那一侧,可以看到七彩虹iGame GeForce RTX 3070 Advanced OC采用了标准的3个DP接口和1个HDMI接口的常规设计,这个HDMI接口是2.1版本的,可以支持8K 60FPS的视频输出。除此之外,还有一个一键超频按钮,可以将该卡在标准模式和增压模式之间切换,并通过图示说明了按下是增压模式。
电源接口是双8Pin的供电设计,配合PCIE接口,最大可以提供375W的持续供电,对于RTX 3070显卡来说,绰绰有余了。
显卡拆解:真空腔均热板、5根8mm热管、13相供电
拆开七彩虹iGame GeForce RTX 3070 Advanced OC之后,发现该卡除了外表质感优异之外,内在也非常让人惊喜。散热器与GPU的结合部分采用了真空腔均热板的设计,这里面充满有冷凝液和粉形成的独立毛细结构,可通过相变原理将热源热量快速传导发散。并且,还有5根8mm规格的热管穿插于众多散热鳍片之中,可以将GPU核心的热量及时分散到大量的散热鳍片上,然后通过三个大风扇将热量排出。
该卡的PCB也非常整洁、好看,虽然笔者较为排斥“在PCB有可能做的更小的情况下还将PCB做的很大”这样的做法,但是七彩虹iGame GeForce RTX 3070 Advanced OC的PCB确实在做工方面很精细,电子元器件排列非常规整,整个PCB一点也不扎手。
在PCB上可以明显的看到RTX 3070的GA104-300核心,周围有8颗显存颗粒环绕,均为三星的K4Z80325BC-HC14显存,这是GDDR6显存,单颗1GB容量、32bit的位宽,一共8颗组成8GB容量和256bit位宽。
供电方面,可以看到七彩虹iGame GeForce RTX 3070 Advanced OC一共是13相供电,其中10相核心供电在GA104-300核心的左边和上边,3相显存供电在核心的右边。核心供电的MosFET均是来自万国半导体(Alpha & Omega Semiconductor)的,不过上面只刻了生产批次编号。
显存供电的MosFET是Sinopower的一颗SM4364AWW7EX和两颗SM4373CU53A桥接的方式,核心供电的PWM控制器是一颗uP9512R,在PCB的反面。
测试部分
七彩虹iGame GeForce RTX 3070 Advanced OC具有双BIOS切换功能,即内置有两套BIOS,一套是超频至1815MHz Boost频率的方案,另一套是与RTX 3070公版卡一样的1725MHz Boost频率的方案,玩家可以通过按该卡视频输出接口那面的切换按钮来切换这两种方案。
先看超频至1815MHz Boost频率的方案,从GPU-Z可以看到,此时七彩虹iGame GeForce RTX 3070 Advanced OC显卡的基础频率为1500MHz,Boost频率为1815MHz,显存等效数据速率为14Gbps,并且七彩虹iGame GeForce RTX 3070 Advanced OC的风扇具有待机停转的功能,通过GPU-Z的传感器监测页面可以看到待机状态下,风扇转速为零。
并且该方案下,七彩虹iGame GeForce RTX 3070 Advanced OC的默认温度上限是83摄氏度,玩家可以选择向上解锁到90摄氏度,功耗上限默认为270W,玩家可以选择向上解锁到最大290W。
另一套与公版一样的方案如上,Boost频率降为1725MHz,同样具有风扇待机停转功能,温度方案也是默认温度上限83摄氏度,玩家可以选择向上解锁到90摄氏度,但是功耗上限降为默认为220W,玩家可以选择向上解锁到最大240W。考虑到玩家的实际情况,以下的测试都是在1815MHz Boost频率方案下进行的。
测试平台
这次对于七彩虹iGame GeForce RTX 3070 Advanced OC的性能测试笔者搭建了一套不同于英伟达RTX 3070公版首发的测试平台,选择搭建了一套Intel平台,处理器为Core i7-10700K,主板是七彩虹iGame Z490 Vulcan X V20主板,内存是2条16GB的芝奇皇家戟DDR4-3600内存组成的32GB双通道配置,电源是ROG的1200W雷神电源,其他各方面配置也是足够高的,尽量排除了系统瓶颈。
基准性能测试
我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3DMark显卡单项的得分。
通过测试来看,七彩虹iGame GeForce RTX 3070 Advanced OC相比RTX 3070公版平均性能提升幅度为4%,这是该卡在增压模式下(Boost频率为1815MHz)的成绩,性能提升幅度约等于频率的提升幅度。
实际频率
由于英伟达的GPU Boost技术,显卡实际的运行频率一般都是高于其标称的Boost频率的,笔者在3DMark Fire Strike压力测试中通过GPU-Z记录了该卡的核心实际运行频率,结果如下:
可以看到,七彩虹iGame GeForce RTX 3070 Advanced OC在增压模式下(Boost频率为1815MHz)的实际核心频率还要高于1815MHz不少,大部分时间稳定在1980MHz,最高到过1995MHz。
游戏性能测试
游戏测试部分分为三个部分,分别是不开实时光线追踪效果和DLSS技术下的2K分辨率游戏测试和4K分辨率游戏测试,最后在加上4K分辨率下开启实时光线追踪效果和DLSS技术的游戏性能测试。
2K游戏测试
这部分游戏实测选择了6款游戏进行实测,测试均将它们开到预设最高画质(《地铁:离去》是开启Ultra画质),分辨率设为2K,此外默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除以上所述之外其他选项均为默认设置,且均采用游戏自带的Benchmark输出结果如下:
4K游戏测试
这部分测试同样均将它们开到预设最高画质(《地铁:离去》是开启Ultra画质),分辨率设为4K,默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除以上所述之外其他选项均为默认设置,且均采用游戏自带的Benchmark输出结果如下:
4K且开启光线追踪和DLSS游戏测试
此部分还选择了几款已经上市的支持实时光线追踪的3A大作(《死亡搁浅》PC版不支持实时光线追踪但是支持DLSS,也放这里了)。全部游戏都将画质开到最高(《地铁:离去》是开启Ultra画质),并且将实时光线追踪效果开到“高”且打开DLSS,DLSS可以选择模式的均选择为性能模式。
可以看到,面对2K分辨率的游戏环境,七彩虹iGame GeForce RTX 3070 Advanced OC是完全游刃有余的,甚至几款新作都可以跑出将近120FPS的流畅度。而面对4K分辨率的游戏环境,七彩虹iGame GeForce RTX 3070 Advanced OC也差不多可以玩,然后即使是4K分辨率且打开实时光线追踪效果,在DLSS技术的加持下,七彩虹iGame GeForce RTX 3070 Advanced OC也能在《地铁:离去》、《古墓丽影:暗影》、《看门狗:军团》这样的3A大作中取得50FPS以上的流畅度,可以说游戏性能非常强大。
温度测试及噪音表现:满载最高仅66℃
我们的显卡散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5℃左右)下进行测试,本次测试时环境温度约为25.2℃。待机温度是开机以后记录10分钟,满载温度则是完成3DMark Fire Strike压力测试后记录下,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线。
七彩虹iGame GeForce RTX 3070 Advanced OC具有风扇待机停转的功能,所以待机状态下全靠被动散热。经过十分钟的待机测试,从开始的32摄氏度上升到40摄氏度左右,仍然属于很清凉的范畴。满载状态下,最高温度仅仅才只有66℃,属于非常好的满载温度控制了。
噪音方面,七彩虹iGame GeForce RTX 3070 Advanced OC的风扇待机停转功能让它在待机状态下完全无任何噪音,满载状态下,风扇最高转速2258 RPM,但是就听感来说,在办公室的较安静环境下,并未感觉到明显的噪音。
功耗测试
通过我们专用的显卡功耗测试仪器,可以分别精确地测量显卡PCI-E、外接电源接口瓦特数,显卡最大功耗在3DMark Fire Strike压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。
经过测试,七彩虹iGame GeForce RTX 3070 Advanced OC的待机功耗平均为22W,满载功耗平均为236W,搭配电源的话,考虑到CPU等平台其他部件的功耗,建议650W的电源起步,当然,如果你预算允许,我们推荐搭配750W起步的电源会更好。
超频测试
将功耗上限和温度上限解锁到最高之后,经过多番手动超频尝试,七彩虹iGame GeForce RTX 3070 Advanced OC最终在核心频率+135MHz,GDDR6显存数据速率+3Gbps下完成超频,超频幅度非常大。这个状态下,这张七彩虹iGame GeForce RTX 3070 Advanced OC能顺利通过3DMark的FireStrike项目测试并且分数最高, 此时这张七彩虹iGame GeForce RTX 3070 Advanced OC的Boost频率为1950MHz,显存等效频率为17Gbps。这张七彩虹iGame GeForce RTX 3070 Advanced OC在超频状态下的实际频率以及运行3DMark FireStrike项目的显卡得分与默频状态下显卡得分的对比如下表所示。
说实话七彩虹iGame GeForce RTX 3070 Advanced OC这么大的超频幅度着实让我没有想到,毕竟对于这颗RTX 3070核心来说,增压模式已经是超频了90MHz的核心频率,没想到居然还能再往上拉高135MHz,而且显存数据速率更是等效超频了3Gbps的幅度,相当恐怖。在这样灰烬级的压榨下,这张七彩虹iGame GeForce RTX 3070 Advanced OC的核心实际频率最高来到了2145MHz的高度,并且超频提升幅度也达到了10.5%之多。
总结:温度控制和超频潜力尤为亮眼
RTX 3070非公版显卡的测试最让我印象深刻的是两点,一是满载状态下的温度控制,二是极大的超频潜力。虽然仅靠七彩虹iGame GeForce RTX 3070 Advanced OC一张显卡并不能代表整个RTX 3070非公版显卡的情况,但是至少说明对于RTX 3070这款核心非公版这边的操作空间是很大的,我们超频后的核心实际频率可是相比RTX 3070公版的1725MHz Boost频率高了整整420MHz。
而具体说到这张七彩虹iGame GeForce RTX 3070 Advanced OC显卡,其不光是外在质感一流,而且别出心裁的灯光设计也让它把灯效玩出了新花样,简单易用的一键超频按钮对于小白用户来说,操作非常友好而且非常方面。
具体到显卡难以被用户察觉的内在,七彩虹iGame GeForce RTX 3070 Advanced OC采用了真空腔均热板搭配5根8mm规格的热管,在散热方面非常的大手笔,如此堆料配合散热器的三个大风扇,所以才有了满载温度仅66摄氏度的优秀表现。而且热管全部镀镍处理,PCB也非常的整洁,这些细节方面也是都做到了最好。
除了散热优异,10+3一共13相的具有冗余的供电设计也是七彩虹iGame GeForce RTX 3070 Advanced OC具有恐怖超频潜力的有力支持。作为首批发售的非公版RTX 3070显卡之一,七彩虹iGame GeForce RTX 3070 Advanced OC在价格上仅保持了官方的建议零售价4699元,现已开售(点此购买),性价比非常高,笔者非常推荐。
另外,七彩虹的Vulcan系列、Ultra系列和战斧系列显卡也于今晚同步开售,iGame GeForce RTX 3070 Vulcan OC售价为5199元,iGame GeForce RTX 3070 Vulcan售价为4999元,iGame GeForce RTX 3070 Ultra OC售价为4299元,而战斧 GeForce RTX 3070售价则看齐公版3899元。
iGame Ultra系列除了黑色版还将于双十一开门红11月1日那天预售白色款的iGame GeForce RTX 3070 Ultra W OC,售价4399元,玩家可以按需选择。