NVIDIA用1年左右的时间,初步布局好基于安培(Ampere)架构GPU,桌面端从兼顾游戏、专业创作的GeForceRTX3090布局到主流级别的RTX3060,移动端更是发布GeForceRTX3050的入门级型号。按照以往的两年更新一次架构的节奏来看,“年中小改款”的GeForce显卡也需要积极推进。

NVIDIA在5月31日带来两款Ti系列的新品,分别是将于6月2日解禁上市的GeForceRTX3080Ti和6月9日解禁上市的GeForceRTX3070Ti。我们在6月2日首发评测七彩虹的iGameGeForceRTX3080TiAdvencedOC,七彩虹送测战斧GeForceRTX3070Ti,下面就一起看看这款显卡的表现。

NVIDIA安培架构GPU沿用了特定组数的CUDA单元、RT核心、Tensor核心封装为SM单元,然后将一定组数的SM单元封装为一个GPC结构,最后将几组GPC单元和内部缓存等其他硬件组成GPU核心。安培架构中每组SM单元内建4个TensorCore核心、128个CUDA核心、一个RT核心。

RTX3070Ti核心采用完整版的GA104核心,拥有48组6144个CUDA核心、192个TensorCore核心和48个RTCore核心。显卡的显存容量为8GB,显存位宽依然是256Bit,但19Gbps速率的GDDR6x显存还是为显卡带来608GB/s的带宽。七彩虹战斧GeForceRTX3070Ti8G的核心频率为1580MHz,Boost频率为1770MHz,分别比RTX3070高80MHz和40MHz。由于采用GDDR6x显存,整卡热设计功耗达到290W,比RTX3070的220W高出不少。

安培架构解析

与图灵架构的RTX20系列相比,采用安培架构的RTX30系列在SM单元上的最大变化,是将用于传统计算的FP32单元翻倍,引入第二代RTCore以及第三代TensorCore。

图灵架构中整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算。考虑到现代游戏多数以FP32进行运算,所以NVIDIA在安培架构上引入可同时支持INT32或FP32两种数据类型的新ALU,让两条不同数据路径能够同时处理整数或者单精度浮点,另一条则单纯处理处理单精度浮点计算。

第二代RTCore核心负责进行实时光线追踪运算,增加动态模糊的加速运算支持。新加入的插值算法保证动态模糊精确性,同时提高实时光线追踪效率,最高可带来8倍于上代的计算速度。第二代RTCore的BVH计算也比第一代快2倍。

负责运行AI计算的TensorCore在安培架构上升级到第三代,能够提供比第二代TensorCore高出4倍的效能。与A100计算卡上的TensorCore相比,GeForce游戏卡上的TensorCore经过一定的精简,其FP16FMA计算的吞吐量只有GA100核心中的TensorCore一半的性能。第三代TensorCore带来的DLSS2.1,通过渲染1440P的画面输出4320P的8K游戏画面。

战斧GeForceRTX3070Ti外观设计

七彩虹战斧GeForceRTX3070Ti显卡配备一个HDMI2.1,可以单线输出8K/60Hz或4K120Hz。另外三个接口则是DisplayPort1.4a。得益于非公版PCB设计,显卡的供电接口采用全新的12pin设计,能够为显卡提供稳定的功率输出。GPU支持PCIE4.0接口,能够大幅减少系统的带宽瓶颈,ResizableBAR更是进一步提升CPU和GPU之间的数据交换。

七彩虹战斧GeForceRTX3070Ti采用经典的红黑配色,正面采用类似钻石的切割设计。三个9cm支持自动启停功能的风扇,能够让显卡在负载情况下保持安静、高负载确保散热能力,带来更人性化的的使用体验。

显卡是七彩虹“COLORFUL”的品牌LOGO,通电后LOGO可实现呼吸闪烁。显卡采用全金属背板,不仅提升显卡的强度,背部的个性化的涂鸦图案能更好地满足用户的个性化选择。显卡PCB与背板之间还有导热贴提升供电部分的散热性能。

七彩虹战斧GeForceRTX3070Ti显卡拆解

由于使用公版PCB,所以七彩虹战斧GeForceRTX3070Ti的元器件布局相当紧凑。供电采用NVIDIA新标准的12pin接口,配合内部的9+2相供电设计,让750W电源就能满足显卡正常使用,不仅省去升级高功率电源的需求,同时还能降低机箱内部走线的难度。

七彩虹战斧GeForceRTX3070Ti显卡使用于公版相同的PCB设计,核心为完整版的GA-104-400-A1,显存颗粒仍然来自美光,型号D8BWW的GDDR6X显存单颗容量1GB,位宽32bit,8颗组成8GB、256Bit位宽。

性能测试

测试平台如上,内存是4条8GB七彩虹捍卫者DDR4-3200,组成32GB双通道,并在BIOS中打开XMP让内存在3200MHz的频率上运行,同时在BIOS中打开ResizableBAR,其他均为默认设置。

基准性能测试

显卡基准性能测试依然采用3DMark,测试项目包括FireStrike、FireStrikeExtreme、FireStrikeUltra、TimeSpy、TimeSpyExtreme以及PortRoyal六个项目。全部均在2K和4K分辨率下进行排分测试,具体的单项得分成绩见下表。

从基准性能测试来看,RTX3070Ti的性能比RTX3070有3%左右提升,但明显落后于RTX3080。4K分辨率下的游戏模拟TimeSpyExtreme的性能更是落后RTX3080多达30%。

传统光栅化游戏测试

传统光栅化游戏测试采用《古墓丽影·暗影》、《刺客信条·奥德赛》、《绝地求生》、《赛博朋克2077》、《GTA5》、《巫师3》,测试2K和4K两种分辨率,采用预设中最高画质设置。

在6款游戏2K分辨率的实测来看,RTX3070Ti平均表现就是RTX3090的97%的性能,平均领先RTX3080则达到12%,领先上一代的旗舰RTX2080Ti达到38%。

在4K分辨率下,RTX3070Ti小幅领先RTX3070,《赛博朋克2077》的落后RTX3080最高达60%,最小的《GTA5》月24%。

实时光追游戏测试

光追测试《赛博朋克2077》、《古墓丽影·暗影》、《控制》、《死亡搁浅》、《我的世界》五款游戏,光线追踪效果均设为“高”,DLSS2.0均选择为“性能”模式。

开启光追后在2K分辨率下,RTX3070Ti的游戏性能领先RTX3070约5%,落后RTX3080在20%~40%之间。4K分辨率的情况与2K大致相同,RTX3070Ti与RTX3080之间的性能差在17%~48%之间。

烤机测试

GPU烤机测试安装在机箱内,测试环境温度约为26℃。待机温度是开机以后记录10分钟。烤机软件为FurMark,通过GPU-Z的LogtoFile功能记录温度、各项功耗、频率等信息。

由于七彩虹战斧GeForceRTX3070Ti采用6热管和3个9cm风扇为显卡提供强大的散热性能,显卡在机箱内的待机温度为56℃,满载后的最高温度86℃,大部分时间的温度稳定在83℃。官方的TGP整卡功耗为290W,测试中的显卡功耗始终控制在290W内,其中GPU功耗224W。频率方面,3Dmark跑分中的最高频率可加速至1905MHz,烤机的功耗始终控制在1770MHz。

评测总结

从硬件规格来说,GeForceRTX3070Ti和RTX3070之间差别并不大,能够明显感受到RTX3070Ti将直接取代RTX3070,硬件限制挖矿性能让显卡的市场和价格不再被“矿老板”左右。

只是从RTX3080Ti首发上市的情况来看,新品并不能在短时间内解决显卡稀缺的问题,虽然Ti系列已经限制了挖矿算力,但依然比上代RTX20系列好不少,加上专用挖矿的CMP显卡毫无性价比的状态,相信“矿老板们”依然想冲RTX3080/70Ti这两款新显卡。

举报/反馈

天极网

44.1万获赞 66.9万粉丝
妙趣科技 专业范儿 好玩的数码资讯看天极
天极网官方账号,优质数码领域创作者
关注
0
0
收藏
分享