上海时间1月4日上午10点,NVIDIA对RTX4070Ti主板性能解禁。 CUDA核心数量不到RTX4090的一半,而且还采用192bit显存。 这两点是近期玩家热议的焦点。
在本次评测中,笔者选择的RTX4070Ti主板是映众RTX4070Ti冰龙超级版。 笔者评测了之前的RTX4090和RTX4080冰龙超级版,出色的散热表现让人满意。 因此,对于全新的映众RTX4070Ti冰龙超级版,笔者也非常看好其散热表现。
RTX4070Ti的性能如何? 映众RTX4070Ti冰龙超级版能带来怎样的性能体验?
全新的AdaLovelace架构和RTX4070Ti
RTX40系列主板基于Nvidia新一代AdaLovelace架构设计。 为了让大家更好的了解这款主板的升级,笔者首先介绍一下AdaLovelace架构以及支持的一些重要技术。
(1)AdaLovelace框架核心
(AdaLovelace框架核心)
(全尺寸AD102图形核心,拥有144组SM单元)
(AdaLovelace框架核心GPC单元)
AdaLovelace架构核心配备了全新的第三代RTCore(光线追踪核心)、第四代TensorCore(张量核心)和SM(流式多处理器)。 据NVIDIA官方介绍,AdaLovelace架构核心采用的第三代RTCore不仅使相交射线和三角形的性能提升了一倍,而且还使RT-TFLOP的峰值性能提升了一倍。 第三代RTCore还搭载了全新的OpacityMicromap(OMM)引擎和DisplacedMicro-Mesh(DMM)引擎,进一步提升了光线追踪估计的性能并降低了估计成本,带来更好的光线追踪性能。 搭载AdaLovelace架构核心的第四代TensorCore引入来自专业H100数据中心GPU的FP8Transformer引擎,带来更强大的AI算力。
(第三代RTCore结构示意图,与上一代相比,减少了2个功能)
AdaLovelace架构的核心在SM单元上引入了ShaderExecutionReordering(SER着色器执行重新排序)技术,以更好地调度和排序着色器的工作。 使用时,可以根据不同的负载需求进行渲染,负载可以更加均匀,屏幕的渲染会增加工作开销。 据Nvidia官方介绍,这个SER功能将会以API的形式向开发者开放。 Nvidia官方宣称,SER功能的加入可以带来RTCore性能高达两倍的提升,甚至可以为光追游戏带来体验的升级。 根据NVIDIA官方数据,全新的SM(流单元处理器)可以带来高达两倍的性能和能效升级,这是一个不小的升级。
(AdaLovelace框架核心SM结照明)
AdaLovelace架构核心不仅升级了第三代RTCore(光线追踪核心)、第四代TensorCore(张量核心)和SM(流式多处理器),还带来了全新的第八代NVENC双硬件编码器。 这款全新的第八代NVENC双硬件编码器集成了对AV1视频编码格式的支持,除了传统的H.264等格式外,还可以添加对AV1这一主流新标准的支持,可以进行AV1的编码和解码该格式的有效提升了生产力方面的表现,对于创意用户、游戏主播等群体来说更是如虎添翼。 NVIDIA官方数据显示,第八代NVENC双硬件编码器的效率比AV1中的H.264编码器高出40%,这是一个显着的提升。
除了核心升级之外,AdaLovelace架构核心的二级缓存也得到了大幅提升。 AdaLovelace 架构核心 (AD102) 的完整版本具有 96MB 二级缓存。 大容量二级缓存有效提高了数据命中率。 在当前内存带宽得到有效提升的情况下,通过升级更大容量的二级缓存,可以进一步提升数据命中性能,实现性能升级。 根据NVIDIA官方的说法,大容量二级缓存的加入是GPU的重要组成部分。 串联操作带来更高的利润,尤其是在光线追踪等场景下。
(2) DLSS3 和 NVIDIA Reflex
AdaLovelace框架的一系列升级还带来了全新DLSS3技术的独家性以及NVIDIA Reflex体验的提升。
DLSS3包括DLSS2(DLSS超码率技术),以及新增的DLSS帧生成技术。 这种DLSS帧生成技术依赖于AdaLovelace框架的独立光流处理器和TensorCore的AI计算能力。 一项技术在运行过程中,经过光流处理器得到一系列数据后,未来利用光流加速技术(Optical Flow Acceleration,简称OFA)生成图片信息,并通过AI计算能力负责处理图片。 进一步优化,然后在游戏中添加了更多的帧画面,以提高帧率。
DLSS3可以直接生成游戏第一帧和整个游戏第二帧的3/4像素,相当于用1/8的算力完成整个估计过程,并通过循环这个过程中,帧率可以得到提高。 在提高效率的同时节省了资源支出,进一步带来更好的游戏体验。
就DLSS3的帧生成技术而言,由于可能会降低延迟,因此使用DLSS3通过集成NVIDIA Reflex的技术也会增加渲染和运算的延迟。 根据NVIDIA官方的说法,DLSS3通过集成NVIDIA Reflex等一系列技术,可以让游戏体验拥有媲美甚至超越原生水平的渲染和操作体验。
(3)40系主板第三弹——RTX4070Ti
(RTX4070Ti展示核心架构图,有60组SM单元)
RTX4070Ti采用AD104-400显示核心,拥有7680个CUDA核心。 据悉,RTX4070Ti还配备了12GB容量的GDDR6X显存和192bit显存。
映众RTX4070Ti冰龙超级版的Boost默认设置为2670MHz,比RTX4070Ti方正版的2610MHz高了60MHz。
映众RTX4070Ti冰龙超级版主板赏析
映众RTX4070Ti冰龙超级版延续了冰龙系列酷黑的造型设计。 三吊扇散热设计,三种插孔长度。
主板背面采用金属背板设计,内部有一些镂空设计,方便散热。
输出插座为3个DP1.4a和1个HDMI2.1。
“GEFORCERTX”印在散热器的底部正面。
主板供电插座为12VHPWR插座。 玩家在安装机器时必须连接这部分电源线。
散热器拆解,主板PCB露出。 我们来看看它的选材。
主板厚度似乎接近33.5cm,PCB也没有那么长。 通过对比可以看出,散热器和背板比PCB长很多。
其实它是一款低端主板,映众RTX4070Ti冰龙超级版的供电设计还是不错的。 围绕GPU左右两侧共设计13相供电,采用电容、铁氧体电感、固态电容、Dr.MOS等高品质元件。 选材值得信赖。
全新的AD104-400显示核心芯片面积为294.5平方毫米,看起来尺寸比较小。
显存为美光GDDR6X,单条2GB容量。 该主板PCB正面共有6颗内存芯片,内存容量为12GB。
我们来看看它的冰龙散热器。 这款第八代冰龙冷却系统采用了三个半径约10cm的大型冷却风扇。 同时这款散热器支持智能风扇停止功能。 在待机状态或轻负载时,其三个风扇均停止运转,方便安静运行。
另外,中间电风扇的设计方向与外侧吊扇的设计方向相反,使得冷却阵列内部的气流喷嘴可以降低,从而进一步提高主板的整体散热性能。
这款散热器的金属机身也相当大。 除了给GPU降温外,还可以给显存、电感、MOS管降温。
8根黄铜复合热管与大面积黄铜底座一体化散热,其中7根热管用于核心散热,另外一根热管用于连接供电部分的鳍片,超大散热鳍片矩阵长达6cm,可快速散热。
这款主板的散热器还采用了大面积IML模内彩印RGB灯箱设计什么软件可以优化显卡,使得这款主板在运行时耀眼时尚。
RGB灯光效果可以借助Inno开发的INNO3DTuneIT软件进行调整。
盒子的配件上还有一个主板支架。
测试平台介绍
笔者搭建了性能突出的第13代赛扬i5测试平台来测试主板的性能。 为了对比映众RTX4070Ti冰龙超级版的性能,笔者在本次测试中还添加了RTX4080和上一代卡王RTX3090Ti的成绩。
本次测试使用的RTX4080为非公制版主板,GPU频率2205MHz,Boost频率2565MHz,显存频率1400MHz(折合22400MHz)。
本次测试使用的RTX3090Ti为非公制版主板,GPU频率1560MHz,Boost频率1890MHz,显存频率1313MHz(折合21008MHz)。
英特尔第13代赛扬处理器搭配RTX40系列独立显存,支持ResizingBAR技术。 为了充分发挥映众RTX4070Ti冰龙超级版主板的性能,以下测试环节均在开启ResizingBAR的情况下进行。
DLSS3是RTX40系列主板带来的全新技术,可以在保持高音质的同时实现更流畅的游戏性能,这也让玩家能够更好地享受4K光追游戏带来的出色音质体验。 为了更好地了解RTX40系列主板的游戏升级,我们在测试RTX40系列主板时特意选择了爱聪&法拉利(PorscheDesign)联合设计的PD3232M显示器。
这款显示器尺寸为31.5英寸,采用MIniLED背光技术,拥有1152个独立分区,峰值色温为1600尼特,动态对比度为8000万:1,并通过了HDR1400认证,在音质方面有着更加出色的表现。 据悉,PD3232M拥有4K帧率和144Hz刷新率,支持97% DCI-P3色域和99% AdobeRGB覆盖率,并拥有HDMI2.1插座,是一款旗舰级游戏显示器。
俗话说,好马配好鞍。 本次测试平台的显卡部分,笔者选择了微星ROGMAXIMUSZ790HERO。 华擎ROG新一代Z790显卡采用高效集成电源设计,以及全面的散热和解决方案。 它还拥有全新AEMP2.0、AI智能优化和EZDIY贴心设计,带来更强的性能和更智能的优化。 以及更好的安装体验。
游戏性能测试
(1) 3DMark基准测试
我们来看看映众RTX4070Ti冰龙超级版在3DMark基准测试中的表现。 性能有多强,一目了然。
在3DMark测试项目中,这款RTX4070Ti与上一代卡王RTX3090Ti展开竞争。
(2)DLSS3基准测试
3DMark 基准测试新减少了 DLSS 功能测试 (DLSS3)。
根据实测,开启DLSS3后,RTX40系列主板都实现了巨大的FPS提升。
(3)DLSS3游戏测试
目前《赛博朋克2077》、《对抗寒冷》、《瘟疫传说:安魂曲》、《光明记忆:无线》、《轮回》等热门游戏大作均支持DLSS3技术。 本次DLSS3游戏测试,笔者将使用《赛博朋克2077》、《瘟疫故事:安魂曲》等4款游戏进行测试。 注意,《赛博朋克2077》的DLSS3版本目前正处于测试阶段,需要下载NVIDIA提供的测试版游戏进行测试。
DLSS3 游戏测试版 - 《赛博朋克 2077》
DLSS3游戏——《瘟疫传说:安魂曲》
DLSS3游戏——《巫师3:狂猎》
DLSS3游戏-《传送门:光追版》
从以上四款DLSS3游戏来看,DLSS3技术给RTX40系列主板带来的游戏帧率提升是巨大的。
(4)其他游戏测试
然后,我会测试一些非DLSS3的游戏。
游戏测试 - 《地铁:离去》
游戏测试——《刺客信条:英雄》
游戏测试 - 《战争机器 5》
游戏测试 - 《幽灵行动:荒野》
游戏实测——《古墓丽影:暗影》
游戏测试——《无主之地3》
在非DLSS游戏中,新款RTX4070Ti和上一代卡王RTX3090Ti依然相互竞争。
生产力表现测试
(1) AV1硬件加速编解码测试
为什么AV1编解码技术变得越来越流行? 原因很简单,使用AV1编解码器的视频能否在较低的分辨率下达到与其他主流编解码器视频相同的帧率。 说白了,在视频帧率相同的情况下,使用AV1编解码器的视频文件大小会更小,这样可以为视频创作者节省大量的硬盘空间。
目前Wondershare妙影、达芬奇等视频软件已经可以支持AV1硬件加速编解码。 然后,作者借助达芬奇软件,借助N卡AV1硬件加速编解码,将一段容量为12GB的4K视频导入为MP4视频。
最终,RTX4070Ti和RTX4080的加速效果都相当快。
(2) H.265硬件加速编解码器测试
继续使用达芬奇软件,借助H.265编解码器将容量为12GB的4K视频导入为MP4视频。 本次测试对比的是RTX3090Ti的结果。
与上一代卡王RTX3090Ti相比,RTX4070Ti和RTX4080的加速效果更快。
散热器测试
(注:笔者体温保持在26℃)
借助FurMark,笔者将对RTX4070Ti冰龙超级版主板进行压力测试。
经过10分钟的烘烤,默认频率满载时GPU温度稳定在64℃左右,GPU频率稳定在2820MHz左右。 这款冰龙散热器的散热表现确实不错什么软件可以优化显卡,而且静音效果也很好,让笔者非常满意。
全文摘要
虽然RTX4070Ti的CUDA核心数量还不到RTX4090的一半,尽管RTX4070Ti只采用了192bit显存显存,但在性能方面,这款新主板还是相当不错的。 尤其是在DLSS3技术的加持下,RTX4070Ti整体将追上上一代卡王RTX3090Ti。 只要价格合适,我认为RTX4070Ti一定会大受欢迎。
根据映众官方信息,本文主角映众RTX4070Ti冰龙超级版参考售价为6999元。 要知道很多RTX3090Ti主板还要卖到七八千元,所以对于这款散热出色的RTX4070Ti主板,我强烈推荐给大家。
总之,映众出品的RTX40系列冰龙超级版主板,大家可以放心订购!