RTX 4060 Ti 8G显卡的发布,让预算在6000元的主流机用户终于可以用上RTX 40系列显卡了。 今天的评测是对耕升GeForce RTX 4060 Ti追锋EX3显卡的评测。
RTX 4060 Ti 8G发布已经有一段时间了,大家想必也清楚它的性能定位。 虽然这款显卡的光栅化性能比较小,但在光线追踪和AI加速计算方面相比RTX 30系列肯定有明显提升。 。
此外,我们还测试了最近流行的游戏《暗黑破坏神4》。 该显卡可以完美处理2K分辨率的高帧率游戏。 我们先简单看一下外观。
1 耕升GeForce RTX 4060 Ti追锋EX3显卡概述
耕升GeForce RTX 4060 Ti追风EX3显卡主打实用性,也是耕升推出的平价显卡。 与没有“EX3”后缀的追风相比,它采用了三个风扇进行散热。
耕升GeForce RTX 4060 Ti追锋EX3整体尺寸为278×113×40mm。 作为一款甜品卡,长度和厚度都有所减少,而且还可以安装在ITX机箱中,兼容性很好。
耕升GeForce RTX 4060 Ti追风EX3采用了该系列经典的红黑设计设置分辨率的软件,前导流罩采用了三个82mm 9叶风扇。 内部有两根6mm复合热管,搭配大面积散热鳍片,对于这款RTX 4060 Ti来说已经绰绰有余了。
耕升GeForce RTX 4060 Ti追锋EX3采用一体式金属背板和经典的黑白配色。 从这个角度可以看到背面大量裸露的散热鳍片。 PCB大约只有整个卡长度的一半设置分辨率的软件,剩下的就是散热模块。
耕升GeForce RTX 4060 Ti追锋EX3采用单8pin供电接口,TDP为160W。 推荐电源450W及以上。 可以说任何玩家都可以无忧升级。
视频输出接口依然采用HDMI 2.1 + DP 1.4a*3的四接口设计。 HDMI 2.1可支持4K 120Hz HDR和8K 60Hz HDR。
2 NVIDIA GeForce RTX 4060 Ti 8GB架构简析
此次发布的GeForce RTX 40系列显卡采用全新NVIDIA Ada Lovelace架构打造,并采用台积电4N NVIDIA定制工艺。 旗舰核心AD102达到了恐怖的760亿个晶体管,而RTX 30系列显卡则有280亿个。
与上一代 NVIDIA Ampere 相比,NVIDIA Ada Lovelace 在相同功耗下性能提升超过 2 倍,达到高达 90-TFLOPS 着色器数据吞吐量。
此次发布的RTX 4060 Ti 8GB共有4352个CUDA核心,提供22-TFLOPS计算能力; 34个第三代Ada RT核心具有51 RT-TFLOPS; 136 个第四代 Tensor Core 可提供 353 Tensor-TFLOPS。
另外,在这份规范中,NVIDIA官方还特别说明了L2 Cache容量和最终等效带宽。 这是RTX 40架构上的重大改变,同时对于位宽的减少也引起了玩家的争议。 罪魁祸首”。
我们用两张图简单说明一下二级缓存的作用。
如果将 GPU 核心比作一个在线商店老板,那么 L1 缓存就是堆放在他每天工作的房间里的可发货产品。 然而,由于所有工作都必须在这个房间内完成,因此堆放产品的空间有限; 所以大部分产品如果需要去二级缓存的话,就像工作室旁边的仓库一样。 虽然需要出去,但距离还是不远。
如果这个仓库仍然无法容纳,那么检索产品的唯一方法就是从更远的记忆中。 当然,如果出现爆显存的问题,那么“店主”可能就得打车去更远的系统内存区域取数据了。
中间花费的距离和时间就像GPU的额外工作量。 如果大部分数据只存储在二级缓存中并且可以被检索,那么功耗将大大节省。 并且由于不需要频繁访问显存中的数据,因此适当减小显存位宽,对运行效率没有影响。
在真正的 GPU 中,核心是所有计算发生的地方,这就是 L1 数据缓存发挥作用的地方。每个 SM 都有一个超低延迟的 L1 数据缓存,位于其处理核心旁边,这使得 L1 成为GPU 来查找信息。
然而,由于L1缓存需要非常靠近核心,所以它不能很大。
如果在L1缓存中找不到内核计算所需的数据,GPU将在L2数据缓存中查找。 该视频内存系统位于GPU芯片上,并通过非常高速的交叉系统连接到所有GPC(图形处理集群),每个GPC包括多个SM。 如果在二级缓存中找到信息,GPU 就会挑选出数据并将其放入内核中。
如果在二级缓存中找不到该信息(称为缓存未命中),那么GPU将通过视频内存接口在VRAM中查找它。 这会在整个 GPU 存储子系统中产生大量额外工作,并降低性能和能效。
事实上,如果只对比传统光栅性能,RTX 4060 Ti 8GB 的进步并不是很大。 不过随着AI的逐渐发展,需要大量的逻辑推理运算,所以可以看到相比30系列,Tensor算力几乎提升了1.7倍。
完整的AD102核心
完整的AD106核心
RTX 4060 Ti 8GB使用的AD106核心
这次的RTX 4060 Ti 8GB采用的是AD106芯片,并使用了3组GPC,其中一组缺少一组TPC,并且有两个NVENC单元。
这款RTX 4060 Ti 8GB的二级缓存为32MB,而上一代RTX 3060 Ti为4MB,差距达8倍。 增加 L2 缓存的大小可以提高性能、减少延迟并延长电池寿命。 数据访问可以在GPU上完成(否则GPU会频繁从显存读取数据,过于依赖显存带宽)。 因此,这也是RTX 40系列显卡位宽和带宽普遍较小的原因。
3 测试平台简介
首先介绍一下测试平台。 为了保证耕升GeForce RTX 4060 Ti和追风EX3的性能,我们的平台也进行了全面更新。
目前GPU-Z版本尚未更新,部分信息无法识别。 你可以简单参考一下。
耕升GeForce RTX 4060 Ti追风EX3采用AD106核心,拥有4352个CUDA,Boost频率为2580MHz,与公版相同。 与RTX 3060 Ti的1665MHz相比,是一个很大的提升。
采用8GB GDDR6显存,位宽128bit,显存带宽288GB/s(最终等效带宽554GB/s),光栅单元和纹理单元分别为48和136。
4 理论性能测试
以下是用来衡量显卡DX11理论性能的3DMARKFS套件:FS、FSE、FSU分别对应显卡在1080P、2K、4K下的理论性能。 显卡成绩实际测试结果如下:
在显卡DX11性能的3DMARKFS套件测试中,更升GeForce RTX 4060 Ti追锋EX3主要与上一代RTX 3060 Ti进行对比,其中FS提升了18%; FSE增长15%; FSU 增加了 2%。 综合来看,相比RTX 3060 Ti性能提升约12%。
与刚刚发布的RTX 4070相比,整体得分相差约24%。
在DX12环境下的Time Spy和Time Spy Extreme测试中,更升GeForce RTX 4060 Ti追风EX3相比RTX 3060 Ti的改进为: TS提升13%; TSE上涨7%,整体改善约10%。
PortRoyal是3DMARK中专门针对光追踪性能的测试项目。 与RTX 3060 Ti相比,更升GeForce RTX 4060 Ti和追风EX3的提升约为16%。
综合来看,耕升GeForce RTX 4060 Ti追锋EX3的传统理论性能相比RTX 3060 Ti提升了约13%。
Speed Way测试是3DMARK最新更新的显卡基准测试,用于测试DirectX12 Ultimate性能。 要运行此测试,显卡必须支持 DirectX 12 Ultimate 并包含 6GB 或更多视频内存。
该测试结合了实时光线追踪和传统渲染技术来测量显卡性能。 该场景包含光线追踪反射、实时全局照明、网格着色器、体积照明、粒子和后处理效果。
简单来说,本次测试是对近年来新技术和未来游戏的综合测试。 与RTX 3060 Ti显卡相比,从1080p分辨率到4K的提升为:12%/10%/6%。
另外,我们使用3DMARK刚刚更新的DLSS 3进行了相关性能测试。 不过由于RTX 3060 Ti无法开机,所以这里使用DLSS2进行对比测试。
2K分辨率下,DLSS开关相比RTX 3060 Ti的提升为23%/16%; 在4K分辨率下,显卡在关闭的情况下几乎无法正常工作。 仅看开启状态,提升幅度约为51%。
5 游戏性能测试
下面我们对这款显卡进行了不同类型的游戏测试,包括传统的光栅化游戏,以及纯光追+DLSS基准跑分测试。
在《极限竞速:地平线 5》中,GeForce RTX 4060 Ti 和追风 EX3 相比 RTX 3060 Ti 的提升分别是: 1080p 提升 12%; 2K提升9%; 4K 提升 8%,整体提升 10%。
由于RTX 4060 Ti 8GB显卡本身定位1080p分辨率,在一些2K游戏中会爆显存,所以在更高分辨率的情况下,它实际上比RTX 3060 Ti优势不大。
在新游戏《暗黑破坏神4》中,耿升GeForce RTX 4060 Ti追风EX3表现出色。 由于这款游戏针对的是更多主流配置的玩家,所以配置相当人性化。 不过,这一代暗黑破坏神中的图形质量提升非常大,堪称优化的典范。
这里我们仅使用RTX 4060 Ti进行测试。 在2K分辨率下开启DLSS后,我们能够达到180帧的完美体验。 不过目前DLSS 3的优化似乎存在问题,在4K分辨率下并没有提升,反而下降了不少。
在《刺客信条:英灵殿》中,耕升GeForce RTX 4060 Ti和追风EX3相比RTX 3060 Ti的改进分别是:1080p提升12%; 2K提升9%; 4K增长4%,整体增长8%。
《无主之地 3》中,GeForce RTX 4060 Ti 和追风 EX3 相比 RTX 3060 Ti 的改进分别是:1080p 提升 13%; 2K提升13%; 4K增长3%,整体增长10%。
《光明记忆:无限》的光线追踪测试软件是一款独立于游戏的测试工具。 它使用了比游戏更多的光线追踪技术。 测试条件为“RTX最高/DLSS质量”。 因此测试帧率比较低,但实际游戏配置还是相当人性化的。
性能方面,耕升GeForce RTX 4060 Ti和追风EX3相比RTX 3060 Ti的提升分别是:1080p提升25%; 2K提升23%; 4K增长5%,整体增长18%。
在另一款国产游戏《边境》的基准测试软件中,情况与《光明记忆:无限》基本相同,测试条件均在“RTX最高/DLSS质量”下进行。
《边境》中,耕升GeForce RTX 4060 Ti和追风EX3相比RTX 3060 Ti的改进分别是:1080p提升33%; 2K提升25%; 4K增长17%,整体增长25%。
在《赛博朋克2077》中,游戏添加了光追超速画质,我们单独进行了测试。
在超画质方面,耕升GeForce RTX 4060 Ti和追风EX3相比RTX 3060 Ti的提升分别是:1080p提升14%; 2K提升6%; 4K增长6%,整体增长9%。
在光追超画质方面,改进如下:1080p提升19%; 2K提升19%; 4K提升15%,整体提升18%。
在光追超速画质中,由于性能要求极其变态,所以只测试了1080p和2K分辨率。 改进分别为,1080p 提升 26%,2K 提升 41%。
这里我们分别向您展示三种不同的图像质量。 从上到下分别是超画质/光线追踪超级/光线追踪超速。 可以看出,光线追踪Overdrive比光线追踪Super更接近真实效果。 它模拟真实的光路。 事实上,它比之前的光线追踪模拟了更多光线在不同表面的反射,并且完全计算了场景的真实光照,避免了上一代光线追踪中的“死黑”情况。 。
这也是NVIDIA致力于打造的下一代光追场景,但目前为止它需要过多的硬件计算,即使是旗舰显卡也无法在4K分辨率下流畅运行。
6 稳定扩散AI绘画测试
除了游戏之外,AI也是目前的热门领域,尤其是Stable Diffusion。 现在很多人工智能生成的图片可以说是完全假的和真实的。 我们也测试一下RTX 4060 Ti 8GB在这方面的表现。
Stable Diffusion可以说几乎没有任何障碍,但本地部署的繁琐让很多用户望而却步。 上图为操作界面。 用户可以根据自己想要生成的图片的细节来丰富关键词。
根据NVIDIA提供的关键词,我们生成了10批共20张图像。 并将刚刚发布的RTX 4070与上一代RTX 3060 Ti显卡进行了对比。
RTX 4070的计算时间为2m24.79s,相当于一张图片约7.2秒。
RTX 4060 Ti 8GB运算时间3分18.26秒,一张图片约9.9秒
RTX 3060 Ti的计算时间为3m40.86s,一张图片约11秒。
Stable Diffusion对显卡的要求比较高,需要显卡具备强大的CUDA计算能力。
另外,它对显存的要求也非常高。 这次RTX 4060 Ti 8GB显存使用率达到了97%。 如果可能的话,尽量选择大容量的显卡。
我们比较了相同设置下 RTX 4060 Ti 8GB 和 RTX 3060 Ti 的计算时间。 两块显卡生成20张图像的时间相差22秒,这个差距还是蛮大的。
此外,我们还测试了在相同设置下使用CPU生成图像,但如图所示,保守估计需要大约3小时30分钟。
7 AV1编码测试
本次AV1编码测试,我们选择了Clip Pro版本,它可以输出H.264/HEVC/AV1三种编码格式的视频。
Cut Movie专业版目前带有AV1编码输出。 实际测试中,我们导出了一段1分钟左右的视频。 可以看到两个文件的大小相差103MB。
由于AV1编码特性,生成的文件码率较低,但视频清晰度完全相同。 所以如果生成相同码率和容量的文件,AV1会更清晰。
我们使用 NVIDIA ICAT 来比较两个视频的图像。 图片左侧为H.264编码,右侧为AV1编码。 几乎没有区别。
8 RTX VSR(RTX视频超分辨率)测试
目前,RTX VSR(RTX视频超分辨率)已经在部分浏览器中进行了测试。 首先,玩家需要更新到最新的NVIDIA驱动程序。 您可以在NVIDIA控制面板的【调整视频图像设置】中看到最新的RTX视频增强超分辨率。 。
RTX VSR是AI图像处理领域的一项突破。 它超越了传统的边缘检测和特征锐化技术,极大地提高了直播视频内容的质量。
开启RTX VSR不仅需要最新的驱动程序,还需要使用RTX 40或30系列GPU,并且适用于Google Chrome和Microsoft Edge浏览器中的几乎所有视频内容(浏览器也需要更新到最新版本)。
开启后,目前已知打开YouTube或Bilibili即可享受RTX VSR效果的加成。
如果不确定,可以在全屏播放视频时打开任务管理器。 如果看到GPU负载增加,则说明开启成功。
(点击放大可查看原图)
我们随意打开YouTube,观看视频。 开启RTX VSR后,我们可以明显看到水下珊瑚的质量得到了明显的提升,边缘更加清晰,畸变也大大减少。
9 温度及功耗测试
功耗测试中,我们选择了FurMark软件进行抄测试,并使用GPU-Z来检测温度。 功耗仅根据显卡本身计算。
可以看到,耕升GeForce RTX 4060 Ti追风EX3显卡通过了拷贝测试,时间约为20分钟。 温度控制在63℃左右,热点温度在73℃左右。
游戏动态功耗测试
耕升GeForce RTX 4060 Ti 追风EX3 3A游戏平均功耗
RTX 3060 Ti 3A游戏平均功耗
在实际游戏功耗测试中,我们选择了《赛博朋克2077》的内置基准,并将屏幕设置为光追超和2K分辨率,以拉伸两块显卡的性能极限,测试我们实际应用的功耗场景。 。
可以看到,虽然两款显卡都是60级别,但耕升GeForce RTX 4060 Ti和追风EX3平均功耗为150W,而RTX 3060 Ti功耗为219W,低了69W。
10 入门实用首选
更生的追风系列一直坚持实用第一的原则,外观近几代都没有太大变化。 这款耕升GeForce RTX 4060 Ti追风EX3的理论测试结果与公版基本相当,虽然与一些旗舰系列相比还有一定的差距。 然而,在实际游戏测试中,这些仅存在 1-2 帧的差异。 而且相比双风扇显卡,EX3在散热方面更加出色,不愧是一款主打实用系列的产品。
与RTX 3060 Ti相比,RTX 4060 Ti的传统性能提升了约13%。 说实话,这种改进不能称为迭代,但在 RTX 40 系列显卡中,光线追踪和 AI 计算能力是主要发力领域。
比如在加入光线追踪和DLSS的测试中,在《光明记忆无限》、《边境》、《赛博朋克2077》中,相比RTX 3060 Ti的提升达到了25-35%左右。
如果你想在 1080p 分辨率下体验光线追踪带来的极致画面,那么这款 RTX 4060 Ti 就非常适合。
另外,在目前流行的SD绘图中,两代甜品卡在单张图片中的差异约为1.1秒,这可能看起来并不大,但在生成批次时仍然可以节省大量时间。
功耗也是RTX 40系列显卡取得长足进步的一个领域。 这款耕升GeForce RTX 4060 Ti追锋EX3的TDP仅为140W。 它由单个 8 针供电。 推荐电源为450W。 任何用户都可以轻松升级,无需更换电源。
耕升GeForce RTX 4060 Ti和追风EX3目前售价3299元。 感兴趣的朋友不妨关注一下。
(8222908)