距离NVIDIA GeForce RTX 30系列显卡上市已经过去了近两个月的时间。 各品牌非公版显卡纷纷到货。 RTX 3080/3090的喧嚣刚刚过去,现在RTX 3070正式与大家见面了。
70型号对于玩家来说有着巨大的魔力。 甚至在发布会上,黄仁勋亲自表示,“70一直是最受欢迎的车型,无论是970、1070还是2070。”
这并非没有根据。 以这款RTX 3070为例。 与售价5499元的旗舰产品RTX 3080相比,RTX 3070仅需3899元,便宜了1600元,但性能属于中高端区间。 根据NVIDIA官方的描述,RTX 3070的性能甚至比RTX 2080Ti还要好。
NVIDIA GeForce RTX 3070
NVIDIA Ampere架构带来的性能飙升能否让昔日的百万卡王黯然失色,这里先对NVIDIA GeForce RTX 3070 Founders Edition显卡进行评测。
01NVIDIA GeForce RTX 3070外观
首先我们来看看GeForce RTX 3070显卡的外观。 与同时发布的另外两兄弟相比,RTX 3070要小很多,而且长宽比给人一种非常舒服的感觉。
外包装一直是NV的简约风格,方形的纸盒。 主色调为黑色,辅以玫瑰金纹理,与RTX 3080相同。
NVIDIA GeForce RTX 3070
RTX 3070的整体外观与RTX 3080有很大不同。在之前的评测中,我们提到RTX 3080采用了串联的风扇散热设计。 显卡后部的风扇主动将热空气排出到顶部,然后排出到整个冷却系统。
NVIDIA GeForce RTX 3070 背板外露散热片
虽然RTX 3070的正面设计与上一代相同,但背面其实另有玄机。 这款显卡依然采用超高密度PCB板设计。
NVIDIA GeForce RTX 3070
与RTX 3080的推拉式散热相比,RTX 3070采用了推式风扇设计。 显卡正面的风扇将机箱后支架的热气排出; 显卡的背面直接由前导流罩和大量外露的散热鳍片组成,形成镂空状态。 时,风扇仍会通过散热片向上排出热空气。 根据官方的说法,与公版RTX 2070相比,RTX 3070流媒体系统安静16dBA,散热性能提升44%。
NVIDIA GeForce RTX 3070供电接口
NVIDIA GeForce RTX 3070 电源适配器电缆
除了一些细节之外,侧面的GeForce RTX标志取消了LED灯,取而代之的是喷印。 供电接口依然是我们熟悉的单12pin,只是转接线略有不同。 由于RTX 3070功耗较低,所以采用12pin转8pin。 那么对于大多数玩家来说,这意味着可以直接升级显卡,而不必费尽心思去换电源。
NVIDIA GeForce RTX 3070视频输出接口
视频输出接口上,RTX 3070采用DP1.4a*3 + HDMI 2.1 4接口,同样可以支持单线8K视频输出。
NVIDIA GeForce RTX 3070
单从外观来看,我个人认为RTX 3070不如RTX 3080好看,但整体工艺同样精致。 只有电源适配器线仍然存在轻微缺陷。 由于线材比较硬,所以从“双马尾”变成了现在的“一根柱子撑天”,不过RTX 3070侧面的Logo并没有发光,所以并不是很显眼。
02RTX 3070 NVIDIA Ampere下
NVIDIA GeForce RTX 3070也采用了NVIDIA Ampere架构。 我们先来看看RTX 3070的改进之处。
第一代RTX架构图灵下的2070
第二代RTX架构下的3070安培
与原有的Turing RTX架构相比,NVIDIA Ampere架构的算力提升了一倍。 这一点在 RTX 3070 上依然有所体现。每个时钟执行 2 次着色器操作,而图灵执行 1 次,RTX 3070 Shader 性能达到 20.3 TFLOPS 单精度性能,而图灵的为 7.9 TFLOPS。
NVIDIA Ampere 架构将光线和三角形相交的吞吐量提高了一倍,RT Core 达到 39.7 RTTFLOPS,Turing 达到 23.8 RTTFLOPS。
新的Tensor Core可以自动识别并消除不太重要的DNN权重,处理稀疏网络的速度是图灵的两倍,计算能力高达162.6 TensorTFLOPS,而图灵为60.3 TensorTFLOPS。
NVIDIA GeForce RTX 3070的GPU核心拥有174亿个晶体管,面积为392平方毫米。 它基于三星8nm NVIDIA定制工艺。 另外,我们都知道RTX 3070仍然使用GDDR6显存,但与RTX 3080的美光不同,RTX 3070使用了三星的GDDR6显存。
我们经常在发布会上听到业绩翻倍的说法。 其实这是因为NVIDIA Ampere的SM在图灵基础上增加了一倍的FP32计算单元,也就是每个SM中FP32计算单元的数量增加了一倍。 ,吞吐量增加了一倍。
通常我们在计算显卡中CUDA的数量时,不会将SM中的所有单元相加,而是只计算FP32单元的数量,所以这样一来,SM中的[FP32:INT32]就从1:1变成了至 2.:1。
RTX 3070共有5888个CUDA。 事实上,它只有2944个INT32单元,但由于内部FP32的数量增加了一倍,最终达到了5888个的惊人数量。
而如此粗暴地增加CUDA数量会对游戏有帮助吗? 答案是肯定的,不仅有进步,而且是巨大的进步。 事实上,浮点运算在游戏中通常比整数计算更常用。 图形、算法和各种计算操作中的着色器工作负载通常需要混合使用 FP32 算术指令,而 FP32 加速还有助于光线追踪、降噪和着色。 设备。
光追工作原理示意图
在这款NVIDIA Ampere架构中,NVIDIA官方宣布其为第二代RT Core。 它和第一代有什么区别。 首先需要了解的是,RT Core的工作原理是,着色器发出光线追踪请求,交给RT Core处理。 它将执行两项测试,即盒子相交测试和三角形相交测试。 。 基于BVH算法,如果是正方形,则返回缩小的范围继续测试。 如果是三角形,就会反馈结果进行渲染。
光线追踪中最耗时的部分是相交计算。 因此,要提高光线追踪的性能,主要是对两种相交(BVH/三角形相交)进行加速。
RT 核心的变化
在Turing的RT Core中,每个周期可以完成5次BVH遍历、4次BVH相交和1次三角形相交。 在第二代RT Core中,NVIDIA添加了新的三角形位置插值模块和额外的三角形相交模块,用于提高运动模糊效果等光线追踪性能。
运动模糊渲染原理
第二代 RT Core 允许同时执行光线追踪和着色。 执行的光线追踪越多,加速越快。 它使光线相交的处理性能提高了一倍。 在渲染具有动态模糊的图像时,根据 NVIDIA 自己的实际测量,它比图灵快 8 倍。
稀疏深度学习
除了光线追踪的增强之外,Ampere架构的Tensor Core也得到了大幅增强。 在第三代Tensor Core中,NVIDIA引入了稀疏加速,可以自动识别并消除不太重要的DNN(深度神经网络)权重。 同时仍保持良好的准确性。
首先训练原来的稠密矩阵,删除稀疏矩阵,然后训练稀疏矩阵,实现稀疏优化,从而提高Tensor Core的性能。
与这款RTX 30系列显卡一起发布的还有一项新技术——RTX IO。 目前,很多游戏往往需要几十GB甚至上百GB的安装空间。 更不用说存储空间的负担了。 不过,显卡想要读取硬盘中存储的数据,需要先由CPU从硬盘中读取并压缩。 数据被解压缩,然后发送到视频存储器。
虽然随着NVMe SSD的推出,读取速度可以比机械硬盘快20倍,但由于传统I/O的限制,NVMe高达7GB/秒的高速读写对硬盘来说是一个巨大的负担。中央处理器。
传统数据交换
这个过程中会占用多个CPU核心,压力急剧增大,占用更多内存。 这个时候GPU其实是空闲的。 RTX IO的作用是跳过CPU解压再传输数据的步骤,直接从PCIE总线读取硬盘上的压缩数据,并完成无损GPU解压,减少CPU占用,换向提升性能。
RTX IO可以大大减轻CPU负担
当然,这项技术作为系统底层运行方式的改变,需要借助微软发布的DirectStorage来实现。 对于目前容量的游戏来说,RTX IO的提升效果有限,但假以时日,当数百GB的游戏容量成为常态时,这项技术将极其有效。
同时,采用全新的HDMI2.1接口,可支持单线8K视频输出,而上一代HDMI2.0仅支持4K 98Hz视频输出。 如果你想连接8K电视,你需要更多的线缆支持。
033DMARK理论性能测试
首先介绍一下测试平台。 为了保证本次评测能够最大限度发挥RTX 3070显卡的性能,主板和CPU均采用目前桌面旗舰配置,如下。
测试结果方面,基准测试使用3DMARK,游戏性能测试使用游戏自带的Benchmark。 同时,为了减少误差,每个测试结果测试3次,取平均值。
GPU-Z参数
首先我们来看看GPU-Z的参数。 RTX 3070采用GA104核心,三星8nm,芯片面积达到392平方毫米,比RTX 3080的628小了236平方毫米,拥有5888个CUDA,频率为1500-1725MHz。 采用8GB GDDR6显存,位宽为256bit,显存带宽达到448GB/s,光栅单元和纹理单元分别为96和184。
以下是用来衡量显卡DX11理论性能的3DMARKFS套件:FS、FSE、FSU分别对应显卡在1080P、2K、4K下的理论性能。 显卡成绩实际测试结果如下:
3D MARK FS设定测试
在3DMARK FS套件对显卡DX11性能的测试中,RTX 3070和RTX 2080Ti相互较量; 不过相比RTX 2070的提升非常大,FS分数高出45%,FSE分数高出50%,FSU分数高出50%。 获胜分数高出56%。 RTX 3070和RTX 3080之间的差异比较稳定,都在28-29%之间。
3D MARK TS 设定测试
在DX12环境的Time Spy和Time Spy Extreme测试中,RTX 3070和RTX 2080Ti也互有胜负。 另外,不难发现,RTX 3070获胜的测试项目全部是4K分辨率。
与RTX 2070相比furmark显卡性能测试软件教程,RTX 3070的TS分数高出52%,TSE分数高出60%。 与 RTX 3080 相比差异为 31-33%。
3D MARK光追测试
PortRoyal是3DMARK中专门针对光追踪性能的测试项目。 RTX 3070的测试结果优于RTX 2080Ti; 与RTX 2070相比,提升了53%。
在理论测试中,RTX 3070可以说与RTX 2080Ti不相上下。 让我们进入游戏测试环节。 遗憾的是,我们手头没有RTX 2080Ti的公版,所以无法进行对比测试。 在上面的理论测试中,我们也使用了之前的测试结果进行对比。
04 游戏性能测试
在游戏性能测试中,我们选择了《古墓丽影:暗影》、《德军总部》、《孤岛惊魂5》、《刺客信条:奥德赛》、国产游戏《边境》、《光明记忆:无限》基准软件。
《古墓丽影:暗影》游戏测试
在《古墓丽影:暗影》中,由于光线追踪和DLSS效果的加入,我们也将其分为2组,每组6次进行测试。 为了照顾之前没有DLSS的测试成绩,第一组预设了最高的图像质量。 、RTX 关闭/DLSS 关闭; 第二组是默认最高画质,RTX Ultra High/DLSS ON。
其中,RTX 3070相对于RTX 2080的成绩提升较为稳定,在10%左右; 与1080P分辨率下的RTX 2070相比,分别提升了36%和37%; 在 2K 分辨率下分别提高了 40% 和 39%; 4K分辨率下分别提升37%和42%,整体提升在30-40%之间; 而RTX3080相比RTX 3070的提升约为40%。 可见,作为一款旗舰卡,RTX 3080的表现还是相当暴力的。
德军总部游戏测试
在《德军总部》中,由于它带有两个基准,所以我们的数据是运行分数的平均值。 其中,RTX 3070在1080P分辨率下的得分比RTX 2080高出16%,在2K分辨率下高出30%,在4K分辨率下高出25%。
《刺客信条:奥德赛》游戏测试
接下来是《刺客信条:奥德赛》,在 1080P 分辨率下,RTX 3070 的得分比 RTX 2080 高 18%; 2K 分辨率下提高 19%; 4K 分辨率下提高了 23%。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》也是一款优化良好的3A大作。 1080P分辨率下RTX 3070的得分比RTX 2080高14%; 2K 分辨率下提高 36%; 4K 分辨率下提高了 41%。
《光明记忆:无限》游戏测试
《光明记忆:无限》是飞燕群岛工作室开发的《光明记忆》新系列。 目前还没有游戏可供试玩,但官方已经提供了基准测试软件,玩家可以在Steam上下载。 另外,由于我们在测试过程中无法关闭光线追踪选项,因此所有测试结果均在“RTX最高/DLSS质量”模式下进行。
在1080P分辨率下,RTX 3070的得分比RTX 2080高17%,在2K分辨率下高38%,在4K分辨率下高41%。
边境游戏测试
《边境》也是柳叶刀工作室的国内AAA级巨作。 具体发布日期未知。 目前仅提供基准运行软件。 同样,当前的基准测试软件也不支持关闭光线追踪选项,因此我们在测试时选择了“RTX Highest/DLSS Quality”。
在1080P分辨率下,RTX 3070的得分比RTX 2080高29%,在2K分辨率下高34%,在4K分辨率下高31%。 总体来看,RTX 3070的游戏成绩相比RTX 2080提升了30%左右。
05温度及功耗测试
温度和功耗测试方面,室温为24℃。 我们没有采用全封闭机箱,而是采用测试平台的方式。 这样可以最大程度地保证显卡除了自身散热之外,还能最大限度地减少风道等外部因素的影响。 。
功耗测试(点击查看大图)
功耗测试中,我们选择了FurMark软件进行抄测,功耗仅在显卡本身上进行计算。 与旗舰RTX 3080相比,RTX 3070的功耗要小得多,峰值情况下整体平均在210W-220W之间。
温度方面,这次RTX 3070依然控制在75℃左右。 根据官方数据,RTX 3080采用的双轴流设计相比之前的设计,气流增加了55%,散热效率提高了30%,而RTX 3070采用的双轴流设计与传统的前置双轴流相比,增加了55%的风量,散热效率提高了30%。风扇设计,散热效率会有所不同,但就RTX 3070本身而言,较高的频率也会增加发热量。
06软硬结合打造安培
好的硬件没有软件的加持,就相当于有长柄而没有枪头。 想要发挥100%的威力,就必须软件与硬件相匹配,反之亦然。 此次发布会还推出了以下项目,值得大家关注。
英伟达反射
以往我们关注延迟时,大多了解到显示器几毫秒的极快响应,但这只是最终的显示输出效果。 您是否考虑过从系统内部到您看到的实际图片的延迟?
英伟达反射
在20系列显卡中,NVIDIA多次提到“帧能取胜”,在30系列显卡中也取得了进一步的突破。 NVIDIA除了会推出自家的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS外,还有NVIDIA Reflex技术。
过去,如果您想测量系统延迟,您需要高速摄像头和定制的 LED 鼠标电路。 搭载NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可以优化CPU和GPU中的渲染管线,大幅降低延迟,将系统整体延迟降低至30ms以下。 但如图所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA 广播
NVIDIA Broadcast是一款简单易用且专业的直播软件。 它的强大之处在于,主机不再需要任何后台布局,只需要一个普通摄像头和一张GeForce RTX系列显卡。
它戳我的脸!
这款软件可以瞬间把你杂乱的房间变成直播间。 内置音频降噪、背景模糊、虚拟背景、头部追踪等功能。 NVIDIA Broadcast的工作原理是通过DGX超级计算机使用AI算法进行深度学习。
NVENC编码
同时RTX 30系列显卡拥有目前最好的硬件解码器。 大多数用户电脑在直播时打开OBS推流时,CPU占用率会直接飙升到50%左右。 基于GPU的NVENC解码可以大大减轻CPU的负担。
英伟达工作室
对于内容创作者来说,说到软件,大多数人可能只会想到内容创作相关的软件,但NVIDIA专门为内容创作者推出的NVIDIA Studio驱动程序,才是连接创作软件和显卡功能的关键。
英伟达工作室
NVIDIA Studio驱动程序进行了更新和优化,为最新版本的Adobe系列软件提供更稳定的支持,并具有更出色的创意功能。 利用NVIDIA CUDA技术,GPU加速的特效可以实现更快的实时视频编辑和加速渲染输出,让原本只能通过软件编码和输出的视频可以轻松得到硬件支持。 此外,AI计算的优势,包括剪辑自动标记、特效追踪、人脸识别等功能,速度都有显着提升。
在 GPU 上渲染需要 14.98 秒,在 CPU 上渲染需要 11 分钟
当然,NVIDIA Studio 并不是唯一加速创作的公司。 Adobe在DaVinci、Keyshot、Blender、D5等专业软件中表现出色。 不仅可以提供强大稳定的运行环境,还可以通过GPU加速,有效提升创作效率。
07 销售冠军预约
性能方面,NVIDIA GeForce RTX 3070与RTX 2080Ti不相上下,但价格仅为3899元。 以中端卡的价格体验上一代的旗舰性能,这笔交易不能用便宜来形容,而是划算。 到达。
NVIDIA GeForce RTX 3070
另外furmark显卡性能测试软件教程,规格方面,RTX 3070虽然依然采用12针接口供电,但只有6针接口,这意味着非公版显卡可能会采用单8针供电接口。 功耗方面,RTX 3070的静频功耗为220W,低于RTX 2080 SUPER。 推荐电源为650W,可与大多数现有电源配合使用。 这对于想要使用新显卡但又不想更换整套配件的玩家来说无疑是最大的福音。
20系列和30系列显卡参数对比
在游戏性能方面,RTX 3070可以说是相当惊艳。 目前市面上的大部分游戏都可以在4K分辨率下实现60FPS的高帧率体验。 评测中我们都是在默认的最高画质下进行测试。 很多游戏在真实游戏时可以关闭不必要的特效,以获得更高的帧率。
NVIDIA GeForce RTX 3070
个人认为,如果你想体验新30系列显卡带来的暴涨性能,但又不想花几千块钱,那么RTX 3070是最合适的。 虽然近期就会有入门级的RTX 3060出现,性能预计会比RTX 2070更高,但你体验到的依然是20系显卡的中高端水平。
总的来说,NVIDIA GeForce RTX 3070在性能和价格之间实现了平衡。 媲美RTX 2080Ti的性能和RTX 2070的价格。RTX 2070 1.6倍的性能让20系列显卡以极快的速度终结。 如果你想升级显卡,体验4K游戏的超清画质,又不想“开战”,那么这样一款低功耗高性能的显卡最适合你了。
NVIDIA GeForce RTX 3070
目前非公版显卡解禁时间为2天后,即10月29日21:00,各渠道销售也将在此时开始。 另外,有消息称RTX 3070的供货量将会大得多。 是时候去试试你的运气并抢到一块了。
(7545771)