映众RTX4070显卡首发评测：4799元，性能依旧给力！

更新时间：2023-04-13 15:43:19作者：cblsl

北京时间4月12号晚上9点，NVIDIA解禁了RTX4070，它也是第四款登场的RTX40系列台式机显卡。售价4799元起步，相比RTX4070Ti显卡6499元的起步价低了不少，这无疑会吸引更多用户们的关注。映众RTX4070显卡首发评测：4799元，性能依旧给力！

笔者此次评测选用的RTX4070显卡为映众RTX4070曜夜。它采用双风扇散热设计，标准双槽厚度，显卡尺寸较小。此外它还采用了单8pin辅助供电接口设计，这也足以让大量用户们眼前一亮。

单从对映众RTX4070曜夜这款显卡的初步印象，笔者认为从RTX4070开始，小尺寸的RTX40系列显卡会越来越多。如果性能依旧给力的话，那么RXT4070的人气肯定会很高。它的性能到底如何?本篇文章便带大家一探究竟。

Ada Lovelace架构与RTX4070

RTX40系列显卡基于英伟达新一代的Ada Lovelace架构设计。为了让大家更好地了解到这一显卡的升级，笔者首先会对Ada Lovelace架构以及所支持的一些重要技术进行介绍。

(一) Ada Lovelace架构核心

(Ada Lovelace架构核心)

(完整规格的AD102显示核心，具备144组SM单元)

(Ada Lovelace架构核心GPC单元)

Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。根据NVIDIA官方的介绍，Ada Lovelace架构核心所采用的第3代RT Core不仅将光线与三角形求交性能提高了一倍，还将RT-TFLOP峰值性能提高了一倍之多。第3代RT Core还配备了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎，进一步提升了光追计算的性能以及减少计算开销，带来了更好的光线追踪效果表现。Ada Lovelace架构核心配备的第四代Tensor Core引入了来自专业级H100数据中心GPU的FP8 Transformer引擎带来了更加强悍的AI算力。

(第三代RT Core结构示意图，相比前代。增加了2个功能)

Ada Lovelace架构核心在SM单元上引入了Shader Execution Reordering(SER着色器执行重排序)技术来更好的对于着色器的工作进行调度排序，在使用上可以根据不同的负载需求来执行渲染，可对负载较为统一的画面进行渲染，降低工作开销。根据英伟达官方的介绍，这一个SER功能将作为API开放给开发者使用。英伟达官方宣称，SER功能的加入至高可带来两倍RT Core性能上的改善，对于光追游戏来说更可带来体验的升级。根据NVIDIA官方的数据，全新的SM(流式单元处理器)可带来至高两倍的性能以及能效升级，这一项升级不可谓不小。

(Ada Lovelace架构核心SM结构图)

Ada Lovelace架构核心除了第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)的升级以外，带来了全新的第八代NVENC双硬件编码器。这一全新的第八代NVENC双硬件编码器整合了对AV1视频编码格式的支持，可以在传统的H.264等格式之外，加入了对AV1这一主流新标准的支持，可以进行对于AV1格式的编码与解码，有效提升了生产力方面的表现，对于创作型用户、游戏主播等群体来说更是如虎添翼。来自NVIDIA官方的数据显示，第八代NVENC双硬件编码器在AV1的效率上比H.264编码器的效率提高了40%，这一提升非常明显。

而除了核心上的升级以外，Ada Lovelace架构核心还大幅度提升了其L2缓存，完成版的Ada Lovelace架构核心(AD102)拥有96MB的L2缓存，大容量的L2缓存带来了数据命中率的有效提升。在现阶段显存带宽提升有效的情况下，通过升级更大容量的L2缓存，可以进一步提升数据命中表现，带来性能方面的升级，根据NVIDIA官方的说法，大容量L2缓存的加入为GPU的一系列操作到带来了更高的收益，尤其是在光线追踪等场景下，表现更为明显。

(二) DLSS 3与NVIDIA Reflex

Ada Lovelace架构的一系列升级还带来了全新的DLSS 3技术的独占以及NVIDIA Reflex方面的体验提升。

DLSS 3包含有DLSS 2(DLSS超分辨率技术)，以及全新加入的DLSS帧生成技术，这一项DLSS帧生成技术依托于Ada Lovelace架构的独立光流处理器以及Tensor Core的AI算力。在一项技术在运行过程中，其通过光流处理器所得到的一系列数据后，以光流加速技术(Optical Flow Acceleration，简称为OFA)来生成画面信息，而AI算力则负责来对画面进行进一步的优化，从而在游戏中加入了更多的帧画面，进行帧数的提升。

DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧，相当于使用1/8的算力，就完成了整个计算过程，而通过这一个流程的循环，可在提升帧数的同时节省资源开销，进一步带来更好游戏体验。

而在DLSS 3的帧生成技术上，由于可能带来延迟的增加，因此DLSS 3在使用上也将通过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而根据NVIDIA官方的说法，DLSS 3通过整合NVIDIA Reflex以及一系列的技术，可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。

(三) RTX40系列显卡第四弹——RTX4070

(RTX4070显示核心架构图，具备46组SM单元)

RTX4070采用的是AD104-250显示核心，拥有5888个CUDA核心，搭配12GB容量、192bit位宽的GDDR6X显存。

(RTX4070Ti显示核心架构图，具备60组SM单元)

RTX4070Ti采用的是AD104-400显示核心，拥有7680个CUDA核心，搭配12GB容量、192bit位宽的GDDR6X显存。

从纸面参数上来看，这两款显卡均基于AD104显示核心设计。全新RTX4070是在RTX4070Ti的基础之上，通过定向削减核心规模而来的。

5888÷7680≈0.77。按照CUDA核心数量差异来衡量的话，RTX4070理论上具备RTX4070Ti显卡约77%的性能水平。当然，这只是理论上。实际表现大概率会有差异。

（映众RTX4070曜夜显卡的GPU-Z信息）

在频率设置上，本文选用的映众RTX4070曜夜显卡与RTX4070创始人版保持一致，GPU频率为1920MHz，Boost频率为2475MHz，显存频率为1313MHz(等效21000MHz)。

映众RTX4070曜夜显卡欣赏

映众RTX4070曜夜以黑、灰色为主色调，主打轻薄双槽特色。该显卡没有设计RGB灯效，也没有什么花里胡哨的设计，低调不张扬。

由于采用的是双风扇散热设计，这款显卡的尺寸比较短，实测约25cm。加上标准双槽厚度设计，令这款显卡的安装兼容性很不错。

显卡背面设计了金属背板，上面有一些镂空设计，以便兼顾散热效果。

输出接口为三个DP 1.4a以及一个HDMI 2.1。

散热器顶部上面印有“INNO3D GEFORCE RTX”的字样。

显卡供电接口为熟悉的单8pin设计。

之前发布的RTX40系列台式机显卡均采用12VHWPR外接供电接口，但是这次RTX4070，NVIDIA开始允许厂商选用传统的8pin外接供电接口设计，也就是说在这次RTX4070上，传统的8pin外接供电接已回归。相信很多用户们都喜欢这种8pin接口设计，笔者也一样。

将散热器拆卸下来，露出显卡PCB，继续欣赏一下它的用料。

这款显卡虽然长度为25cm，但是它的PCB并不长。通过对比明显能够看出散热器和背板比PCB长出很多。

映众RTX4070曜夜的供电设计依旧不错。GPU左右周围共设计了13相供电，搭配电容铁素体电感、固态电容等高品质元器件，用料值得信赖。

全新的AD104-250显示核心，芯片面积为294.5平方毫米，看上去尺寸比较小。

显存是来自美光的GDDR6X，单颗2GB容量。这款显卡PCB正面共设计有6颗显存，组建了12GB显存容量。

这款显卡采用的是HERCULEZ X2散热器，搭配有两枚直径约9cm散热风扇。风扇支持可拆洗，便于用户们日常保养清灰。此外，这款散热器支持智能风扇停转功能，在待机状态下或者轻负载状态下，它的这2枚风扇会全部停转，以便实现安静的运行效果。

这款散热器的金属主体部分比较大，不仅能够为GPU进行散热，而且还能够为显存、电感以及MOS管进行散热。

纯铜镀镍底座，5根纯铜镀镍热管，加上大面积散热鳍片矩阵，可实现高效的散热。

测试平台介绍

笔者组建了一套性能出色的13代酷睿i9测试平台，用来测试显卡的性能。为了对比映众RTX4070曜夜的性能，笔者此次测试还加入RTX4070Ti以及上一代RTX3070Ti的成绩。

此次测试所选用的这款RTX4070Ti是一款非公版显卡，其GPU频率为2310MHz，Boost频率为2685MHz，显存频率为1313MHz(等效21000MHz)。

此次测试所选用的这款RTX3070Ti同样是一款非公版显卡，其GPU频率为1575MHz，Boost频率为1785MHz，显存频率为1188MHz(等效19000MHz)。

英特尔13代酷睿处理器搭配RTX40系列独立显卡是支持Resizable BAR技术的。为了充分发挥映众RTX4070曜夜显卡的性能表现，以下测试环节均是在Resizable BAR开启状态下进行的。

DLSS 3是RTX40系列显卡带来的全新技术，在维持高画质的情况下也可以实现更为流畅的游戏表现，这也让玩家可以更好的享受4K光追游戏带来的出色画质体验。为了更好的感受RTX40系列显卡在游戏方面的升级，我们在测试RTX40系列显卡时特意选择了爱攻&保时捷(Porsche Design)联合设计的PD32M显示器。

这款显示器为31.5英寸，采用MIni LED背光技术，拥有1152个独立分区，拥有1600尼特峰值亮度，8000万：1动态对比度，并通过HDR1400认证，在画质上有着更为出色的表现。此外，PD32M拥有4K分辨率以及144Hz的刷新率，支持97%DCI-P3色域以及99% Adobe RGB覆盖，并且拥有HDMI 2.1接口，是一款旗舰级电竞显示器。

游戏性能测试

(一) 3DMark基准测试

首先是映众RTX4070曜夜在3DMark基准测试当中的表现。性能到底有多强，大家一看便知。

在3DMark Time Spy测试项目中，这款RTX4070的性能约为RTX4070Ti的79.9%。

在3DMark Port Royal光线追踪测试项目中，这款RTX4070的性能约为RTX4070Ti的80.7%。

对比上一代RTX3070Ti，RTX4070的性能明显是要高出不少的。

(二) DLSS 3基准测试

根据实测来看，在开启DLSS 3之后，RTX40系列显卡实现了巨大的FPS提升。其中在2K分辨率下，开启DLSS性能模式之后，RTX4070已可实现超过100 FPS的表现。

(三) DLSS 3游戏实测

目前已有《赛博朋克2077》、《逆水寒》、《瘟疫传说：安魂曲》、《光明记忆：无线》、《生死轮回》等热门游戏大作支持DLSS 3技术。此次DLSS 3游戏实测，笔者将利用5款游戏进行测试。

DLSS 3游戏测试版——《赛博朋克2077》

DLSS 3游戏——《瘟疫传说：安魂曲》

DLSS 3游戏——《巫师3：狂猎》

DLSS 3游戏——《传送门：光追版》

DLSS 3游戏——《F1 22》

通过上述5款DLSS 3游戏来看，DLSS 3技术为RTX40系列显卡带来的游戏帧数提升是巨大的。

其中在2K分辨率下，开启DLSS性能模式之后，RTX4070普遍可实现超过100 FPS的表现，令人满意。

此外，开启DLSS技术之后，不论DLSS 3还是DLSS 2，PC延迟也会明显降低，这也是DLSS技术的一大优势。

PC延迟越低，游戏画面流畅度自然也就越好。

(四) 其它游戏实测

接下来，笔者再测试一些非DLSS 3游戏。

游戏实测——《中土世界：暗影之战》

游戏实测——《刺客信条：奥德赛》

游戏实测——《战争机器5》

游戏实测——《幽灵行动：荒野》

游戏实测——《古墓丽影：暗影》

非DLSS游戏中，RTX4070也要明显强于上代RTX3070Ti。

(五) 实际游戏过程中的显卡功耗测试

除了性能更强之外，RTX4070在功耗表现方面也要明显优于上代RTX3070Ti。

通过实测来看，实际游戏过程中，RTX3070Ti显卡的功耗不仅明显高于RTX4070，甚至也要高于RTX4070Ti。

生产力性能测试

(一) AV1硬件加速编解码测试

为什么AV1编解码技术越来越受欢迎?理由很简单，采用AV1编解码的视频能够以更低的码率，实现其它主流编解码视频相同的画质。说白了，在视频画质相同的情况下，采用AV1编解码的视频文件体积会更小，以至于能够为视频创作者们节省大量的硬盘空间。

目前剪映、万兴喵影、达芬奇等视频软件已可支持AV1硬件加速编/解码功能。接下来笔者利用剪映这款软件，将一部H264编码的MP4视频，导出为一部AV1编码的MP4视频。

显而易见，在RTX40系列显卡AV1视频编码加速的助力之下，转换时间比单用处理器转换大幅缩短，加速效果相当显著。

(二) VSR功能测试

NVIDIA在近期推出了一项重磅更新——RTX Video Super Resolution，这一项功能翻译过来就是视频超分辨率技术，简称VSR。它可以允许用户在播放视频时，以GPU配备的Tensor Core以及强悍的AI算力来进行内容的计算，从而提升画面分辨率，带来至高4K分辨率视频输出，为用户带来视频观感的提升。

VSR功能目前可在30/40系列显卡上进行开启，用户能在英伟达控制面板内开启这一项功能的使用，其在70级别以上显卡提供了4档的VSR增强选项可供调整。这一项VSR功能可在Google Chrome(110.0.5481.105版本以上)或者Microsoft Edge(110.0.1587.56版本以上)播放视频时进行调用。

我们也采用RTX4070显卡对英伟达推出的VSR功能进行了实际的体验，首先选取的是在网页上播放480P的经典动画《猫和老鼠》，这一动画由于成片年代较早，因此画面在4K分辨率屏幕上的播放存在许多瑕疵。而通过开启VSR进行增强后，画面的细节有了明显的改善，并且画面的噪点有了明显的降低。在这里我们也通过截取同一帧画面，通过英伟达ICAT进行画面对比，方便各位感受到VSR带来的画面效果提升。

△左480P原生画面，右 480P RTX VSR 4X画面

除了在网页端可以进行VSR的调用外，英伟达也是在和不少的本地播放器进行合作，让用户在本地播放器也可以体验到VSR功能带来的提升。

根据了解到的信息，知名的开源播放软件VLC将会提供到VSR的功能支持，而我们也是提前拿到了VLC的内部测试版本进行了本地VSR播放的体验。

在通过VLC本地播放《少女与战车》720P画面时，没开启VSR的情况下，整体画面在4K的显示器中显示并不是很清晰，而在开启VSR功能后，其在4K分辨率显示器的播放中也是显示出了更好的画面观感，对于观看体验有所提升。

笔者也是截取到了VLC本地播放《少女与战车》720P视频时，关闭与开启VSR功能的画面，通过ICAT进行了A/B画面对比。从对比中可看到，在VLC播放时开启VSR功能后，画面的噪点被进行了明显的压制，并且画面的线条整体更为锐利清晰，对于观感加成不少。

△左720P原生画面，右 720P RTX VSR 4X画面

△左720P原生画面，右 720P VSR 4X画面

从画面的对比上，我们可以看到VSR功能带来了更好的画面观感，对于用户的体验是有明显的加分的。而有朋友会好奇，开启VSR后GPU会进行相关的内容计算，这部分计算会不会带来更高的功耗?因此我们也是针对这一问题进行了功耗测试。

在4K分辨率屏幕下通过网页端播放1080P《某科学的超电磁炮》时，RTX 4070在不同的VSR档位设置中的功耗区间如下：

在4K分辨率屏幕下通过本地VLC播放器播放720P《少女与战车》时，RTX 4070在不同VSR档位设置中的功耗区间如下：

从功耗来看，RTX 4070在开启VSR功能后，其功耗的增长并不大，但是却可以带来更好的画面观感，因此推荐用户开启这一项功能。因为VSR 4档增强可以带来更好的画面效果，所以在1档和4档VSR增强功耗差距并不大的情况下，我们更为推荐用户开启到4档的VSR画面增强。

散热器测试

(注：笔者所处的室温维持在26℃)

利用FurMark，笔者将对映众RTX4070曜夜显卡进行压力测试。

通过10分钟的烤机，默认频率下满载时GPU温度稳定在约67℃，GPU频率稳定在约2760MHz左右，散热设计可靠，同时静音效果也令笔者比较满意。

全文总结

作为第四款登场的RTX40系列台式机显卡，RTX4070的性能依旧很不错，在大多数游戏当中均可实现2K 100FPS的性能水准。特别是在DLSS 3技术的加持下，即使面对大量4K游戏，RTX4070依旧也是可以畅玩的。因此对于这款显卡的性能，主流用户们大可放心。笔者认为，RTX4070显卡开售之后，RTX3070Ti和RTX3080那些4、5千元的上一代显卡已没必要购买了。

总的来看，对于RTX4070的综合表现，笔者认为很不错，相信会有大量用户入坑的。作为本文的主角映众RTX4070曜夜，它小巧轻薄，堪称性能小钢炮，再加上4799元的首发价，性价比很高，值得笔者力推。

好了，此次首发评测就到这里，希望大家喜欢！