前言
距离NVIDIA发售RTX 40系显卡已经过去半年有多了,不知道大家用上新显卡,体验DLSS 3带来的巨大性能提升了吗?也许不少玩家对高端显卡的售价犹豫不决,期待一款既有强劲性能又能维持合理价格的显卡,现在它来了!NVIDIA在昨天终于公布了GeForce RTX 4070显卡,新显卡有着媲美RTX 3080的性能,更低的功耗,相信会成为更多硬核玩家的首选。
而影驰作为NVIDIA的核心AIC合作伙伴之一,也发布了旗下的RTX 4070显卡,我们这次收到的是影驰GeForce RTX 4070 星曜OC显卡,这代星曜的设计经过全新升级,更强的散热系统助力显卡澎湃释放,更亮眼的ARGB带来非凡的视觉体验,下面就一起看看这代星曜究竟有什么魔力能够让一众玩家钟情于它。
*下文“影驰GeForce RTX 4070 星曜 OC”简称为“影驰RTX 4070星曜OC”
规格对比
在开始测试前,我们先了解一下影驰RTX 4070星曜OC的配置,首当其冲的自然是显卡的“心脏”——AD104核心,在RTX 4070 Ti首发测试时我们知道,那上面搭载的才是完整版的AD104核心,而RTX 4070上的这颗则是阉割版。
从下图可以看到,完整的AD104核心应该包括5个GPC(图形处理集群)、30个TPC(纹理处理集群)、60个SM(流式多处理器)以及一个带有6个32Bit显存控制器的256Bit显存带宽。
而RTX 4070上的这颗AD104核心则只有4个GPC(图形处理集群),其中1个GPC也是经过阉割的、另外还有23个TPC(纹理处理集群)、46个SM(流式多处理器)以及一个带有6个32Bit显存控制器的256Bit显存带宽。二级缓存部分也与RTX 4070 Ti有细微差距,RTX 4070 Ti为48MB的二级缓存,而RTX 4070则是36MB,不过相比起前代的RTX 3070或RTX 3070 Ti的4MB二级缓存,可以是降维打击了。
除此之外,影驰RTX 4070星曜OC上的这颗AD104核心被命名为AD104-250-A1,TSMC 4N工艺制造,芯片面积为295平方毫米,虽然不及上代的面积大,但因为工艺制程的进步,影驰RTX 4070星曜OC上的这颗AD104内塞下了更多的晶体管,足足有358亿之多,并且频率上也往前迈进了300MHz以上,可以说是全方位的领先。
其他参数也是堆料十足,5888个CUDA,46个第三代RTX Cores,184个第四代Tensor Cores,并且用上了12GB的GDDR6X显存,相比上代的提升还是很明显的,大显存配合性能上的提升更可以为游戏以及创作者带来更好的使用体验。
外观赏析:影驰 GeForce RTX 4070 星曜 OC
讲完了规格,终于可以一睹显卡芳容了,有一说一,影驰在设计上是有一手的,单是包装盒的吸睛程度已经超越一众竞品了。彩色镀膜工艺让显卡时刻光鲜照人,大胆的二次元战姬形象让游戏玩家大饱眼福!
正面的影驰Logo在彩色镀膜的映衬下,从各个角度看过去更是熠熠生辉,辨识度拉满。
包装盒上还有另一个值得关注的点,在右上角还特地标注了影驰RTX 4070星曜OC支持三年质保以及个人送保,玩家可以放心购买。
包装盒的背面一样霞光四射,不过上面印的是影驰RTX 4070星曜OC的产品特色,如全新升级的星卓Ⅲ散热系统、ARGB灯效展示、黑科技DLSS 3以及8K多屏输出支持等等。
打开包装,可以说是应有尽有了,除了显卡本体外,星曜定制的显卡支架惊艳亮相,附赠的还有5V ARGB同步线、显卡支架同步线等,接电感受神光同步的洗礼。
正面外观延续了星曜系列一贯的纯白设计,整体设计采用钻石切割工艺,通体透露出宝石般晶莹的白色,颜值绝对是一众显卡中最出众的存在。
三把102mm的散热风扇坐镇,搭配四周的钻切外壳,透明的设计在RGB的照耀下带来绝佳的视觉盛宴,完美诠释了什么叫科技美学。
放大看,每个散热风扇都有一圈水晶外壳包边,视觉效果尤为明显,另外这个透明上盖是可以卸下的,玩家可以在白色的面板上打造专属自己的外观。
当然DIY可不止在白色面板上涂鸦,影驰也为极客玩家推出了5套官方定制方案的星曜外壳,样式丰富,颜值惊人,每天换一款,天天用的都是新显卡!
这次我们先拿到的是“校园版”的显卡“皮肤”,一起换上这个新皮肤看看吧。
换上校园版的皮肤后,影驰RTX 4070星曜OC一下就焕发新机,正面透明的钻切外壳配合底下樱花般的纹理,别有一番韵味。不得不说,影驰拿捏玩家确实有一套,光是这个皮肤就让人欲罢不能。
背面则是二次元浓度拉满,正中央则是穿着华丽校服的星曜娘,旁边巨大的“曜”字与外包装不谋而合,在镂空窗口处还有“放肆玩”的Slogan,彰显了星曜系列一直以来所说的“青春无极限,就要放肆玩”,同时也与校园版的显卡皮肤十分契合。
看回纯白设计的影驰RTX 4070星曜OC,其背板是高端显卡常见的金属背板设计,白色喷涂搭配丝印工艺提升了整体的质感的同时也诠释了什么叫做“纯白美学”。
金属背板的末端是大面积的镂空,旁边还有多如繁星的镂空装饰,有颜的同时,还能够增强散热表现。
显卡的顶部则是常规的”GEFORCE RTX”字样以及一长排的鳍片散热口,用于加速内部空气流动,降低核心温度。
显卡供电用的是全新的12VHPWR供电接口,使用一根12VHPWR的电源线就可达到供电需求。相比之前的8Pin接口,安装确实更加方便快捷。
如果使用的是ATX2.0标准的电源,那可以使用包装盒内随机附赠的双8Pin转16Pin的转接线,也能满足这张影驰RTX 4070星曜 OC的供电要求。
视角切到显卡底部,还可以看到显卡的PCIe金手指,标准的PCIe 4.0 x 16速率,它可以为显卡提供更快的传输速度。
最后再介绍一下这张显卡的视频输出接口,影驰给它配备了3个DP1.4a和1个HDMI2.1,支持4屏显示或最高8K@60Hz的超清输出。
并且从这个角度可以看到,影驰RTX 4070星曜OC终于不像其他几款显卡一样,开始“瘦身”了,侧面看过去仅有2槽多的厚度,官方数据是56mm厚,终于可以塞进小机箱了。
RGB展示 & 显卡拆解
RGB灯效展示:影驰 GeForce RTX 4070 星曜 OC
看完外观设计,怎能不见识一下RGB在钻切外壳下的惊艳效果呢?下面随笔者的镜头一起看看影驰RTX 4070星曜OC那炫酷而又恰如其分的RGB灯效。
通电点亮后,映入眼帘的便是正中间的信仰Logo“BOOMSTAR”,多层折射镜面设计,在ARGB灯效下光彩夺目,第一眼就抓住了一众游戏发烧友的心。
星曜定制的显卡支架也是玩灯的一把好手,用上了同款钻切镜面设计,并且还支持RGB同步灯效,一同感受整个机箱都为RGB所照亮。
顶部的Logo灯牌除了可以展示炫酷的RGB灯效,还自带检测功能,黄灯表示显卡外接供电异常,而红灯则表示主板异常,玩家排障更直观。
要说RGB最出众的自然是正面的三把散热风扇,钻切的棱镜花边折射RGB灯光,配合半透明磨砂质感的扇叶,风扇转动后,五光十色的灯效让显卡颜值更进一步,不得不说玩灯还得是你影驰。
既然是玩灯,那灯效自然是支持自定义的,在官方配套的魔盘Xtreme Tuner控制软件中,玩家可以对影驰RTX 4070星曜OC上的灯效进行客制化,并且它们也支持与其他硬件同步灯效。
极客的颜值配上炫彩的RGB灯效,这绝对是白色主题装机的最佳选择,即使是对RGB不感冒的用户看来,也会被它璀璨夺目的RGB灯效所吸引,不得不拜倒在它的颜值下。
显卡拆解:影驰 GeForce RTX 4070 星曜 OC
显卡拆解是评测不可或缺的一部分,拧下金属背板上的多颗螺丝后,PCB就可以跟星卓III散热系统分离了,整体拆解难度不大。
首先看看影驰RTX 4070星曜 OC的PCB,一眼就能看出此次影驰采用的是自研非公版设计,8层高规格工艺打造,并且在设计上影驰也加入了一些自己的理解和创新,镂空PCB设计既美观,又能够帮助显卡散热,展现了一线大厂的设计实力。
PCB的背面相比正面密密麻麻的排布就显得整洁许多,背面基本上是各类控制芯片。不过从背面依然可以看到核心上安排了POSCAP(导电聚合物钽电容),有助于提升显卡的电气性能。
PCB上的主角永远是这颗性能强劲的“心脏”——AD104-250-A1核心,TSMC 4N工艺打造,295mm2的芯片面积内塞下了5888个CUDA 核心,同时内部还有46个第三代RTX Cores,184个第四代Tensor Cores以及36MB的L2缓存,性能强劲不言而喻。
核心的四周就是NVIDIA与美光独家研制的GDDR6X显存,足足有6颗,型号是3DU47 D8BZC,单颗显存容量为2GB,6颗显存共组成12GB。要知道上代的RTX 3070也只给了8GB,现在给到了12GB,加上21Gbps的显存等效频率,让影驰RTX 4070星曜OC有了更多处理复杂项目的能力。
供电规模在一众RTX 4070显卡中也是佼佼者,毕竟要驱动的可是AD104这种高端核心,影驰RTX 4070星曜OC采用11相豪华供电配置,核心供电位于PCB左侧。另外在PCB上还可以看到3相显存供电,位置则安排在PCB右侧。
无论是核心供电还是显存供电都采用了独立的DrMos芯片,来自安森美,型号是NCP302150,单颗持续输出电流为50A,足以带动AD104与GDDR6X显存这两个性能大户。
PWM供电芯片则被安排在PCB背面,型号为uP9512R,用于同时管理核心供电金和显存供电。
正面的uS5650Q则担任电压/电流/功耗监控的工作,是不可或缺的芯片之一。
而在uS5650Q隔壁的GM009A 93F150芯片则是显卡的RGB控制芯片,你所见到的炫酷灯光就是它的功劳。
PCB的底部就是PCIe金手指了,标准的PCIe 4.0 x16速率,使用前务必确保其接入主板上最高速率的PCIe插槽及开启主板Resizable BAR功能,这样显卡才能够满血释放。
再看看电源接口,最新的12VHPWR,单口就能提供600W的供电能力,用在最高250W的影驰RTX 4070星曜 OC上属实是有些大材小用了,不过也说明影驰给这款显卡的堆料相当豪华。
供电接口的背后还有两颗LR22电容坐镇,保障显卡电源的稳定输出,随时让影驰RTX 4070星曜OC火力全开。
看完了堆料配置,该看看这款显卡的散热如何了,影驰RTX 4070星曜 OC也用上了星卓III散热系统,这可是自家RTX 4090、RTX 4080的同款,一下子就让我来精神了,如此高规的散热系统,那这款显卡的散热一定令人期待。
初见散热器,其中间就是大面积的均热板,并且影驰在均热板上还为显存、电感、MOS管接触的地方用上了高系数的导热垫辅助散热。
放大看细节,在均热板的中央就是AD104核心的位置,这里也是直触均热板设计,并且在二者之间填充了散热系数极高的硅脂,为的就是快速带走核心热量,满血释放性能。
不仅仅正面的均热板有散热,金属背板上同样安排了导热垫,配合金属导热性强的特性,影驰RTX 4070星曜 OC的散热效能可以说是拉满了。
整个散热器被分为两段式设计,大面积的导流型散热鳍片遍布全身,散热鳍片之下藏着5根Φ6mm的镀镍复合热管,贯穿整个散热器,回流焊接工艺加持保证高效导热。
要说细节设计还得看影驰,在散热器的一侧,我们还可以看到新增了一个金属加强件,用于保护鳍片不变形,毕竟前面几张显卡的重量大家也是有目共睹了。并且这个设计还能有效带动热量传导至背板,提高散热性能。
主动散热部分用的是3个102mm的风扇,厚度达到了惊人的20mm,并且每把风扇上带有11片静霜叶片,升级后的扇叶,可实现更强风压和更大风量,并且支持智能启停,保证显卡随时全力输出。
最后来个全家福,影驰RTX 4070星曜OC的堆料可以用豪华来形容,都知道RTX 4070 Ti用这款散热系统时已经有出色的温控,现在RTX 4070也用这款散热,完全有充足的余量供玩家发挥,这也让笔者对它的超频充满期待。
测试平台 & 理论与游戏性能
测试平台介绍
相信上面的部分已经让大家大饱眼福了,那影驰RTX 4070星曜OC的性能表现究竟如何,下面就让我们一同探索!
首先介绍一下本次的测试平台,我们用上了评测室的最强硬件,CPU使用的是目前的旗舰——Intel i9-13900KS处理器,主板为影驰Z790 金属大师,搭配同款的影驰星曜32GB DDR5-6000高规格内存,确保这张显卡能够释放全部性能。
得益于Ada Lovelace架构的革新和TSMC 4N工艺的加持,影驰RTX 4070星曜OC有着不错的能耗比,因此我们也给它配备了一款体积小巧、稳定优秀的电源——XPG CORE SHIFT 魔核战斗版750W全模组。
这款电源可以说相当亮眼的,内部用料以及结构都是相当成熟,主动PFC+全桥LLC+Dc-dc+同步整流技术,通过80PLUS 金牌认证,采用电线全模组化,加上小巧的体积,14cm长度设计等,不得不说它就是你RTX 4070的最佳拍档。
测试平台方面我们已经祭出了目前地表最强的硬件,那拿来衬这张显卡的显示器自然也不能弱,用的依旧是天花板级别的AGON PD32M保时捷联名款,4K@144Hz的高刷,丝般顺滑畅享市面上的3A游戏。
测试前还是要验明正身,在GPU-Z中可以看到影驰 RTX 4070星曜 OC的基础频率为1920MHz,Boost频率为2610MHz,比公版足足多了135MHz!可以期待一下它的性能表现,另外TGP设定却给到了250W,温度墙也跟RTX 4080为同一水平线的88℃,看来影驰给极客玩家预留了充足的超频空间。
理论性能测试
实测开始,首先带大家体验全世界最好玩的游戏《3DMark》,从理论性能来看,影驰RTX 4070星曜OC相比上代的RTX 3070 Ti有着更为出色的性能表现,整体性能是后者的1.3倍以上。已经比肩上代的RTX 3080了,不得不说这样的性能表现,着实让我有些意外。
在注重游戏的Time Spy和Fire Strike测试中,影驰RTX 4070星曜OC也有不俗的表现,两项成绩领先RTX 3070 Ti约20%,这也让笔者对这张显卡的实际游戏表现充满期待。而在老黄引以为傲的光追跟DLSS上,这款显卡也取得了长足的进步,PortRoyal项目中突破1w分大关,领先前代的RTX 3070 Ti 约3000分,提升幅度令人惊喜。DLSS项目中,DLSS 2更上一层楼,4K也能稳定60 FPS,还给玩家带来了惊喜连连的DLSS 3黑科技!
而在GPGPU理论性能测试方面,拥有Ada Lovalace架构的RTX 40系列显卡在算力上也有出色的性能表现,尤其是单精度和双精度浮点运算上,提升幅度是最大的。影驰RTX 4070星曜OC相比RTX 3070 Ti显卡有着巨幅提升,领先幅度足足有40%以上,整体性能也是RTX 3070的1.5倍左右。
游戏性能测试
理论性能的提升令人眼前一亮,游戏性能才是众多游戏发烧友关注的重点,因此我们选择了多款游戏在多种分辨率下进行实测,让你一睹影驰RTX 4070星曜OC在游戏中的风采。
首先是常见的1080P分辨率,这对于影驰RTX 4070星曜OC来说是小菜一碟,不少游戏都能稳定运行在150 FPS以上,像《战争机器5》这样优化比较好的游戏,不开任何DLSS加成,它也能接近200 FPS。相比起20系的RTX 2070 Super,帧数几乎是翻倍的提升,即便是面对上一代的RTX 3070或RTX 3070 Ti,影驰RTX 4070星曜OC的游戏性能也是它们的1.3倍左右。
2K分辨率则是影驰RTX 4070星曜OC的主场了,在这个分辨率下,一众游戏依旧有120 FPS左右的表现,如果你玩的是像《古墓丽影:暗影》这类的老3A大作,优化效果更明显,这张显卡能在2K分辨率下跑出205 FPS的超高成绩,可见RTX 4070的实习非同小可!而一些优化一般的游戏,影驰RTX 4070星曜OC也有优势,素有“显卡离去”之称的《地铁:离去》,RTX 2070 Super几乎是不可玩的状态,30系的两张卡也是刚好达到及格线,而影驰的这张卡却能几乎维持在90 FPS左右,丝滑体验不言而喻。
总的来说,在不开启DLSS或仅开启DLSS 2的情况下,影驰RTX 4070星曜OC完全能够应付2K分辨率下的3A大作,不少游戏表现甚至超出预期,满足2K高刷玩3A完全不是梦。
DLSS 3性能测试
DLSS 3性能测试
要说这一代RTX 40系显卡最大的升级就是DLSS 3黑科技,DLSS早在RTX 20系显卡就已经发布了,其主要是让显卡在不影响画面质量的情况下提升游戏性能,目前DLSS已经更新至3.0版本,相比前代,新增帧生成和NVIDIA Reflex技术,据老黄所说,用上DLSS 3后可以实现游戏性能的翻倍提升。
3DMark DLSS 3理论性能测试
在最新版的3DMark测试软件中已经加入了DLSS 3相关的测试,有了DLSS 3后,影驰RTX 4070星曜OC如虎添翼,2K分辨率下,开关DLSS 3性能差距能够达到2.5倍以上,帧数稳定在135 FPS以上,但从理论测试来看影驰RTX 4070星曜OC已经能够很好的满足2K@120Hz的游戏需求。
4K分辨率我们也测试了,不得不说老黄的刀法还是相当精准的,影驰RTX 4070星曜OC开关DLSS 3的性能差距足足有4倍之多,但4K分辨率下也只是接近90 FPS,因此影驰RTX 4070星曜OC能够轻度游玩4K,想要更丝滑的体验就得选择更高端的显卡了。
《微软模拟飞行》游戏实测
光测试理论性能肯定是不够的,现在支持DLSS 3的游戏已经上升至50款,因此我们也选用了一些热门游戏尽显详细测试。在对硬件要求颇高的《微软模拟飞行》中,影驰RTX 4070 星曜OC开启DLSS 3后对RTX 3070 Ti简直是降维打击,1080P分辨率下几乎是2倍的帧数提升,2K分辨率下也比RTX 3070 Ti高出60多 FPS,更别提RTX 2070 Super了,它还是勉强能玩的水平。另外影驰RTX 4070星曜OC的功耗仅149W,基本上是用RTX 2070 Super的功耗实现了2倍以上的性能!
在其他几款游戏中也是如此,影驰RTX 4070星曜 OC在开启DLSS 3后,游戏帧数相比RTX 3070 Ti都有60%-70%左右的提升,不少项目更是有翻倍的帧数提升,并且功耗都更低,用更低的功耗实现更强的性能,这才是玩家所乐见的。
1080P分辨率DLSS性能测试
在1080P分辨率下,影驰RTX 4070星曜OC开启DLSS 3后,游戏性能提升非常离谱!性能直接是RTX 2070 Super的2倍有多!大部分游戏都能稳定在200+ FPS以上,有人可能会问,那跟RTX 3070 Ti相比如何,这张卡的性能在1080P下依旧领先RTX 3070 Ti 70%以上!有这样的提升幅度,DLSS 3功不可没。
2K分辨率DLSS性能测试
2K分辨率下,以影驰RTX 4070星曜OC的性能也是毫无压力,上面测试时不少游戏开启DLSS 2时就领先RTX 3070 Ti仅20帧,但开启DLSS 3后,整个世界都变了!领先幅度来到了惊人的50-60帧以上;毫无疑问的说,影驰RTX 4070星曜OC在2K分辨率下的优势明显,相比RTX 2070 Super,性能足足是其4倍之多,相比RTX 3070 Ti也丝毫不虚,性能是翻倍的提升。这样的游戏性能领先让它稳居2K高刷游戏甜品显卡的宝座。
我们也使用影驰RTX 4070星曜OC在DLSS 2和DLSS 3两种模式下测试了多款游戏,从实测结果来看,DLSS 3确实有点东西,不少游戏的帧数都有明显提升,其中不乏一些游戏有翻倍的性能提升。像《赛博朋克2077》这款游戏,众所周知它被誉为“显卡杀手”,影驰RTX 4070星曜OC在DLSS 2下游戏帧数为96 FPS,而开启DLSS 3后,游戏帧数达到了惊人的144FPS,这已经可以2K@144Hz畅玩电竞级的夜之城了!更让人惊喜的是开启DLSS 3后,游戏的1% Low帧也有提升,这也意味着你在玩游戏时更稳定更丝滑。
4K分辨率DLSS性能测试
虽然说这是一张定位2K 100+FPS游戏级别的显卡,但影驰RTX 4070星曜OC仍是具备一定的4K游戏能力,只要把DLSS3一开,或者是把游戏画质降低一些,游戏流畅度就直接上来了,跑个60+FPS不成问题。
RTX VSR测试
RTX VSR测试
有些时候你是不是也会有这样的烦恼,那些480P甚至360P的早期视频清晰度不够,看起来不够清楚?现在这种烦恼将不再困扰你。NVIDIA带来了视频版的DLSS 3!正是前不久发布的RTX Video Super Resolution 视频超分辨率技术(RTX VSR),通过AI技术即可提高浏览器内的视频的分辨率,展现前所未有的显示效果。
今天我们也测试了这项划时代的RTX VSR技术,在RTX 30系和RTX 40系的NVIDIA控制面板中找到视频图像设置,手动开启RTX Video enhancement即可启用RTX VSR技术,其中分为1-4档调节,数字越大质量越好。
实测环节,可以看到在开启RTX VSR技术之后,原视频里的人物线条由原本的模糊不清变得十分清晰锐利,并且随着VSR级别的提高,清晰度逐级提升,甚至部分细节已经接近原生1080P了。
在暗部表现同样如此,原视频里地板如同劣质贴图,有VSR加持后每块砖头都清晰可见,且立体感满满,尤其是旁边绿色植被的清晰度更高了一个数量级。除此之外,RTX VSR技术的AI算法似乎还能够通过类似DLSS帧生成的方式计算出物体的远近关系优化景深效果,这一点同样能够使得画面整体观感得到提升。
这里我们也给大家准备了对比视频,从视频里就可以看到VSR的效果之明显,最高级别的VSR 4跟原生480P相比就是一眼的区别,在开启RTX VSR技术后,部分图像质量有了显著提高,不仅锯齿和噪点几乎全部消失,颜色过渡也更为平滑,目前VSR能有这种表现堪称惊艳。
当然你除了在浏览器能够使用这项功能外,本地浏览器也能享受黑科技的魅力,VLC是目前首个支持RTX VSR技术的本地播放器,且能够支持多种视频格式播放。正式版也随着RTX 4070显卡的解禁上线了,你硬盘里的老视频也能摇身一变成1080P了!
我们将浏览器中的视频与本地的视频同时进行RTX VSR 4档渲染,从画面上看,右侧本地播放器的效果要弱于左侧浏览器的,浏览器上的4档VSR线条更锐利,画质也更清晰,不过即使是本地播放器的效果也要远强于原生480P,笔者猜测可能是目前本地浏览器的优化还不到位。
我们也将原生480P与浏览器和本地播放器上的VSR渲染视频进行对比,从视频画面中可以看到,本地播放器上4档VSR渲染过后,文字或线条都相比原生480P有一定提升,至少以前模糊不清的视频可以看了,不过对比浏览器的效果还略有差距,后者的效果已经接近原生1080P了。
有用户可能担心功耗的问题,在VSR开启最高档4档的情况下,影驰RTX 4070星曜OC的功耗仅有24W左右,显卡利用率也远没有网络上传得那么高,在HWINFO64中可以看到显卡全程利用率不过25%。
总的来说,影驰RTX 4070星曜OC上的RTX VSR技术将为玩家和视频观看者带来革命性的新体验!无论是性能上还是技术上的创新,都称得上是流媒体时代的革命!
创作性能 & NVIDIA编码器专项测试
创作者性能测试
测试完游戏后,少不了的就是生产力性能,生产力分为创作生产力与专业生产力两部分,这里我们选择PugetBench、PCMark 10、Blender等多款常见的测试软件,来测试影驰RTX 4070 星曜OC在日常办公、视频内容生产、专业渲染等方面的性能表现。
首先我们来看看PCMark10 Extended项目上各显卡的性能表现如何,可以看到影驰RTX 4070 星曜OC在游戏这个子项目上与前代的RTX 3070 Ti拉开了差距,并且领先幅度约为20%左右,这与我们上面的游戏实测相符,与老大哥RTX 4070 Ti相比,性能差距也在10%以内。
而在UL Procyon与PugetBench测试中,影驰RTX 4070星曜OC不单止超越了前代的RTX 3070 Ti,甚至在部分项目上还反超了大哥RTX 4070 Ti。另外最新的RTX 40系支持AV1的编解码,在达芬奇软件中优势相当明显,有了AV1的加持后,影驰RTX 4070星曜OC相比RTX 3070足足领先了38%的性能,这是前代显卡无论如何也无法逾越的一道鸿沟,毕竟这需要RTX 40系显卡中的双NVIDIA编码器的硬件支持。
专业性能上,影驰RTX 4070星曜OC的提升更是惊人,在N卡常用的Blender渲染软件中,影驰RTX 4070星曜OC相比RTX 3070有50%的性能提升,就算是RTX 3070 Ti,它依旧领先45%以上。
而在以工业软件为主的SPEC 2020中,影驰RTX 4070星曜OC依旧展现出来强大的实力,相比RTX 2070 Super,性能领先50%有多,相比RTX 3070 Ti领先25%,反应在实际应用中则是同样的工程文件,使用最新的影驰RTX 4070星曜OC能够节约四分之一的时间,提升你的工作效率。
当然这里面提升最大的还要属OC渲染器,性能足足是RTX 3070的1.6倍!这明显是ADA架构革新所带来的算力提升。想要提升专业性能的用户不妨考虑一下影驰RTX 4070星曜 OC,相对低的售价但却带来强悍的性能表现,不得不说真香!
NVIDIA编码器专项测试
通过上面的测试,我们也知道现在的RTX 40系显卡不仅有游戏版DLSS,还有视频版DLSS,不过你以为RTX 40系显卡对视频的提升仅仅如此吗?其实它还隐藏了一项特殊技能,影驰RTX 4070星曜OC内置了NVIDIA编码器,它支持时下热门的AV1编码,作为下一代主流的视频编码技术有着自己独特的优势,更快的编码速度和更高质量的流媒体传输性能,让越来越多的剪辑软件和视频网站青睐于它,像我们熟悉的达芬奇、剪映、B站等已经支持AV1编解码,未来AV1将会成为一个新趋势。
我们使用NVIDIA提供的8K片源与工程文件分别测试AV1格式和H.265格式下的编码时间。实测同一段素材下,同样使用H.265编码,有双编码器的加持下,影驰RTX 4070星曜OC的效率比RTX 3070快40%以上,如果使用AV1编码,那效率会比H.264快50%。
当然我们上面也提到AV1编码不止导出速度更快,它的文件占用空间也比H.265要小,无论是4K分辨率还是8K分辨率,使用AV1编码后,文件整体大小能够降低25%以上,并且肉眼下几乎没有画质区别,单凭AV1的这些优点,未来将会是AV1的天下,现在装备一张影驰RTX 4070星曜OC即可感受最新技术带来的优势。
AI运算能力测试 & 功耗
AI运算能力测试
接下来的测试更是重量级,最近一段时间,AI绘图、ChatGPT等AI工具如雨后春笋般冒了出来,老黄甚至在前段时间的GTC大会上重点介绍了AI技术,还指出“现在AI行业已经到达了像iPhone横空出世时为手机行业带来的革命性颠覆的时间点。”
借这个机会,我们也对影驰RTX 4070星曜OC显卡进行AI运算能力测试,在使用达芬奇AI ACCELERATED MAGIC MASK测试时,可以看到影驰的完成时间为14秒,而前代的RTX 3070则是21秒,你可能觉得时间差距不大,但项目一旦复杂起来,选用影驰RTX 4070星曜OC会让你的效率快33%以上。
再看看最近大火的AI作画,AI作画近期取得如此巨大进展的原因个人认为有很大的功劳归属于Stable Diffusion的开源。因此我们也用Stable Diffusion生成50张768 x 768的图片进行测试,从生成时间上就可以看到影驰RTX 4070星曜OC的强势,前代的RTX 3070 Ti生成50张图需要接近3分钟的时间,而影驰只需要2分11秒,相比大哥RTX 4070 Ti也差距不大,仅差20秒,如果是跟RTX 2070 Super相比,影驰的效率已经接近2倍了!
另外在测试中还有一个值得关注的地方就是显存占用,基本上RTX 20系跟RTX 30系的几张显卡在测试时显存占用都达到了7.6G以上,虽然影驰RTX 4070星曜OC的显存占用也有7G以上,不过得益于影驰RTX 4070星曜OC的12GB大显存,因此在生成速度上有明显优势,可见这个软件还是很吃显存的,所以大家在玩这个软件的时候应该是显卡显存越高越好,选择影驰RTX 4070星曜OC就是你高性价比兼高性能的选择。
功耗与发热
星卓III散热系统的配置大家都有目共睹,虽然影驰RTX 4070星曜 OC只是一款定位250W,但它的散热系统跟RTX 4070 Ti几乎是同一规格的,这也让我对这款显卡的功耗和发热情况充满好奇。
在室温25℃的情况下,使用Furmark单烤15分钟后,影驰RTX 4070 星曜 OC的GPU核心运行在2700MHz以上的高频,但此时核心温度仅有57.8℃,显存更是仅有50℃出头,50多℃意味着什么?意味着它可能比你使用的CPU还要低温!如果是待机温度,那这代显卡的温度更是惊人,GPU在待机下30℃不大,现在知道星卓III散热系统的强势之处了吧。
真正优秀的还不止于此,采用TSMC 4N工艺后的影驰RTX 4070星曜 OC的功耗和噪音控制也相当优秀,烤机15分钟,最高功耗仅有215W,这个水平约等于RTX 2070 Super,意思就是影驰RTX 4070星曜OC用相同的规格实现了性能的飞跃!这也是最让笔者惊喜的地方之一。
我们还利用HWINFO64软件与FrameView软件双重记录多款显卡的功耗表现情况,从图中可以看到影驰RTX 4070星曜OC整体功耗控制相当出色,在所有测试场景内近乎都是维持在200W左右,用RTX 2070 Super一样的功耗,但性能却已经实现全方位的领先!
不禁感慨老黄的Ada Lovelace架构和TSMC的4N工艺确实有点东西,影驰RTX 4070星曜OC无论是性能表现、温度控制甚至是能耗比都可以说是N卡的新高度,相比前代的RTX 30系还是初代光追显卡20系都是一次降维打击。
超频潜力 & 评测总结
超频能力测试
前面在GPU-Z中可以看到影驰 RTX 4070星曜 OC的TGP最高去到了250W,这比公版RTX 4070还要高出不少,显然这是给超频预留了充足的空间,那笔者自然是不可能错过这个绝佳的机会,下面一同看看这款显卡的超频潜力究竟有多大吧。
这里我们使用影驰官方提供的XTREME TUNER魔盘工具对显卡进行超频,这款工具不仅可以解锁GPU核心的电压限制、功耗限制等,还可以自由调节风扇转速,实测这款显卡的散热配置明显是超规格的,因此风扇转速还可以进一步下探,超低的风扇噪音还你舒适的使用体验。
先对这张显卡的基本性能有个基本的了解,默频状态下Time Spy得分18671分。
小试牛刀,核心与显存均先超频200MHz,没想到仅仅超频200MHz后,Time Spy得分就已经接近2W分大关了,此时影驰RTX 4070星曜OC在测试中的核心频率就已经有3060MHz了,相比默频时最高的2865MHz刚好提升了200MHz左右。
核心频率加码到250MHz,显存频率也超频500MHz,此时Time Spy测试得分稳步上升至19649分,核心频率也再创新高,达到了3105MHz,搭配地表最强的13900KS,影驰RTX 4070星曜OC超频性能尽显。
万万没想到影驰RTX 4070星曜OC的潜力远不止于此,最后我们将核心和显存分别提升了250MHz和750MHz,此时在Time Spy测试中,显卡的核心频率已经上到了3120MHz,可见它的超频能力还是相当可观的。频率甚至比RTX 4070 Ti还要再强一些,总分也来到了19710,相比默频的18671分,提升近1000分,能力可见一斑。
评测总结
RTX 40系列自发布以来就给广大用户带来不少惊喜,这次更是再添一位大将!全新的Ada Lovelace架构、黑科技DLSS 3、RTX VSR等创新技术的出现让RTX 40系显卡相比前代有着无可比拟的竞争力。实测下来也不得不赞叹老黄真的有点东西,因此GeForce RTX 4070显卡有着超乎预期的性能表现,不仅专业性能有质的飞跃,游戏性能也让人眼前一亮,惊喜连连。
这次上手体验影驰 GeForce RTX 4070 星曜 OC,最深刻的印象那一定是它的纯白美学与钻切时尚。作为星曜系列的新选手,延续了自家旗舰的设计水准,白色战甲配上晶莹剔透的外壳,精致亮眼。高度可DIY的特性让游戏发烧友可以尽情发挥创意,异想天开,设计独一无二的星曜显卡。
光有惊艳众人的颜值还不够,影驰GeForce RTX 4070 星曜 OC的性能才是重头戏!AD104核心在性能释放上已经完胜RTX 3080,更别提RTX 3070,性能领先更是接近翻倍,并且功耗保持在RTX 2070 Super的水平!花小钱办大事的典范了属于是,这才是高端显卡应有的表现。玩家最关心的游戏性能也是当仁不让,2K分辨率下依旧可以保持100 FPS以上的超高帧率,4K下搭配DLSS 3也可一战。如此性能,是多少玩家心心念念的梦中情卡
总的来说,影驰 GeForce RTX 4070 星曜 OC更像是集美貌与才华于一身的高端显卡,如果你注重游戏性能体验,想要体验超频的乐趣,同时希望兼顾绝美的颜值,那这款显卡一定是你的不二之选。目前影驰 GeForce RTX 4070 星曜 OC已经上市,售价5299元,性价比真不错,现在各大电商平台均已开售,感兴趣的话可以去了解一下。
技术讲解:Ada Lovelace架构
Ada Lovelace架构讲解
Turing、Ampere上两代架构核心均以人物来命名,前者是计算机科学之父——艾伦·麦席森·图灵;后者则是“电学中的牛顿”——安德烈·玛丽·安培,电流的国际单位安培就是以其姓氏命名。那Ada Lovelace定非凡人,度娘一下果然,这是 人称“数字女王”的阿达·洛芙莱斯,编写了历史上首款电脑程序,是被世界公认的第一位计算机程序员,果真是一代比一代还要更牛。PS:她的父亲是《唐璜》的作者,诗人拜伦。
从Turing架构开始,NVIDIA首次在显卡中加入了加速光线追踪的RT Core单元,以及面向AI推理的Tensor Core单元,这革命性的创新使实时光线追踪成为可能。而Ampere架构则是全面的架构改进,在加入新一代的二代RT Core和三代Tensor Core基础上,还有着更先进的SM单元设计,这样显卡工作效率那是翻倍的提升。而来到Ada Lovelace架构,同时是以效率提升为大前提,自然是引入了最新的第三代 RT Cores与第四代 Tensor Cores单元,同时加入众多新颖的黑科技,从执行效率来说Ada Lovelace架构是上代Ampere架构的2倍以上,甚至光线追踪能力更是达到了恐怖的4倍性能。
全新的SM流式多处理器
Ada Lovelace架构中最大的亮点之一:全新的SM流式多处理器,每个SM包含了128个CUDA核心、1个第三代的RT Cores,4个第四代 Tensor Cores(张量核心)、4个Texture Units(纹理单元)、256 KB Register File(寄存器堆),以及128 KB L1 数据缓存/共享内存子系统,于是这一个全新的SM单元有着超过上一代2倍之的性能表现。
过去的Turing架构INT32 计算单元与FP32数量是一致的,而两者相加才组成了64个CUDA核心。但是Ampere架构开始,左侧的计算单元实现了FP32+INT32的计算单元并发执行,也就是说CUDA核心数量翻倍到了128个。
再来看看Ada Lovelace架构的SM,FP32/INT32的计算单元组合,同样实现了每个SM内含128个CUDA的设计,看似提升不大,但是当你了解到GeForce RTX 4070拥有46个SM,5888个CUDA核心,那你也就应该明白它的着色器能力进一步加强,跟上一代的RTX 3070相比,虽然是同样的CUDA核心,但得益于新架构的优势,完全可以说是遥遥领先。
另外缓存方面Ada Lovelace架构也进行了大规格的提升,首先每个SM单元中单独配上了128 KB的缓存,其次核心的二级缓存进行进行了重新的设计,使得RTX 4070配备了36MB二级缓存,相比RTX 3070可以说是质的飞跃,足足提升了9倍之多。
技术讲解:第三代 RTX Cores 与 第四代 Tensor Cores
以为刚才的CUDA数量与超大L2缓存就已经很猛了,实现上Ada Lovelace架构最大的提升还是在第三代 RTX Cores与第四代 Tensor Cores身上。
第三代 RTX Cores
RTX Cores用于光线追踪加速,第三代 RTX Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。
在Ampere架构中,第二代RT Cores支持边界交叉测试(Box Intersection testing)和三角形交叉测试(Triangle Intersection testing),用于加速BVH遍历和执行射线三角交叉测试计算,虽然光线追踪处理能力已经比初代的Turing架构核心更高效,但是随着环境和物体的几何复杂性持续增加,传统的处理方式很难再以更高效率、正确反应出的现实世界中的光线,尤其是光的运动准确性。
所以在第三代 RTX Cores增加了两个重要硬件单元:Opacity Micromap Engine与Displaced Micro-Meshes Engine引擎。Opacity Micromap Engine,主要是用于alpha通道的加速,可以将 alpha 测试几何体的光线追踪速度提高2倍。
在传统光栅渲染中,开发人员使用一些 Alpha 通道的素材来实现更高效的画面渲染,例如 Alpha 通道的叶子或火焰等复杂形状的物体。但在光线追踪时代,这传统的做法会为光线追踪带为不少无效的计算,例如运动性的光线多次通过一块叶子,光线每击中一次叶子,都会调用一次着色器来确定如何处理相交,这时就会做成严重的执行成本与时间等待成本。
而Opacity Micromap Engine用于直接解析具有非不透明度光线交集的不透明度状态
三角形。根据Alpha 通道的不透明,透明与未知等三个不同的块状态进行处理:透明则直接忽略继续找下一个,不透明块则记录并告之命中,而未知的则交给着色器来确定如何处理,这样GPU很大部分都不需要进行着色器的调试处理,能够实现更为高效的性能。
Displaced Micro-Meshes Engine
如果说Opacity Micromap Engine加速的是面处理,那么Displaced Micro-Meshes Engine就是几何曲面细节的加速器。如上图所示,在Ada Lovelace架构中,通过1个基底三角形+位移地图,就可以创建出一个高度详细的几何网格,所需要资源占用比二代RTX Cores更低,效率也更高。
通过NVIDIA给出的创建14:1珊瑚蟹例子来说事,这里我们需要需要1.7万个微网格、160万个微三角形,在Ada Lovelace架构中BVH创建速度可加快7.6倍,存储空间缩小8.1倍。Displaced Micro-Meshes Engine起到了关键性的作用,其将一个几何物体根据不同细节分成密度不一的微网络处理,红色密度超高,细节处理越为复杂 。相应的低密度微网络区域则可以释放更多的资源与存储空间,这样Displaced Micro-Meshes Engine就可以帮助BVH加速过程,减少构建时间和存储成本。
同时Ada Lovelace架构SM中新增了着色器执行重排序(Shader Execution Reordering,SER),这是由于光线追踪不再只有强光或者阴影渲染处理,未来将会更多的是在光线的运动性,这样光线就会变得越来越复杂,想要第三代 RTX Cores与第四代 Tensor Cores有着更高的执行效率,那就得为他们来安排一位管家。而着色器执行重排序(SER)就是为了能够即时重新安排着色器负载来提高执行效率,为光线追踪提供2倍的加速,也能更好地利用 GPU 资源。不过目前仍未有实例,想实现这个功能,还得游戏与开发工具的支持才行。
第四代 Tensor Cores
Tensor Cores是专门为执行张量/矩阵运算而设计的专用执行单元,这些运算是深度学习中使用的核心计算功能。第四代Tensor Cores新增FP8引擎,具有高达1.32 petaflops 的张量处理性能,超过上一代的5倍。
技术讲解:DLSS 3
技术讲解:DLSS 3
或者说第四代Tensor Cores太硬核你不会知道是啥?提升意义在哪?但是Tensor Cores最经典的应用DLSS你肯定会知道,这一次Ada Lovelace架构支持NVIDIA最新的DLSS 3技术。
之前我们也聊过DLSS技术,其设计之初是为了弥补光线追踪技术后的性能损失,具体的表现为开启光线追踪技术后游戏帧数大幅度的下降,甚至很难保证游戏流畅的运行。于是DLSS使用低分辨率内容作为输入并运用AI技术输出高分辨率帧,从而提升光线追踪的性能。
在DLSS 3中包含了三项技术:DLSS帧生成、DLSS超分辨率(也称为DLSS 2)和NVIDIA Reflex。你可以理解为DLSS 3是在DLSS 2的基础上,新增了DLSS帧生成技术;而后两技术中,DLSS超分辨率只需要GeForce RTX显卡都能使用上,NVIDIA Reflex则是GeForce 900 系列以后的显卡都用使用上。
想实现DLSS帧生成可不简单,这需要配合上Ada Lovelace架构的GeForce RTX 40系列显卡才行。DLSS帧生成技术原理是:利用AI技术生成更多帧,以此提升性能。DLSS会借助 GeForce RTX 40系列GPU所搭载的全新光流加速器分析连续帧和运动数据,进而创建其他高质量帧,同时不会影响图像质量和响应速度。
从Ampere架构开始,NVIDIA显卡就已经支持了光流加速器,而Ada Lovelace架构的光流加速器升级到了第二代,其提供了高达300 TeraOPS (TOPS) ,比安培架构的初代光流加速器(Optical Flow Acceleration,OFA)快2倍以上。为了实现DLSS帧生成,OFA扮演了重要的角色,其配合上新的运行矢量分析算法在DLSS 3技术框架内实现精确和高性能的帧生成能力。
另外,由于DLSS帧生成是在GPU上作为后处理执行的,那么即使在游戏受到CPU性能限制的时候,我们同样能够从中获得更好的游戏性能提升。尤其是那种物理计算密集型的游戏或大型场景游戏,DLSS 2均可以让GeForce RTX 40系列显卡以高达两倍于CPU可计算的性能来渲染游戏。
最后由于DLSS 3是建立在DLSS 2基础之上的,游戏开发者可以在已支持DLSS 2或NVIDIA Streamline的现有游戏中快速集成该功能,所以DLSS 3已在游戏生态得到广泛应用,目前已有超过35款游戏和应用即将支持该技术。
阅读小亮点:NVIDIA Reflex
NVIDIA Reflex也是DLSS 3其中的一环,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。
想要实现端对端的最低延迟,你需要确保游戏、显示器以及鼠标三者都同时支持并开启了Reflex 技术。
当GeForce RTX 40系列显卡和NVIDIA Reflex搭配上后,直接达到1440p分辨率360 FPS的体验,这着实是性能有点强劲了。
在GTC2022大会时已经透露将会还有4 款 1440p 分辨率的新型 G-SYNC 电竞显示器将要发布,包括采用mini-LED技术的AOC AG274QGM – AGON PRO Mini LED、MSI MEG 271Q Mini LED 和 ViewSonic XG272G-2K Mini LED三款显示器刷新率均为300Hz,而最猛的是ASUS ROG Swift 360 Hz PG27AQN ,刷新率直接来到了360Hz。
但唯一一个问题就在于,部分显示器厂商认为此类产品受众人群较少,会降低此类显示器的产能,甚至产品就已经被内部PASS掉,所以1440p 360Hz是很美好,但现实也是相当的骨感。
技术讲解:NVIDIA编码器
技术讲解:NVIDIA编码器
GeForce RTX 40系列显卡还有一个全新的升级,那就是编码器NVENC。第八代的NVENC编码器不仅支持H.264与H.265,还支持开放式视频编码格式 AV1。
而由于AV1是一种免版税的视频编码格式,上游软件厂商与下游戏的配套端都在大力推广此编码格式,我们也会看到越来越多的硬件与软件支持AV1格式,包括剪映专业版、DaVinci Resolve、以及Adobe Premiere Pro较为流行的Voukoder插件均支持,且均可通过编码预设使用双编码器,这样我们等待视频导出的时间缩短将近一半。
不单是视频制作软件,AV1格式也将会是主播、游戏直播UP主们的新宠儿,在保证画面最高质量的情况下,AV1 编码器可将效率提高 40%,同时显卡的占用也更低。包括OBS Studio一代软件中也会增加AV1格式的支持。另外我们还能通过 GeForce Experience 和 OBS Studio 录制高达 8K60 的内容,这样我们做游戏录制也会变得更为轻松。
包括我们之后测试时使用的游戏内录视频都是支持AV1格式,同时编码器NVENC在资源占用和适配上做得越来越好。
相关教程
2023-04-14
2023-05-31
2023-05-29
2023-02-13
2023-05-24
2023-05-16
2024-10-23
2024-10-22
2024-10-22
2024-10-21