1引言&规格对比&外观赏析:iGame GeForce RTX 4070 Ti Neptune OC
引言
无论是旗舰级的RTX4090还是次旗舰的RTX4080,一经发售就被一抢而空,造成这样的状况一方面是产能的不足,另一方面则是全新AdaLovelace架构以及TSMCN4工艺加持下,RTX40系显卡的性能和能耗确实给玩家带来惊喜。买不到高端旗舰,更多硬核玩家将视线转向了即将发布的RTX4070Ti显卡,期待它有强劲性能的同时也能够维持合理的价格。
这次我们也在第一时间拿到了RTX4070Ti,今天的主角就是七彩虹iGameGeForceRTX4070TiNeptuneOC,作为七彩虹iGame的高端显卡之一,玩家一般称呼其为“水神”,与我们之前测试的“火神”显卡并称为双雄旗舰。相信不少玩家已经对这张“改头换面”的RTX4070Ti充满好奇了,下面随笔者一探究竟。
下文“iGameGeForceRTX4070TiNeptuneOC”简称为“iGameGeForceRTX4070Ti水神”。
规格对比
开始测试前,先让我们了解一下iGameGeForceRTX4070Ti水神,其采用的是AD104-400核心,TSMC4N工艺制造,芯片面积为295平方毫米,别看它面积比上代的GA104-400核心小,但它的晶体管密度达到了358亿,晶体管数量相比较于上一代产品提升非常明显,近乎翻倍,而这一代的核心还进一步提升了频率,因此能带来更好的性能表现。
其他参数方面,iGameGeForceRTX4070Ti水神上的AD104核心标配7680个CUDA,60个第三代RTCores,240个第四代TensorCores,并且用上了12GB的GDDR6X显存,相比上代的提升还是很明显的,毕竟大显存配合性能上的提升更可以为游戏以及创作者带来更好的使用体验。
目前iGameGeForceRTX4070Ti水神显卡上配备的这颗AD104-400核心可以算是完整的AD104核心了。完整的AD104核心应该包括5个GPC(图形处理集群)、30个TPC(纹理处理集群)、60个SM(流式多处理器)以及一个带有6个32Bit显存控制器的256Bit显存带宽。
不过以老黄精准的刀法来看,RTX4070Ti之下应该还有一张RTX4070,笔者猜测,RTX4070显卡应该还会延用AD104核心,不过会在RTX4070Ti的基础上进行阉割,衍生出AD104-300核心,性能会稍逊一筹,不过价格也会有一定优势。
外观赏析:iGame GeForce RTX 4070 Ti Neptune OC
打开硕大的包装盒后,我们期待已久的iGameGeForceRTX4070Ti水神终于揭开了它神秘的面纱。我们首先看到的是它的本体,采用银白色金属机身,细节做工相当精致,整体质感拉满。
显卡的正面以海底文明亚特兰蒂斯为灵感所设计,表面是厚重的合金装甲,拿在手里非常有份量感,机身上方为两道波浪形线条,它们也同时为RGB组件,可模拟流动的海洋波涛。
显卡背面同样是一体成型的金属背板设计,中央镂空处可以隐约看到iGameGeForceRTX4070Ti水神的GPU核心。四周为蓝白相间的图形装饰,与水神这一设计理念吻合,极富设计感。
显卡顶部左侧有一处开孔,内嵌一块灯板,当显卡点亮时,此处可以见到iGame字样亮起。
灯牌的附近是常见的“GEFORCERTX”字样,另外还可以看到显卡本体通过两根水冷管与冷排连接。
供电接口被安排在显卡顶部最靠右的位置,目的是装机时尽量不让电源线挡住这款显卡的颜值,接口用的是全新的12VHPWR供电接口,通过一根12VHPWR的电源线就可达到供电需求,单口600W的供电能力,用来应付RTX4070Ti可以说是大材小用了。
在包装盒内也随机附赠了一根双8Pin转转16Pin的延长线,如果用户使用的是ATX2.0标准的电源,利用这根转接线即可供电显卡,无需更换电源。
看完了显卡本体,该来了解一下这个硕大的240冷排了,采用标准12水道设计,可见iGameGeForceRTX4070Ti水神的散热能力不容小觑。
冷排上是2个12025规格的散热风扇,高效降温,让iGameGeForceRTX4070Ti水神能够始终满血释放性能。
每把散热风扇配备7片扇叶,并且扇叶经过特殊设计,可以更好降低风扇转动时产生的噪音,并起到增强风压的效果。
2个散热风扇通过直连的形式最终接在冷排上边的HUB上,利用这个HUB可以轻松PWM调节风扇转速和ARGB控制。
在冷排的侧面可以看到POWERFULWHETHERREALORVIRTUAL(现实与虚拟均是最强的存在)的英文标识,而在冷排的两端还可以看到iGame的标志。
不同于其他显卡动辄三槽起步的厚度,采用240冷排的iGameGeForceRTX4070Ti水神能够将机身做薄,仅仅只有两槽多的厚度,这对小机箱也十分友好。
接口方面还是三个DP1.4a和一个HDMI2.1,完美支持8KUHD60Hz输出,这样的接口配置已经能够满足绝大多数用户的需求了。
值得一提的是在接口的旁边还有一颗BIOS切换按钮,用来切换显卡的双BIOS设计,NORMAL模式下显卡会以更低的风扇转速运转,而切换至TURBO模式后,iGameGeForceRTX4070Ti水神的Boost频率能够直接提升至2790MHz,带来更强劲的性能释放。
2RGB灯效展示:iGame GeForce RTX 4070 Ti Neptune OC
RGB灯效展示:iGame GeForce RTX 4070 Ti Neptune OC
看完外观设计,怎么能不玩玩灯呢。下面随笔者的镜头一起看看iGameGeForceRTX4070Ti水神那炫酷而又恰如其分的RGB灯效。
在显卡的侧面有一小块灯板,显卡点亮后即可清晰的看到iGame字样亮起。
显卡的正面有两道水波纹里的灯条,在点亮后,灯效静谧流淌,潺潺流动。预示着iGameGeForceRTX4070Ti水神将带领一众玩家乘风破浪,畅享游戏乐趣。
240冷排上的两把风扇同样支持ARGB调光,随着电源接通,两把风扇开始肆意舞动,灯效在这个半米见长的机箱内闪耀。
既然是玩灯,那灯效自然是支持自定义的,在官方配套的iGameCenter控制软件中,玩家可以对iGameGeForceRTX4070Ti水神上的灯效进行客制化,并且它们也支持与其他硬件同步灯效。
极客的颜值配上炫彩的RGB灯效,这绝对是白色主题装机的最佳选择,即使是对RGB不感冒的用户看来,也会被它璀璨夺目的RGB灯效所吸引,不得不拜倒在它的颜值下。
3显卡拆解:iGame GeForce RTX 4070 Ti Neptune OC
显卡拆解:iGame GeForce RTX 4070 Ti Neptune OC
想要拆解iGameGeForceRTX4070Ti水神还是比较简单的,只需要卸下背板螺丝即可。从PCB正面可以看出这次的设计有轻微越肩,不过整体设计合理,安排规整,单从PCB上的接口、供电、核心、显存等细节就可以看出这一定是大厂出品的品质。
翻到PCB的背板,可以看到相比正面更为简洁,元器件更少,仅有少部分供电芯片。
其中AD104核心背部的电容位置使用了三个POSCAP(导电聚合物钽电容),电气性能会更强一些。
PCB的正中央就是iGameGeForceRTX4070Ti水神的核心大脑——AD104-400核心,采用TSMC4N工艺制造,拥有7680个CUDA核心,在性能上已经可以媲美上代卡皇RTX3090Ti了,如果相比前代的RTX3070Ti,那性能可以说是飞跃般的提升。
核心四周还有6颗GDDR6X显存,颗粒来自美光,型号是型号为2GU47D8BZC,单颗显存容量2GB,6颗组成12GB,显存位宽为192Bit,速度达到了21Gbps。
iGameGeForceRTX4070Ti水神采用16+4相供电设计,其中核心供电为16相,安排在PCB两侧,显存供电则是4相,位置在核心四周。
每相供电配有一个iGameGeForceRTX4070Ti水神特有的I.P.P(iGamePurePower)至纯供电电感。
并且均采用了独立的DrMos芯片,来自万国半导体,封装型号为BLN0,实际应为AOS的AOZ5311NQI,持续输出电流为55A。
PWM供电芯片则被安排在PCB背面,型号为uP9512R,同时管理核心供电及显存供电。
PCB的右上角是12VHPWR供电接口,附近也有两颗I.P.P至纯供电电感保障电流稳定。
在PCB上还有两颗不起眼的小芯片,它们主要负责控制显卡的双BIOS模式,型号是P25Q16L。
控制BIOS的按钮在IO挡板上,用户只需轻按即可在NORMAL和TURBO两种BIOS之间随意切换。
AD104核心固然强劲,但总需要一个强有力的散热系统才能让它一直全力输出。iGameGeForceRTX4070Ti水神的散热做得也是相当出色,这也让我对这款显卡的烤机测试究竟能有多出色的表现。
在铜板模块上可以看到厚厚的一层导热硅脂,有了这层硅脂,AD104核心与铜板间的空隙就填平了,热量也能全部转移至铜板上,有效降低温度,稳定释放性能。
除了显存特有的高性能导热垫之外,在电容、电感以及DrMos也全覆盖的添加了高性能导热垫,超高的散热效能助力iGameGeForceRTX4070Ti水神显卡强劲的性能释放。
你以为铜板只是给PCB散热用的吗?其实在铜板模块的背面还隐藏着两根热管,既为显卡散热也为水泵降温,能够将热量导至金属装甲上,进一步冷却显卡。
铜板模块也紧贴其旁边的水泵,而水泵的位置恰好处于AD104核心的背面,这样做的目的是能够最快的将核心热量传导出去。
而说到铜板的背部就不得不提这块绿色的小PCB板,上面是密密麻麻的电子元器件,构成了240冷排的动力源头。
其中FT8213Q是一款马达驱动IC,来自峰岹科技,主要用于驱动水泵,为显卡散热提供源源不断的水流。
而240冷排内的水冷液则是通过两根水冷管源源不断的输送过来,用来给铜板模块降温。
回流至冷排内的液体带走了铜板的热量后,再由2把12025风扇主动散热。不得不说这样的散热配置,别说是RTX4070Ti了,就算是次旗舰RTX4080用也绰绰有余。
4测试平台介绍&理论/游戏性能
测试平台介绍
iGameGeForceRTX4070Ti水神的精致小巧的外观与豪华堆料的内在对游戏玩家来说无疑是一场饕餮盛宴,接下来就进入大家最为关注的实战测试部分吧!
首先介绍一下本次的测试平台,我们用上了评测室的最强硬件,CPU使用的是目前的旗舰——Inteli9-13900K处理器,主板为华硕Z790HERO,搭配金士顿的64GBDDR5-6000高规格内存,确保这张显卡能够释放全部性能。
iGameGeForceRTX4070Ti水神都已经用上240冷排了,测试平台也祭出了目前地表最强的硬件,拿来衬这张显卡的显示器自然也不能弱,用的依旧是天花板级别的AGONPD32M保时捷联名款,4K@144Hz的高刷,丝般顺滑畅享市面上的3A游戏。
测试前,首先用GPU-Z对显卡的运行状态以规格参数进行检查,避免因为运行状态及参数不正确而导致测试成绩不正确。同时也能通过GPU-Z所呈现的数据来看看iGameGeForceRTX4070Ti水神显卡更为详细的规格参数。
从软件中可以看到iGameGeForceRTX4070Ti水神的基准频率为2310MHz,Boost频率则前所未有的高,可以达到2790MHz。我们在图中还可以了解到这款显卡的温度和功耗限制,iGameGeForceRTX4070Ti水神的TGP设定是320W,与RTX4080是一致的,不过允许最高限度比较保守,仅有340W;温度控制的上限为84℃,不过可向上调整至88℃。
理论性能测试
国际惯例,先跑一遍3DMark测试,从理论性能来看,iGameGeForceRTX4070Ti水神相比上代的RTX3070Ti有着更为出色的性能表现,整体性能是后者的1.5倍以上。已经比肩上代卡皇RTX3090Ti了,不得不说这样的性能表现,着实让我有些意外。
而在注重游戏的TimeSpy和FireStrike测试中,iGameGeForceRTX4070Ti水神也有不俗的表现,两项成绩不仅仅领先RTX3070Ti约43%,比RTX3090Ti还要高上一些,这也让笔者对这张显卡的实际游戏表现充满期待。
光追和DLSS作为老黄引以为傲的发明,自RTX20系显卡以来就给玩家带来了全新的游戏体验,这一代也不例外,尤其是在光线追踪项目上,iGameGeForceRTX4070Ti水神提升最为明显,光是PortRoyal项目中就得分14444,这个成绩已经跟RTX3090Ti处于同一起跑线上了。
而来到算力方面,我们使用AIDA64GPGPU进行测试,虽然iGameGeForceRTX4070Ti水神的显存位宽不及前代显卡,但得益于升级到了GDDR6X,无论是速度还是算力都当仁不让,丝毫不逊色于RTX3090Ti。如果是对比前代RTX3070Ti,那性能提升更是颠覆性,整体性能差距足足有1.7倍。
游戏性能测试
看完了理论性能测试,iGameGeForceRTX4070Ti水神的提升着实让人眼前一亮,几乎媲美RTX3090Ti的性能表现让笔者迫不及待想要用这张显卡进行游戏实战,这次我们选取了多款游戏在多种分辨率下进行实测。
首先是1080P分辨率,由于显卡压力不大,所以常规的游戏性能提升其实不算明显,不过开启DLSS后,游戏性能小幅提升,像跑分界的活化石《古墓丽影:暗影》,iGameGeForceRTX4070Ti水神开启DLSS后,帧数达到了289FPS,不少游戏也都保持在180FPS左右。
2K分辨率下,iGameGeForceRTX4070Ti水神终于开始发力了,测试的游戏基本都在144FPS以上,全方位的领先于RTX3090Ti,像《战争机器5》,RTX3090Ti在最高画质下的帧数为176FPS,换上iGameGeForceRTX4070Ti水神后,游戏帧数已经去到228FPS,这个水平已经能够满足2K@240Hz的高刷游戏体验了。
来到4K分辨率后,iGameGeForceRTX4070Ti水神的游戏性能是RTX3070Ti的2.3倍之多,不少游戏已经是不可玩跟流畅玩的区别了。《赛博朋克2077》一直被玩家戏称为“显卡杀手”,就是因为其对硬件要求颇高,不过iGameGeForceRTX4070Ti水神在超级光追的条件下已经可以67FPS流畅运行了,而前代RTX3070Ti仅有可怜的38FPS。
总的来说,iGameGeForceRTX4070Ti水神在游戏方面的表现还是符合预期的,相比起RTX3070Ti已经有了长足的进步,即使面对前卡皇RTX3090Ti也是丝毫不虚,不要忘记这款显卡还有DLSS3这样的黑科技加持,实际游戏表现会更胜一筹,游戏玩家选它准没错。
5DLSS 3性能测试
DLSS 3性能测试
RTX40系列显卡最大的提升莫过于DLSS3技术,这项技术相比DLSS2新增了帧生成和NVIDIAReflex,在RTX40系列显卡上能实现成倍提升性能,帧数进一步提升的同时,还不会影响画质和响应速度。
3DMarkDLSS3性能测试
在最新版的3DMark测试软件中已经加入了DLSS3相关的测试,有了DLSS3后,iGameGeForceRTX4070Ti水神如虎添翼,2K分辨率下,开关DLSS3性能差距能够达到2.5倍以上,帧数稳定在165FPS以上,可以说iGameGeForceRTX4070Ti水神已经能够很好的满足2K@120Hz的游戏需求。
4K分辨率下同样表现亮眼,不开DLSS时,仅有30FPS,开启DLSS2后,帧数虽有提升,游戏帧数已经可以去到80FPS了,而启用DLSS3后,帧数直接来到了110FPS左右。我们甚至还测试了8K分辨率,不得不说有DLSS3加持后,iGameGeForceRTX4070Ti水神也有接近60FPS的水平。
《暗影火炬城》游戏实测
前段时间E宝的圣诞大促期间给每位玩家都赠送了《暗影火炬城》,这是首批支持DLSS3技术的游戏,得益于它的加持下,显卡性能提升尤其明显,早前我们在测试RTX4090时就发现开启DLSS3后,游戏帧率能够直接翻倍,这也让笔者期待中高端显卡在开启DLSS3后能否与前代卡皇Battle。
实测下来我们发现,iGameGeForceRTX4070Ti水神的游戏性能与RTX3090Ti相当,在开启DLSS2时游戏帧数已经超越前代卡皇了,如果开启DLSS3后,游戏帧数还可以进一步提升至200FPS左右,即使是4K分辨率下,这款显卡也能稳定在146FPS,4K@144Hz电竞不再是梦。
光有性能还不够,我们在测试时也发现这款显卡的功耗控制相当不错,在《暗影火炬城》这款游戏中,RTX3090Ti的游戏功耗为388W,而iGameGeForceRTX4070Ti水神仅需206W即可完成对前代卡皇的逆袭,甚至于帧数还要高出20-30FPS,要知道它的售价只有RTX3090Ti的一半,高性价比的同时,能耗比还有如此表现,妥妥的2K游戏显卡。
1080P分辨率DLSS性能测试
另外我们还实测了多款游戏跟程序,从实测结果来看,1080P分辨率下,iGameGeForceRTX4070Ti水神在开启DLSS3后性能有了质的飞跃,参测的多款游戏均跑出了200+FPS的优秀成绩,这已经是用网游的标准在玩3A大作了。
2K分辨率DLSS性能测试
2K分辨率下,以iGameGeForceRTX4070Ti水神的性能也是毫无压力,不少游戏开启DLSS2时就已经领先RTX3070Ti有50-60帧,开启DLSS3后性能还能更高,领先幅度来到了惊人的100帧以上,可以说这波DLSS3功不可没。
不过iGameGeForceRTX4070Ti水神真正的对手应该是RTX3090Ti,像《生死轮回》、《暗影火炬城》这类新游戏中,iGameGeForceRTX4070Ti水神已经反超前代卡皇。如果开启DLSS3,两者的差距将进一步拉大。
比较有代表性的是《赛博朋克2077》,在DLSS2下,RTX3090Ti的帧数仅为112FPS,当iGameGeForceRTX4070Ti水神开启DLSS3后,帧数能够飙升至172FPS,性能已经是前代卡皇的1.5倍之多,这是RTX3090Ti无论如何也企及不了的高度。
后续《赛博朋克2077》还会更新Overdrive全景光追模式,在这个模式下,赛博朋克夜之城的每个霓虹灯标识,路灯,汽车前灯,LED广告牌等都将拥有更细致的光照和阴影。给玩家带来更加准确、真实和沉浸式的光追体验。
值得一提的是,在2K分辨率下,开启全景光追模式,拥有DLSS3黑科技的iGameGeForceRTX4070Ti水神的性能将会是RTX3090Ti的3倍以上,并且功耗还比后者低一半!不得不说这张卡的性能未来可期,将会是新一代的2K游戏神卡,满足游戏性能的同时还能兼顾高刷需求。
4K分辨率DLSS性能测试
iGameGeForceRTX4070Ti水神在4K分辨率下也能很好的应对,我们实测下来,大部分游戏在开启DLSS3后都能够有100+FPS的游戏表现,玩家只需要降低部分特效,这个游戏帧数还能更进一步,届时搭配AGONPD32M显示器还能感受4K@144Hz的高刷电竞。
总的来说,正因为iGameGeForceRTX4070Ti水神有着强劲的性能,所以它即使只开启DLSS2,游戏体验已经领先RTX3090Ti。如果开启DLSS3后,那它的帧数提升更为明显,几乎是全方位吊打RTX3090Ti,可以说有了DLSS3这个黑科技,一下子就跟30系显卡拉开了不小的差距。
6创作/生产力性能测试
创作者性能测试
创作生产力也是检验一张高端显卡的必备科目之一,因此笔者这次选择了PugetBench、ULProcyon、PCMark10等多款常见的测试软件,来测试iGameGeForceRTX4070Ti水神在日常办公、视频内容生产等方面的性能表现。
首先是模拟日常综合体验的PCMark10,实测结果如下,iGameGeForceRTX4070Ti水神在数位内容创作和游戏项目上有不小的提升,可见升级硬件确实能够给实际体验带来较大的提升,这也与上面的游戏性能测试相符。
来到视频创作生产力部分,iGameGeForceRTX4070Ti水神也有亮眼操作。我们可以看到在ULProcyon的照片与视频剪辑测试中,这款显卡都比前作有优势;而在PugetBench测试中优势更为明显,整体性能领先10%以上,并且在有特殊优化的达芬奇剪辑软件中,iGameGeForceRTX4070Ti水神因为有更先进的编解码器,所以领先幅度更大,下面我们也会专门测试这一特性。
创作者不仅仅体现在视频剪辑上,不少用户也需要高端显卡从事建模、渲染、工业设计等工作,所以我们也测试了多款知名的渲染软件和工业软件。首先是Blender渲染软件,测试中可以看到,iGameGeForceRTX4070Ti水神相比前代RTX3070Ti就有近1.7倍以上的性能提升,面对卡皇RTX3090Ti也毫不逊色,性能依旧领先10%。
将测试软件换成SPECviewperf2020也是如此,这款软件中集成了8款常用的工业软件测试程序,能够较为全面的反应这款显卡的真实性能,实测可以看到这款显卡的性能提升也来到了1.5倍左右。总的来说,换装iGameGeForceRTX4070Ti水神可以让你的创作效率大大提升。
双NVENC编码器专项测试
上面我们讲到iGameGeForceRTX4070Ti水神在达芬奇剪辑软件中有特殊“优化”,这个“优化”体现在这张显卡独有的编解码器上。全新的RTX40系显卡上升级了双NVENC编码器,并且支持时下热门的AV1编码,而AV1作为下一代主流的视频编码技术有着自己独特的优势,其具有更快的编码速度和更高质量的流媒体传输性能,像达芬奇、万兴喵影、剪映等常用的剪辑软件已经支持AV1编码,B站等主流的视频网站也加入了AV1解码,未来AV1将会成为一个新趋势。
为了验证双NVENC编码器对视频创作的提升究竟有多大,我们使用NVIDIA提供的8K片源与工程文件分别测试AV1格式和H.265格式下的编码时间。实测同一段素材下,使用iGameGeForceRTX4070Ti水神进行AV1编码会比H.265编码快不少;即使同样使用H.265编码,有双编码器的加持下,iGameGeForceRTX4070Ti水神的效率也比RTX3090Ti快60%以上。
AV1编码除了有导出速度快这个先天优势,占用空间也比其他编码格式小,无论是4K还是8K分辨率,采用AV1编码后,视频文件大小平均能够降低25%以上。除此之外,画质也完全不输H.265,可以说无论是导出速度、空间占用还是画质表现,它都完胜H.265。
7功耗&超频&评测总结
功耗与发热
在上面的拆解中我们知道,iGame为这款GeForceRTX4070Ti水神配备了一个相当“唬人”的240冷排,散热配置堪称豪华。下面我们就利用Furmark软件,来对iGameGeForceRTX4070Ti水神进行功耗测试。
在室温20°的环境下,Furmark甜甜圈设定为1280x720分辨率。在烤机15分钟后,TURBOBIOS下的显卡占用率达到了100%,满载功耗仅有300W出头,仅仅只比上代RTX3070Ti高10W左右,而得益于240冷排非凡的散热能力,核心满载温度稳定在51℃,显存满载温度为50℃,对比前代动辄七八十度起跳,可以说这代显卡的能耗比有了史诗级的进步。
另外值得一提的是,用上240冷排散热后,iGameGeForceRTX4070Ti水神即使满载运行,风扇噪音也不大,并且这款显卡还有NORMAL模式可选,开启后,风扇转速和风扇噪音还可以进一步降低,放在机箱内仿佛安静的美男子。
我们也横向对比了一下上代显卡与RTX4080、RTX4090显卡的功耗,从功耗来看,其实iGameGeForceRTX4070Ti水神的功耗控制还是相当不错的,最高才300W,功耗比RTX3080Ti低40-50W,实际性能还更强了,完胜前代卡皇RTX3090Ti。
在实际的软件和游戏测试中也是这样,我们实测RTX3090Ti在游戏中基本跑的是430W的功耗,而iGameGeForceRTX4070Ti水神甚至不足300W,部分应用软件上甚至有更低的功耗表现。对硬件极高的《微软模拟飞行》中,iGameGeForceRTX4070Ti水神仅用186W的功耗就达到了RTX3090Ti1.7倍以上的性能,要知道这比RTX3090Ti整整低了近250W,甚至还不到RTX3090Ti的一半功耗!
不得不说老黄的AdaLovelace架构和TSMC的4N工艺确实有点东西,妥妥的吊打前代显卡,让RTX40系列显卡的每瓦性能实打实的提升到了一个新高度。
超频潜力测试
在GPU-Z中我们知道iGameGeForceRTX4070Ti水神的BOOST频率相当之高,因此我们也不会错过这款显卡的超频测试,我们使用官方配套的iGameCenter控制软件进行操作。在软件中可以很清楚的看到硬件的相关信息。
另外还能随时监控我们这张iGameGeForceRTX4070Ti水神显卡的运行频率、显存频率、功耗以及风扇转速,让用户对自己的硬件状况一清二楚。
在默认状态下,我们解锁功耗墙和温度墙,开启风扇最大转速后,iGameGeForceRTX4070Ti水神在TimeSpy测试中有小幅度提升,已经能够跑到23554分,核心频率由2895MHz抬升至2940MHz。
笔者没想到还没开始超频,这颗核心已经能够接近3000MHz,所以我们继续超频,在iGameCenter控制软件中将核心频率提高200MHz,显存频率则拉升610MHz,此时再次运行TimeSpy测试,此时iGameGeForceRTX4070Ti水神的得分相比默频状态高出1000分,整体性能提升约5.8%,并且核心频率已经跑至3135MHz,可见即使是RTX4070Ti,超频能力也不容小觑。
评测总结
RTX40系列自发布以来就给广大用户带来不少惊喜,无论是旗舰RTX4090还是本次的RTX4070Ti,给我的感受就是老黄的RTX40系显卡诚意满满,在全新AdaLovelace架构和DLSS3的双重作用下,RTX4070Ti在游戏性能或专业生产力上都能带来质的飞跃。同时换装TSMC4N工艺后,显卡的能耗比显著提升,既有强劲的性能又有冷静的表现,可以说这代RTX40系显卡交出了一份不错的答卷。
再说说这次的主角——iGameGeForceRTX4070TiNeptuneOC,作为Neptune水神家族的最新成员,延续了两位老大哥的设计水准,银白色的战甲配上流线型灯效,时尚而又精致。性能上它也是当仁不让,满血AD104核心在性能释放上已经完胜RTX3090Ti,功耗更是仅有后者的一半!这才是高端显卡应有的表现。
老实说笔者测试了多款RTX4070Ti显卡,如果你要我选择最心仪的一款,那必然是iGameGeForceRTX4070TiNeptuneOC。它是所有RTX4070Ti中性能表现最强劲的,也是所有RTX4070Ti中外观最出众、设计最抢眼的。当然想要让游戏玩家醉心于它还得靠游戏性能,2K@120Hz的极致游戏体验,甚至可以说它就是目前最香的2K游戏神卡。
总的来说,iGameGeForceRTX4070TiNeptuneOC更像是集美貌与才华于一身的高端显卡,如果你注重游戏性能体验;想要体验超频的乐趣,同时兼顾绝美的颜值,那这款显卡一定是你的不二之选。目前iGameGeForceRTX4070TiNeptuneOC已经上市,感兴趣的玩家千万不要错过。
8技术讲解:Ada Lovalace架构解析
Ada Lovelace架构讲解
Turing、Ampere上两代架构核心均以人物来命名,前者是计算机科学之父——艾伦·麦席森·图灵;后者则是“电学中的牛顿”——安德烈·玛丽·安培,电流的国际单位安培就是以其姓氏命名。那AdaLovelace定非凡人,度娘一下果然,这是 人称“数字女王”的阿达·洛芙莱斯,编写了历史上首款电脑程序,是被世界公认的第一位计算机程序员,果真是一代比一代还要更牛。PS:她的父亲是《唐璜》的作者,诗人拜伦喔。
从Turing架构开始,NVIDIA首次在显卡中加入了加速光线追踪的RTCore单元,以及面向AI推理的TensorCore单元,这革命性的创新使实时光线追踪成为可能。而Ampere架构则是全面的架构改进,在加入新一代的二代RTCore和三代TensorCore基础上,还有着更先进的SM单元设计,这样显卡工作效率那是翻倍的提升。而来到AdaLovelace架构,同时是以效率提升为大前提,自然是引入了最新的第三代RTCores与第四代TensorCores单元,同时加入众多新颖的黑科技,从执行效率来说AdaLovelace架构是上代Ampere架构的2倍以上,甚至光线追踪能力更是达到了恐怖的4倍性能。
全新的SM流式多处理器
AdaLovelace架构中最大的亮点之一:全新的SM流式多处理器,每个SM包含了128个CUDA核心、1个第三代的RTCores,4个第四代TensorCores(张量核心)、4个TextureUnits(纹理单元)、256KBRegisterFile(寄存器堆)。以及128KBL1数据缓存/共享内存子系统,于是这一个全新的SM单元有着超过上一代2倍之的性能表现。
过去的Turing架构INT32计算单元与FP32数量是一致的,而两者相加才组成了64个CUDA核心。但是Ampere架构开始,左侧的计算单元实现了FP32+INT32的计算单元并发执行,也就是说CUDA核心数量翻倍到了128个。
再来看看AdaLovelace架构的SM,FP32/INT32的计算单元组合,同样实现了每个SM内含128个CUDA的设计,看似提升不大,但是当你了解到GeForceRTX4070Ti拥有60个SM,7680个CUDA核心,那你也就应该明白它的着色器能力进一步加强,即使比起上一代的卡皇RTX3090Ti显卡,那也是丝毫不虚的。
另外缓存方面AdaLovelace架构也进行了大规格的提升,首先每个SM单元中单独配上了128KB的缓存,其次核心的二级缓存进行进行了重新的设计,使得RTX4070Ti配备了48MB二级缓存,相比RTX3070Ti可以说是质的飞跃。
技术讲解:第三代RT Cores 与 第四代Tensor Cores
以为刚才的CUDA数量与超大L2缓存就已经很猛了,实现上AdaLovelace架构最大的提升还是在第三代RTCores与第四代TensorCores身上。
第三代RTCores
RTCores用于光线追踪加速,第三代RTCores的有效光线追踪计算能力达到191TFLOPS,是上一代产品2.8倍。
在Ampere架构中,第二代RTCores支持边界交叉测试(BoxIntersectiontesting)和三角形交叉测试(TriangleIntersectiontesting)。用于加速BVH遍历和执行射线三角交叉测试计算,虽然光线追踪处理能力已经比初代的Turing架构核心更高效,但是随着环境和物体的几何复杂性持续增加,传统的处理方式很难再以更高效率、正确反应出的现实世界中的光线,尤其是光的运动准确性。
所以在第三代RTCores增加了两个重要硬件单元:OpacityMicromapEngine与DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine,主要是用于alpha通道的加速,可以将alpha测试几何体的光线追踪速度提高2倍。
在传统光栅渲染中,开发人员使用一些Alpha通道的素材来实现更高效的画面渲染,例如Alpha通道的叶子或火焰等复杂形状的物体。但在光线追踪时代,这传统的做法会为光线追踪带为不少无效的计算,例如运动性的光线多次通过一块叶子,光线每击中一次叶子,都会调用一次着色器来确定如何处理相交,这时就会做成严重的执行成本与时间等待成本。
而OpacityMicromapEngine用于直接解析具有非不透明度光线交集的不透明度状态
三角形。根据Alpha通道的不透明,透明与未知等三个不同的块状态进行处理:透明则直接忽略继续找下一个,不透明块则记录并告之命中,而未知的则交给着色器来确定如何处理,这样GPU很大部分都不需要进行着色器的调试处理,能够实现更为高效的性能。
DisplacedMicro-MeshesEngine
如果说OpacityMicromapEngine加速的是面处理,那么DisplacedMicro-MeshesEngine就是几何曲面细节的加速器。如上图所示,在AdaLovelace架构中,通过1个基底三角形+位移地图,就可以创建出一个高度详细的几何网格,所需要资源占用比二代RTCores更低,效率也更高。
通过NVIDIA给出的创建14:1珊瑚蟹例子来说事,这里我们需要需要1.7万个微网格、160万个微三角形,在AdaLovelace架构中BVH创建速度可加快7.6倍,存储空间缩小8.1倍。DisplacedMicro-MeshesEngine起到了关键性的作用,其将一个几何物体根据不同细节分成密度不一的微网络处理,红色密度超高,细节处理越为复杂。相应的低密度微网络区域则可以释放更多的资源与存储空间,这样DisplacedMicro-MeshesEngine就可以帮助BVH加速过程,减少构建时间和存储成本。
同时AdaLovelace架构SM中新增了着色器执行重排序(ShaderExecutionReordering,SER),这是由于光线追踪不再只有强光或者阴影渲染处理,未来将会更多的是在光线的运动性,这样光线就会变得越来越复杂,想要第三代RTCores与第四代TensorCores有着更高的执行效率,那就得为他们来安排一位管家。而着色器执行重排序(SER)就是为了能够即时重新安排着色器负载来提高执行效率,为光线追踪提供2倍的加速,也能更好地利用GPU资源。不过目前仍未有实例,想实现这个功能,还得游戏与开发工具的支持才行。
第四代TensorCores
TensorCores是专门为执行张量/矩阵运算而设计的专用执行单元,这些运算是深度学习中使用的核心计算功能。第四代TensorCores新增FP8引擎,具有高达1.32petaflops的张量处理性能,超过上一代的5倍。
9技术讲解:DLSS 3
技术讲解:DLSS 3
或者说第四代TensorCores太硬核你不会知道是啥?提升意义在哪?但是TensorCores最经典的应用DLSS你肯定会知道,这一次AdaLovelace架构支持NVIDIA最新的DLSS3技术。
https://images.nvidia.cn/cn/youtube-replicates/r-hu006p23I.mp4
之前我们也聊过DLSS技术,其设计之初是为了弥补光线追踪技术后的性能损失,具体的表现为开启光线追踪技术后游戏帧数大幅度的下降,甚至很难保证游戏流畅的运行。于是DLSS使用低分辨率内容作为输入并运用AI技术输出高分辨率帧,从而提升光线追踪的性能。
在DLSS3中包含了三项技术:DLSS帧生成、DLSS超分辨率(也称为DLSS2)和NVIDIAReflex。你可以理解为DLSS3是在DLSS2的基础上,新增了DLSS帧生成技术;而后两技术中,DLSS超分辨率只需要GeForceRTX显卡都能使用上,NVIDIAReflex则是GeForce900系列以后的显卡都用使用上。
想实现DLSS帧生成可不简单,这需要配合上AdaLovelace架构的GeForceRTX40系列显卡才行。DLSS帧生成技术原理是:利用AI技术生成更多帧,以此提升性能。DLSS会借助GeForceRTX40系列GPU所搭载的全新光流加速器分析连续帧和运动数据,进而创建其他高质量帧,同时不会影响图像质量和响应速度。
从Ampere架构开始,NVIDIA显卡就已经支持了光流加速器,而AdaLovelace架构的光流加速器升级到了第二代,其提供了高达300TeraOPS(TOPS),比安培架构的初代光流加速器(OpticalFlowAcceleration,OFA)快2倍以上。为了实现DLSS帧生成,OFA扮演了重要的角色,其配合上新的运行矢量分析算法在DLSS3技术框架内实现精确和高性能的帧生成能力。
另外,由于DLSS帧生成是在GPU上作为后处理执行的,那么即使在游戏受到CPU性能限制的时候,我们同样能够从中获得更好的游戏性能提升。尤其是那种物理计算密集型的游戏或大型场景游戏,DLSS2均可以让GeForceRTX40系列显卡以高达两倍于CPU可计算的性能来渲染游戏。
最后由于DLSS3是建立在DLSS2基础之上的,游戏开发者可以在已支持DLSS2或NVIDIAStreamline的现有游戏中快速集成该功能,所以DLSS3已在游戏生态得到广泛应用,目前已有超过35款游戏和应用即将支持该技术。
阅读小亮点:NVIDIAReflex
NVIDIAReflex也是DLSS3其中的一环,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。
想要实现端对端的最低延迟,你需要确保游戏、显示器以及鼠标三者都同时支持并开启了Reflex技术。
当GeForceRTX40系列显卡和NVIDIAReflex搭配上后,直接达到1440p分辨率360FPS的体验,这着实是性能有点强劲了。
在GTC2022大会时已经透露将会还有4款1440p分辨率的新型G-SYNC电竞显示器将要发布,包括采用mini-LED技术的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款显示器刷新率均为300Hz,而最猛的是ASUSROGSwift360HzPG27AQN,刷新率直接来到了360Hz。
但唯一一个问题就在于,部分显示器厂商认为此类产品受众人群较少,会降低此类显示器的产能,甚至产品就已经被内部PASS掉,所以1440p360Hz是很美好,但现实也是相当的骨感。
10技术讲解:双NVIDIA编解码器
技术讲解:双NVIDIA编码器(NVENC)
GeForceRTX40系列显卡还有一个全新的升级,那就是双编码器NVENC。第八代的NVENC双编码器不仅支持H.264与H.265,还支持开放式视频编码格式AV1。
而由于AV1是一种免版税的视频编码格式,上游软件厂商与下游戏的配套端都在大力推广此编码格式,我们也会看到越来越多的硬件与软件支持AV1格式,包括剪映专业版、DaVinciResolve、以及AdobePremierePro较为流行的Voukoder插件均支持,且均可通过编码预设使用双编码器,这样我们等待视频导出的时间缩短将近一半。
不单是视频制作软件,AV1格式也将会是主播、游戏直播UP主们的新宠儿,在保证画面最高质量的情况下,AV1编码器可将效率提高40%,同时显卡的占用也更低。包括OBSStudio一代软件中也会增加AV1格式的支持。另外我们还能通过GeForceExperience和OBSStudio录制高达8K60的内容,这样我们做游戏录制也会变得更为轻松。
包括我们之后测试时使用的游戏内录视频都是支持AV1格式,同时双编码器NVENC在资源占用和适配上做得越来越好。
相关教程
2023-04-13
2023-05-18
2023-03-06
2023-08-08
2023-05-29
2023-05-18
2023-05-25
2023-05-18
2023-04-12
2024-10-23
2024-10-22
2024-10-22
2024-10-21