一、写在前面
随着NVIDIA Ada Lovelace 架构的发布,NVIDIA GeForce RTX 40系列显卡相继推出,其中,4080系列和4090系列显卡依旧是高端游戏玩家的首选。前些天我深度测试了索泰 RTX4080 AMP EXTREME AIRO的显卡性能以及包括《巫师3》、《赛博朋克 2077》《荒野大嫖客2》、《古墓丽影:暗影》在内的多款游戏大作的游戏表现,接下来和大家详细聊一聊我的体验结果。
二、 Ada Lovelace 架构解析
(1)GPC-TPC-SM层级架构
从完整的架构核心图看,Ada Lovelace依然沿用了GPC-TPC-SM层级架构,最大核心的GPC规模从Ampere架构(2020年发布的30系显卡架构)的最大7个增加至12个,Ada Lovelace的二级缓存规模是Ampere的16倍,这些暴增的参数意味着性能的巨大提升。
Ada Lovelace架构的每组GPC包含6组TPC(每组TPC包含2组SM)、1个独立光栅引擎(Raster Engine)、2个ROP分区(每个分区包含8个ROP单元)。这样,Ada Lovelace架构的TPC和SM单元数量分别增长到最多72个和144个。
SM的结构也与Ampere架构一样,有4个计算模块,1个RT CORE光追核心(第三代)以及128KB L1缓存。
每个计算模块包含64KB寄存器文件、零级缓存指令、16个FP32单精度浮点CUDA核心、16个FP32/INT32单精度浮点和整数混合CUDA核心、1个Warp调度器、1个分配单元、1个Tensor Core张量核心(第四代)、4个载入存储单元以及1个特殊功能单元(SFU)用于执行图形差值指令。
除了在架构核心方面的提升,Ada Lovelace对游戏性能的支持主要体现在三个部分:第三代RT Core、第四代 Tensor Core、NVIDIA DLSS 3。
(2)第三代RT Core
RT Core核心在视频、游戏中实现实时光线追踪,专为处理性能需求密集的光线追踪工作负载而设计。 全新的第三代RT Core不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能提高了一倍之多。RT Core 还配备全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。
Opacity Micro-Map引擎将光线追踪的Alpha-Test几何性能提升2倍;Displaced Micro-Mesh引擎可动态生成微网格产生额外的几何图形,从而实现几何复杂场景的实时光线追踪,同时所占用的显存只有之前的二十分之一。
例如下图是《赛博朋克2077》游戏中的一颗树,通过DMM引擎可以更精准的对树叶边缘进行光线追踪计算,实现真实的渲染效果,展示更多的细节。
(3)第四代 Tensor Core
Tensor Core可实现混合精度计算,动态调整算力,从而在保持准确性的同时提高吞吐量。第四代Tensor Core新增了Hopper FP8 Transformer Engine,可提供1400 TFLOPS的张量处理性能,性能是上一代的5倍。
(4)DLSS 3
DLSS 3算是一系列技术结合的成果,包括全新的帧生成技术、DLSS 2超分辨率技术和NVIDIA Reflex技术,应用到游戏中就对应了帧生成、超分辨率和NVIDIA Reflex技术,开启这三个选项才是完整DLSS 3。
在第四代Tensor Core的支持下,DLSS 3可以在不影响画质和相应时间的前提下,利用AI创造更多高质量帧。
三、索泰 RTX4080 AMP EXTREME AIRO介绍
作为一款高端显卡,索泰 RTX4080 AMP EXTREME AIRO的设计明显是下了一番功夫的,机身采用流线型设计,少了一些硬朗的直角,多了一些圆润的曲线,粗狂中流露出一丝优雅,整体质感十足。
显卡正面的幻彩装饰条的设计灵感来源于北欧神话的彩虹桥,迎着不同角度的光线会发生不同颜色的光影效果。点亮后有炫酷的RGB灯光效果,简直酷到没朋友。
显卡尺寸355mm x 166mm x 72mm,拿在手里很厚重,个头比索泰RTX 4070Ti大了一圈,安装时需要占用3.5个槽位。
索泰 RTX4080 AMP搭载ICESTORM 3.0散热系统,有3个11cm大尺寸放生盾鳞2.0风扇,优化了扇叶的曲率和鳞状仿生条纹,提升风量。
索泰 RTX4080 AMP内置加厚、加高的散热鳞片模组,有9条冰脉2.0复合热管均匀分布,与导热铜底和鳍片无损焊接,有利于提升散热面积和导热能力。
背板是高强度合金材料,一体铸型,可以增加显卡结构的强度,保护PCB面板,减少弯曲风险。
有3个DP 1.4接口(支持8K@60Hz视频输出)和1个HDMI 2.1接口(支持4K@120Hz、8K@60Hz视频输出)。
这么高端的显卡,怎么能少了灯效。在索泰 RTX4080 AMP的顶部、正面、侧面、北部共设有5个ARGB灯光区域,搭载了SPECTRA 2.0灯效系统,可以自行设定不同的颜色和效果,支持单独设置或一键同步。
四、 硬件配置一览
显卡再高端也离不开CPU、主板、内存、硬盘等一套硬件的支持,这样才能将性能释放最大化。
CPU:Intel i5-13490F
英特尔i5-13490F是 一款“仅供中国大陆地区”的特定型号,10核心(6+4)16线程,最大睿频频率4.8GHz(性能核),基础频率2.5GHz(性能核),L3缓存24MB,基础功耗65W,最大睿频功耗148W。从规格参数看,i5-13490F算是i5-13400F的小幅增强版,前者的性能核和能效核的最大睿频都比后者高0.2GHz,前者L3缓存24MB,后者L3缓存20MB。
Cinebench R23处理器运算能力测试中,i5-13490F多线程14765 pts,单线程1818 pts,MR Ratio 8.12x。结果比我的预期好一些,应对游戏、文档编辑多任务并行更能游刃有余。
说到这,可能会有人觉得“显卡用RTX 4080、CPU用英特尔i5-13490F,会不会影响显卡实力发挥呀。”这是一个典型的“高显低U”的问题,接下来我用个一个测试告诉你答案。
判断是不是高显低U,可以参考游戏中的CPU和显卡的资源占用率率判断CPU是否能跑满显卡的性能,正常情况下,CPU占用率在50%-75%之间,同时显卡的占用率在95%-99%之间,大概能说明CPU是能吃满显卡性能的。而如果CPU占用率超过了80%同时显卡占用率低于85%,这就说明CPU跑不满显卡的全部性能,是典型的高显低U。
《巫师3》游戏中,4K分辨率时,CPU占用率77%,显卡占用率98%,刚刚好吃满显卡,算不上高显低U。因此,用i5-13490F+RTX 4080这套搭配去打游戏是没问题的。当然,如果你预算充足,建议直接上i7或者更高的i9系列,这样基本不会存在CPU的瓶颈问题。
最后我想和大家聊一聊关于盒装和散片CPU的个人观点。
盒装处理器是来自英特尔授权总代理的正版盒装处理器。散片处理器是销售给大批量制造商,例如宏基、华硕、戴尔、惠普或联想的OEM版本。虽然产品规格一样,但目前个人买到的散装处理器大多是被挑过体质甚至装过机的二手商品,这点你去某宝平台看评论就明白了。并且,盒装处理器有三年官方质保,英特尔官方不提供散装处理器的保修服务。
所以,为了处理器的质量和质保,强烈建议买盒装处理器。
内存:金百达黑刃 16G*2
金百达黑刃DDR5 16G*2套条,原厂三星B-die颗粒,频率6000MHz,时序36-36-36-80,可以满足大型游戏、生产力、影音娱乐等需求。这款内存条的马甲贼帅,低调黑色马甲,金属拉丝工艺,质感直接拉满。
软件测试读取速度86781MB/s,写入速度83138MB/s,文件读写速度79859MB/s,延迟72.2ns。
SSD:金百达 KP260 2T*2
金百达KP260使用长江存储 TLC 3D NAND颗粒,NVME PCIe 4.0 x4协议,联芸主控,没有物理缓存颗粒,质保写入量1200TBW,质保3年。 这块硬盘我用作仓库盘,完全够用。
实测顺序读取速度4824MB/s,顺序写入速度4457MB/s,与理论速度(5000MB/s与4500MB/s)相差无几,4K随机速度也很可观。
ATTO磁盘基准测试中,金百达KP260从32KB文件开始读写速度稳定4GB/s左右。
路由器:华硕RT-AX86U Pro
打游戏怎么能没有一个稳定、高速的网络环境!我先是升级了千兆宽带,然后把路由器换成了华硕RT-AX86U Pro,主要是看中了它的稳定性,毕竟AX86U的名声在外,作为升级款的华硕RT-AX86U Pro只能更强。
华硕RT-AX86U Pro外观相比AX86U基本没变化,立式设计,线条硬朗,工业气息很足;搭载四核博通芯片,4x4 160MHz频宽,支持AiMesh组网,不仅网络环境稳定,如果是大户人家,可以多买几台组Mesh直接WiFi全屋覆盖。
如下图,我监测了华硕RT-AX86U Pro的信号覆盖情况,虽然在厨房的最北部分还是会丢失信号,但在厨房门口位置可以收到WiFi信号。对我来讲这样的表现已经满足了,只要信号能稳定、不掉速样就够了。
五、性能测试
先贴上索泰 RTX4080 AMP EXTREME AIRO的纸面参数。
索泰RTX 4080 AMP采用台积电4nm工艺的AD103核心,核心频率为2205/2565MHz,和公版RTX 4080的基础核心频率一致,Boost频率高出了60MHz。配备16GB GDDR6X显存,位宽256-bit,显存频率22.4 Gbps,功耗为320W,推荐电源850W起步。
3DMARK Time Spy是针对2K分辨率 DirectX 12 游戏的基准测试,测试结果22742分,显卡得分27523分,CPU得分11462分。
▼ Time Spy测试预估几款游戏大作2K分辨率的帧率
Time Spy Extreme 是针对4K分辨率 DirectX 12 游戏的性能测试,测试结果11267分,其中显卡测试13832分,CPU测试5495分。
Port Royal显卡光追性能测试,得分17583分。
NVIDIA DLSS功能测试,在2K分辨率下,关闭DLSS后的帧率38.17 FPS,开启DLSS后的帧率提升到131.44 FPS,由此可见,DLSS对游戏帧率的影响有多大。尤其开启光线追踪后的效果更明显,这里先卖个关子,后面我会结合游戏表现为大家更直观的讲解光线追踪和DLSS的 作用。
六、游戏体验
(1)解读光线追踪与DLSS
关于光线追踪与DLSS的技术理论在前面已经做了解释,接下来看它们会给索泰RTX 4080 AMP的游戏表现带来哪些提升。
光线追踪通过模拟真实世界的光纤特性渲染出更逼真的游戏画面,创造身临其境般的游戏体验。光线追踪是RTX系列显卡的独有技术,在40系显卡提升到第3代,大幅提升了运算能力与应用性能。
以《赛博朋克 2077》为例,通过下面两组对比可以明显看出光线追踪对画面质感、细节表现、光影效果的加成。
开启光线追踪后画质和细节的表现力有非常大的提升,但也意味着更多资源的占用,导致游戏帧率大幅下降。这时就轮到NVDIA DLSS出场了。
前文提过,DLSS的作用是在不影响画质和响应速度的前提下,利用AI技术创造更多高质量帧,从而提升画面流畅度。
《赛博朋克 2077》中,4K分辨率开启光追,DLSS打开后的帧率是关闭时约2.7倍。
● 关闭光追、关闭DLSS,2K分辨率帧率111 FPS,4K分辨率帧率72 FPS
● 开启光追、关闭DLSS,2K分辨率帧率112 FPS,4K分辨率帧率55 FPS
● 开启光追、开启DLSS,2K分辨率帧率155 FPS,4K分辨率帧率148 FPS
那么,CPU的性能会不会影响光追与DLSS呢?直接实测,《巫师3》4K分辨率:
● 关闭光追、关闭DLSS:CPU占用率51%,功耗70.3W,显卡占用率76%
● 开启光追、关闭DLSS:CPU占用率57%,功耗70.9W,显卡占用率91%
● 关闭光追、开启DLSS:CPU占用率55%,功耗74.6W,显卡占用率94%
● 开启光追、开启DLSS:CPU占用率54%,功耗72.4W,显卡占用率99%
在没开启光追和DLSS前,这颗英特尔i5-13490F处理器的占用率在50%左右;开启之后占用率在55%左右。由此可见,CPU的性能并不能直接影响光线追踪和DLSS的效果,显卡性能的释放才是关键。不过话说回来,显卡性能的发挥又由CPU决定,也算间接有影响吧。
(2)《巫师3》
先来对比一下光追的视觉效果。2K分辨率:
● 图1关闭光追、关闭DLSS帧生成,帧率144FPS
● 图2开启光追、关闭DLSS帧生成,帧率110FPS
● 图3开启光追、开启DLSS帧生成,帧率156FPS
从三张图的对比中可以看出,未开启光追时,植物看着很单薄,毫无立体感可言;开启光追后,画面的质感有了非常明显改善,细节丰富度和颜色的质感都是肉眼可见的提升,前后对比好像不是同一款游戏。
▲ 关闭光追、关闭DLSS帧生成
▲ 开启光追、关闭DLSS帧生成
▲ 开启光追、开启DLSS帧生成
在4K分辨率:
● 图1开启光追、开启DLSS帧生成,游戏帧率175 FPS,显卡占用率达到98%
● 图2开启光追、关闭DLSS帧生成,游戏帧率102 FPS,显卡占用率97%
● 图3关闭光追、开启DLSS帧生成,游戏在帧率290 FPS,显卡占用率81%
● 图4关闭光追、关闭DLSS帧生成,游戏帧率144 FPS,显卡占用率56%
▲ 开启光追、开启DLSS帧生成
▲ 开启光追、关闭DLSS帧生成
▲ 关闭光追、开启DLSS帧生成
▲ 关闭光追、关闭DLSS
由此可见,光追+DLSS的确可以鱼和熊掌兼得,提升画质的同时保证游戏的流畅度,但代价是显卡一直处于近乎满载的工作状态。 还有一点,不论是2K分辨率还是4K分辨率,DLSS的功能主要提升游戏帧率,对画质的影响微乎其微,几乎看不出来。
(3)《荒野大镖客2》
2K分辨率,高画质场景:
● 开启DLSS,游戏帧率114 FPS
● 关闭DLSS,游戏帧率103 FPS
4K分辨率,高画质场景:
● 开启DLSS,游戏帧率112 FPS
● 关闭DLSS,游戏帧率87 FPS
(4)《古墓丽影:暗影》
使用游戏自带benchmark测试:
● 2K分辨率,开启DLSS,平均帧率 204 FPS,渲染帧率31993
● 2K分辨率,关闭DLSS,平均帧率199 FPS,渲染帧率31165
● 4K分辨率,开启DLSS,平均帧率 199 FPS,渲染帧率31325
● 4K分辨率,关闭DLSS,平均帧率149 FPS,渲染帧率22830
(5)《赛博朋克 2077》
在游戏中,同时开启光追和DLSS的帧率是最高的,画质也是最好的,甚至2K分辨率和4K分辨率基本没有太大变化,索泰 RTX4080 AMP的表现让我很满意。
七、散热与功耗表现
这里先声明一点,由于风扇与散热器的规格、频率与功耗设置这些因素都会影响散热结果,不同品牌型号也各有不同,所以,针对索泰 RTX4080 AMP的的测试仅供参考。
室温26℃左右,FurMark烤机30分钟左右,平均帧率185 FPS,显卡核心温度71℃左右,显存温度58℃,整卡功耗318W,与官方TGP基本相符。满载风扇转速2000 RPM,噪音控制的很不错,基本被机箱风扇盖住。
值得一提的是,索泰 RTX4080 AMP支持风扇智能启动技术,通过AI管控可以在高/低温和负载之间智能启停,有利于减小噪音。
八、总结
得益于NVIDIA Ada Lovelace架构的更新,索泰 RTX4080 AMP EXTREME AIRO能轻松驾驭各种3A大作、热门单机,不论画质、流畅性都有非常好的表现,尤其在4K分辨率时,凭借光线追踪和DLSS 3的辅助,可以无压力畅玩3A游戏,这倒是有些出乎我的意料之外。
除此之外,英特尔i5-13490F的 表现也让我惊喜有加,本以为作为13代入门级处理器吃不满RTX 4080的性能,没想到它竟然能带得动,最起码畅玩主流3A游戏是够用的。
总之,如果你预算充足,准备组装一台高配主机,索泰 RTX4080 AMP EXTREME AIRO是个不错的选择。至于CPU,如果没有渲染、视频等生产力需求,这颗i5-13490F用来玩游戏也是够用的。