再探光芒追踪兼七彩虹 iGameGeForce RTX 4080 16GB UltraWOC测试

2023-03-09 11:49:06 数码推荐 ℃

经到达 102 个，大略均匀的话那便是每一年 25 个。

流的情形下起首，光栅衬着和光芒追踪都是用于断定可视性的一种方法家喻户晓，光栅化衬着的道理是将场景华厦每一只三角形拿出来，扔到银幕空间上，让光栅器查找该三角形在银幕上对应的像素，而后依据法线、深度缓存、光照、纹理等信息衬着该三角形对应的像素，理论上每一只三角形都要停止如许的操纵，为了节俭衬着资本，大伙引入了各类剔除、修剪和隐面打消等技巧，削减衬着的三角形。

此华厦少少高文包含比方·赛博朋克 2077 、古墓丽影之阴影、Far Cry 6、漫威蜘蛛侠重制版、地平线 5、生化危机村落、地铁拜别等等，此中像地铁拜别还出了一只强迫请求显卡支撑 DXR 特征的加强版。

而光芒追踪则是对衬着分辨率的每一只像素发射一条大概一束射线，让其击中最濒临的三角形，依据击中点的属性，断定是被接收、折射仍是曲射（后两种会发生衍生射线），然而发生出倒影、发散、折射等后果，循环往复光芒追踪自身只是一种衬着技巧的通用名词，今朝曾经开展出了五花八门实现，比方门路跟踪、分布式光芒追踪、双向光芒追踪、光子映照等等，都是对于差别利用情境下提出的各具长处和毛病的光芒追踪实现，比方双向光芒追踪可能比拟合适散焦殊效，分布式光芒追踪比拟合适全局光照。

除电子GAME文娱外，另有良多衬着器仍是都引入了硬件光芒追踪加快，比方以往只供给 Intel CPU 优化的产业衬着器Keyshot等也都第一时光跟进了，起因很简略，采取硬件光芒确实明显提高了衬着机能，节俭了时光提高了生产力。

从光学角度看，光芒追踪才是正确的物理实现，光栅化衬着固然也可到达源于物理衬着的后果，然而由于缺少屏外空间信息，可能须要更多的代码和数据才干濒临，不然轻易发生各类怪僻的现象《猎天使魔女》中源于光栅化的银幕空间倒影，出现了口红戳眼睛的现象。

对显卡厂商、GAME玩家和GAME开辟商来讲，硬件光芒追踪大概说视觉感染力和GAME是相反相成的关联电子GAME是离不开视觉感染力的，硬件光芒追踪为更强的衬着后果供给了可能，此不只是画布衬着，还包含了源于光芒追踪的音效处置等对玩家雷同有直观体会的特征。

《丢失》中源于光栅化的银幕空间倒影，猫咪在镜子的怪僻倒影。

绝对 4 年前的 GeForce RTX 2080 Ti，现在的崭新世代 GPU 比方 GeForce RTX 4090、GeForce RTX 4080 在机能上级有了明显的提高，比方 RTX 2080 Ti的单精度机能是 14.2 TFLOPS，而早先宣布的 RTX 4080 单精度机能依据我之前的实测到达了 51 TFLOPS，提高了濒临 2.6 倍，在相称局部GAME中，像 5800X 如许客岁还属于旗舰的 CPU 曾经成为瓶颈。

在地铁拜别中，银幕空间倒影（SSR）和光芒追踪倒影（RTR）的对照（SSR 里船的倒影跟着角度的变化而忽隐忽现，而光芒追踪倒影则坚持很好的一贯性）：

对于 CPU 瓶颈成绩，NVIDIA 为 GeForce RTX 4000 序列引入了名为 DLSS 3 的新超采样技巧，在本来 DLSS 2 空间超分辨率的基本上，引入了源于硬件光流加快的时光超分辨率大概说帧分解（FrameGeneration）技巧，能在前后两帧一朝一夕天生一张画布，在不增添 CPU 开消的情形下实现更光滑的画布过渡后果。

即便是某些声称是光芒追踪的情形，然而由于和真实的光芒追踪实现完整不是一回事而消亡各类成绩，比方Reshade殊效外挂源于银幕空间实现的伪光芒追踪全局光照轻易发生忽有忽无的现象（黄色色染跟着梯子移出银幕外后就忽然消失了）：

在实践测试中，DLSS3 FG 能提高大概 30% 以上的帧率由于 FG 插帧须要衬着两帧后才干实现插帧行动，会增添额外的时延，因而 DLSS 3 还联合了 Reflex低时延技巧，用来确保时延阻止大幅度增添。

既然光芒追踪大概说真实的光芒追踪能发生更真切的画布，那末为什么在 RTX GPU 之前少少看到呢？谜底相信各位都听说过，那便是光芒追踪须要大批的盘算光芒追踪发生衍生射线后，会持续反弹射向下一只物体，且反弹的标的目的多是立即的，单条射线难以正确盘算出全部物体名义的明暗，随之就会发生噪点，为了削减噪点，要嘛便是每一只像素发射更多的射线，比方数千条射线，又大概是联合立即算法停止积聚，此些措施城市招致盘算量多少级回升，而更庞杂的场景和模子（比方庞杂的通明模子）会让盘算量在此基本上再跳多少个多少级。

一起落来，你会发明 NVIDIA 在光芒追踪安排上级堪称是有板有眼：中路主打光芒追踪，而后加上一直进级 DLSS 技巧打帮助，面临 AMD 和 Intel的叠加围攻下仍然不落下策，最近的市场份额甚至是不减反增。

NVIDIA 在 Volta世代起始引入的光芒追踪便是支撑利用张量内核停止降噪处置，可能实现较少的射线实现濒临参考目的图的后果到了Turning世代，NVIDIA 引入了 RTCore来实现光芒追踪求交集快，今朝一切的 GPU 硬件光芒追踪加快基本上都是类似于Turing——经由过程参加求交集快模块来加快光芒追踪，所差别的重要是具体的范畴和涵盖的加快特征范畴（比方 NVIDIA RTCore和 Intel RTU 还支撑遍历、排序，AMD RDNA2 则另有完善，RDNA 3 有大批改良）。

除硬件一直加强，NVIDIA 在软件上级的行动更加风趣以 RTX R次，时下流行的 10 款电子竞技GAME里就有 9 款有魔改。

上图是分辨是参考图、采取 NVIDIA 及时降噪器处置的后果和输出降噪器的光芒追踪衬着画布今朝绝大多数的硬件光芒追踪加快GAME都是采取了混杂衬着流水线，也便是先用光栅化断定可视性，而后利用光芒追踪对银幕地区中特定的地位停止光芒追踪盘算，此不失为一种画质与机能的调和，比方 AMD 的 SSSR 便是对于场景中差别地位利用传统光栅 SSR 和DXR 光芒追踪的倒影算法。

被魔改次数最多的GAME The Elder Scrolls V: Skyrim（上古卷轴 5：天涯）和The Elder Scrolls V: Skyrim Special Edition（上古卷轴 5：天涯特别版），此中被下载最多的魔改模组均为图形上级的魔改包。

经由 4年的开展，光芒追踪加快曾经不再生疏，除折射、倒影、阴影等殊效处置外，另有一只重要的利用现在起始逐步增加，那便是全局光照（Global Illumination，简称 GI）的广泛实现。

要修正GAME的图形是一件非常困难的事情，须要开辟出特定的货色，为每一只素材重修新艺术作品，NVIDIA 表示，为了开辟 Quake II RTX，动用了 NVIDIA 工程师、美工、QA 集体数个月时光才搞定，此仍是在取得源代码和其余开辟职员供给的魔改货色前提下实现的，如许的开辟强度对市面上浩若烟海的GAME一直反复停止是完整不可行的，并且，依照 PCGamingwiki供给的材料，在已知的 7500 个GAME里，唯一 28 个是供给了已转换的可修正格局。

上图是GAME ICARUS 启用源于 RTXGI 全局光照后后果NVIDIA 在此上级有较长的积聚，比方在 2019 年提出的 DDGI（现在的营销称号为 RTXGI），可能在无噪点的情形下实现及时全动静光芒追踪全局光照。

而 NVIDAI 供给的 RTX Remix货色则是一只源于 NVIDIA Omniverse 的收费魔改平台，可能为差别的GAME疾速创立 RTX On模组，此些模组能供给加强的材质、完整光芒追踪、NVIDIA DLSS 3 和 NVIDIA Reflex支撑，哪怕GAME利用的是老式的 DX8、DX9 世代衬着流水线。

AMD 在本年（2022 年）10 月也宣布了一篇论文，提出了名为 GI 1.0 的全局光照实现措施，在此篇论文中，固然 AMD RX 6900XT 光芒追踪局部的机能只要 RTX 3080 的一半，然而凭仗高速缓存的上风，终极到达了持平的机能。

RTX Remix供给了被称为 RTX Remixruntime的 D3D9 runtime，此相称于把GAME的衬着接收为 RTX On功效运转时，当此些老GAME如常向 D3D9 runtime发送衬着指令的时候，RTX Remixruntime会把此些指令拦阻落来，将其重命名为差别的数字资产偏偏重组到相同的场景中。

另一只挑衅则是场景光照的丰富性成绩，比方今朝的光芒追踪GAME个别只要两个到十六个主光源，即便是 Quake 2 RTX 中也不外是 100 多个用于光芒追踪的光源，NVIDIA 为此提出了 RTXDI 技巧（在 2021 年正式采取也许称号，重要源于 NVIDIA 2020 年前提出的 ReSTIR技巧）。

到了此一步后，RTX Remix 将资产和场景转换为广泛采取的通用场景描写(USD) 开放式 3D 框架，而也许框架也是构建和操纵自定义 3D 管道的NVIDIA Omniverse平台的基本。

RTXDI 测验考试近似典范衬着方程的方法停止盘算，经由优化后，每一只像素只用两条射线采样，联合 NRD 特地为 RTXDI 优化的 RELAX 降噪器，透过五花八门重采样技巧，就可以对百万级数目的光源实行光芒追踪，完全摒弃其余一切阴影技巧和情况掩蔽技巧，并且可能和 RTXGI 联合实现更真切壮丽的衬着后果。

由于 RTX Remix 是源于 NVIDIA Omniverse 构建的，此些 USD GAME资产可能轻松导入 RTX Remix 利用法式或任何其余 Omniverse 利用法式或连接器，包含GAME行业标准利用法式，比方 Adob e Substance 3D Painter、Autodesk Maya、3ds Max、 Blender、SideFX Houdini 和 Epic Games 的空幻引擎。

RTXDI 可能在 NVIDIA、AMD 等支撑 DXR 和 Vulkan光芒追踪扩大的 GPU 上运转，不只GAME中可能利用，另有少少开辟职员曾经供给了支撑 Blender的 RTXDI 衬着引擎，适用性相称广。

当资产从 Omniverse 连接器同步到 Remix 的视口时，魔改集体可能合作改良和调换资产，并可视化每一只变动也许事情流程可能转变魔改社区处置相信其GAME魔改的方法，为模组制造者供给一只统一的事情流程，将相信的知识应用到各类GAME而无需进修大批专有货色。

说了此么多做为铺垫，接落来我要做少少光芒追踪的相干测试了，此局部分为重要是偏偏底层的测试和实践GAME测试，手头有一片 GeForce RTX 3080 Ti FE 和七彩虹的 iGame GeForceRTX 4080 16GBUltraWOC，绝对之前的公版测试，我此次重要是要少少延长性的测试，特别是我的 AMDRyzen 7 5800X 平台上，启用光芒追踪能否下相称于“收费”。

上图是上古卷3晓风的GAME原图。

测试平台CPU：AMD Ryzen 7 5800X 锁定 4.5GHz，开启超线程主板：华硕 ROG StrixX570E Gaming内存：TT Tough DDR4-3600 8GB*4电源：TT Tough 850W 80 Plus白金认证

上图是上古卷轴3晓风经由 RTX Remix魔改创作后的实践画布当开辟职员制造好 RTX Remix魔改包后，就可能轻松地将模组导出分享给其余玩家，玩家下载了魔改包后，扔到GAME目次内启动GAME，RTX Remixruntime就可能实现剩下的事情——RTX Remix的 64 位 Vulkan衬着器调换掉旧的衬着 API 和体系。

显卡：七彩虹iGame GeForceRTX 4080 16GBUltraWOC显卡：NVIDIA GeForce RTX 3080 Ti FE显示器：DELL U2413驱动法式：GeForceGameReady驱动 v526.98

是一只存在划时代意思的魔改货色，对很多旧GAME来讲可能会因而再度抖擞重生，在尤其是GAME开辟本钱越来越高确当下，为各类重制版打开了一条新的疾速开辟道路。

操纵体系：Windows 11 22H2 22621.819 专业事情站版，电源治理出色机能情势，封闭 WindowsDefender主板 BIOS 设定：开启 ResizableBAR支撑七彩虹 iGameGeForce RTX 4080 UltraWOC

抉择——有必要采取光芒追踪吗？此是一只常见的风趣成绩，特别也是今朝光栅化衬着

此次参加对照的新卡是来自七彩虹的 iGame序列 GeForce RTX 4080 16GB UltraWOC：

七彩虹的 iGameGeForce RTX 4080 16GB UltraWOC是我打仗的第一款非公版 RTX 4080，和公版一体化设想比拟，iGameGeForce RTX 4080 16GB UltraWOC的更长，如许设想的目的是为了包容 3 个电扇，供给更良好的散热后果。

散热器外甲采取波普艺术风格，显卡正面引人瞩目的是“漫画殊效”的Ultra灯组（可能利用 iGameCenter 2.0 停止灯光同步设置），在开机后会亮起，内部散热模组采取了 5*6 mm + 2*8 mm热管，热管和鳍片采取了回流焊骤然融为一体，三组双滚珠轴承电扇的扇叶直径均到达 100mm，9片电扇叶片是利于聚风的环形叶片。

位于顶部的电源接口是12VHPWR（PCIE 5.0）电源接口，随卡供给了一条 3* 8pin PEG 转接线，固然假如可能的话最佳电源也采取 ATX 3.0 带 12VHPWR 连接线，如许可能让机箱空间更简练。

固然七彩虹iGameGeForce RTX 4080 16GB UltraWOC的尺寸比 NVIDIA FE 公版更长（大概是 32.5cmvs 30cm），然而在团体轻重上由于采取了三电扇开放式散热设想反而要轻良多，不像公版如许有一大圈金属包抄，如许的利益除散热最好外，对主板来讲也是降低了累赘，而用户须要注意的是机箱内部须要有足够的空间。

七彩虹iGameGeForce RTX 4080 16GB UltraWOC供给了一键超频功效，在显卡挡板处有一只按钮，按下后就可以启用一键超频：

利用 3DMarkSpeedWay测试成果以下：

一键超频略显守旧，机能改良幅度大概是 1.3%，利益是比拟简略，并且是有官方质保的底下就让咱们进入具体的光芒追踪测试环节底层测试底层测试的目的是盼望尽量获知硬件的理论机能，特别是像 RTCore绝对较少材料的单元，咱们对其细节更是充足猎奇。

底层测试——光芒追踪峰值机能测试为了探测 GeForce RTX 4080 的光芒追踪底层机能，我此次利用 Matt Pettineo的 DXR PathtTracer停止了简略的对照，测试前提是每像素 16 射线、8次反弹、32 光源，并且启用了多少常见的衬着后果：

此是一只很简略的场景，然而请注意，咱们测试的是一只门路跟踪器，机能和取样数、光照门路长度有较大关联。

后面咱们说过，常见的光芒追踪衬着实现方法是指从摄像机标的目的发射射线穿过银幕像素最后击中场景中某个三角形，此一步被称作求交，在实现求交盘算后，光芒衬着法式华厦 anyhit代码会依据击中点的属性断定能否发生衍生射线和抉择相应的后续盘算。

由于会发生屡次的衍生射线碰撞，光芒追踪须要停止大批简略而反复的求交测试盘算，因此求交测试模块是光芒追踪加快单元的最重要组成局部，咱们在此里的底层测试便是为了探测出 GPU停止必定殊效处置的情形下每秒可能停止的射线求交才干。

从测试成果来看，RTX 4080 可能每秒跑出 31.1 Grays(GigaRays，十亿条射线)，而 RTX 3080 Ti则是 18.4 Grays，二者而今的机能比值为 1.69 倍底层测试——Ray Tracing in Vulkan。

此里我利用的是 GPSnoopy的 Ray Tracing in Vulkan，此是 Tanguy Fautre依照 Peter Shirley 的 Ray Tracing in One Weekend光芒追踪短训教程在 github上宣布的代码实现，最后利用的是 NVIDIA 公有 Vulkan扩大，厥后 KHR 宣布了官方 Vulkan光芒追踪扩大后，一切代码也随之移植到官方 Vulkan扩大上去，此意味着包含 AMD、Intel等 GPU 也可运转也许法式。

假如有看过我之前测试的话，应当也了解到我之前是跑过也许法式的此次我测试的是 github 上的崭新代码版块，利用 VS 2022 和 Vulkan SDK 编译法式供给了 5 个场景，分辨是：1. Ray Tracing In One Weekend。

2. Planets In One Weekend3. Lucy In One Weekend4. Cornell Box5. Cornell Box & Lucy

法式容许修正射线取样数目（默许每像素 8 条射线，至高 128 条）和射线反弹次数（默许 16 次，至高 32 次）固然法式每一只场景跑一遍只须要 60 秒，然而我此次利用的测试剧本是涵盖了每像素 1、2、4、8、16、32 条射线和一次、两次、四次、八次、十六次、三十二次反弹，一轮跑落来大略须要数个儿时。

测试成果以下：

由于法式衬着的场景绝对简略，也不波及降噪等着色器操纵，比拟轻易表示光芒追踪加快环节大概说求交机能上的机能差别由于 RTCore对咱们来讲仍是一只黑匣子，内里很多多少细节咱们都知之甚少，NVIDIA 供给了一只名为 RT TFLOPS 的目的，然而也许货色是依据GAME运算量统计百分比，揉合了 SM 单精度机能、RTCore等效机能、张量内核机能的东东，纯洁度略显不敷。

为了简化描写，我此里将每一只 RTCore每周期跑的操纵集称之为 RTCore-Ops七彩虹iGameGeForce RTX 4080 16GB运转法式时候的 3D 内核频次为 2805 MHz，乘与 76 个第三代 RTCore的话，理论上便是每秒跑 213,180 百万次序三代 RTCore-OPs。

NVIDIA GeForce RTX 3080 Ti 12GB运转法式时的频次稳定绝对较大，在 1835 MHz 到 1905 MHz一朝一夕，取旁边值 1870MHz的话，乘与 80 个第二代 RTCore，那便是每秒跑 149，600 百万次序二代 RTCore-Ops。

纯真看RTCore-Ops的话，七彩虹iGameGeForce RTX 4080 16GB是 NVIDIA GeForce RTX 3080 Ti 12GB的 1.42 倍。

然而从 GPSnoopy Ray Tracing in Vulkan 的测试成果来看，七彩虹iGameGeForce RTX 4080 16GB的实测光芒追踪机能是 NVIDIA GeForce RTX 3080 Ti 12GB的 1.61 倍（均匀值），多出来的 20% 显然是来自于第三代 RTCore或更大高速缓存（64MB L2 vs 6MBL2）所谈论的。

我还测试了包含其余每周期射线数目（每像素 1、2、4、16、32 射线）的情形，在较少采样的情形下，比方每像素一射线的时候，二者的均匀机能比值差别会少些——152%，在更多采样的时候，机能比值基本雷同

提高幅度较少的是场景 4，也许场景的特点是不通明、镜面物体，此意味着衍生射线的数目和随之而来的庞杂着色盘算会更少，在每像素 1 条射线的时候，七彩虹iGameGeForce RTX 4080 16GB 是 RTX 3080 Ti的 142%，相称于二者的 RTCore-Ops比值。

在采样数目增添到每像素 8 条射线后，七彩虹iGameGeForce RTX 4080 16GB在场景四的机能是 NVIDIA GeForce RTX 3080 Ti 12GB的 148%，仍然濒临二者 RTCore-Ops 1.42 倍比值。

由于支撑供给 RTCore状况特征信息 Nsight今朝只对企业用户以 NDA 的情势供给，普通人难以打仗，故此想进一步正确获知相干细节的正门今朝是堵死的，因而此次测试只能依据名义成果做断定考虑到测试场景不波及动静含混大概其余射线插值盘算的情形，因而第三代 RTCore的每周期三角形求交才干两倍于第二代 RTCore的特征在此里应当是表示不出来的。

对上级此些测试成果，我很轻易得出底下的论断：对波及较多通明、镜面曲射物体的场景，NVIDIA GeForce RTX 3080 Ti 12GB大概说 Ada构筑可能从较大的高速缓存和着色器机能明显获益，而对通明、镜面大概说反弹次数较少的场景，基本上便是二者单元范畴和频次乘积的高下差别。

GAME实测在GAME测试上级，我此次盘算精简一下，只抉择三款光芒追踪GAME，分辨是赛博朋克 2077、地铁逃离加强版和蜘蛛侠重制版，此中赛博朋客 2077 存在光芒追踪倒影、阴影盘算，地铁拜别加强版采取了光芒追踪来实现全局光照、倒影、阴影，蜘蛛侠重制版是从主机平台移植过去的，供给了光芒追踪倒影殊效，上述上个GAME均供给了 DLSS 超分辨率技巧，此中蜘蛛侠重制版以正式版的方法供给了 DLSS 3 插帧支撑，赛博朋克 2077 之内测版的方法供给了 DLSS 3 插帧支撑，地铁逃离加强版供给了 DLSS 2 支撑。

地铁逃离加强版

地铁：逃离加强版：地铁逃离加强版是一只出色的第一人称单人GAME，采取 4A Engine开辟，是第一只强迫请求显卡必需支撑 DXR 的GAME七彩虹 iGameGeForce RTX 4080 16GB UltraWOC在也许GAME中实现了 95fps的 4K 全开至高 DLSS Performance机能，在 2560x1440 则是到达了 121 fps。

蜘蛛侠重制版：蜘蛛侠重制版是一只移植自GAME机的第三人称行动GAME，采取 Insomniac GAME引擎，崭新版供给了 DLSS 3 插帧支撑从测试成果来看，蜘蛛侠重制版在咱们的测试平台上遇到了 CPU 机能瓶颈，在 2560x1440 的时候启用光芒追踪+DLSS 3 插帧可能到达 1.73 倍于插帧之前的机能。

相较之下，4K 光芒追踪+ DLSS 3 插帧是启用插帧之前的 1.48 倍和封闭光芒追踪比拟，启用光芒追踪 + DLSS 2 后的机能会更快，以七彩虹 iGameGeForce RTX 4080 16GB UltraWOC为例，而今的机能是封闭光芒追踪时的 1.24 倍。

赛博朋克 2077：赛博朋克 2077 是一只跨平台GAME，采取的GAME引擎是 REDengine 4，供给了光芒追踪倒影、光芒追踪阴影等殊效支撑，咱们此里测试的版块是供给了 DLSS 3 插帧支撑内测版NVIDIA 在 9 月份的时候曾经将赛博朋克 2077 列为 DLSS 3 GAME，然而具体的正式支撑时光尚不明白，可能会和 Overdrive光芒追踪（RTXDI）一起宣布？

在 4K 分辨率下，七彩虹 iGameGeForce RTX 4080 16GB UltraWOC启用光芒追踪+ DLSS 2 后的机能是封闭光芒追踪、不启用 DLSS 2 的 1.22 倍在打开光芒追踪情势下， DLSS 2 Performance能实现 2.62 倍于启用 DLSS 2 之前的机能。

对 DLSS 3 插帧机能表示，做为参考，七彩虹 iGameGeForce RTX 4080 16GB UltraWOC启用 DLSS 3 插帧后，4K 时的机能提高了 47%（假如是纯真和启用光芒追踪比拟则是 289%），而在遭受 CPU 机能瓶颈的 2560x1440 下提高幅度到达了 73%（假如是纯真和启用光芒追踪比拟则是 215%）。

为了获知更多的细节，我将蜘蛛侠重制版和赛博朋克 2077 的更多 CaoFrameX细化测试成果收拾为底下的两个表格：

上级表格中除各位常见的均匀帧率外，另有低于 1% 的均匀帧率、利用时延、GPU 耗电、GPU 每 10 瓦耗电帧率和 GPU 占用率等目的1% 频次低帧率是指依照从至高到最低帧率来布列，而后取位于开端大概说最慢的 1% 帧率停止均匀取得的均值，英文个别称为 1% LowAveragsFPS被认为是反应卡顿的最佳目的，也许目的越高GAME流利性感触就越好。

假如你对GAME卡顿比拟敏感的话，倡议存眷一下也许目的

pLatency类似于 NVIDIA Frameview华厦 PCLatency，是指微机 I/O 端口接收到内部人机装备指令后到显卡实现衬着发送数据到显示器的此段耗时。

也许目的完整独立于显示器和人机装备，只考虑微机体系内的情形，可能最大限度反应微机内部衬着时延成绩，该目的的单元个别是毫秒表示然而依据我的实践对照，发明 AppLatency和 PCLatency仍是消亡必定差别的，特别是在启用了 DLSS 后：

可能看出，在 DLSS Perf + FGon的时候，PCLatency测试成果为 50ms，比 CapFrameX的 13ms高良多在启用光芒追踪后，纯真启用 DLSS 的话，PCL 只要 34ms，比封闭光芒追踪、封闭 DLSS 的时候快 29.4%，改良幅度比均匀帧率还高。

GPU Power表示显卡的全卡耗电，而 GPU fps/10W 代表的是每 10 瓦耗电能告竣的帧率GPU Usage表示测试过程的均匀 GPU 占用率从测试成果可能确认蜘蛛侠重制版在 2560x1440 的时候确实更轻易遭到 CPU 机能影响，在启用 DLSS 2 后 GPU 均匀占用率只要 52%，而今耗电为 123 瓦，每 10 瓦帧率为 6.92 fps/10瓦。

启用 DLSS 3 插帧后，耗电会有所提高，到达 161 瓦，增添 30%，然而机能耗电比会明显提高到达 10.42 fps/10瓦，提高了 51%网络上有人表示封闭超线程的话，蜘蛛侠重制版的机能会有所提高，我试了一下，确实是必定的改良：。

帧率从 85.1 fps提高到了 96.5fps，不外 1% LowAvg只要 1 fps的改良，最慢帧时光有较大改良依据记载数据，而今 CPU 的耗电是 86 瓦，降低了两瓦，而 CPU 最大利用率从 81% 提高到了 96%，GPU 耗电基本持平——125 瓦。

假如你是GAME玩家的话，无妨测验考试到 BIOS 里封闭掉超线程，很可能会有一点小欣喜全文总结经由四年的开展，光芒追踪在软硬件上级曾经有了大幅度的改良，当前的旗舰硬件光芒追踪 GPU 在 4K 分辨率下共同超分辨率、插帧等技巧下轻松每秒破百帧，在如许硬件才干下，越来越多GAME和利用开辟商纷纭参加到支撑硬件光芒追踪加快的行列，像 PC 平台上的硬件光芒追踪GAME数目就从零增添到 100 款以上。

光芒追踪对画布的改良不是表示在纹理、模子的细节上，而是更真实的物理光学体会，比方自然而然的全局光照（RTXGI）、阻止忽有忽无的倒影、“接地气”的阴影、绚丽壮丽的夜景（RTXDI）等等。

硬件光栅衬着经由近 30 年的开展，能做的改良曾经不多，难以克服的地方是时候交给光芒追踪来实现了在此次测试中，咱们了解了 GeForce RTX 4080 16GB 的峰值光芒追踪机能大概是每秒 31.1 GRays，是上一代 Ampere构筑 RTX 3080 Ti每秒 18.4 GRays的 1.69 倍，在演示场景测试中个别幅度会在 1.65 倍操纵，而在GAME中，也许幅度是 1.35 倍操纵，起因和今朝GAME基本采取混杂衬着流水线有关。

在混杂衬着流水线中，GAME利用光栅器断定每一只三角形在银幕上的地位，而后依据需要决定能否在此些地位上停止光芒追踪衬着DLSS 技巧是及时光芒追踪的最佳朋友，经由屡次版块迭代后，DLSS 的画质有了明显的改良，新参加的插帧技巧让须要更高画布流利体会的玩家多了抉择。