© ROOT-NATION.com - 本文由人工智能自动翻译。如有不准确之处,敬请谅解。若要阅读原文,请选择 English 在上面的语言切换器中。
随着介绍 NVIDIA 数字支持系统 4.0 和 反射2,我们正在见证图形技术的又一次重大飞跃。
新宣布 NVIDIA GeForce RTX 5000 系列,亮相于 CES 2025年,游戏性能或将迎来真正的突破。这些技术有望同时提升帧率、改善画质并降低延迟,彻底改变玩家对高端游戏体验的期待。
在本文中,我将深入分析 DLSS 4.0 与早期版本(包括 DLSS 3.5)的区别,并深入探讨其基于 Transformer 模型的全新 AI 架构。我还将介绍 Reflex 2 带来的优势以及这些优势在实际应用中的意义。当然,我们将从最重要的视角——玩家——来探讨这一切。
NVIDIA DLSS 4.0 是一场革命,而非进化
DLSS 是深度学习超级采样的缩写, NVIDIA的神经渲染技术套件,利用人工智能提高游戏渲染效率。在早期版本(DLSS 2.x 和 3.x)中,这意味着先以较低的分辨率渲染帧,然后使用 AI 对其进行升级,从而提高帧率并改善图像质量。
然而,3.5 年底发布的 DLSS 2023 首次引入了光线重建这一重大功能——这是一种 AI 驱动的光线追踪降噪技术。尽管如此,DLSS 4.0 可以说是自 2.0 年 DLSS 2020 发布以来最重要的更新。为什么?因为它整合了多项重大改进,包括:
- 多帧生成 (MFG)DLSS 4.0 能够为每帧实际渲染生成最多三帧额外帧,而 DLSS 3 只能生成一帧 AI 生成的额外帧。实际上,与传统渲染相比,这可以将帧率提高多达八倍。理论上,这为在顶级 GPU 上启用完整光线追踪功能,以 4 FPS 的速度运行 240K 游戏打开了大门——这是帧率性能的重大飞跃。
- 基于 Transformer 的 AI 模型. NVIDIA DLSS 4 Transformer 模型采用基于 Transformer 的全新架构,更新了 DLSS 算法,标志着 Transformer 首次应用于实时游戏图形。与之前使用的卷积神经网络相比,DLSS Transformer 模型的参数数量增加了一倍,对每个场景的理解也更加深入,从而显著提升了图像质量。
- 改善图像质量得益于更先进的处理技术,DLSS 4.0 可提供更稳定的帧率,显著减少图像重影,并在运动过程中呈现更丰富的细节,相比 DLSS 3.5 更胜一筹。精细的纹理和边缘预计将更加清晰锐利,快速移动的物体也将保留更多细节,不再出现早期版本中常见的拖影或闪烁现象。
- 增强的帧生成管道. NVIDIA 不仅增加了更多帧,他们还改进了整个帧生成流程。与 DLSS 4 相比,新的 DLSS 40 帧生成器预计速度将提高约 30%,占用的视频内存将减少约 3%。实际上,这意味着只需为每个真实帧调用一次生成器,就可以生成多个中间帧,从而降低系统的整体负载。
- 更广泛的支持和向后兼容性另一个积极的方面是,DLSS 4.0 并不局限于新的 GPU。虽然关键的多帧生成功能需要最新的 GeForce RTX 5000 系列,老款 RTX 显卡仍然受益。RTX 20、30 和 40 系列 GPU 可以充分利用全新的超级分辨率、光线重建以及基于 Transformer 的 DLAA 改进功能。
阅读: 技术封建主义——世界秩序的新形式
DLSS 4.0 Transformer 架构,用于智能运动缩放和重建
NVIDIA DLSS 4 将成为首个采用全新实时 Transformer 模型的缩放技术。基于全新 Transformer 模型的超分辨率和光线重建解决方案现在将使用两倍的参数和四倍的计算能力,从而提高运动过程中的图像稳定性,最大限度地减少移动物体上的光晕,提供更丰富的图像细节,并改善边缘平滑度。除帧生成器(缩放、光线重建、DLAA)之外的所有 DLSS 4 增强功能都将在所有 DLSS 平台上提供。 GeForce RTX GPU。 NVIDIA 预计 DLSS 4 不仅能够提供更好的视觉缩放效果,而且与传统原始分辨率渲染相比,其性能还将提高 8 倍,这主要归功于多帧生成功能。
DLSS 4.0 的主要特色之一是全新的基于 Transformer 的 AI 模型——DLSS Transformers。这类 AI 模型与支持自然语言处理的模型(例如 ChatGPT),但 NVIDIA 已将其应用于实时图像处理。这不仅仅是一个改变,而是一个显著的改进,因为 Transformer 擅长理解数据中的上下文和关系,在本例中,指的是给定帧和后续帧中的像素。

效果如何?新模型采用了 Vision Transformer 架构,将注意力集中于整帧(甚至跨连续帧)。实际上,它并非仅仅单独分析一小块像素,而是综合考虑整幅图像和前几帧,以最佳方式重现所有细节。这种全局方法使 AI 能够识别,例如,一帧中物体的边缘应该与下一帧中的运动保持一致,或者纹理图案(例如栅栏网格)应该保持一致而不是闪烁。
在实践中,这种方法可以产生更清晰、更稳定的图像。早期的例子,例如《心灵杀手2》,已经证明了这种方法的优势。网格栅栏等小细节保持平滑稳定,不会闪烁;移动的风扇叶片不会留下重影;电线等细小物体在光线变化时也不会闪烁。换句话说,Transformer 消除了之前版本的 DLSS 或其他升频器无法处理的许多运动伪影和叠加问题。

多帧生成,否则你最终将不再抱怨游戏的流畅度
DLSS 4.0 的另一项重大改进是多帧生成 (MFG),它基于 DLSS 3 引入的帧生成功能。多帧生成扩展了最初随 Ada Lovelace 架构出现的帧生成器。它利用 AI 算法,现在可以为以传统方式渲染的每个图像帧生成最多三个额外帧。得益于更先进的第五代 Tensor 核心,此功能目前仅限于 NVIDIA GeForce RTX 5000 系列 GPU 及其笔记本电脑版本。全新 Tensor 核心的 AI 处理性能比第四代 Ada Lovelace 核心提升了 2.5 倍。新帧生成后,会均匀分布,确保性能流畅运行。
DLSS 4.0 并非为每个真实帧添加一个人工帧,而是更进一步,在整个渲染管线中插入三个额外的帧。实际上,GPU 渲染一个“真实”帧,而 DLSS 系统生成三个额外的帧间图像。这意味着,游戏中每个渲染帧都会显示四个。那么问题来了:如何在不增加延迟的情况下实现这一点呢?

为了理解这种方法, NVIDIA 不得不重新设计整个帧创建流程。此前,生成每个人工帧都需要单独的光流计算和神经网络处理,这在生成大量帧时成本过高。
在 DLSS 4.0 中,这个问题得到了解决,使 AI 的每帧效率都得到了显著提升。更新后的帧生成器模型(仍然基于神经网络,但不一定是基于 Transformer)运行一次即可生成多个中间帧。与之前相比,它的速度提高了 40%,内存占用减少了 30%。因此,该技术对组件的要求更低,同时仍然能够提供 DLSS 的强大性能。实际上,这种多帧生成技术能够显著提升性能,尤其是在高性能显卡上。

值得注意的是 NVIDIA 通过帧生成功能严格管理输入延迟。传统上,添加人为帧会增加输入延迟,因为这些帧无法反映玩家的新动作,从而导致游戏响应速度降低。这就是为什么 NVIDIA Reflex 一直与 DLSS 3 配合使用,以同步游戏模拟。现在,有了 DLSS 4,尽管帧数更高, NVIDIA 声称延迟减少了一半。怎么做到的?主要归功于 Reflex 技术的改进(我们稍后会讨论),部分归功于更佳的 DLSS 性能。由于 GPU 不会过载,它可以更快地处理新的输入数据。
阅读: 简化黑客工作的 10 个错误
反射2: NVIDIA 前所未有地减少输入延迟
高帧率本身固然很好,但为了获得最佳游戏体验,它需要与低输入延迟相辅相成,尤其对于快节奏游戏的玩家而言。如果没有低输入延迟,游戏体验就像在厚厚的泥浆中穿行一样。这正是 NVIDIA Reflex 2 是 2020 年推出的 Reflex 技术的后续产品。该解决方案通过优化 CPU 和 GPU 之间的连接来降低系统延迟。
它的工作原理是将 GPU 与 CPU 同步,消除渲染队列中的瓶颈。这意味着鼠标点击可以更快地到达屏幕。当然,许多游戏已经支持 Reflex 1.0,通常可以将延迟降低 30-50%,但 Reflex 2 更进一步,引入了一项名为 Frame Warp 的新技术。
At CES NVIDIA 宣布 Reflex 2 可将 PC 延迟降低高达 75%。这是如何实现的?借助 Frame Warp,系统不仅可以更快地渲染帧,还能在最后一毫秒内重新处理帧,并考虑最新的输入数据。
换句话说,即使在 GPU 渲染完一帧之后,Reflex 2 仍然可以在帧显示之前调整摄像机或十字准星的位置,以适应玩家的最新动作。其工作原理是,当 GPU 渲染 X 帧时,CPU 会根据最近的鼠标或控制器移动情况,同时预测玩家的摄像机或十字准星在 X+1 帧中的位置。一旦 GPU 完成 X 帧的渲染(基于稍早的数据),系统就会扭曲该帧以匹配 X+1 帧的新摄像机位置。然后将修改后的帧发送到屏幕。

有趣的是,这种方法与虚拟现实中使用的方法(例如异步重投影)类似。其背后的原理是,如果 VR 头显中的最后一帧略微过时,系统就会对其进行修改,以减少玩家感知到的延迟。目前,这一概念已被应用于鼠标和电脑游戏。结果如何?延迟显著降低——从几十毫秒缩短到几毫秒……对于要求较低的游戏,延迟甚至更低。遗憾的是,Reflex 2 目前仅在少数几款游戏中可用,例如 勇敢 or 总决赛,并需要一个 NVIDIA GeForce RTX 5000系列显卡才能发挥作用。
游戏支持和开发者对 DLSS 4.0 的采用
即使是最好的技术,如果不加以利用,也是无用的。幸运的是, NVIDIA 确保 DLSS 4.0 从一开始就获得广泛支持。当 GeForce RTX 5000 系列 GPU 发布首日,该公司宣布 75 款游戏和应用程序将支持多帧生成 (MFG)。这一数字每月都在增长。如今,我们已经可以在 庞克2077, 艾伦·维克二世, 暗黑破坏神IV, 战神仙境传说及 星球大战亡命之徒.
值得注意的是,不仅新游戏可以从 DLSS 4 中受益。得益于 NVIDIA由于注重向后兼容性,已经实施 DLSS 2 或 3 的游戏开发者可以轻松更新其游戏以支持 DLSS 4。

通常,只需更新 DLSS 插件即可激活新的 Transformer 模型和多帧生成功能。即使是响应速度较慢的工作室和开发者也不会成为障碍,因为 NVIDIA 通过 DLSS SDK 中的覆盖功能,用户可以手动强制启用受支持游戏的 DLSS 设置,即使游戏本身没有官方更新。
如今,AI 渲染已成为现代游戏开发的支柱之一。这项技术正在快速发展,但 NVIDIA 确保未来版本不仅至少部分兼容旧版本,而且易于实现。这一点至关重要,因为为了使这项技术更具优势,我们需要一个尖端的超新星解决方案,即使其支持程度有限。然而,只有时间才能证明 DLSS 4.0 以及 Reflex 2 是否会在游戏中获得广泛支持,以及英特尔和 AMD 等竞争对手是否会提供同样先进高效的解决方案。
阅读: 降噪耳机有害吗?听力学家的见解
为什么 DLSS 4.0 和 Reflex 2 如此重要
这些技术对于现代游戏和实时性能至关重要,尤其对游戏玩家和内容创作者而言。首先,DLSS 4.0 至关重要,因为它能够在不牺牲画质的情况下实现更高的性能。这意味着即使在要求苛刻的场景中,也能实现更高的帧率。此外,DLSS 4.0 能够更准确地预测细节,更高效地处理运动、动态和场景深度。所有这些都归功于基于 Transformer 的全新 AI 架构。光线追踪与 DLSS 的结合,能够呈现逼真的图形,而不会出现严重的帧率下降。此外,DLSS 4.0 能够有效地扩展到超高分辨率,而不会损失清晰度。
Reflex 2 对游戏体验同样重要,因为它能够减少输入延迟,这对于电子竞技和 FPS 游戏至关重要。Reflex 2 能够更精确地同步 GPU 和 CPU,从而最大程度地减少延迟。在《CS2》、《Valorant》和《Apex Legends》等游戏中,即使是几毫秒的差距也能决定战斗的胜负。动作将变得更加清晰锐利,反应也更加迅速。这不仅关乎舒适度,更是竞争优势。Reflex 延迟分析器工具可以精确测量系统延迟。
这就是为什么所有玩家都热切期待新的 GeForce RTX 5000 显卡将利用最新的 NVIDIA DLSS 4.0 和 NVIDIA Reflex 2 技术。这些技术的实际表现如何还有待观察,但我们会随时向您通报最新动态。
阅读: