渲染瓶颈成过去式:Microsoft推出SER技术,最高能提升90%效能

随着游戏画面质量要求越来越高,现代显卡的渲染管线变得日益复杂,传统的光线追踪处理方式已开始成为效能瓶颈。 Microsoft最新的革命性技术「Shader Execution Reordering(SER)」正式加入DirectX 12 Shader Model 6.9,为显卡带来前所未有的效能提升。 根据 Microsoft 的测试结果,Intel 的「B系列」(Battlemage)显示卡在启用 SER 后,效能提升幅度高达 90%,而 NVIDIA GeForce RTX 4090 也有 40% 的效能增长。

渲染瓶颈成过去式:Microsoft推出SER技术,最高能提升90%效能

这项技术最初在2025年的GDC(游戏开发者大会)上伴随DXR 1.2一起宣布,当时Remedy Entertainment展示了在《Alan Wake 2》游戏中,结合Opacity Micromaps(OMMs)和ShaderExecution Reordering,光线追踪消耗资源成功降低了三分之一。

SER 运作原理:打破光线追踪瓶颈

SER 的全名是「Shader Execution Reordering」(着色器执行重排序),其核心概念在于优化光线追踪效率。 由于许多光线追踪工作负载具有随机性质(stochastic nature),DXR 应用程序常常遭受「分歧的着色器执行」和「分歧的数据存取」问题所苦。

传统方式的瓶颈是:当单一光线击中多个物体,且每个物体需要不同的着色器时,传统方式会让 warp 中的每个执行绪相互等待,导致大量的闲置时间。 这种情况下,即使显卡拥有强大的运算能力,却因为执行顺序不佳而无法充分发挥潜力。

SER 的解决方案

通过 SER,所有被光线击中的物体会先被储存起来,然后根据两个关键因素进行重排序:

  1. 空间位置(Spatial Locations) – 根据物体在 3D 空间中的位置排序
  2. 着色器相似性(Shader Similarities) – 将需要相同着色器的对象排在一起

这使得执行过程能以更加「连贯」(coherent)的方式进行,大幅减少执行绪等待时间,让显卡的运算资源得到更充分的利用。

渲染瓶颈成过去式:Microsoft推出SER技术,最高能提升90%效能

「HitObject 与 SER 的结合特别强大,能够利用 HitObject 中的信息和用户提供的额外提示,进一步提升 hit/miss 处理的连贯性潜力。」— Microsoft

HitObject 技术:解耦光线追踪各阶段

除了 SER 之外,这次更新还引入了「HitObject」概念,它将光线追踪的「遍历」(traversal,包括 AnyHit 着色和 Intersection 着色)与「ClosestHit」和「Miss」着色解耦开来。

这种设计带来了几项重要优势:

  1. 减少重复代码:过去常见的代码(如顶点撷取和插值)必须在每个 ClosestHit 着色器中重复,现在可以避免
  2. 更灵活的处理:简单的可见性光线现在可以不必为了取得基本的命中信息而执行完整的命中着色器
  3. 多来源调度:ClosestHit/Miss 的调度可以从遍历以外的来源(如 RayQuery)开始

Shader Model 6.9 完整更新内容

这次发布的Shader Model 6.9带来了多项重要更新:

功能说明
Long Vector支持最多 1024 元素的矢量运算
16-bit Float SpecialsHLSL 新增 IsNan()、IsInf()、IsFinite() 对 16 位浮点数的支持
DXR 1.2包含 Opacity Micromaps 和 SER
16/64-bit Shader Ops这些功能现在是 SM 6.9 的必要功能

此外还包括多项客户请求的功能改进,如修订的资源视图创建API、周期性剪辑通知、增加的dispatch网格限制等。

支持硬件与使用方法

用户无需担心如何启用这项功能,因为 SER 已整合至 Microsoft 的 Shader Model 6.9 中,需要 AgilitySDK 1.619 版本。

硬件支持

根据 Microsoft 的演示视频和测试结果,预期支持 SER 的硬件包括:

  • NVIDIA Ada Lovelace 及以上架构(RTX 40 系列及以上)
  • Intel Battlemage 系列(Arc B570/B580 等)

值得注意的是,SER 是 Shader Model 6.9 中的「必要功能」,这意味着所有显卡驱动程序都必须支持包含 SER 的着色器代码。 至于是否能实际获取效能提升,则取决于个别显示卡硬件的支持程度。

效能测试说明

Microsoft 在样本测试中观察到Intel Arc B系列显卡有90%的性能提升,NVIDIA RTX 4090 有40%的提升。 不过 Microsoft 也特别指出,这些测试并非完全反映实际游戏效能,因此玩家在实际游戏中体验到的效能提升可能会略低于上述数据。

开发者资源

Microsoft 同时发布了多项开发者资源:

  • PIX 工具支持:SER 发布当天就获得了完整的 PIX 支持[2]
  • 范例代码:NVIDIA 的 RTX Path Tracing 范例和 Microsoft 的 D3D12RaytracingHelloShaderExecutionReordering 示例都已支持 SER
  • 详细文档:完整的 SER 技术规格可在 GitHub 上的 DirectX 官方规格文件中找到

对玩家的意义

对于广大PC游戏玩家而言,DirectX 12 SER的正式支持意味着未来的光线追踪游戏将能够在保持画质的同时,获得更流畅的帧率表现。 特别是对于使用Intel Arc B580等中端显卡的玩家,这项技术有望让他们在光线追踪游戏中获得接近高阶显卡的体验。

随着愈来愈多的游戏开发者采用Shader Model 6.9和SER技术,我们可以期待看到更多支持实时光线追踪的游戏作品,为PC游戏带来更逼真的视觉效果(希望别唬玩家呀… )。

(0)
MobileMaestroMobileMaestro

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注