光线追踪技术正变得更“聪明”了。微软近日宣布,在其最新的 DirectX Agility SDK 中,正式将 着色器执行重排序 (Shader Execution Reordering, SER) 纳入 DXR 1.2 标准。这项曾由 NVIDIA 独占的硬件级优化技术,如今已成为开放标准,有望彻底改变 GPU 处理复杂光追场景的方式。

核心技术解析:SER 如何拯救 GPU?
在光线追踪或路径追踪场景中,光线在物体表面的反弹是随机且不可预测的。这种不可预测性是 GPU 并行架构的噩梦:当线程束(Wave/Warp)中的不同线程需要处理截然不同的任务时,GPU 必须串行执行,导致大量算力闲置。
SER 的作用正是解决这一痛点:
- 动态分类:SER 会实时分析正在运行的光线追踪着色器,识别出具有相似执行路径的任务。
- 重组队列:它将这些相似任务重新排序并分组,确保 GPU 的线程束能尽可能并行处理相同类型的指令。
- 提升相干性:通过减少线程发散(Thread Divergence),大幅提高了 GPU 的利用率和渲染效率。
黄金搭档:不透明度微映射 (Opacity Micro-Maps)
此次 DXR 1.2 更新还引入了另一项关键技术——不透明度微映射。
- 原理:它预先标记场景中哪些部分是透明/半透明的,哪些是完全不透明的。
- 效果:GPU 在遇到光线照射时,可以直接跳过那些被标记为“完全透明”区域的着色器计算,只对可见像素进行渲染。
- 双重加持:SER 负责让剩下的工作更高效,微映射 负责直接砍掉不必要的工作。两者结合,显著降低了光追负载。

性能实测:数据令人震惊
微软在官方博客中展示了 SER 技术的实测数据,结果令人振奋:
- NVIDIA GPU:在启用 SER 后,光线追踪性能平均提升了 40%。这验证了该技术自 RTX 40 系列推出以来的有效性。
- Intel Arc B 系列 GPU:表现更为惊人,部分场景下的帧率提升高达 90%!
- 这表明英特尔的新一代架构对 SER 技术有着极高的敏感度,或许意味着其之前的光追瓶颈很大程度上源于着色器执行的无序性。
- 这也暗示了未来 AMD 和英特尔的硬件可能会更深层次地原生集成 SER 支持。
开发者工具:着色器模型 6.9
为了支持这些新功能,微软同步推出了 着色器模型 6.9 (Shader Model 6.9)。
- 基础支撑:它是开发者调用 SER 和不透明度微映射功能的底层接口。
- 其他改进:新增了对长向量、16 位浮点运算的支持,并优化了硬件开销管理。
- 现状:虽然功能已结束预览并正式发布,但实际体验仍需游戏开发者在引擎中主动适配和实现。
未来展望
随着 SER 成为 DirectX 的标准组件,我们有望看到:
- 硬件普及:不仅是 NVIDIA,AMD 和英特尔的下一代 GPU 都将把 SER 作为核心特性进行硬件级优化。
- 游戏画质飞跃:开发者可以更放心地在游戏中开启高阶光追效果,而无需过度担心帧率崩塌。
- 显存压力缓解:更高效的着色器执行意味着更少的冗余计算,间接降低了对显存带宽和容量的极端需求,或许能让 12GB 以下显存的显卡在未來游戏中运行得更顺畅。


0条评论