50系及4060的神经纹理压缩实测：大大降低显存和硬盘占用

双击支持一下啦，顺便求个电🥰

总而言之就是，游戏体积大和爆显存在NTC普及以后应该是过去式了，如果旧游戏也做适配那就更完美了，4060在1k下可以获得基本不占性能的显存占用降低，2k稍微占一些，显卡性能比4060强的依次影响降低。

开头依然介绍什么是 RTX 神经纹理压缩

RTX 神经纹理压缩（NTC）是一种基于机器学习的纹理（现代游戏的存储空间和显存占用的最大头）压缩与解压缩方案。

在 DirectX 12 中它支持三种运行模式：加载时推理、采样时推理、反馈时推理；在 Vulkan 中不支持反馈时推理，仅开放前两种模式。

——————————————————————

在采样时推理模式下，每个纹理像素会在需要时才被解压。NTC 是确定性算法，并非生成式技术。为减少画面瑕疵，技术会采用随机纹理过滤（STF）引入随机性，生成过滤后的纹理。

50系架构显卡的点采样纹理过滤速率提升一倍，因此在这类显卡上运行速度尤为出色。

采样时推理是大众认知中神经纹理压缩的核心形态，它能最大幅度降低显存占用，但也会带来一定性能开销，对部分中低端显卡不够友好。——————————————————————

好在低端硬件也有对应的适配方案（下面两个）。——————————————————————

加载时推理会在游戏或地图加载阶段解压 NTC 纹理，并同步转码为块压缩格式（BCn），整个解压过程完全在 GPU 上完成。实际表现上，它的性能与传统块压缩纹理持平，没有额外性能损耗，同时能大幅缩减纹理的磁盘占用与 PCIe 总线传输量。

缺点是相比块压缩纹理，无法进一步降低显存占用。

——————————————————————

反馈时推理借助采样器反馈机制，仅解压渲染当前画面所需的纹理块。该模式是前两者的折中方案，能显著降低显存占用（但幅度不及采样时推理），性能也介于两者之间。

最上为现有渲染，往下依次为加载、反馈、采样时推理

为什么要用神经纹理压缩？

神经纹理压缩的压缩比远高于 BCn 等传统格式，同时支持高通道数材质，单次可处理最多 16 个通道，而传统块压缩仅支持 1–4 通道图像。

实测数据显示，对比转码为块压缩格式的加载时推理模式，采样时推理可将纹理显存需求降低 85%。

不仅如此，采样时推理生成的画面比 BCn 转码纹理更接近原始参考画质，几乎与未压缩纹理完全一致。

不过该模式也存在局限：上述优质画面均在开启 DLSS 的前提下实现。

随机纹理过滤（STF）会引入随机性，若不开启抗锯齿，画面会出现大量噪点。

DLSS 可以完全消除这类噪点，TAA 时间抗锯齿能大幅改善但无法彻底清除。采样时推理强制启用 STF，因此必须搭配抗锯齿（优先 DLSS）才能获得最佳画质。

这项技术优势明显，但性能开销如何？

下面在 GitHub 官方 NTC 示例程序中，对多款显卡进行了测试。

加载时推理将 NTC 纹理转码为 BCn，与传统块压缩相比零性能开销；而采样时推理需要实时执行神经解码，会在所有显卡上产生性能成本，理想情况下这一开销应尽可能小。

——————————————————————

各显卡实测结果

RTX 5090：4K 分辨率下，采样时推理搭配 TAA 的帧时间开销极低；开启 DLSS 会小幅增加张量核心负载，但在真实游戏中，DLSS 低分辨率渲染仍能带来整体性能收益。

RTX 5070：2K 分辨率下，采样时推理开销约 0.50–0.70ms；4K 下约 1.20ms。

RTX 5060：1080p 下开销 0.60–0.70ms；2K 下超 1ms，4K 下接近 2ms。

RTX 4060 笔记本显卡：1080p 下开销约 0.70–0.85ms，接近 1ms。对于 8GB 显存的笔记本显卡，若显存吃紧、降低纹理画质后帧率仍充足，采样时推理仍有实用价值。

我的注解：

20~40ms 系统总延迟是整条链路的总和，多 1~2ms 几乎感觉不到，但这里是渲染延迟

帧率 ↔ 帧时间换算

60 帧 = 每帧 16.67ms
144 帧 = 每帧 ~6.94ms
240 帧 = 每帧 ~4.17ms

GPU 渲染一帧本身就只有几毫秒到十几毫秒

为什么多 1ms 就很严重？

因为这 1ms 是纯额外开销，是在原本的渲染时间上硬加的。

144Hz 高刷游戏

GPU 原本渲染一帧需要 7ms

NTC 多加 1ms → 变成 8ms

帧率直接从 144fps → 125fps

直接掉 近 20 帧

4K 3A 游戏，刚好跑 60 帧

原本一帧 16.67ms

多加 1ms → 17.67ms

帧率从 60 → 56.6fps

跌破流畅线

为什么到 2ms 就说 “吃力”？

尤其对 RTX 5060、RTX 4060 这种中端 / 入门卡：它们本身算力就弱，高分辨率（2K/4K）下，渲染一帧本来就接近满载，比如一帧要15~20ms，再加 2ms，帧率掉得更狠。

英伟达 NTC 开发者在YTB评论区的回复：

各模式适配什么显卡？

采样时推理仅适合高端旗舰显卡；加载时推理会转码为 BCn，仅缩减硬盘 / 下载体积，不优化显存。显卡能否流畅运行采样时推理，取决于游戏具体实现（材质通道、着色器复杂度等），英伟达也在持续优化推理效率。

游戏中如何落地 NTC？

游戏可内置 NTC 纹理，提供加载 / 反馈模式与采样模式的选项，玩家根据自身硬件性能选择。

简单判断标准：如果一款游戏因显存不足必须降低纹理画质，但降质后帧率过剩，就非常适合开启采样时推理。

同时游戏无需对所有纹理使用 NTC，可单纹理独立控制，画质损失明显的纹理可保留原始格式。

实际游戏与测试示例的表现差异？

采样时推理明显慢于零开销的加载时推理，但真实游戏有大量不受 NTC 影响的渲染通道，整体帧时间差距会被稀释。同架构显卡的两种模式相对性能差异相近。若显卡显存耗尽，加载时推理完全无效，因为它不会减少工作集显存占用。

随机纹理过滤（STF）的影响

采样时推理强制开启 STF，关闭抗锯齿会出现明显噪点，DLSS 可完全消除，TAA 仅能部分改善；参考模式与加载模式可手动开关 STF。

渲染技术的未来一瞥

神经纹理压缩能在不牺牲画质的前提下实现极高压缩比，部分场景下画质甚至优于传统块压缩格式，不损失性能且大幅缩减游戏体积，同时也支持 AMD、英特尔显卡。（这两家也做了同款技术）

神经纹理压缩注定会在未来实时图形领域扮演关键角色，对未来显卡的规格影响也是决定性的

一如之前评论区的盒友们对3G显存6060的调侃———

但毕竟还有这么多旧游戏，所以最坏的结果应该是硬件显存增长再次放缓，60系和50系同定位显卡显存可能不会有太大变化。

更多游戏资讯请关注：电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com

50系及4060的神经纹理压缩实测：大大降低显存和硬盘占用

双击支持一下啦，顺便求个电🥰

开头依然介绍什么是 RTX 神经纹理压缩

最上为现有渲染，往下依次为加载、反馈、采样时推理

为什么要用神经纹理压缩？

这项技术优势明显，但性能开销如何？

各显卡实测结果

我的注解：

20~40ms 系统总延迟是整条链路的总和，多 1~2ms 几乎感觉不到，但这里是渲染延迟

帧率 ↔ 帧时间 换算

144Hz 高刷游戏

4K 3A 游戏，刚好跑 60 帧

为什么到 2ms 就说 “吃力”？

英伟达 NTC 开发者在YTB评论区的回复：

各模式适配什么显卡？

游戏中如何落地 NTC？

实际游戏与测试示例的表现差异？

随机纹理过滤（STF）的影响

渲染技术的未来一瞥

神经纹理压缩注定会在未来实时图形领域扮演关键角色，对未来显卡的规格影响也是决定性的

一如之前评论区的盒友们对3G显存6060的调侃———

但毕竟还有这么多旧游戏，所以最坏的结果应该是硬件显存增长再次放缓，60系和50系同定位显卡显存可能不会有太大变化。

相关资讯 更多

热点资讯

热门游戏

帧率 ↔ 帧时间换算

相关资讯更多