AMD 的 RDNA4 GPU 架构
在 Hot Chips 2025 上,AMD 工程师介绍了该公司最新一代显卡 RX 9000 系列使用的 RDNA4 GPU 架构。RDNA4 GPU 大幅改进了光线追踪和机器学习效率,让中端显卡 RX 9070 以更小的面积、更低的功耗、更少的带宽实现了与上一代旗舰显卡 RX 7900XT 相似的光栅性能,以及更高的光线追踪性能。AMD GPU 的硬件视频编解码通常落后于竞争对手,RDNA4 的媒体引擎(Media Engine)提供了更快的解码速度,改进了 H.265、H.265 和 AV1 的视频编码质量,尤其是在低延迟编码方面,串流能从中受益。显示引擎(Display Engine)引入了 Radeon Image Sharpening 过滤器,让专门的硬件锐化最终图像有助于改进功耗;显示引擎也改进了多显示器的待机功耗。标量单元(Scalar Unit)加入了一些浮点指令。RDNA4 的一大变化是 L2 缓存从 RDNA2 的 4MB 和 RDNA3 的 6MB 增加到了 8MB,AMD 称光线追踪等工作负荷能受益于更大的 L2 缓存。