英伟达(NVIDIA)和AMD显卡GPU芯片的常见术语及其解释

一、基本架构与组件

1. CUDA核心(仅限NVIDIA):NVIDIA GPU中的基本计算单元,用于执行并行计算任务,如浮点和整数运算。

2. 流处理器(AMD):AMD GPU中的基本计算单元,类似于NVIDIA的CUDA核心,用于并行处理图形和计算任务。

3. 张量核心(Tensor Core,仅限NVIDIA):专门用于加速深度学习和人工智能任务的硬件单元,能够高效执行矩阵运算。

4. 光线追踪核心(RT Core,仅限NVIDIA):专门用于加速光线追踪计算的硬件单元,提高图形渲染的真实感。

5. 计算单元(CU,AMD):AMD GPU中的计算单元,包含多个流处理器和其他资源,用于并行处理任务。

6. 流式多处理器(SM,NVIDIA):NVIDIA GPU中的核心计算单元,包含多个CUDA核心、张量核心和其他资源。

二、显存与带宽

7.GDDR5/GDDR6:不同代的显存类型,GDDR6相比GDDR5提供更高的速度和带宽。

8. HBM/HBM2/HBM3(High Bandwidth Memory):不同代的高带宽显存技术,通过堆叠多个内存芯片来提高带宽和容量。

9. 显存带宽:衡量GPU与显存之间数据传输速度的指标,影响GPU处理高分辨率和复杂图形任务的能力。

10. 显存容量:GPU用于临时存储图像数据的内存容量,越大处理复杂图形任务的能力越强。

三、性能指标与技术

11. 浮点运算能力(FLOPS):衡量GPU计算性能的重要指标,表示每秒可执行的浮点运算次数。

12. TFLOPS(TeraFLOPS):每秒万亿次浮点运算,用于衡量高端GPU的计算能力。

13. 光线追踪性能:衡量GPU在光线追踪技术中的表现,影响图形渲染的真实感。

14. NVLink(NVIDIA):NVIDIA的高速互连技术,用于连接多个GPU,提高数据传输速度。

15. Infinity Fabric(AMD):AMD的高速互连技术,用于连接GPU和其他系统组件,提高整体性能。

四、编程与并行计算

16. CUDA(Compute Unified Device Architecture):NVIDIA的并行计算平台和编程模型,允许开发者利用GPU进行通用计算。

17. HIP(AMD):AMD的异构编程接口,兼容CUDA代码,允许在AMD GPU上运行。

18. 线程(Thread):GPU中的最小执行单元,多个线程并行执行以实现高性能计算。

19. 线程块(Block):多个线程的逻辑分组,可以共享内存并同步执行。

20. 网格(Grid):多个线程块的集合,构成一个完整的并行计算任务。

五、其他关键技术

21. DLSS(Deep Learning Super Sampling,NVIDIA):基于深度学习的图像超采样技术,提高游戏帧率同时保持图像质量。

22. FSR(FidelityFX Super Resolution,AMD):AMD的图像超分辨率技术,通过算法提高游戏帧率。

23. 稀疏技术(Sparse Technology):通过减少模型中的参数数量来提高计算效率,适用于深度学习模型。

24. 混合精度训练(Mixed Precision Training):使用不同精度的数据类型(如FP16和FP32)进行训练,以节省显存并提高计算速度。

25. 量化(Quantization):将高精度数据类型转换为低精度数据类型,以减少计算量和显存使用。

六、功耗与散热

26. TDP(Thermal Design Power):衡量GPU最大功耗的指标,影响散热需求和系统配置。

27. 制造工艺(Process Node):GPU芯片制造时使用的半导体技术,以纳米(nm)为单位,更先进的工艺通常意味着更高的性能和更低的功耗。

英伟达(NVIDIA)显卡工艺发展

AMD显卡工艺发展

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com