AMD Radoen RX 5700 XT/RX 5700评测
2019-7-7 21:00
|
发布者:
橙黄鼠标|
查看:
56795|
评论:
|原作者: 橙黄鼠标
摘要:
AMD于6月8日-6月10日期间正式发布了采用RDNA架构、核心代号NAVI、7nm工艺的Radeon RX 5700 XT/RX 5700显卡,拥有更高的频率、更小的体积、更低的功耗等优势,配备GDDR6显存,相对GDDR5显存可达到两倍的带宽优 ... .. ...
什么是RDNA架构?
DNA架构其实就是Radeon DNA的意思,意指这是一张灵感来自于Radeon显卡的架构,但又有DNA的遗传概念,吸取了上一代显卡的优点,创造出一个新的个体,同时更是针对Radeon 游戏显卡而设计的架构。
RDNA架构有三个亮点让它效率倍增,其一是全新的计算单元、其二是多层次的缓存结构、其三是精简的图形流水线,这三者均是底层架构上的变革,也让RDNA架构实现1.25倍的每时钟性能提升和1.5倍的每瓦性能提升。
RDNA是一个全新的架构,并非GCN架构的升级版或改良版,是从CU单元的底层着色器进行重新研发的架构,只是在指令集部分依然兼容GCN的指令集,但同时也有全新的指令集是GCN架构无法支持的。
Navi核心是目前已知唯一采用RDNA架构的独立显卡,配备40组CUs单元,每组Cu单元拥有64个流处理器、2个标量流处理器、4个64位双线性过滤单元,共计2560个流处理器、80个标量流处理器、160个64位双线性过滤单元。
Navi 核心有四个图形引擎,每个引擎有5个Dual Compute Unit(DCU单元),每个DCU单元里包含了2个CU单元,AMD将其称做Work Group Processors(工作组处理器),将CU单元成双配对,以获得更高的并行性能,这也是RDNA架构和GCN架构截然不同的地方。
AMD对CU单元也进行了全新的设计,过去的GCN架构每个CU单元中有一组调度器、标量单元,而全新的RDNA架构则每个CU单元配备了两组调度器、标量单元,仅有后端架构相同。RDNA这样的设计用意是为了CU单元的两组SIMD单元可以在一个时钟周期中并行运行,而不像GCN架构四组SIMD只能等待单一的前端逐一运行。
SIMD,CU单元中的执行单元,SIMD意为Single instruction, multiple data的缩写,可以理解为单指令多数据的运算单元,例如指令需要运算乘法,SIMD就会对数据运算乘法,指令需要运算减法,SIMD就会对数据运算减法,因为它每次只能执行一条指令,但可以对多个数据块进行运算,所以被称为SIMD。
RDNA除了CU单元结构不同以及增加全新的DCU单元概念,连SIMD单元都有所不同。
GCN的CU单元是采用4个SIMD16的执行单元做运算,但只配备一个标量单元,每当有指令需要处理时,首先要经过标量单元处理,然后分配给4个SIMD16执行运算,SIMD0-SIMD1-SIMD2-SIMD3,四个时钟周期过去后才处理完。
而RDNA的CU单元是采用2个SIMD32的执行单元做并行运算,并且每个SIMD32均配备一个标量单元、调度器,当有指令需要处理时,两个标量单元、调度器同时处理,然后将数据分配给两组SIMD32运算,SIMD0/SIMD1同时处理,一个时钟周期就处理完了,处理效率比GCN架构快四倍并不是随便说说的。
某种程度上RDNA的CU单元里的两组SIMD都是互相独立、并行运算的,各自拥有专门的标量单元、标量寄存器、调度器以及矢量寄存器,只有缓存依然是共享使用,而GCN的CU单元则是一体的,四组SIMD只配备一组调度器、标量单元、标量寄存器等。
RDNA这种结构更适合较为简单的运算过程。我们刚刚说过SIMD意思是单指令多数据运行的计算单元,那多个SIMD有什么好处吗?当然有,如果有同时包含加减乘除的复杂运算要处理,那四个SIMD就刚好对口。而如果运算没有这么复杂,那四个时钟周期也只是白白被浪费掉。RDNA更适合游戏中包含复杂和简单运算过程的多样性运算负载,而GCN则更适合科学运算的复杂运算过程。
所以在AMD E3 2019的发布会上,AMD也给我们透露以后RDNA架构将会专注于游戏显卡上,而GCN架构也不会荒废,将会用于Radeon Pro的专业级图形卡上。
“WAVE”是SIMD的可执行的模式,后面的数字可以理解成需要处理的“工作项”或是整个WAVE的长度,过去GCN只支持WAVE 64,是因为GCN的CU单元有四组SIMD16,经过标量单元处理就可以把WAVE 64分配到四组SIMD16中,但它们无法在一个时钟周期完成,一个WAVE 64需要4个时钟周期才能跑完。而RDNA因为CU单元采用SIMD 32 x 2的设计,既可以原生支持WAVE 32,也可以以两组SIMD32组合并行运算的方式,处理WAVE 64。
除了CU单元的全新设计,RDNA架构的多层次缓存设计也是性能提升的法宝。从缓存的设计可以看出,RDNA中的R除了Radeon还有Ryzen的意思。AMD在每个图形引擎中配备了全新的128KB L1独立缓存,而原本位于CU单元的本地缓存则被称为16KB L0缓存,并让SIMD单元到L0缓存的带宽实现翻倍的提升。
在L2和L0之间增加的新L1缓存能有效减少四个图形引擎对L2缓存的依赖,减少每个级别的缓存访问延迟,这意味着有效带宽的效率提升,因为需要请求的数据在每一级的计算单元都有本地缓存,而不用从更远的缓存中取出。
除了多重缓存设计,RDNA架构还支持多层级Delta 色彩压缩技术,从几何引擎到光栅单元、L1缓存、L2缓存以及显存和显示引擎,均可进行色彩压缩,提高传输速率。
RDNA提升效率之三的法宝是简化的图形引擎,拥有四个增强型ACE异步计算单元和中心几何单元,过去的异步计算引擎无法完全调度流水线,而RDNA甚至可以暂停部分单元的工作,并进行重新分配,以提高计算单元的使用效率。
除了在架构上的重新设计,RX 5700 XT/RX 5700显卡的显示引擎也有了升级,支持HDMI 2.0和DP 1.4 HDR,可输出4K 240Hz、8K 60Hz HDR,针对VR头盔做优化,只需一根数据线即可连接。
多媒体引擎同样有了升级,增加H.265 HEVC编码器,支持8K 24、4K 90、1080p 360帧的解码和4K 60、1080p 360帧的编码;增加VP9解码器,可解码4K 90和8K 24的视频,整体编码速度提升40%。
|