- 内容展现
- 最新评论
AMD Ryzen ThreadRipper 1950X与技嘉X399 AORUS Gaming 7评测
今天,AMD推出了Ryzen ThreadRipper处理器,意为“线程撕裂者”,同样基于Ryzen架构,多达16个核心,直接参与高性能PC市场的竞争,如此一来,多年未见的IA大战将波及整个PC产品线,而且,这次掀起的是“核战争”! . ...
AMD Ryzen ThreadRipper架构概览
Ryzen TR核心内部架构和Ryzen是一样的,每个Die两个CCX,每个CCX内部4个Zeppelin Core,每个Zeppelin Core有512KB的L2缓存,每个CCX有8MB的L3排除式缓存,以及相关的技术SenseMI包含的Precision Boost、XFR等,这里不再重复。 实际上,Ryzen TR是由EPYC处理器演变而来,EPYC处理器内部是4个Die,Ryzen TR只启用了两个,Die之间通过Infinity Fabric总线连接,双向42GB/s的带宽。 内存控制器的部分自然也是在两个Die上,每个Die上只有两个通道,为此,AMD提供了两种内存交错访问模式。 第一种叫做Distributed Mode,也就是不同Die上的每个内存通道都可以同时被访问,这样可以提升内存带宽,但是由于在不同的Die上,内存延迟会比较大,在默认状态下,TR处理器会执行这种模式。 第二种叫Local Mode,不同Die之间的内存通道不可以同时被互访,这样可以降低延迟,但是内存带宽是无法真正达到四通道的水平的。AMD建议游戏之类的对延迟比较敏感的用途使用这种方式。 根据AMD的说法,有些游戏对核心数需求较高,有些游戏对主频比较敏感,有些游戏对内存延迟、核心之间的延迟比较敏感,用户可根据不同的游戏设置不同的模式。 在Ryzen Master中,这两种模式是可以切换的。 在技嘉的BIOS里,Memory Interleaving选项选择Die就是Distributed模式,选择Channel就是Local模式,Socket模式应该是为多路而设计,在X399平台上只能支持单路,因此没有意义。 另外,根据AMD的测试,在内存DDR4-3200时,两种模式的AIDA64内存读写带宽和延迟表现分别如下。左侧Distributed模式读取带宽高,延迟也高,右侧Local模式读取带宽低,但延迟也低不少。 但是根据我们的测试,和AMD的结果有些出入,在DDR4-3600时,Local Mode(右侧)无论是带宽还是延迟,均要好于左侧Distributed Mode。看来这里边一定还有什么bug存在。 |
本文版权归 PCEVA,PC绝对领域,探寻真正的电脑知识 原作者所有 转载请注明出处
发表评论
最新评论
- 引用 ydjj
- 本帖最后由 ydjj 于 2017-8-10 21:19 编辑
感谢R大的辛苦评测~
超频后渲染16打10还打不过?这我还真的没想到
等x264和265的avx512优化上来了差距不更大?
- 引用 royalk
ydjj 发表于 2017-8-10 21:16
感谢R大的辛苦评测~
超频后渲染16打10还打不过?这我还真的没想到
等x264和265的avx512优化上来了差距不更 ...
渲染没问题,编解码打不过,但我总觉得编解码的优化还不到位,不知道是BIOS问题还是系统问题。
- 引用 Mufasa
royalk 发表于 2017-8-10 21:22
渲染没问题,编解码打不过,但我总觉得编解码的优化还不到位,不知道是BIOS问题还是系统问题。
...
视频解码那个,是软件的问题,等软件厂商优化就好了。
我用双路E5的16C32T系统,也发现,看视频时,只满载一颗CPU,另一颗打酱油。
- 引用 ydjj
royalk 发表于 2017-8-10 21:22
渲染没问题,编解码打不过,但我总觉得编解码的优化还不到位,不知道是BIOS问题还是系统问题。
...
渲染算了下也有问题
比如blender那个
16核4G vs 10核4.6G
换算下来,核心x频率增加了39%,但成绩只是好了13.35%……
- 引用 royalk
ydjj 发表于 2017-8-10 21:48
渲染算了下也有问题
比如blender那个
16核4G vs 10核4.6G
blender那个十几秒就完了,估计线程draw call耗时占比例过大,如果跑时间长一点的这个差距应该会趋于正常。
- 引用 xyj1232007
- 最后那张图……脸盆U
- 引用 aibo
- 本帖最后由 aibo 于 2017-8-11 00:03 编辑
这次的线程撕裂者就是2个节点的NUMA。
正常模式的延迟是惨不忍睹的,特别是内存频率低的时候。
开NUMA的local模式的话,游戏方面就类似ryzen了。不过这时候多核心的优势就会缩小很多。
anandtech的评测很明显的反应了这个特征。
另外,legacy模式是关掉HT,不是关掉一个die
- 引用 lovelesski
- 家用估计用不上了,土豪上。
- 引用 ydjj
royalk 发表于 2017-8-10 21:53
blender那个十几秒就完了,估计线程draw call耗时占比例过大,如果跑时间长一点的这个差距应该会趋于正常 ...
仔细拜读了全文后
我觉得12核的7920x只要能超到个4.3~4.5G,打1950x一点都不虚
- 引用 haomingci3
- 本帖最后由 haomingci3 于 2017-8-11 07:12 编辑
建议之后的测试里面加入R15能耗比对比,现在很多评测有个问题,贴AVX2甚至是AVX512的功耗,但是测试里面没有AVX2和AVX512应用,或是只提及一个,让人误以为测试得到的功耗是全部或者多数测试项目的运行功耗。
R15是纯SSE应用,也刚好符合了一些AVX无用党的胃口,并且实际上有AVX offset这种设定,按照xeon的玩法,用的到AVX2/AVX512的时候使用低频即可获得超越高频SSE/AVX1的性能。
根据一些有R15能耗比和其他一些区分指令集的测试看,R15(SSE浮点)同频同核数是KBL占优,AVX1是ryzen占优,AVX2是KBL占优。比较理想的测试是SSE,AVX1,AVX2,AVX512找到分别的典型应用测试分数和功耗进行对应。
本人拙见,仅供参考
- 引用 xiaokey
- AMD Ryzen ThreadRipper 1950X与技嘉X399 AORUS Gaming 7评测
多媒体处理与创作类软件效能测试
Blender 2.78c“ Ryzen TR 1950X也是核心多干活快,默频就已经超过了7950X的4.6G成绩。”
是不是写错了
没有用7950X啊 是7900X
我不是找茬的 我是提醒你一下
最后感谢R大一直带着我们玩超频
热门评论
热门评论