PCEVA,PC绝对领域,探寻真正的电脑知识
  • 内容展现
  • 最新评论
AMD Ryzen ThreadRipper 1950X与技嘉X399 AORUS Gaming 7评测
2017-8-10 20:59| 发布者: royalk| 查看: 57001| 评论: 84|原作者: royalk
摘要: 今天,AMD推出了Ryzen ThreadRipper处理器,意为“线程撕裂者”,同样基于Ryzen架构,多达16个核心,直接参与高性能PC市场的竞争,如此一来,多年未见的IA大战将波及整个PC产品线,而且,这次掀起的是“核战争”! . ...
AMD Ryzen ThreadRipper架构概览



Ryzen TR核心内部架构和Ryzen是一样的,每个Die两个CCX,每个CCX内部4个Zeppelin Core,每个Zeppelin Core有512KB的L2缓存,每个CCX有8MB的L3排除式缓存,以及相关的技术SenseMI包含的Precision Boost、XFR等,这里不再重复。

实际上,Ryzen TR是由EPYC处理器演变而来,EPYC处理器内部是4个Die,Ryzen TR只启用了两个,Die之间通过Infinity Fabric总线连接,双向42GB/s的带宽。

内存控制器的部分自然也是在两个Die上,每个Die上只有两个通道,为此,AMD提供了两种内存交错访问模式。

第一种叫做Distributed Mode,也就是不同Die上的每个内存通道都可以同时被访问,这样可以提升内存带宽,但是由于在不同的Die上,内存延迟会比较大,在默认状态下,TR处理器会执行这种模式。

第二种叫Local Mode,不同Die之间的内存通道不可以同时被互访,这样可以降低延迟,但是内存带宽是无法真正达到四通道的水平的。AMD建议游戏之类的对延迟比较敏感的用途使用这种方式。

根据AMD的说法,有些游戏对核心数需求较高,有些游戏对主频比较敏感,有些游戏对内存延迟、核心之间的延迟比较敏感,用户可根据不同的游戏设置不同的模式。

在Ryzen Master中,这两种模式是可以切换的。

在技嘉的BIOS里,Memory Interleaving选项选择Die就是Distributed模式,选择Channel就是Local模式,Socket模式应该是为多路而设计,在X399平台上只能支持单路,因此没有意义。

另外,根据AMD的测试,在内存DDR4-3200时,两种模式的AIDA64内存读写带宽和延迟表现分别如下。左侧Distributed模式读取带宽高,延迟也高,右侧Local模式读取带宽低,但延迟也低不少。

但是根据我们的测试,和AMD的结果有些出入,在DDR4-3600时,Local Mode(右侧)无论是带宽还是延迟,均要好于左侧Distributed Mode。看来这里边一定还有什么bug存在。


收藏 邀请
0
本文版权归 PCEVA,PC绝对领域,探寻真正的电脑知识 原作者所有 转载请注明出处
发表评论

最新评论

引用 athloncn 2017-8-10 21:09
这一套板U实在是太强大了
引用 ydjj 2017-8-10 21:16
本帖最后由 ydjj 于 2017-8-10 21:19 编辑

感谢R大的辛苦评测~
超频后渲染16打10还打不过?这我还真的没想到
等x264和265的avx512优化上来了差距不更大?
引用 royalk 2017-8-10 21:22
ydjj 发表于 2017-8-10 21:16
感谢R大的辛苦评测~
超频后渲染16打10还打不过?这我还真的没想到
等x264和265的avx512优化上来了差距不更 ...

渲染没问题,编解码打不过,但我总觉得编解码的优化还不到位,不知道是BIOS问题还是系统问题。
引用 无心飘落 2017-8-10 21:28
专业回收各类测试平台
引用 Mufasa 2017-8-10 21:40
royalk 发表于 2017-8-10 21:22
渲染没问题,编解码打不过,但我总觉得编解码的优化还不到位,不知道是BIOS问题还是系统问题。
...

视频解码那个,是软件的问题,等软件厂商优化就好了。

我用双路E5的16C32T系统,也发现,看视频时,只满载一颗CPU,另一颗打酱油。
引用 zwccwz 2017-8-10 21:47
看样子目前还是不完善,仍有bug。
引用 ydjj 2017-8-10 21:48
royalk 发表于 2017-8-10 21:22
渲染没问题,编解码打不过,但我总觉得编解码的优化还不到位,不知道是BIOS问题还是系统问题。
...

渲染算了下也有问题
比如blender那个
16核4G vs 10核4.6G
换算下来,核心x频率增加了39%,但成绩只是好了13.35%……
引用 royalk 2017-8-10 21:53
ydjj 发表于 2017-8-10 21:48
渲染算了下也有问题
比如blender那个
16核4G vs 10核4.6G

blender那个十几秒就完了,估计线程draw call耗时占比例过大,如果跑时间长一点的这个差距应该会趋于正常。
引用 qsmcomp 2017-8-10 22:00
能不能来一发Linux测试?
另外我的锐龙7 1700遇到了生产时的缓存缺陷,已经在RMA步骤了。
引用 donnyng 2017-8-10 22:51
我觉得“carrier frame”字面是(承载)托(框)架;操作意义上是,安装cpu时用到的,承载cpu的框架。
引用 xyj1232007 2017-8-10 23:18
最后那张图……脸盆U
引用 aibo 2017-8-10 23:19
本帖最后由 aibo 于 2017-8-11 00:03 编辑

这次的线程撕裂者就是2个节点的NUMA。
正常模式的延迟是惨不忍睹的,特别是内存频率低的时候。
开NUMA的local模式的话,游戏方面就类似ryzen了。不过这时候多核心的优势就会缩小很多。

anandtech的评测很明显的反应了这个特征。

另外,legacy模式是关掉HT,不是关掉一个die
引用 lovelesski 2017-8-10 23:24
家用估计用不上了,土豪上。
引用 ydjj 2017-8-10 23:26
royalk 发表于 2017-8-10 21:53
blender那个十几秒就完了,估计线程draw call耗时占比例过大,如果跑时间长一点的这个差距应该会趋于正常 ...


仔细拜读了全文后
我觉得12核的7920x只要能超到个4.3~4.5G,打1950x一点都不虚
引用 沙沙 2017-8-10 23:58
做这么大,过几年测评CPU将变成体力活?
引用 haomingci3 2017-8-11 07:06
本帖最后由 haomingci3 于 2017-8-11 07:12 编辑

建议之后的测试里面加入R15能耗比对比,现在很多评测有个问题,贴AVX2甚至是AVX512的功耗,但是测试里面没有AVX2和AVX512应用,或是只提及一个,让人误以为测试得到的功耗是全部或者多数测试项目的运行功耗。
R15是纯SSE应用,也刚好符合了一些AVX无用党的胃口,并且实际上有AVX offset这种设定,按照xeon的玩法,用的到AVX2/AVX512的时候使用低频即可获得超越高频SSE/AVX1的性能。
根据一些有R15能耗比和其他一些区分指令集的测试看,R15(SSE浮点)同频同核数是KBL占优,AVX1是ryzen占优,AVX2是KBL占优。比较理想的测试是SSE,AVX1,AVX2,AVX512找到分别的典型应用测试分数和功耗进行对应。
本人拙见,仅供参考
引用 xiaokey 2017-8-11 07:28
AMD Ryzen ThreadRipper 1950X与技嘉X399 AORUS Gaming 7评测
多媒体处理与创作类软件效能测试
Blender 2.78c“ Ryzen TR 1950X也是核心多干活快,默频就已经超过了7950X的4.6G成绩。”
是不是写错了
没有用7950X啊 是7900X
我不是找茬的 我是提醒你一下
最后感谢R大一直带着我们玩超频
引用 gandlf 2017-8-11 09:56
r7内存难超,tr内存超频能力如何?和i9比上3600mhz难度大吗?
引用 techneek 2017-8-11 10:07
胶水16核啊,万能的胶水再现江湖

查看全部评论(84)

热门评论
    热门评论
      返回顶部