PCEVA,PC绝对领域,探寻真正的电脑知识
  • 内容展现
  • 最新评论
一张主板两个架构 Intel Core i9 7900X与Core i7 7740X评测
2017-7-11 17:19| 发布者: royalk| 查看: 70953| 评论: 114|原作者: royalk
摘要: 今年年初AMD发布的Ryzen处理器,正式掀起“核战争”,可谓是打破了处理器市场多年来Intel一家独大的局面,同时也让Intel的产品计划有了一定调整。在2017年Computex上,Intel发布了新的至尊平台X299主板和Core-X系列 ...
Skylake-SP架构细节



核心设计:环路变网格
从已经公布的Skylake-SP的Die Shot来看,这次Intel是把两个Die推向桌面产品,其中12核至18核使用HCC Die,而6至10核的使用LCC Die。另外还有28核的Xeon使用XCC Die。叫法和之前有些不一样,但Skylake-SP仍然是3个Die。

这次Intel放弃了Ring总线,而改用类似Knights Landing架构Xeon Phi上使用的Mesh网格总线,大幅降低核心之间的通讯延迟。因此,Skylake-SP的核心的设计也有所改变,以18核的HCC Die为例,我们可以看出一个5x4的网格状结构,其中18个格子是核心,除了第一排和最后一排左数第二个格子,可以看到和其它有些不一样的,是内存控制器,看起来像是一边3个,所以Skylake-SP最高是支持6通道的内存,而桌面级Skylake-X屏蔽了两个。而PCIE、IO及其它东西都在边缘。以此类推,LCC Die就是一个4x3的Mesh,10核心加上2个MC,而XCC则是6x5的Mesh,28核心加上2个MC。

每个核心、MC、PCIE、IO等设备都作为一个节点,Mesh总线把每个节点互相连接成一个网格状。这样一来在核心越来越多的今天,隔得最远的两个核心想要通讯,可以有多条路走,而不像ring总线那样需要排队,甚至像之前那样在MCC、HCC Die还需要多条Ring总线来交接。简单举个例子,在Xeon E5v4上,如果你想让Core 1和Core 10通讯,那么走Ring总线你可能要经过Core 2至Core 9,核心越多会让Ring总线越长,路过的核心越多,造成越来越高的延迟,而Mesh就不一样,它可以跳过一些核心,哪怕是对角线上的两个核心互访,那么最多也就是横竖各一跳就可以到达。

缓存的改动:L2变大,L3变性
Skylake-X核心的L2和L3缓存做了较大的改动。L2缓存,从第一代Core i7开始就是256KB每核心,一直沿用到Kabylake,这次Skylake-X增加到1MB每核心,更大的L2缓存固然会增加命中率,但同时也会加大延迟,这次Skylake-X这1MB的L2缓存,Intel给出的延迟大概是不超过13个周期,而之前256KB的L2设计是11个周期。经过测试,L2缓存大了四倍对普通测试项目的IPC提升并无太大帮助,这样的设计有可能是为了满足AVX512指令的运算需求。

L3缓存从以前的每核心2.5MB变成了现在的每核心1.375MB,形式也变成了排除式缓存。一方面是由于L2缓存的增加,L3缓存做成包含式已经没多大意义,反而要被灌入大量的重复数据,因此做成排除式缓存是明智之举,另一方面是MESH架构的采用,L3无法再像之前那样挂在Ring总线上,因此作为排除式缓存的存在,其角色其实更像是Intel在一些嵌入式封装处理器上所使用的eDRAM。L3排除式缓存就是用来放L2洗出来的数据,在缓存中数据利用率小的时候,L3缓存利用率比较多,如果CPU一直在做重复工作,那么数据就一直在L2中,L3就闲置了。Ryzen有512KB的L2缓存,因此L3缓存也是做排除式的。

AVX-512指令集:可能要摊上大事了……
AVX-512指令集早在Larrabee时代就已经提出,早些时候已经在Xeon Phi X200系列上使用。Skylake-X终于在桌面级平台正式加入了Intel酝酿已久的AVX-512指令集,AVX-512指令集可以让处理器每周期计算512bit位宽的浮点数。Skylake-SP处理器可以通过复用两个256bit AVX单元来实现AVX-512的运算。

但即便都是Skylake-X,Intel这次在AVX-512指令集的支持上也做了区分。在Skylake架构CPU每个核心内部,前端调度器上的0,1端口是具备256bit AVX单元的,而5端口根据目前得到的消息来看,是具备一个512bit的AVX计算单元,也就是这些端口可以运行AVX指令。而AVX-512的实现方式,可以是复用0,1两个端口同时计算256bit的AVX,也可以是用5端口的AVX单元。虽然Intel目前没有正面表态,但有可靠消息称,Intel屏蔽了Skylake-X八核心与六核心处理器上5端口的512bit AVX功能,只留下0和1端口的两个256bit AVX单元。

也就是说,现阶段只有Core i9 7900X处理器每个核心中有完整的两组512bit AVX单元,而Core i7 7820X、Core i7 7800X只有一组两个256bit AVX单元,这与Kabylake/Skylake/Haswell是一样的规格,区别只是前者可以把这两个单元合并起来执行AVX-512,但理论计算位宽还是和Kabylake在一个级别,而只有Core i9 7900X的两组AVX单元才会实现翻倍的理论算力。或许这也是Intel引入Core i9命名并把6核、8核命名成Core i7的原因。类似的,Ryzen通过复用两个128bit的AVX单元实现AVX2.0(256bit),理论算力是Haswell的一半,和Ivy Bridge一个水平。

但是话说回来,理论算力和实际软件效能是两码事,Core i9的两组512bit AVX单元,需要通过软件的优化才能发挥出凌驾于Core i7之上的功效,而Core i7 7820X、7800X虽然算力和Kabylake一样,但反馈到实际软件性能上,实际上在CPU内部就已经做好了“优化”,在支持AVX-512的软件上执行效率比Kabylake会更快。

现阶段AVX-512主要是为大规模的计算应用服务,Intel也一直想要在SIMD并行计算上和GPU叫板,所以在Xeon Phi上寄予厚望,这次居然把两组512bit AVX单元下放到Core i9,比较令人意外。然而民用软件普及AVX-512还需要时间,并且现阶段AVX-512的支持程度并非完整版本,所以可以说Core i9的AVX-512虽然下放到民用产品上,但对用户来讲在未来一段时间内用到的概率还不大,并且几乎可以肯定Intel下一代产品AVX-512的效率还会再次得到提升,因此这一代的Core i9对于AVX-512来讲只是一个过渡。另一方面,CPU片上AVX单元的晶体管密度相当大,所以两组AVX单元在负载时功耗和发热密度会相当之大,在使用Xeon处理器的工作站和服务器平台上遵循严格的TDP限制机制,温度和功耗超出时处理器会降频,所以不会出什么问题。而民用桌面级PC,由于处理器都不锁倍频,主板BIOS可以开放解锁功耗限制,加上FIVR和硅脂的因素,Haswell时代的高温高热量历史会在Core i9上重演,AVX-512是导致目前i9-7900X烤机功耗暴涨的一个原因,也是对主板供电设计的一个巨大考验。

总体来说,现阶段AVX-512的存在对民用级市场来讲还太超前,极少有软件应用会用到,反而还会加大处理器的功耗,并且由于L3缓存改成排除式设计,AVX-512将对内存带宽的需求大幅增加。例如经过我们的测试,Core i9 7900X在默认设置下运行LinX AVX-512时最高只能运行在3.3GHz的频率,完全没有Boost的余地,并且在超频内存之后,Linpack的性能甚至比超主频收益更高。在BIOS中,主板厂商通常会留一个AVX-512倍频offset,必要的时候可以开启此项降低几个倍频,从侧面避免处理器功耗和温度超过规定值。

改进的内存控制器
在Computex 2017上,我们已经见到了风冷DDR4-4800、128GB双面DDR4-4133的内存展示,这都是Skylake-X的CPU跑出来的,由于内存控制器的进步,这次Skylake-X对高频内存的支持进一步提升,对双面内存的频率提升也有了一定帮助,只要你的内存颗粒能超,DDR4-4000很容易就可以跑上去。另外,Intel这次还专门安排了一个内存控制器PLL Trim电压,让高频内存的Training成功率增加。

其他技术
Speedshift:继续沿袭Kabylake的功能,让睿频响应速度更快。

Turbo Boost Max 3.0:简称TBM3,在Broadwell-E时代出现,处理器会选择体质最好的核心来进一步提高Turbo Boost的频率。到了Skylake-X这个功能有所增强,TBM3核心从1个变成2个。另外,6核心的Core i7 7800X不支持TBM3,而8核心、10核心的Core-X处理器,都可以使用TBM3功能让两个核心达到4.5GHz。

FIVR:Intel并没有针对Skylake-X的FIVR是去是留做出明确表态,我就此事问了主板厂商的RD,得到的反馈也是对此不知情,建议我们去问Intel,他们只按Intel给的规范设计主板。以目前的情况来看,Intel的市场策略似乎是打算在Xeon上保留FIVR,以应对未来越来越复杂的CPU内部设计,只是在Skylake、Kabylake和以后的Coffeelake这些相对比较简单的LGA1151接口CPU上去掉FIVR,就主板BIOS情况来看也印证了这一点。FIVR同样会加大CPU的功耗和温度,影响CPU的超频,但好处是面对Core i9的巨大功耗,FIVR输出1.8V的电压,可以在一定程度上减少主板供电的压力。在这里也提醒大家,在更换Skylake-X和Kabylake-X的CPU时,在不确定主板BIOS会重新识别新CPU之前,一定要清空CMOS,否则很可能1.8V的FIVR输出电压会直接加在Kabylake-X处理器上,导致处理器损坏。

VROC:即是Virtual RAID on CPU。这代CPU还支持直出的PCIE RAID功能,终于可以正大光明的把3个NVMe固态硬盘挂在CPU上做硬RAID0了。因此这也催生了一种新的附件——PCIE转多M.2插槽的转接卡。但,目前VROC只支持Intel的SSD,希望以后有大神可以破解支持所有的SSD。


收藏 邀请
0
本文版权归 PCEVA,PC绝对领域,探寻真正的电脑知识 原作者所有 转载请注明出处
发表评论

最新评论

引用 gtx9 2017-7-11 18:14
本帖最后由 gtx9 于 2017-7-11 18:53 编辑

除了AVX512功耗和初期主板问题,基本完美

Ryzen ThreadRipper应该和Ryzen一样4G到头了,只能默认下打打14核和16核的skylake-x,7980XE是摸不到的(不考虑功耗)

不知道Ryzen ThreadRipper4通道内存会不会有些加成?


引用 slymitec 2017-7-11 18:19
坐等10nm 8~10核4.5GHz(轻度超频也行) 6~8通道内存和PCI-E 4.0
引用 haomingci3 2017-7-11 19:00
29.1x64已经有avx512支持了
引用 醉酒棕熊 2017-7-11 19:11
这次主板坑很大,不急的话还是再等等吧
就像当年的R4BE一样
引用 PCEX 2017-7-11 19:26
本帖最后由 PCEX 于 2017-7-11 19:33 编辑

牙膏厂500+的功耗这车上不起了,目前对性能不追求极端,ThreadRipper就够用了。
引用 gtx9 2017-7-11 19:48
PCEX 发表于 2017-7-11 19:26
牙膏厂500+的功耗这车上不起了,目前对性能不追求极端,ThreadRipper就够用了。 ...

500w是比较极端的情况了

一般很难达到的
引用 DGX 2017-7-11 21:34
gtx9 发表于 2017-7-11 18:14
除了AVX512功耗和初期主板问题,基本完美

Ryzen ThreadRipper应该和Ryzen一样4G到头了,只能默认下打打14 ...

ThreadRipper应该是台积电代工
等表现吧
引用 liot 2017-7-11 21:38
不敢超的HEDT有何意义
这次抢着早产skylake-x可以说翻车了
希望第二批板子能改进
只能等threadripper和8月后可能的钎焊HCC hedt
这次首发挺失望的
引用 PCEX 2017-7-11 21:39
本帖最后由 PCEX 于 2017-7-11 21:43 编辑
gtx9 发表于 2017-7-11 19:48
500w是比较极端的情况了

一般很难达到的

一颗i9 7900x的价格差不多可以买农企 两颗14核threadripper了吧,Ryzen几款高端CPU电压太高,农企什么时候才能完成普遍1.25V上4G。牙膏厂的玩意儿除了主板集成的网卡以外不买了。
引用 FlankerWang 2017-7-11 22:09
PCEX 发表于 2017-7-11 21:39
一颗i9 7900x的价格差不多可以买农企 两颗14核threadripper了吧,Ryzen几款高端CPU电压太高,农企什么时候 ...

你来搞笑的么?一颗i9 7900x jd价7500=两颗14核threadripper,那ryzen 1800x还卖什么
引用 haomingci3 2017-7-11 22:15
234234.png
引用 DGX 2017-7-11 22:16
FlankerWang 发表于 2017-7-11 22:09
你来搞笑的么?一颗i9 7900x jd价7500=两颗14核threadripper,那ryzen 1800x还卖什么
...


买买买
引用 龙抬头 2017-7-11 22:46
感谢R大的详细评测,看样子7900x有的玩,如果7740x体质都算不错的话,一块主板玩两块u也无所谓。另我还是等等R6 apex吧、两颗7900x,五颗7740k、还有四套极品内存,每套都可以4133c15-17,电压1.490v过测试,电源也更新到白金1000w,现在万事具备,只欠主板了!
引用 atmosphere 2017-7-11 22:54
PCEX 发表于 2017-7-11 19:26
牙膏厂500+的功耗这车上不起了,目前对性能不追求极端,ThreadRipper就够用了。 ...

不烧AVX512估计不会超过400W
引用 konglang_616 2017-7-11 23:31
我就好奇的问问,PCI-E的数量差距拉得这么大,从16至44,各大主板厂商的硬件设计师会不会很崩溃?
引用 hnxxwpf 2017-7-11 23:34
国内坛子看来还是PCEVA有底蕴,从Ryzen和7900X的评测就可以看出来
支持R大
引用 ydjj 2017-7-11 23:56
感谢R大评测
个人觉得从7920x开始才算真I9,7900X只是拿来急行军玩票的(看主板支持度就知道)
我不信7920x开卖各家主板的真旗舰X299还不上市,有本事憋到7980XE再出R6E,R6 APEX和R6E WS
引用 bhl 2017-7-12 00:12
本帖最后由 bhl 于 2017-7-12 00:14 编辑

看到这功耗和X299的各品牌主板,我是越来越觉得INTEL是被打了个措手不及,临时弄个I9来应急的了,按这些主板用料来看,我猜想原来INTEL应该没把RYZEN放在眼内,还是打算升点频率,加两个核就当是新一代来糊弄消费者了。然而没想到R7一下子就上到了8核,后面还有大鱼,再按原计划的产品就不够看了,然而新产品是不可能一下子就弄出来的,只能把原来就计划发布的高端下降一级,再用PPT发布一些原来根本就没有的高端来撑场面。我怀疑那些18核什么的,其实原来就不是在路线图中的,只是现在先画个大饼而已,可能真实产品现在都还没想好怎么刀(我倒是不信INTEL没料,只是舍不得一下挤太多牙膏而已),挤多了INTEL心疼,挤少了要是被AMD后面的暴打就闹笑话了。
引用 jerrytsao 2017-7-12 00:55
本帖最后由 jerrytsao 于 2017-7-12 00:58 编辑
bhl 发表于 2017-7-12 00:12
看到这功耗和X299的各品牌主板,我是越来越觉得INTEL是被打了个措手不及,临时弄个I9来应急的了,按这些主 ...

10C以上型号是临时做的决定是个人都看得出来, 由不得牙膏厂不承认, 本来吧7900X到顶用钎焊完事, 想想14nm+的超频能力足以放旗舰了...

不料对手掀起多核战争, 牙膏厂慌忙之下将HCC下放民用, 然后发现自己牙膏挤多了, 所以想出在LCC里换成硅脂, 这很Intel...

新U高频发热本来已经很可观, 换成硅脂是雪上加霜, 再来个AVX512凑热闹, 主板商队友们齐发现都被Intel的TDP坑了...

查看全部评论(114)

热门评论
    热门评论
      返回顶部