PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

推土机Bulldozer入手前瞻及平台构建

  [复制链接]
跳转到指定楼层
1#
lk111wlq 发表于 2011-10-10 00:09 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:19961|回复数:55
本帖最后由 lk111wlq 于 2011-10-10 09:56 编辑

AMD新一代桌面级高性能处理器——推土机(Bulldozer)经历了多次跳票和许多的猜测、传闻后,最终确定于美国时间10月12日正式发布。而经过这段时间陆续传出的消息,我们已经对它有了初步的了解,因此写下这篇文章作为大家入手推土机平台的一个借鉴。

由于本人手中没有推土机处理器与相应的主板,所得信息皆为网上搜集,如有错漏之处,欢迎各位指正。

本文出自www.pceva.com.cn,转载敬请注明出处。

目录:

Bulldozer理论部分
FX系列规格、市场定位
FX系列超频相关
FX系列主板部分
总结



资讯站http://www.pceva.com.cn/html/2011/cputech_1010/301.html

评分

参与人数 5活跃度 +302 收起 理由
overthink + 50 精品文章
f1koaa + 2 感谢您提供了怎么全面的资料
无心飘落 + 100 精品文章
royalk + 100
jasu30 + 50 精品文章

查看全部评分

2#
lk111wlq  楼主| 发表于 2011-10-10 00:09 | 只看该作者

Bulldozer理论部分

本帖最后由 lk111wlq 于 2011-10-10 00:59 编辑

自K10时代,AMD的创新几乎是停滞不前,通过不断地改进K10架构支撑了这么多年,至今才见到全新设计的处理器架构,那就是Bulldozer架构、核心代号为Zembezi,并用FX系列替代原有的Phenom/Athlon品牌,家族编号为15h,也就是K15架构。关于Bulldozer的理论知识我并不想说太多,此前AMD在computex 2011与22届Hot Chips及各类场合均对此进行过解说,故在此仅节选部分进行说明,有兴趣的可以自行深入。

CPU架构部分


Bulldozer Die Shot

全规格的桌面级产品中,拥有四个Bulldozer模块(八核心),每个模块拥有独立的2MB二级缓存,以及共享的8MB三级缓存、四条HyperTransport3.1总线、双通道72bit的DDR3内存控制器、I/O输入输出。六核心(三模块)和四核心(双模块)型号都是对全规格的部分模块和二级缓存进行屏蔽得来的,其他规格全部相同。

模块化概念与性能


单个模块Module示意图

对于模块化设计,大概有两种看法:

1)八核心八线程:每个“核心”包含:一个整数计算单元,与模块内另一“核心”共享的前端部分(Fetch、Decode等)、64KB的一级缓存、浮点计算单元、以及2MB的二级缓存
2)四核心八线程:每个“核心”包含:二个整数计算单元,前端部分(Fetch、Decode等)、64KB的一级缓存、浮点计算单元、以及2MB的二级缓存

上述两种看法并没有绝对的对错,但要说的是,如果按照八核心的看法,人们很容易拿过去K10的架构规格来对比,而按照这种思路,推土机的“单核心”规格相比Phenom II是有所缩减的,每个整数运算单元减少了一个ALU(Arithmetic Logic Unit,算术逻辑单元),而整数运算单元中总共就三个ALU单元,因而单线程性能表现的比K10还要差,这是大多数人不乐意看到,也较难接受的,之前网上对推土机IPC(Instruction per Cycle)下降的争论就是围绕这点展开,AMD官方曾经说过推土机的IPC是有提升的,但是结合现在泄露出来的测试数据来看,推土机IPC下降确实已经成为事实。
如果按照四核心八线程的看法,由于Bulldozer架构模块化设计的性能发挥需要相应的优化(操作系统、软件、游戏引擎等),目前的表现并不尽人意,与Phenom II物理六核心的默认性能较为接近,甚至部分项目有所不如。

AMD官方宣传的说法是八核心处理器,但根据bulldozer的物理规格和实际表现,我们更倾向于能够实现八线程运算的物理四核心处理器这种看法,而为了照顾普通的用户,后文两种说法都有使用。

新的特点

Bulldozer处理器采用AM3+接口,同时AM3+插槽的9系列主板向下兼容AM3的Athlon II/Phenom II处理器,而采用AM3插槽的部分8系/7系主板也可通过刷新BIOS,但并未从AMD官方得到确认,详情见后文。

Bulldozer处理器将支持更低的内存电压以及更高的默认频率,并且Bulldozer处理器的内存控制器(IMC)性能比K10有较大的提升。但是,默认支持1866MHz的内存频率,对应的内存读/写/复制性能却没有提高太多,反映出内存效率并没有获得较大的提升,CPU-NB仍将成为AMD平台内存性能的瓶颈。

新的节能技术Core C6 State:模块内的两个核心全部空闲时,可通过Power Gating关掉Core VSS,从而彻底关闭核心;恢复时则重新载入关闭前的状态,但是会不会跟CNQ初期一样因响应速度慢而影响性能,有待考证。

Turbo Core 2.0:这里借一张图来说明

Turbo Core 2.0在原有半数核心频率提升模式(Max Turbo Boost)的基础上增加了提升所有核心频率的新模式(All Core Boost)。与Thuban相同,Turbo Core在激活时VID提升的现象仍可能存在,且关闭Turbo Core时,部分主板VID发生变化导致Offset电压跟着变化,因此要特别注意超频时的电压设定。同时,超过一定的功耗/温度时,Turbo Core2.0将失效,恢复为默认频率,若温度继续升高则启动过热降频功能。所有FX系列处理器皆支持Turbo Core2.0,以首批发布中的FX-8150型号为例,默认主频为3.6GHz,最大Turbo频率为4.2G(双模块4核心),主频提升600MHz,将获得小幅度的性能提升。

所有的FX系列处理器都不锁倍频,具有较大的超频潜力和可玩性。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
3#
lk111wlq  楼主| 发表于 2011-10-10 00:09 | 只看该作者

FX系列规格、市场定位

本帖最后由 lk111wlq 于 2011-10-10 01:00 编辑



首批发布的FX系列处理器分别有8核心、6核心、4核心三种规格,均拥有8MB的L3缓存,全部不锁倍频,TDP分为125W/95W。其中最高型号FX-8150,默认主频达3.6G,仅比X4 980BE的3.7G低100MHz,且通过Turbo Core可将半数核心提高至4.2GHz的频率,但IPC下降的情况下,单线程性能与3.6G左右的K10相当。

价格上,目前已知FX-8150的价格约为245美元/1562人民币,最低的FX-4100也要175美元/1116人民币左右,在国内上市初期,千元以上是肯定的了。

FX系列处理器均采用32nm SOI工艺制造,前不久的消息显示,因芯片代工合作伙伴GlobalFoundries德国工厂的生产良率、增产、制造问题,32nm的Llano处理器供货量无法保证,而Llano的良品率问题主要来自CPU与GPU分别使用SOI和Bulk-CMOS之间的通讯问题导致的,推土机由于全是SOI工艺,可能情况反而会好点。


CPU编号解读



推土机实物OPN编号

FD8150FRW8KGU
FA1  1136EPM
F153423110011

第一行:如下图所示


第二行:FA为核心类型,代表推土机,Llano为DA,Zacate为EA;1可能是指代第一代推土机,第二代推土机估计为2,早期的没有这项数字编号,但有待确认;1136为周期,11年第36周;最后三位仍为流水线代号,没有太大意义。

第三行仍旧为CPU的识别码,与盒子上的条码相同,作为保修的凭据。

开核的可能性


Bulldozer结构框图

Bulldozer在全规格的基础上通过屏蔽手段得到6核心和4核心处理器,因此有两种情况:如果被屏蔽的模块属于硬性屏蔽,例如将相应的模块进行物理报废,那么该模块不存在“开核”可能;如果被屏蔽的模块属于非硬性屏蔽(BIOS层限制),那么与SB750上的ACC能开核一样,该模块存在“开核”的可能。这2年流行的开核事件AMD并未作出表态,但相当于默许,而如今的推土机是否能延续开核的“性价比”路线,还要看AMD和各主板厂商的情况了。

Bulldozer平台市场定位


从上图可知,Bulldozer取代Phenom II成为新一代的发烧级、高性能桌面平台,那么,推土机较适用于哪些人?
前文说过,推土机是以模块化为设计理念:如果数整数运算单元,有八个,如果数浮点计算单元,那么只有四个(桌面级)。L2、L3缓存增大,其余部分没有大的变化。而按照推土机官方的说法,在浮点计算性能足够的情况下,增加的一个整数运算单元能有效提升处理器的整体运算能力,但这种设计需要系统、软件作出相应的优化。而此前有部分使用者反映,推土机的媒体运算能力显著,但在游戏中的表现较差,想必是因为线程的利用效率问题导致的。当然,我们并不想过早地给它下结论,因此有相关需求(媒体运算)的用户可以关注推土机的实际表现。
价格上,首批发布的最低型号FX-4100也要千元以上,再加上较高功耗对主板的需求,Bulldozer平台的整机预算将在5000元左右。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
4#
lk111wlq  楼主| 发表于 2011-10-10 00:09 | 只看该作者

FX系列超频相关

本帖最后由 lk111wlq 于 2011-10-10 09:55 编辑

1)FX系列处理器的超频与Athlon II/Phenom II没有太大的变化,与Thuban核心的黑盒产品相似,调节项目同样为CPU电压、NB电压、CPU-NB(IMC)电压、内存电压和外频、CPU倍频、CPU-NB倍频、内存分频,且主板孔距、扣具与AM3通用;
2)CPU倍频与CPU-NB倍频均开放调节,FX-8150的倍频可达31,基于200MHz的外频,可以说风冷超频只需加CPU电压、无脑拉倍频即可,CPU-NB倍频、内存分频也是同样的方法。

然后来看看首批发布的顶级型号FX-8150的超频潜力:


推土机的超频思路与此前的黑盒产品相同,即超外频与超倍频两种,通过不同的组合方式可以达到十分多样化的CPU、CPU-NB、内存设定



外频联动CPU、CPU-NB、内存频率,超外频时请注意相应的倍频、分频设置,图中红色数值部分仅供参考,请根据CPU体质来设置,切勿照搬。超频及排除故障的时候,也可以按以下的思路分三大步走:外频/倍频->CPU-NB倍频->内存分频。

超频相关:
1)由于官方HT3.1版本为3200MHz(6400MT/s),因此CPU-NB>=HT>DRAM可能不再适用,不过目前主板均为HT3.0(默认2000MHz,最大13倍频即2600MHz),这点有待确认;
2)CPU-NB频率默认为2000MHz,默电超频至2600MHz左右没有悬念,极限频率则有待确认;
3)FX系列处理器的内存控制器有可能与Llano相同,故支持内存频率较高,默认1866MHz不是问题,甚至有2400MHz的成绩出现;
4)内存分频可能有2400(1:1.8)选项,详情视主板而定;
5)超频时务必关闭Turbo Core功能
6)节能项目CC6与C1E、CnQ的具体情形未知,K10STAT在基于K10架构的Llano上能够使用,15h的Bulldozer架构理论上不再适用,而出自AMD的PSCheck 1.34版本确定可以对FX系列处理器进行实时vid、CPU倍频调节。
7)CPU功耗与主板供电需求:随着频率和电压的提升,推土机的功耗也在增加,对主板的供电需求也提高不少。根据部分测试的数据来看,默认情况下的FX-8150满载功耗十分接近TDP的125W,而加压至1.475v后超频至4.8GHz的FX-8150,仅仅是进行Cinebench R11.5的测试时,CPU功耗就达到了268W。因此特别提醒,要进行大幅度的超频,一张好的主板是必不可少的,如果在主板上省钱的同时又企图超频,会有烧主板的危险!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
5#
lk111wlq  楼主| 发表于 2011-10-10 00:11 | 只看该作者

FX系列主板部分

本帖最后由 lk111wlq 于 2011-10-10 09:52 编辑

前面说过,AM3+(Socket 942)接口的FX系列处理器配备的主板为9系列芯片组——9xx的北桥芯片和SB950南桥芯片。

我们先来看看主要的9系、8系、7系芯片组之间的区别

北桥芯片规格对比

资料参考http://en.wikipedia.org/wiki/Comparison_of_AMD_chipsets

主要特点汇总如下:

1)最大的变化是HyperTransport升级为3.1版本,带宽可达6.4GT/s,但是,目前各大主板厂商的990FX芯片组最高型号主板均只支持HT3.0
2)全面支持IOMMU (Input/Output Memory Management Unit),一种用于虚拟机领域的硬件加速技术,与Intel芯片组的VT-d类似
3)9系列芯片组均无集成显卡,故9系列主板将不再配备DVI/VGA/HDMI接口
4)9系列芯片组获得NVIDIA的SLI授权
5)南桥原生6 x 6 Gbps,基本与SB850相同(SB850之前型号均无原生SATA 6 Gbps)
6)SB950支持RAID 0, 1, 10,5,最新的AHCI驱动已支持固态硬盘修剪(TRIM)指令

从上面可以看出,9系芯片组规格与890FX最相近,TDP也相同,分别为18W、6W。


主板AM3/AM3+插槽部分


AM3插槽示意图


AM3+插槽实物图

仔细观察会发现,两者只有“25”处不同,AM3+比AM3多了一个孔位

早在4月份,就有人曝推土机CPU针脚的实物图

上图右下角空缺位,对应AM3插槽示意图上“25”位置。如果上述针脚图片属实,那么AM3插槽是能够插上AM3+的CPU的,但AM3/AM3+插槽的区别还不仅于此。



包括上图在内,一共有6张图片表明,AM3+插槽在孔位大小、电压频率/功率损耗、电流大小/噪音、原装扣具都与AM3有所不同,因此AM3的插槽无法支持AM3+的FX系列Bulldozer架构的处理器是可以理解的,也解释了各大厂商采用原有8系芯片组但更换AM3+插槽新主板的举动。但与AMD官方说法相悖的是,各大厂商的部分AM3主板也提供了AM3+处理器支持。

以技嘉的顶级890FX+SB850主板GA-890FXA-UD7为例,它采用AM3插槽,但在特性中明确表明了对AM3+处理器的支持,甚至连部分880G、870、760G主板也提供了AM3+支持,支持方式均为刷新BIOS。




然后我们再注意一下对应的990FX+SB950的顶级型号




对比两者的BIOS部分会发现,GA-890FXA-UD7最新BIOS的发布日期为2011/7/28,而GA-990FXA-UD7自2011年5月24日的F2开始,目前最新的版本已经是F6E,发布日期为2011/10/06, BIOS更新显得十分频繁。其中最主要是AGESA版本(AMD支持64位操作系统的处理器的程序库)的更新,而在9系列芯片组主板上使用较早版本BIOS的同时使用64位操作系统,有发现部分测试成绩异常的情况,32位操作系统是否有同样问题还未确定。其他8系列/7系列的AM3插槽主板也是类似的情形,最新版本的BIOS要落后于对应9系列主板的BIOS,因而实际的支持情况来说,并不乐观。

FX系列处理器主板的选购汇总为以下几点:

1)9系列芯片组可以获得最完整FX处理器支持,各大厂商的BIOS更新进度有所不同,且是价格略贵;
2)8系列芯片组各大厂商均有8系芯片组配合AM3+插槽的主板,以新型号或新版本的形式出现,价格上与同芯片组的AM3主板相差不大,但BIOS更新进度较缓慢;而AM3插槽的主板,FX系列处理器的实际支持情况未知,且BIOS更新比AM3+主板还要更缓慢;
3)7系列芯片组AM3+插槽的主板还是有望获得FX处理器支持的,而AM3插槽的主板,
想要获得FX系列处理器的支持,还要视相关主板厂商的态度,毕竟芯片组过于老旧,且大部分主板无法满足推土机超频的供电需求。

总的来说就是:如果以AMD的Bulldozer平台为/选购升级目标,请尽量购买9系列芯片组主板,预算有限的话才考虑相应的8系列/7系列AM3+主板,不推荐AM3插槽的主板使用FX系列处理器。而无论选择什么主板,都请刷新最新的BIOS以支持FX系列处理器。


对各平台的影响

对X58平台:作为上一代高性能平台的X58芯片组,上一代的I7系列处理器虽然功耗大,但在性能上仍保持着较高水平,且经过漫长的市场更迭,相关产品的价格已经有所降低,加上三通道内存的支持,X58平台综合性价比其实并不输给Bulldozer。而X58平台的劣势在于,主板大多数为工包、二手、库存,比较难买,且南桥与周边芯片规格也比较老旧。

对SNB-E平台:X79平台与Bulldozer平台的主要用户与芯片组规格都比较接近,且以多线程应用为主,而根据目前情况来看,SNB-E在性能上领先FX系列处理器已经毫无疑问,但相对的,构建SNB-E平台的花费也较为昂贵,属于追求极致性能、资金充足的用户,而此类用户在FX系列处理器的对象中占了不小的比例,因此会受到其影响。

对Sandy Bridge平台:从官方的宣传来看,FX-8150定位于2600K与2500K之间,从性能上来说较为接近,价格上也持续了一贯的性价比路线,最高型号8150价格约1600人民币,与2500K相当,但最低型号的FX4100也要上千元,各型号间差价并不大,产品分布显得有些集中。但是,SNB平台仅有2个SATA3,无法双16x交火,且大部分CPU无法超频,加上FX系列处理器突出的媒体处理能力,在部分应用上推土机还是具有较大的竞争力。

对Phenom II平台:Phenom x6无论是默认还是超频,性能都不输于FX-81xx多少,x6甚至能够在部分项目中超过它,纯粹的高频率在IPC降低的情况下并没有带来太大实际上的提升;推土机的四核双线程在媒体运算及相关能力上有所提升,但只对有相应需求的用户吸引力较大,对一般的家用用户来说,两者差别并不大,而且推土机由于上市初期,平台构建上的花费要高于即将退出市场的Phenom II系列。当然,为了享受最新的高性能处理器而搭建平台的玩家,在性能满足要求、预算充足的情况下,FX系列处理器的确值得入手一玩。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
6#
lk111wlq  楼主| 发表于 2011-10-10 00:16 | 只看该作者

总结

本帖最后由 lk111wlq 于 2011-10-10 00:46 编辑

与K10相同/相近的地方:芯片组规格、CPU-NB性能、功耗要求、超频思路
与K10不同的地方:单模块双线程、32nm新制程、单线程性能降低、支持1866内存分频、新的节能技术Core C6 State、Turbo Core 2.0

推土机是AMD自八年前的K8以来,对处理器架构的最大改革,且仍有开发的潜力。但由于目前的操作系统、软件程序、游戏等还来不及跟进、作出相应的优化,使得目前FX系列处理器的性能表现不尽人意,加上受人们观念中核心数定义的影响,以及全新的模块化设计导致的线程利用问题,需要我们更多的耐心去等待它的完善。同时,AMD也要加强在软件、游戏方面的公关,以尽快提供相关的优化。
7#
ABC毒药 发表于 2011-10-10 01:03 | 只看该作者
表示最大倍频47的BLACK秒杀他31。。
我更期待990FX板子。。
另外想确定一点。。990FX是可以拆分4X8的把
8#
lk111wlq  楼主| 发表于 2011-10-10 01:06 | 只看该作者
回复 7# ABC毒药


   是的,芯片组那里的x8 quad就是4x8,可以CF或SLI哦
9#
wsy2220 发表于 2011-10-10 01:12 | 只看该作者
分析得很好,等着低价收6核PHENON II
10#
batlv4 发表于 2011-10-10 01:15 | 只看该作者
本帖最后由 batlv4 于 2011-10-10 01:18 编辑

等着用推土机架构的APU,推土机就算了,刚为了超,买了一块Z68,唉,推土机啊,等你那么久了,还是让我那么不尽兴,唉!喜欢你的模块化架构,可惜现在的软件,无语了!用推土机架构的APU了!
11#
fanlei501 发表于 2011-10-10 01:25 | 只看该作者
好文

认真拜读了一遍
12#
135tt 发表于 2011-10-10 01:35 | 只看该作者
某版的文章不错。拜读了 ,加油
13#
鼠标仔 发表于 2011-10-10 01:36 | 只看该作者
回复,等明天慢慢品读~
14#
ABC毒药 发表于 2011-10-10 01:47 | 只看该作者
回复 8# lk111wlq


   也就只对这个感点兴趣了- -。
15#
风林火山 发表于 2011-10-10 03:28 | 只看该作者
对Phenom II平台:Phenom x6无论是默认还是超频,性能都不输于FX-81xx多少,x6甚至能够在部分项目中超过它,纯粹的高频率在IPC降低的情况下并没有带来太大实际上的提升;推土机的四核双线程在媒体运算及相关能力上有所提升,但只对有相应需求的用户吸引力较大,对一般的家用用户来说,两者差别并不大,而且推土机由于上市初期,平台构建上的花费要高于即将退出市场的Phenom II系列。当然,为了享受最新的高性能处理器而搭建平台的玩家,在性能满足要求、预算充足的情况下,FX系列处理器的确值得入手一玩。

````````````````````````为什么AMD不出 32MN的六核啊·············
16#
ABC毒药 发表于 2011-10-10 03:38 | 只看该作者
回复 15# 风林火山


   FX6100不就是么。。
17#
karl.12 发表于 2011-10-10 08:57 | 只看该作者
推土机上市最大的价值就是让老速龙退市抄底
18#
solonace 发表于 2011-10-10 09:39 | 只看该作者
电源厂商又高兴了,CPU和显卡的功耗依然居高不下
19#
royalk 发表于 2011-10-10 09:40 | 只看该作者
对推土机来说,IPC下降还有补救机会,这功耗我看是没救了
JF说的8核/IPC提升是互相矛盾的,只能取其一
20#
zerozhong 发表于 2011-10-10 09:44 | 只看该作者
PII X4表示后继者仍需努力啊
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部