- 内容展现
- 最新评论
Kepler架构火力全开 NVIDIA GeForce GTX TITAN评测
在去年下半年,GK110核心一直只以Tesla K20X/K20的专业计算卡身份出现,而如今,它已正式被用于民用级别。NVIDIA在2013年2月19日发布了GeForce GTX TITAN,就是采用GK110核心的Kepler旗舰级显卡。 ... ...
Kepler GK110核心架构简介
首先是核心照: GK110核心同样是台积电28nm工艺制造,核心面积达到了550平方毫米左右,几乎是GK104核心的两倍,晶体管数目也比GK104核心翻了一倍,达到71亿,这在GPU核心上还是史无前例的。再来看看架构图: GPC GK110共有5个GPC,每个GPC包含3组SMX和一个Raster引擎,这一点也可以从核心照中的分块反映出来。而GK104则是4个GPC,每个GPC包含两组SMX和一个Raster引擎。因此GK110并不能完全等同于GK104增加GPC或者增加SMX,它们之间的配比还是有改变的。 SMX GK110的SMX结构和GK104大致相同,但主要计算单元设计却有较大变化。首先前端的Polymorph 2.0引擎设计和GK104相比没什么变化,纹理单元(TMU)也依然是每个SMX有16个,每个SMX也包含了64KB的L1缓存。每个SMX中包含192个CUDA核心和32个加载/存储单元(LD/ST)、32个特殊功能单元(SFU)这些也都和GK104一样。不同的是,GK110每个SMX中还加入了64个双精度浮点单元(DP Unit),以及48KB的只读数据缓存,这些增加的部分都是为了提升双精度浮点计算能力。因此,Tesla K20X的双精度浮点计算能力可达1.31TFlops,是单精度浮点计算能力的1/3,GeForce GTX TITAN因为核心频率的关系还可能会再高一些。而GK104每个SMX里只有8个FP64 CUDA计算核心,所以它的双精度浮点计算能力仅有单精度浮点的1/24,大约为131.8GFlops,仅为GK110的1/10和GF110的1/5,这也是我们说GK104主要是游戏显卡而不适合做计算显卡的原因。 不过无论是Tesla K20X也好还是GeForce GTX TITAN也好,NVIDIA都屏蔽了一组SMX,只留下14组SMX,对应2688个CUDA单元。至于原因,无论是为了控制良品率、控制功耗还是其它什么别的设计需求,都仅限于各家之言,NVIDIA都没有就此给出官方说明。 后端 除此之外GK110核心还包含了6个64bit的显存控制器,以及对应的6组ROP,每组8个,和1.5MB的L2缓存,这些都是GK104的1.5倍,只是增加了规模,结构并无明显变化。 |
本文版权归 PCEVA,PC绝对领域,探寻真正的电脑知识 原作者所有 转载请注明出处
发表评论
最新评论
- 引用 wsy2220
- 本帖最后由 wsy2220 于 2013-3-4 21:22 编辑
太贵了啊....
3年以后如果降到可以承受的价位再弄一块试试
PS.r总什么时候玩上big bang了啊,出个评测呗
- 引用 zhubo88597171
- 前排看来是占不上了,好贴必须要顶起
- 引用 hyenax1950xtx
- 没得测到泰坦
热门评论
热门评论