PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

探秘Intel SSD验证实验室

[复制链接]
跳转到指定楼层
1#
Essence 发表于 2015-7-1 12:01 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:13293|回复数:25
芯片巨头Intel的非易失性存储器解决方案集团(Non-Volatile Memory Solutions Group,以下简称NSG)位于其在美国加利福尼亚州福尔松的工业园区内。在媒体公开日上,Intel邀请一些媒体参观和了解了NSG的内部运行情况。本文编译自pcmag.com及pcper.com,内容有删节。

加利福尼亚州,福尔松,Intel在这里对其生产的各类SSD产品进行质量验证,包括消费级、企业级和数据中心应用产品,都会在此进行全面的验证工作,包括质量、可靠性、与其他硬件的兼容性以及数据完整性验证,并分析找出所有可能导致意外错误的固件缺陷。Intel对固态硬盘的验证工作包括各种不同配置、不同驱动、不同工作负载下的测试。

NSG团队在测试与验证Intel SSD产品上进行了大量工作,包括消费级的730系列、商用Pro 1500系列和数据中心级DC S3500、S3700系列都在福尔松经过了验证。

上图为Intel SSD测试设施内一名英特尔员工在为测试做准备。

Intel的验证过程覆盖范围很大,包含了各种工况不同配置下的多维度测试。上图中我们可以看到来自FlexStar的测试设备,浦科特在对自家产品的质检介绍中曾多次提到该设备,这些设备能够在可控温度下对数以百计的SSD同时进行各种预设的测试工作。我们知道写入过程温度越高,断电保存状态温度越低,越有利于数据保持,而相反低温写入高温保存则更容易导致数据出错以至于丢失,在FlexStar测试设备的帮助下可以进行各种温度条件下的验证。

为保持SSD市场领先地位,Intel非常重视品质与可靠性、兼容性验证和对掉电保护等技术的研究与开发。

Intel对SSD的验证工序在不同温度下进行(温度区间从零下65度直到零上150度),特殊测试包括了静电放电测试,甚至是使用粒子加速器模拟宇宙射线可能造成的数据出错。

上图介绍的是宇宙射线引发SSD数据错误的原理。宇宙射线时刻在轰击地球,其中包含了高能量中子,虽然会被大气层过滤掉大部分,但仍会有一部分到达地面。中子本身不带电荷,不过他能够激发原子,影响周围原子的电荷形式。如果这些现象发生在一个闪存单元或SRAM缓存当中引发比特翻转,ECC机制一般能够纠正其中的错误,但有些情况下也会造成错误,由此可能导致未被检出的用户数据静默错误甚至是固件逻辑执行故障以至于SSD挂盘和丢失写入数据等。

这些宇宙射线导致的故障并不常见(在数千台设备中可能有十亿分之一的概率),但是这仍旧会影响到作为企业级应用的主控设计。SSD主控通常使用较老的制程工艺制造,这样可以减少宇宙射线引发电荷变化的影响,此外主控固件中还可以增加额外的检查以减少比特翻转可能带来的错误操作。为了加速验证这个发生概率不高的潜在故障,Intel使用了粒子加速器。洛斯阿拉莫斯实验室的粒子加速器可以模拟数十倍强度于正常使用条件下的中子束,Intel通过反复试验来改进固件与硬件上的设计,最终达到提高SSD稳定性的目的。

对于高耐久度SSD来说,为了进行闪存耐久度测试,一般简单的写入测试需要数月以至于一年以上的时间才能将闪存磨损到可发生失效的状态。由于磨损均衡算法的存在,简单的限制写入测试LBA范围无法达到加速耐久度测试的目的。为此Intel开发出一种新的加速测试方法,通过对固件的小改动,使其仅对每个闪存边缘的一小部分存储区域(上图中红色所示)进行寻址。由于移动和封装过程导致闪存的边缘位置是最容易失效的部位,这样的加速测试能够在6周左右时间内完成闪存耐久度可靠性测试。从上图还可以看到,Intel对于企业级SSD的耐久度测试标准相比JEDEC标准更加严格,错误率也更低。

除了前边所述的各种设计开发、测试与验证工作,最终SSD还需要在各种实际硬件平台上完成兼容性测试。上边仅是Intel庞大验证中心的一部分,在这里SSD将被设定使用于各种操作系统和重负载软件应用下,软件应用将包括从VMWare ESX、Redhat到Windows Server,运行的硬件平台则有HP、Dell、IBM、联想、思科等等。

看完这些介绍之后,想必大家都已经深深体验到了Intel作为芯片巨头在产品质量验证上所做出的巨大努力。在大企业面前,小作坊厂商的开卡成功就算通过质检与之形成了鲜明的对比。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 1绝对值 +2 收起 理由
变开彡金钅冈 + 2 赞一个!

查看全部评分

2#
az6338890 发表于 2015-7-1 12:06 | 只看该作者
intel大法好...
就是国内联邦有点慢
3#
无心飘落 发表于 2015-7-1 13:17 | 只看该作者
卧槽,还以为论坛有这么好的福利不发給我们玩家去参观。。
原来是翻译文。。
4#
airushuijing 发表于 2015-7-1 15:38 | 只看该作者
intel P系列无可匹敌
王者


至于消费级大部分都中庸垃圾
这样严苛的环境竟然还出现8M门事件
匪夷所思
说其他的都是扯淡无用

评分

参与人数 4绝对值 -25 收起 理由
111alan -5 枪法拙劣
nighttob -20 字大显智商么?
iFive -2 放你一条命
risigcd123456 + 2 我很赞同

查看全部评分

5#
lacsiess 发表于 2015-7-1 16:28 | 只看该作者
我有个问题~~~这么严苛的测试怎么8M门就是解决不了呢?

评分

参与人数 2绝对值 +3 收起 理由
111alan + 1 坏一般都是8M,所以只要把8M的概率减小到别.
risigcd123456 + 2 很给力!

查看全部评分

6#
neeyuese 发表于 2015-7-1 17:19 | 只看该作者
8M只是丢映射表的一种,有些情况做下SE盘还能继续用,而别的SSD表现就是直接变砖或者无法初始化。
7#
kmt 发表于 2015-7-1 18:06 | 只看该作者
了解吼吼
8#
红色狂想 发表于 2015-7-1 18:13 | 只看该作者
工业美呀,筛选如此严谨,以后不选坑屎盾就选intel大法
9#
yukari 发表于 2015-7-1 18:20 | 只看该作者
neeyuese 发表于 2015-7-1 17:19
8M只是丢映射表的一种,有些情况做下SE盘还能继续用,而别的SSD表现就是直接变砖或者无法初始化。
...

就是說intel 8M概率和其他牌變磚概率一樣?

10#
cssniper 发表于 2015-7-1 18:38 | 只看该作者
我能进去装一麻袋吗!
11#
nighttob 发表于 2015-7-1 18:59 | 只看该作者
yukari 发表于 2015-7-1 18:20
就是說intel 8M概率和其他牌變磚概率一樣?

8M是故障结果,代表这块盘还能通电,但是坏了
就跟别的盘死了是一个效果
12#
PCfoxstep 发表于 2015-7-1 19:14 | 只看该作者
谢谢分享,8M的确是intel的一个令人遗憾的瑕疵
13#
OstCollector 发表于 2015-7-2 00:13 | 只看该作者
Intel 干脆还是掉盘吧
如果8M能给出更详细的原因也行
比如ECC失败,电气故障
就一个8M很容易让人认为是固件bug的

话说,这里的ECC只保护RAM么(flash必然有),那么ALU和reg之类的咋办?因为有活动电流,所以这种干扰会小很多?
14#
zhu890103 发表于 2015-7-2 10:52 | 只看该作者
相比说来 因特尔贵的还是有理由的
15#
脑浆断层现象 发表于 2015-7-2 11:00 | 只看该作者
粒子加速器intel大法好!!
16#
脑浆断层现象 发表于 2015-7-2 11:22 | 只看该作者
我想知道阵列上那么多测试盘最后都到哪儿去了
17#
yukari 发表于 2015-7-2 11:29 | 只看该作者
nighttob 发表于 2015-7-1 18:59
8M是故障结果,代表这块盘还能通电,但是坏了
就跟别的盘死了是一个效果
...

囧,所以真相是intel 8M不直接變磚反倒是給有心人說嘴的理由了?

18#
nighttob 发表于 2015-7-2 12:08 | 只看该作者
yukari 发表于 2015-7-2 11:29
囧,所以真相是intel 8M不直接變磚反倒是給有心人說嘴的理由了?

变砖还是8M结果都是一样的啊,都是无法再使用。
只是有很多人刻意曲解8M

这就跟昨天还看的好好的电视机,第二天发现根本不亮了,或者背光亮但是没图像,是一样的。
19#
xuchao0719 发表于 2015-7-2 13:30 | 只看该作者
拆开intel的固态是整个一个2.5PCB 死棒子只有1/3,
20#
固特异轮胎 发表于 2015-7-2 19:42 | 只看该作者
宇宙射线。。。。动感光波么?
大型离子对撞机?还是超大型离子加速器?
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部