从硬件角度出发,可靠性测试分为两类:
下面分别介绍这两类可靠性测试。
1. 基于行业标准、国家标准的可靠性测试方法
产品在生命周期内必然承受很多外界应力,常见的应力有业务负荷、温度、湿度、粉尘、气压、机械应力等。各种行业标准、国家标准制定者给出了某类产品在何种应用环境下会存在多大的应力等级,而标准使用者要根据产品的应用环境和对质量的要求选定相应的测试条件即应力等级,这个选定的应力等级实质上就是产品测试规格。
在产品的测试阶段,我们必须在实验室环境下对足够的测试样本一一施加相应的应力类型和应力等级,考察产品的工作稳定性。对于通信设备而言,常见的测试项目至少包括电磁兼容试验、安规试验、气候类环境试验和机械环境试验,而上述四类测试项目还包含很多测试子项,比如气候类环境试验还包括高温工作试验、低温工作试验、湿热试验、温度循环试验等。此类测试项目还有很多,这里就不做详细介绍。总的而言,所有的测试项目都属于规格符合性测试(即PASS或者FAIL测试),试验的目的都是模拟产品在生命周期内承受应力类型和应力等级,考察其工作稳定性。
2. 企业设计的可靠性测试方法
由于网络产品的功能千差万别,应用场合可能是各种各样的,而与可靠性测试相关的行业标准、国家标准,一般情况下只给出了某类产品的测试应力条件,并没有指明被测设备在何种工作状态或配置组合下接受测试,因此在测试设计时可能会遗漏某些测试组合。比如机框式产品,线卡种类、线卡安装位置、报文类型、系统电源配置均可灵活搭配,这涉及到的测试组合会较多,这测试组合中必然会存在比较极端的测试组合。再如验证该机框的系统散热性能,最差的测试组合是在散热条件机框上满配最大功率的线卡板;如果考虑其某线卡板低温工作性能,比较极端的组合时是在散热条件最好的机框上配置最少的单板且配置的单板功耗最小,并且把单板放置在散热最好的槽位上。
总之,在做测试设计时,需要跳出传统测试规格和测试标准的限制,以产品应用的角度进行测试设计,保证产品的典型应用组合、满配置组合或者极端测试组合下的每一个硬件特性、硬件功能都充分暴露在各种测试应力下,这个环节的测试保证了,产品的可靠性才得到保证。
举例
以下举两个例子来说明如何根据产品特点设计出可靠性测试方法。
实例一:包处理器外挂缓存(Buffer)的并行总线测试
为了应对网络的突发流量和进行流量管理,网络设备内部的包处理器通常都外挂了各种随机访问存储器(即RAM)用来缓存包。由于包处理和RAM之间通过高速并行总线互连,一般该并行总线的工作时钟频率可能高达800Mhz,并且信号数量众多,拓扑结构复杂,在产品器件密度越来越高的情况下,产品很可能遇到串扰、开关同步噪音(SSN)等严重的信号质量问题,针对上述可能遇到的问题,我们需进行仔细的业务设计,让相应硬件电路的充分暴露在不利的物理条件下,看其工作是否稳定。
串扰,简单的来说是一种干扰,由于ASIC内部、外部走线的原因,一根信号线上的跳动会对其他信号产生不期望的电压噪声干扰。为了提高电路工作速率和减少低功耗,信号的幅度往往很低,一个很小的信号干扰可能导致数字0或者1电平识别错误,这会对系统的可靠性带来很大影响。在测试设计时,需要对被测设备施加一种特殊的业务负荷,让被测试总线出现大量的特定的信号跳变,即让总线暴露在尽可能大的串扰条件下,并用示波器观察个总线信号质量是否可接受、监控业务是否正常。以16位并行总线为例,为了将这种串扰影响极端化,设计测试报文时将16根信号中有15根线(即攻击信号线Agressor)的跳变方向一致,即15根信号线都同时从0跳变到1,同时让另一根被干扰的信号线(即Victim)从1下跳到0,让16根线都要遍历这个情况。
开关同步噪音也是RAM高速并行接口可能出现的我们所不期望的一种物理现象。当IC的驱动器同时开关时,会产生瞬间变化的大电流,在经过回流途径上存在的电感时,形成交流压降,从而产生噪音噪声(称为SSN),它可能影响信号接收端的信号电平判决。这是并行总线非常恶劣的一种工作状态,对信号驱动器的高速信号转变能力、驱动能力、电源的动态响应、电源的滤波设计构成了严峻的考验。为了验证产品在这种的工作条件下工作是否可靠,必须被测设备(DUT)加上一种特殊的测试负荷,即特殊的测试报文。
举例:如果被测总线为16位宽,要使所有16跟信号线同步翻转,报文内容应该为:
FFFF 0000 FFFF 0000
如果被测总线为32位宽,要使所有32跟信号线同步翻转,测试报文内容应该为:
FFFF FFFF 0000 0000 FFFF FFFF 0000 0000
如果被测总线为64位宽,要使所有64根信号线同步翻转,测试报文内容应该为:
FFFF FFFF FFFF FFFF 0000 0000 0000 0000 FFFF FFFF FFFF FFFF 0000 0000 0000 0000
如果报文在DUT内部的业务通道同时存在上述位宽的总线,业务测试必须加载上述的报文,看DUT UUT在每种报文下工作是否正常,同时在相应总线上进行信号测试,看信号是否正常。
实例二:热测试
热测试通过使用多通道点温计测量产品内部关键点或关键器件的温度分布状况,测试结果是计算器件寿命(如E-Cap)、以及产品可靠性指标预测的输入条件,它是产品开发过程中的一个重要的可靠性活动。
一般而言,热测试主要是为了验证产品的热设计是否满足产品的工作温度范围规格,是实验室基准测试,这意味着为了保证测试结果的一致性,必然对测试环境进行严格要求,比如要求被测设备在一定范围内无热源和强制风冷设备运行、表面不能覆盖任何异物。但实际上很多产品的工作环境跟上述测试环境是有差异的:
有些产品使用时可能放在桌子上,也可能挂在墙上,而这些设备基本上靠自然散热,安装方法不同会直接影响到设备的热对流,进而影响到设备内部的温度分布。因此,测试此类设备时必须考虑不同的安装位置,在实验室条件把设备摆放在桌子热测试通过,并不代表设备挂在墙上热测试也能通过。
有些网络设备在网吧行业用得比较多,几台设备叠在一起使用比较常见,做类似产品的热测试时,必须考虑到产品在此情况下热测试是否符合要求。
一些机框式设备,由于槽位比较多,风道设计可能存在一定的死角。如果被测对象是一块业务板,而这块可以随便插在多个业务卡槽位,热测试时必须将被测板放在散热最差的槽位,并且在其旁边槽位插入规格所能支持的大功耗业务板,后让被测单板辅助单板和满负荷工作,在这种业务配置条件下进行热测试。
针对不同的产品形态,硬件可靠性测试项目可能有所差异,但是其测试的基本思想是一致的,其基本的思路都是完备分析测试对象可能的应用环境,在可能的应用环境下会承受可能工作状态包括极限工作状态,在实验室环境下制造各种应力条件、改变设备工作状态,设法让产品的每一个硬件特性、硬件功能都一一暴露在各种极限应力下,遗漏任何一种测试组合必然会影响到对产品的可靠性。
可靠性试验的分类
1、按试验场所
1)现场试验
2)实验室试验——即在实验室内开展的各种应力条件下的模拟试验
2、按试验目的
1)工程试验
工程试验的目的是暴露产品的可靠性薄弱环节并采取纠正措施加以排除(或使其故障率低于允许水平)。这种试验由承制方进行,以研制样机为受试产品。
2)统计试验
统计试验的目的是在一定的置信度要求下,验证产品的可靠性是否达到规定的定量要求。统计试验一般有经认可的第三方实验室负责完成,受试单位事先必须经订购方批准。可靠性试验应尽可能结合产品的性能试验、环境适应性试验等来进行。
3、 按试验性质
1)破坏性试验
2)非破坏性试验
4、通常惯用的分类法,是把它归纳为五大类:
A 环境试验
B 寿命试验
C 筛选试验
D 现场使用试验
E 鉴定试验
可靠性评估分析的意义:
可靠性(Reliability)则是对产品耐久力的测量, 我们主要典型的IC产品的生命周期可以用一条浴缸曲线(Bathtub Curve)来表示。
如上图示意, 集成电路得失效原因大致分为三个阶段:
Region (I) 被称为早夭期(Infancy period), 这个阶段产品的失效率快速下降,造成失效的原因在于IC设计和生产过程中的缺陷;
Region (II) 被称为使用期(Useful life period), 这个阶段产品的失效率保持稳定,失效的原因往往是随机的,比如温度变化等等;
Region (III) 被称为磨耗期(Wear-Out period),这个阶段产品的失效率会快速升高,失效的原因就是产品的长期使用所造成的老化等。
·**级器件老化筛选
·元器件寿命试验
·ESD等级、Latch_up测试评价
·高低温性能分析试验
·集成电路微缺陷分析
·封装缺陷无损检测及分析
·电迁移、热载流子评价分析
根据试验等级分为如下几类:
一、使用寿命测试项目(Life test items):EFR, OLT (HTOL), LTOL
①EFR:早期失效等级测试( Early fail Rate Test )
目的: 评估工艺的稳定性,加速缺陷失效率,去除由于天生原因失效的产品。
测试条件: 在特定时间内动态提升温度和电压对产品进行测试
失效机制:材料或工艺的缺陷,包括诸如氧化层缺陷,金属刻镀,离子玷污等由于生产造成的 失效。
参考标准:
JESD22-A108-A
EIAJED- 4701-D101
②HTOL/ LTOL:高/低温操作生命期试验(High/ Low Temperature Operating Life )
目的: 评估器件在超热和超电压情况下一段时间的耐久力
测试条件: 125℃,1.1VCC, 动态测试
失效机制:电子迁移,氧化层破裂,相互扩散,不稳定性,离子玷污等
参考数据:
125℃条件下1000小时测试通过IC可以保证持续使用4年,2000小时测试持续使用8年;150℃ 1000小时测试通过保证使用8年,2000小时保证使用28年。
参考标准:
MIT-STD-883E Method 1005.8
JESD22-A108-A
EIAJED- 4701-D10
二、环境测试项目(Environmental test items)
PRE-CON, THB, HAST, PCT, TCT, TST, HTST, Solderability Test, Solder Heat Test
①PRE-CON:预处理测试( Precondition Test )
目的: 模拟IC在使用之前在一定湿度,温度条件下存储的耐久力,也就是IC从生产到使用之间存储的可靠性。
②THB: 加速式温湿度及偏压测试(Temperature Humidity Bias Test )
目的: 评估IC产品在高温,高湿,偏压条件下对湿气的抵抗能力,加速其失效进程
测试条件: 85℃,85%RH, 1.1 VCC, Static bias
失效机制:电解腐蚀
参考标准:
JESD22-A101-D
EIAJED- 4701-D122
③HAST 高加速温湿度及偏压测试(HAST: Highly Accelerated Stress Test )
目的: 评估IC产品在偏压下高温,高湿,高气压条件下对湿度的抵抗能力,加速其失效过程
测试条件: 130℃, 85%RH, 1.1 VCC, Static bias,2.3 atm
失效机制:电离腐蚀,封装密封性
参考标准:
JESD22-A110
④PCT:高压蒸煮试验 Pressure Cook Test (Autoclave Test)
目的: 评估IC产品在高温,高湿,高气压条件下对湿度的抵抗能力,加速其失效过程
测试条件: 130℃, 85%RH, Static bias,15PSIG(2 atm)
失效机制:化学金属腐蚀,封装密封性
参考标准:
JESD22-A102
EIAJED- 4701-B123
*HAST与THB的区别在于温度更高,并且考虑到压力因素,实验时间可以缩短,而PCT则不加偏压,但湿度增大。
⑤TCT: 高低温循环试验(Temperature Cycling Test )
目的: 评估IC产品中具有不同热膨胀系数的金属之间的界面的接触良率。方法是通过循环流动的空气从高温到低温重复变化。
测试条件:
Condition B:-55℃ to 125℃
Condition C: -65℃ to 150℃
失效机制:电介质的断裂,导体和绝缘体的断裂,不同界面的分层
参考标准:
MIT-STD-883E Method 1010.7
JESD22-A104-A
EIAJED- 4701-B-131
⑥TST: 高低温冲击试验(Thermal Shock Test )
目的: 评估IC产品中具有不同热膨胀系数的金属之间的界面的接触良率。方法是通过循环流动的液体从高温到低温重复变化。
测试条件:
Condition B: - 55℃ to 125℃
Condition C: - 65℃ to 150℃
失效机制:电介质的断裂,材料的老化(如bond wires), 导体机械变形
参考标准:
MIT-STD-883E Method 1011.9
JESD22-B106
EIAJED- 4701-B-141
* TCT与TST的区别在于TCT偏重于package 的测试,而TST偏重于晶园的测试
⑦HTST: 高温储存试验(High Temperature Storage Life Test )
目的: 评估IC产品在实际使用之前在高温条件下保持几年不工作条件下的生命时间。
测试条件: 150℃
失效机制:化学和扩散效应,Au-Al 共金效应
参考标准:
MIT-STD-883E Method 1008.2
JESD22-A103-A
EIAJED- 4701-B111
⑧可焊性试验(Solderability Test )
目的: 评估IC leads在粘锡过程中的可靠度
测试方法:
Step1:蒸汽老化8 小时
Step2:浸入245℃锡盆中 5秒
失效标准(Failure Criterion):至少95%良率
具体的测试条件和估算结果可参考以下标准
MIT-STD-883E Method 2003.7
JESD22-B102
⑨SHT Test:焊接热量耐久测试( Solder Heat Resistivity Test )
目的: 评估IC 对瞬间高温的敏感度
测试方法: 侵入260℃锡盆中10秒
失效标准(Failure Criterion):根据电测试结果
具体的测试条件和估算结果可参考以下标准
MIT-STD-883E Method 2003.7
EIAJED- 4701-B106
三、耐久性测试项目(Endurance test items )
Endurance cycling test, Data retention test
①周期耐久性测试(Endurance Cycling Test )
目的: 评估非挥发性memory器件在多次读写算后的持久性能
Test Method: 将数据写入memory的存储单元,在擦除数据,重复这个过程多次
测试条件: 室温,或者更高,每个数据的读写次数达到100k~1000k
参考标准:
MIT-STD-883E Method 1033
②数据保持力测试(Data Retention Test)
目的: 在重复读写之后加速非挥发性memory器件存储节点的电荷损失
测试条件: 在高温条件下将数据写入memory存储单元后,多次读取验证单元中的数据
失效机制:150℃
参考标准:
MIT-STD-883E Method 1008.2
MIT-STD-883E Method 1033
免责声明:本公众号所载文章为本公众号原创或根据网络搜集编辑整理,文章版权归原作者所有。如涉及作品内容、版权和其它问题,请跟本号联系!文章内容为作者个人观点,并不代表本公众号赞同或支持其观点。本公众号拥有对此声明的最终解释权。