减少机房UPS事故需要注意的几个问题(尤其电容)

     

  摘要:机房UPS为重要负载供电,不容忽视。文章介绍了UPS输出负载短路的后果及解决方案;结合说明维护中要重视零线的检查;UPS零地电压产生的原因及解决方案;UPS蓄电池安装,需要注意的问题;UPS电容爆炸的原因及解决方案,并分析了电容爆炸几种不同现象的原因。

  机房UPS为计费系统、IDC设备、重要金融用户设备、网管终端等重要负载供电,一旦出现事故影响很大。近年来,各运营商都出现过因UPS导致的系统瘫痪事故。笔者经多年的工作实践总结了减少机房UPS事故需要注意的几个问题。

  1UPS输出负载短路问题

  UPS 输出负载短路百分之九十以上会导致UPS 系统出现输出停电或闪断故障,从而导致所接的重要设备瘫痪。UPS 输出负载短路时,不管单机、主从、并机,还是双母线系统都不能保证负载不断电。以目前安全可靠的UPS 并机双母线冗余供电系统为例,如图1。

 UPS并机双母线冗余供电系统

图1  UPS并机双母线冗余供电系统

  图中4台UPS 每2台1+1 带并机柜并机提供双母线供电,UPS1-1和UPS1-2通过并机柜并机构成系统一,UPS2-1 和UPS2-2通过并机柜并机构成系统二。正常情况下,系统一与系统二分别带自己的负载。

  系统一经UPS1输出柜和静态转换开关STS1 带负载,系统二经UPS2输出柜和静态转换开关STS2带负载,STS1 设定1路优先导通,STS2设定为2路优先导通。当其中一个系统供电母线上的任何设备故障时,其负载可经静态转换开关切换至另一个系统供电。

  为了保证两套系统可以同频率、同相位跟踪,还可以通过负载总线同步跟踪控制器保证切换时电源在波形和相位上是连续的。对多数故障,这种系统都没有问题,但还是不能解决输出负载短路问题。这是因为短路相当于过载,切换到系统2,系统2也会过载宕机,导致负载断电。

  实际工作中发生输出短路的可能性其实很大。现在很多运营商机房的UPS 系统是并机方式,2台UPS 并机通过一个UPS 配电柜/配电箱给机房内所有的数据、网管、计费设备供电。从这个主UPS 配电柜到各负载还有可能经过若干个配电柜、配电箱、插座。其中任何一个环节出现短路故障,都有可能导致全系统断电。另外不同运营商,不同地市,各之间的维护界面不尽相同。有的是所有电源都由动力维护;有的是UPS 主配电柜以外归其它维护,UPS 主配电柜及以内归动力维护。其它在动力技能方面可能有欠缺,存在很多不确定性,有发生短路的可能。UPS 都是优先保护自身设备,不同厂家设计理念不同,输出短路时有的UPS 不转旁路,直接关掉逆变器宕机;有的转旁路,但会顶掉空开,造成小面积停电。笔者遇到过,两台30kVA UPS 并机,安装调试时由于施工人员操作不慎,设备端的UPS 输出配电柜母排短路,两台UPS 逆变器都停止工作,也没有转旁路,只有断开再关闭市电输入开关,重新开机才恢复正常。

  如何避免UPS 输出负载短路导致系统宕机呢?

  目前,设备制造厂商已将多数重要的网络通信设备制作成具有双电源输入特性的设备。有2个交流电源接口,可以接2路交流电,内部再通过2个交流/直流转换模块转换成直流电,并联给设备供电,如图2。

双路输入供电方式

图2双路输入供电方式

  但实际工作中,一般只用了1个交流电源接口,或者多用一根导线并接到第二个电源接口。这样只解决了交流/直流转换模块的冗余保护,对电源线意外断开或是输出短路则无能为力。为了限度地发挥双电源输入设备的技术潜力,避免UPS 输出短路导致系统宕机,保证重要设备供电安全,的解决办法是用两套双母线并机系统,分别给重要设备的2个电源端口供电。这样既解决了电缆冗余,又解决了输出短路问题,虽然建设成本高了一些,但安全性大大提高,对重要设备还是值得的。

  2零线问题

  零线问题是维护中很容易忽视的一个问题,有可能导致严重事故,结合一个说明此问题。

  一个无人值守关口局在某写字楼八楼,一楼营业厅从八楼关口局交流配电柜引电,UPS 也从交流配电柜引电,UPS 输出到一个UPS 配电箱再给一些计费、网管等设备供电。故障现象是冬季UPS 连续几天晚上12点左右断电,UPS 显示“输出短路”,负载掉电,到现场重起UPS 后恢复正常。发现是以下2个原因:一是一楼营业厅门卫晚上用几个单相电暖器,并且接到了同一相交流电上,导致三相不平衡,由于零线电流是三相电流的矢量和,不平衡导致零线电流过大。

  从主交流配电柜测零线电流,白天很正常,晚上用电暖器时测约20A。二是UPS 配电箱的零线排上几个设备的零线螺丝松动。零线虚接再加上零线电流过大导致打火,UPS 判断为“输出短路”从而宕机。紧固零线,拆除电暖器后故障排除。所以在维护中要特别注意零线的检查,从UPS 输出到用电负载的整个供电路径上的零线都要定期检查紧固。

  3UPS 的接地问题

  UPS 的接地也是一个比较容易被忽略的问题。

  当UPS 的负载不对称,或UPS 带有非线性负载时,中性线中就会有电流流过,在中性线上产生压降引起中线和地线之间的电压差通常称为“零地电压”。中性线电流越大、负载距离越远、中性线导线截面越小,则“零地电压”就越大。有些灵敏负载对“零地电压”要求很高,例如“零地电压”大于1V,有些服务器就不能正常工作。

  这是因为一般机房接地系统都是UPS 输出中性线和负载中性线固定接到市电电源的中性线上,市电电源的中性线在低压进线柜中连接到接地极上,UPS 输出和负载的中性线与市电的中性线没有任何的隔离。机房中交流电缆很多,每一根电缆都含有大量的电磁干扰,所有的这些电缆被捆扎在一起走长线,使得这些高频干扰互相串扰,高频干扰电流在零线、地线上流过带来了零地之间的压降。

  解决的办法一是将UPS 的火线和零线、地线分开走线,两者的距离应该保证在20 cm以上,其它动力电缆也远离UPS 零线。如果施工现场条件不允许,零线和地线要用铠装屏蔽电缆。但这种方法治标不治本,机房内设备变化,电磁干扰环境也随之改变,零地电压也会改变,不能彻底解决问题。二是在UPS 负载端加隔离变压器,并将隔离后的零线接地,可以保证负载的零地电压趋近于零,解决“零地电压”问题效果。

  4UPS蓄电池问题

  UPS 蓄电池是一个容易出问题的环节,由UPS蓄电池引发的事故占UPS总事故较大比重。这是因为UPS蓄电池一般是12V蓄电池,内部实际上是6只2V蓄电池串联焊接构成,制作难度大,而且板栅,连接条比较薄,只要一个板栅出现问题,整只UPS 电池就有问题,故障率远远高于2V蓄电池,所以在安装维护中要注意以下几个问题。

  (1)UPS蓄电池用蓄电池架安装,不要用蓄电池柜。一是便于通风散热,UPS蓄电池对温度非常敏感,环境温度是20~25℃,温度每升高10℃,蓄电池的寿命就会降低一倍。UPS蓄电池充放电过程中会释放大量热能,热量散不出去,直接影响电池容量与寿命。二是便于维护测量。用蓄电池柜安装,如果空间太小,巡检时操作人员可能会因为操作不便,或视线问题导致操作工具短路或检查不仔细忽略本应发现的故障隐患。有这样一个:主从热备份UPS 系统,密封蓄电池柜(有通风孔),螺丝固定的面板拆卸不便,用螺丝刀拆才能打开。巡检发现备机UPS 的蓄电池组中底层角落里有两只蓄电池连接线松动,并且漏液。UPS 蓄电池是大电流放电,这种情况下如果恰好主机UPS 故障,备机UPS 蓄电池放电供给负载,后果严重,有可能着火甚至爆炸。

  (2)UPS蓄电池连接线不要用开口铜鼻子,要用孔型铜鼻子,开口铜鼻子不如孔型压接牢固,容易脱落;连接线要用软铜线,不要用硬铜线,硬铜线有时由于吃着劲,当时紧固了,时间长了会松动,造成端子处连接不良,在一定的条件下可能端子处拉弧或热量*,终导致着火;连接线要用长度一致的同一规格导线,否则电阻不一致,长期使用,会发生充电时有的UPS 蓄电池已充满,有的UPS 蓄电池还没充满,从而导致已充满的UPS 蓄电池过充,水分从安全阀溢出,电解液浓度变大,长时间会腐蚀极板,导致蓄电池一致性变差。

  (3)由于蓄电池很重,安装时要用正确的方法搬运和吊装蓄电池,不能用钩子或螺丝刀直接勾住蓄电池外露极柱搬卸蓄电池。极柱与极板是焊接的,这样会拉伤蓄电池端子,严重时可能导致着火。另外蓄电池组上输出的电缆,不要直接从电池端子拉至主设备,中间需要有接线盒或转接端子,否则蓄电池端子上长期承受拉力,可能破坏蓄电池内部的连接。

  5UPS 电容爆炸问题

  5.1UPS 电容爆炸的原因

  UPS 的电容一般是指其内部的直流滤波电容和储能电容及输入输出交流滤波电容。UPS 电容爆炸一般是指直流滤波电容和储能电容,它通常选用容量较大的电解电容,电容爆炸一般是因为耐压问题造成的,其本质原因有如下二个。

  5.1.1内部电介质绝缘强度下降导致电容击穿

  (1)电容本身质量问题。近年来,一些厂家为了降低产品售价,提高产品中标的竞争力,选用了寿命较短的直流滤波电容,这也是导致目前发生电容爆炸故障的事例日益增多的主要原因。

  (2)温度。电容器的使用寿命随温度的增加而减小,温度加速介质与电解液化学反应使介质随时间退化,耐压值下降。另外温高还会导致漏电流增大。在直流正向电压施加于电容器一段时间后仍有一个微小电流持续从正电极流向负电极,这个微小的电流即称为漏电流。漏电流越小表明电介质制作得越精良,漏电流的特性是随着温度的升高越来越大。为防止电解液蒸发,电容一般采用密封结构,散热性较差。如果热量不能及时排出去,器件内部温度上升会很快,导致漏电流的进一步增大;根据电流热效应,漏电流增大又会导致温度上升,热量积累恶性循环,使电容内部电解液沸腾和汽化,气压迅速增大到外壳无法承受时,就会爆炸。如果防护设计的不好,电解液喷溅到电路板上,检测控制电路受损还会导致更加严重的后果。

  电容温度高的原因一是机房环境较差,长期不维护造成UPS 内部积尘过多,散热不良。二是空调送/回风通道设计不好,UPS 周围环境温度较高。解决的方法为每年对UPS 做内部除尘;做好空调设计,避免局部高温;采用远红外成像仪、远红外测温仪等检测仪对滤波电容的异常温升进行检测,及时更换有潜在故障隐患的电容,防患于未然。


  5.1.2外部电压超过电容的耐压值

  UPS 内部的储能直流电容耐压值一般为直流450~500V,以POWERWARE9150/930510kVA UPS为例,其内部直流母线电压为400VDC,而直流电解电容的耐压值是450VDC。UPS 中的相控整流器控制着输出直流电压的高低,UPS使用年限越长,相控整流器电路器件参数越老化,造成UPS 内部的直流400V电压不再稳定。市电波动时,会造成UPS 内部400V直流电压波动,波动的电压幅值很可能会超过450V,造成直流电解电容过压,再加上电容长期使用耐压性能下降,就会发生爆裂。解决的方法是选用大品牌UPS 设备,把好产品质量关;到达报废年限的UPS 坚决报废(一般UPS 寿命是5 ~7年,建议5年报废);使用超过3 年的UPS 要定期检查内部的电容,看看有没有漏液、鼓包,容量是不是已经下降到其容量误差下限等,这些是爆炸的前兆。

  5.2UPS 电容爆炸的几种可能现象及分析

  理论上,并机系统中一台UPS 故障,故障UPS应自动退出系统,其它正常工作,但现实中电容爆炸时却不一定是这样。统计资料显示一旦发生电容爆炸故障,90%以上的几率会导致并机系统出现输出停电或闪断故障(中断时间大于8~20ms),从而导致负载瘫痪几十分钟甚至几小时。

  (1)除了发生电容爆炸的那台UPS 单机处于逆变器自动关机状态之外,其余各台UPS 似乎都处于“正常的”逆变器电源供电状态。这是因为并机UPS 系统中一台设备逆变器发生故障导致系统输出电压波动,或是输出交流电压中含有很高的直流成分电压,或是拉低了系统输出电压,从而影响到负载。

  (2)除了发生电容爆炸的那台UPS 单机处于逆变器自动关机状态,其它UPS的输入开关或UPS并机系统的总输入开关跳闸,UPS处于电池组提供能量的逆变器供电状态。这种情况主要原因是电容爆炸的UPS 的逆变器发生了内部短路故障,由于逆变器并联,导致其它UPS 逆变器输出瞬间短路,输出电流瞬间增大,而这些电流不是供给负载,而是供给内部短路的UPS,从而造成正常的UPS 瞬间过载,进而导致相关输入开关跳闸。

  (3)“N+1”UPS并机系统中各台UPS的输入、输出配电柜中的开关都配置为断路器开关。一台UPS 的滤波电容爆炸,其余UPS的输入、输出开关全都跳闸。这是因为交流输入滤波电容爆炸造成市电小范围供电环境恶化。UPS 都有输入滤波器,该滤波器都有电感线圈,输入市电在瞬时发生突变,相当于感性负载两端电压突变,从而产生反向电动势,冲击相关的断路器,断路器都有过压保护和过流保护功能,开关全都跳闸。

  (4)并机系统中除了发生电容爆炸的那台UPS 逆变器自动关机,其余UPS 均处于“正常的”逆变器供电状态,负载正常工作的情况。这种侥幸情况不会超过10%,一般是交流输入电容爆炸或者直流电解电容爆炸没有影响到检测控制电路。

  6结束语

  机房UPS维护难度大,故障率高,发生事故影响大。为了减少机房UPS事故,需要深入分析其发生事故的各种可能原因,做好基础维护工作,将事故隐患消除在萌芽状态。

作者:hschina

本站使用百度智能门户搭建 管理登录
苏ICP备2023004300号-1