打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
数据中心测试验证

测试验证commissioning的定义,是一个确保系统设计、安装、功能测试、系统联调,并能保持良好运行,以实现与设计意图相符合的过程。测试验证是设施获得良好功能和可靠运行过程中的重要组成部分。


测试验证建议始于项目之初,贯穿于设计、施工、启动、验收、运维的整个项目寿命周期中,以验证设计是否满足了业主的需求,施工是否满足设计和设备厂商的要求,启动是否能满足全系统满负载负荷,运维是否能稳定安全,是否存在何种隐患。这样业主的要求可在整个设计和实施及使用过程中得到更好的明确、处置和验证。


用户普遍理解测试验证工作通常与新建项目有关,其实不尽然,测试验证同样也适用于扩建、改造项目和日常维护活动中。业主应考虑作为一种常态的测试验证形式,融入到日常的操作和维护工作中,确保所安装的系统和设施达到了功能要求,实现了期望的可靠性和可利用性。当一个系统由于缺少维护或因设备故障而偏离了设计运行工况时,通常应有一个“再调试”过程,使现有系统恢复到正常、有效的运行工况。


测试验证按照其内容和特点可以分为六个阶段。


一、工厂验收测试阶段


工厂验收测试,是设备在其制造场所进行的测试。一般用于高端的、重要的支持性设备,如高压配电柜、发电机、UPS系统、冷水机组等。这对于整个项目团队了解具体设备是一个很好的机会。尽管设备可能会与产品说明书所说的一样好,但是实际查看、倾听、观察满载运行状况下的设备,能发现其它途径不能得到的情况。可使有关设计、运行、维护、产品质量和客户售后支持等问题,在源头上得到处理。


1、常见的检查内容


(1)生产进度检查:主要设备的供货周期,直接关系到项目建设的具体完工日期,对于设备的供货周期要有统一的考虑。有些设备的搬运安装甚至与主体建筑密切相关,比如有的发电机要安装到地下,要预留天井,等设备运进去以后才能封口。有些设备对安装条件有明确的要求,比如承重,通风距离等。不能等到设备到了现场才发现不具备条件,甚至要比较大的整改。要让配套施工和设备生产加工周期较好地匹配。尽量避免由于工期紧而压缩工期造成的生产环节的纰漏或减少工厂内的检验。


(2)设备配置:设备内部的元器件配置和功能配置,是否与招标文件相符。是否与该项目的工况参数相符。如配电柜内部元器件的品牌、型号规格,比如开关的额定电流、分断能力、脱扣器类型、安装方式、电量仪表型号功能、防雷器、铜排的规格和材质、导线的规格。


(3)安装方式:要考虑现场的装卸、运输通道、后期维护、现场的噪声、震动、对周围环境的影响。


(4)过程检验和出厂检验:可以抽查检验记录,甚至见证出厂试验。在有条件的情况下,厂商可以将各项测试、检验记录以传真或邮件方式通知需方。需方接到测试文档后去供方进行出厂检验。检验合格后供方方能进行交付。


(5)预留测试接口:既要考虑现场项目整体测试验证的必要接口,也要考虑日常维护是测试项目的接口,如发电机和UPS的假负载测试接口。有些机房的发电机没有预留测试接口,多数情况下,机房不允许带真实负荷做带载测试,这种情况下如果在假负载测试需要较长的停电时间做接线准备,这往往又是很难具备的条件。


(6)对于带控制系统的设备,在项目的施工期间,经常会遇到一些事项和调整顺序,也就是需要针对单个项目做定制或者二次开发。当系统正在进行调试而控制商正在编程时,会逐步暴露一些问题。为了满足关键的移交期限,分配给调试的时间可能会被减少,可靠性调试会成为主要关注问题,对能效关注的位置排到最后。


(7)通过要求控制商对其系统进行工厂测试,关键的可靠性问题可处理到90%,这样可使设计人员有更多的时间为期望的系统能效进行操作与细调。使有负载情况下进行额外测试的能力有了提高,设计的能效特征不会成为进度计划的“受害者”。


2、参考样例


工厂验收发现配电柜是后面维护及接线操作,而现场已经改成了靠墙安装了。汇流排是一组几台柜子通长的,该配电间现场通长的汇流排无法装入并柜后的配电柜中。


如图示下进线的开关,在开关距离顶部空间比较小的时候,是否考虑了电缆接线的空间。


二、现场部件测试阶段


现场部件测试,是指设备运到用户项目现场后的检查和验证,检查设备在运输和装卸过程中是否收到损坏。


常见的检查内容包括:包装是否损坏,设备外观是否有损伤,有些重要设备有防倾倒标签、防震动标签,随机资料清单是否齐全、随机附件是否齐全。现场运输和存储应当有合适的位置,确保设备受到良好保护,随时可以安装。


下面是一个现场部件测试表格参考样例。

三、系统施工验收阶段


系统施工验收阶段,是指检测设备是否按照设计意图、安装计划和设备说明书的要求进行了组装。这些正式的过程性检测应形成文件,业主、合同人和设备供应商共同参见。


运维团队应至少在这个阶段进入项目,这样可以让运维人员熟悉设计和配置,提供维护方法、储藏、备件库存控制输入,检查安装和运行维护手册等,就希望基础设施如何运行等问题,向设计团队、施工和安装合同商以及测试验证机构咨询和学习。


1、常见的检查内容


(1)检查图纸资料、设备使用说明书是否齐全。


(2)对照设备白皮书做设备安装的目测检测:维护方便、快速、能准确定位、排除故障,是一个高利用率数据中心的基本要求,也为数据中心面临的投产做好准备。首先要求设备周围有足够的工作间距,制造商的推荐值应作为服务区域的最低要求。


(3)设计者应提供维护与操作阀门、控制装置、传感器和大型设备所需的通道。管道的走向尽量避免与设备搬动发生冲突。水泵和冷水机组这类设备的布置,应方便彻底更换;切断阀门的位置也必须能在更换时不使服务中断。


(4)标识检查包括设备名称、编号、路由等,图纸与实物必须一一对应,线缆的管理要尤其注意,路由、规格、上级开关的位置等。


(5)通电开机测试。


(6)模拟部分故障。


(7)模拟部分运维部分动作测试。。


2、参考样例


某机房冷水机组放置在大楼顶层,但是顶层考虑到安装有可能会破坏防水,后来采用架空结构安装了3台冷水机组及相应的管道(管道上有压力表和温度表),但是没有做维修通道,设备的巡检及检修时非常不方便,甚至有生命危险。冷水机组没有主进线开关,控制室又距离比较远,这在做检修维护时,既不方便又不安全。设备编号与对应的电控柜不一致,操作容易出错。


四、现场验收验证阶段


现场验收验证阶段,是指让组成特定系统的有关部件、设备和辅助设备进行运行与功能演示,以达到额定的、规定的性能标准。这要求所有涉及到的团队,对这些组合、安装的部件是如何像一个系统那样实现其功能,要理解并同意。在规划和设计阶段有一个深思熟虑的验证计划,有助于确保设计意图和基础设计说明能产生一个作用与责任描述清楚的合同。典型的测试手段有机架式假负载、满负荷的假负载模拟实际运行的电负荷与热负荷。验证各个子系统是否满足设计需求。


1、常见的检查内容


(1)发电机单机各种性能参数,如单机轻载满载工况下,半载情况下,满载情况下,负载阶跃变化下等情况下的电参数、带载能力。


(2)UPS单机各种性能参数,如单机轻载满载工况下,半载情况下,满载情况下,负载阶跃变化下等情况下的电参数、带载能力,UPS放电测试。


(3)冷水机组在轻载、半载、满载情况下的运行情况。


(4)末端空调设备、显示参数、可设置参照、报警参数的测试和单独检测设备进行比对。


(5)配电柜的图纸、开关整定值的设置、控制器的参数设置、手动和电动操作、联动试验、ATS切换试验、仪表的参数测试、E开关的控制器电源、操作电源的功率、电压等级和工作范围、应急照片系统、消防分励脱扣器。


(6)精密配电柜和智能PDU的参数检测、报警值测试、通讯能力、连接点的发热检测。


(7)智能PDU的相位检测、连接点检测、接口形式。


机架式假负载是测试验证的重要手段,主要是两个作用:一是完整链路的电功率释放验证(从市电电源-UPS-列头柜-PDU-终端设备的完整供电链路),二是模拟热负荷验证空调系统的制冷能力(既要有与IT设备等功率的发热,而且假负载要配有风扇模拟实际气流组织)。也就是既要模拟电功率,同时也要模拟热负荷,这样才能高度模拟服务器等IT设备的实际工况。


机架式假负载现场测试照片


运维人员应参与项目验收测试验证全过程,深入了解设计意图、设备特点、运行工况和掌握基础数据。


2、参考样例


(1)样例一


某电视台数据中心高密机房,单机柜设计容量10KW,做50%负载测试时,配电和空调系统一切正常;但是做满载测试过程中发现机房温升过高。后来查找原因,空调其实负荷率并不高,还有很多制冷能力没有发挥出来,但是地板出风口风速不是很高,原因找到了进入房间的风道由于房屋结构问题,在进入房间时风道变小了,施工人员没有及时提出,在项目要完工的时候发现,再进行结构上的改造已经不可能了(风口旁边已经布满了其它管线),最后结果是整个机房高密模块暂时只能降容使用。


(2)样例二


某互联网公司测试时发现,多台UPS负载施加25%时一切正常,施加到50%时,UPS自动关机保护,后全部更换控制板后复测正常。在正常使用的情况下,UPS使用到负荷的50%需要较长的时间,如果是2N系统,可能要接近满负荷时才会出现这种情况。多台配电柜电量仪表的互感器变比没有设置正确,导致电流和功率显示不准确;施工接线原因导致多处电气连接点虚接,在满载测试时发现局部过热情况,部分连接点温度达到100度以上,这些虚接情况,一般在轻载情况下很难发现。



五、系统集成测试验证阶段


系统集成测试验证,是指对全系统联动,以及冗余和备用的部件、系统和相互关联的系统组进行测试,视它们对预料之中和预料之外的反常现象的反应。这个阶段挑战的是要确保所有故障事先已有考虑,并经适当测试,表明其反应能满足原计划中的意图和期望。


1、常见的检查内容


典型的测试内容有系统的整体联动试验,主要的机械和电气设备以非正常运行工况进行测试。记录所有观察和测量到的数据,也包括这些机械和电气设备的性能和工况参数。测试验证时的性能数据,可作为建立合理的预防性或预示性维护程序的时间标记和基础数据。


空调系统的群控功能的测试,包括冷水机组、换热器、末端空调、新风机组、排风系统、补水系统等。配电系统包括市电电源投切、发电机备用电源投入及退出、UPS单机工况参数及并机运行、配电系统的满载加电测试。


多种灾难场景模拟测试,市电故障、发电机故障、UPS故障、冷水机组故障、空调故障、配电柜故障等。


使用机架式假负载模拟正常运行工况、满载工况及故障工况,对于测试验证配电系统和空调系统是有效的和必要的手段。


2、参考样例


某集团数据中心采用双路10KV进线+1路高压发电机的供电方式供电,任何一路高压均可以带全部负荷,两路高压供电回路均有问题后高压柴发启动能供全部的负荷。两路高压进线和柴油发电机实现电气联锁,供电可靠性本身设计等级是比较高的。低压侧两套变压器,同时低压主进线柜也有联络柜并有电气联锁,可以实现任何一路市电高压或柴发运行均可以实现两路供电,并且任何一个变压器均可带全部负荷。在做故障模拟测试时发现,两路低压主进柜和联络柜有联锁关系,两路高压分别供电时一切正常,任何一路停电,另一路均能通过母联柜带全部负荷。模拟故障测试时发现,两台低压主进线开关柜有手动和自动运行方式,在手动方式下联络柜不能闭合,只能两边单独供电,这时一路变压器有问题时,就只有一路供电了。这个属于配电柜的设计缺陷,改正后正常。


两路高压均断电时高压柴发启动,延时后投入运行,市电恢复一路之后且稳定运行5分钟后,高压柴发退出运行。但是在5分钟内发电机没有停机时,再次发生两路市电全失时,高压柴发无法投入运行了。后来分析发现,是一个时间继电器的触点选型问题导致,这类问题如果不是模拟运行一下实际中发现这种问题,现场人员运维人员是很难在短时间内处理的。


六、实际运维团队日常维护测试阶段


机房设施正式投入运行后,运维团队负责基础设施的日常维护和测试工作。建立一种程序,能预测设备性能开始变差和在导致实际停机前,能及时确定潜在的问题。

所有设备和系统都有一个最佳性能范围,设备和系统的供应商和控制器供应商紧密合作是必要的,使控制器能保持设备和系统高性能的、协调的运行。在设计阶段中想象的策略,需要在系统最终功能测试时的调试过程中得到确认和微调。通过使用过程中的不断测试和调整,可以使整套系统逐步达到最佳的运行状态。


1、应急预案


各种应急预案及其演练也是日常测试维护的重要手段,结合数据中心地理位置和气候特点,制定极端气候条件下的应急响应预案,下面是一些应急预案要考虑的情况。


(1)大风情况下户外设备的防护。


(2)高温情况下空调室外机(有些空调使用环境温度是35°C以下)要加遮阳、水雾降温等措施。


(3)严寒情况下设备的使用极限工况,下雪造成冰凌落下损坏空调室外机的情况,及水管冻坏,均会造成制冷系统失灵。


(4)暴雨情况下建筑物的排水能力是否会对机房基础设施造成影响。


(5)地震多发地段的防震措施。


(6)长时间断电的响应措施。


(7)防鼠患、虫子。


(8)油箱和水箱的油位、水位。


(9)检查柴油机漏油、漏水、漏气现象。


2、日常运维


模拟市电停电状况,自动运行状态看发电机是否能正常投入和退出,也包括手动投入发电机和退出发电机。至少发电机的空载启动要做一次。同时检查并记录这些关键设备的工况参数。通过演练可以发现诸如油路堵塞、冷冻结晶(油品标号使用不当或出现极端天气等原因,均可能出现此类情况)、启动电池故障等,并及时采取预防和解决措施,可以避免多数的关键设备失效问题。


每月进行油机空载启动试验,并定期进行保养,确保发电机工况性能良好。在一次例行演练过程中,发现油机启动不起来,经过检查和分析进行比较发现油品含水量偏大,原因是油箱是埋入地下的,时间长了油箱外壳腐蚀受损导致渗水进入油箱。后果断更换了油箱,并进行了防腐处理。如果不是定期的演练中发现问题,真正需要用油机供电时,临时解决问题肯定是来不及的。


应用数据中心基础设施的全生命周期管理方式指导工作。设施的生命周期是多少?基础设施的设计寿命?关键设备的生命周期情况:如冷水机组、发电机、UPS、空调等。附属设备的生命周期是多少,如管道、水罐、电缆的裕量、绝缘、开关等。根据各种设备的生命周期安排巡检(设备的不同生命周期阶段,检测内容更不同,这些要参照设备商的建议),空气污染导致的腐蚀情况的了解和检测,也要列入工作日程。


制定设备的年度维护计划非常重要,下面是一个设备年度运维计划表参考样例。


3、预防性维护


设备运行的关键参数,电压、电流、温度、压力、流量的监控程度,和持续分析改进工况监测。


(1)观察:人体感官(触觉、视觉、嗅觉和听觉等)及简单工具,如油表或液位示镜,进行定性测试。


(2)临时性工况核查:包括测量参数,与基线特征或预定的设计值进行比较。


(3)趋势监测:包括工况指示参数的历史追踪。这是一般情况下最有效的CM形式,对开发全面的知识库或专家系统最为有用。常见的测试内容有,发电机每月一次的空载测试,每年一次或两次的带载测试,UPS的放电测试,完整供电链路的发热情况检查,监测仪表的检查与比对测试,关键设备的维护保养。


(4)各种报警信息的原因分析,并定期做好汇总的分析报告。


数据中心中的大多数机械、电气和空调系统的故障,可以追溯到以下原因:1)设计缺陷;2)产品缺陷;3)安装缺陷;4)运行缺陷;5)缺乏维护。前面三个源头与最初的设计和施工有关,通过适当的测试可以发现问题进而通过整改解决。其余两个源头可采用预防性测试手段和自动化的监控手段加以缓和。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
压缩机量热计试验装置设计和要求
液压故障测量诊断法
数据中心基础设施综合测试之假负载测试
附录5验证管理
2.13 验证标准操作规程
3.7.3供配电系统查验内容及查验方法
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服