陆翰涛 黄 赟 陈 强
中国移动通信集团上海有限公司
在信息时代下,数据正呈现指数倍增长,对数据进行大规模和灵活性的运用,可以更好地理解及发掘其价值。数据中心产业得以蓬勃发展,建设体量和建设规模不断扩大。而数据中心的用能以电力消耗为主。
随着数据中心的迅猛发展,国家相继出台数据中心关于能效的强制规定和要求。2013 年工信部等五部委《关于数据中心建设布局的指导意见》,要求新建大型IDC 的PUE 值在1.5 以下,已建数据中心需要整合、改造、升级,确保PUE 值降低到2.0 以下[1]。2016年国务院关于印发《“十三五”国家信息化规划》的通知,要求到2018 年,新建大型云计算数据中心PUE 值不高于1.5;
到2020 年,新建大型云计算数据中心的PUE 值不高于1.4[2]。工业和信息化部、国家机关事务管理局、国家能源局在2019年发布《关于加强绿色数据中心建设的指导意见》,明确提出2022 年新建大型、超大型数据中心的PUE值达到1.4以下,力争通过改造使既有大型、超大型数据中心PUE 值不高于1.8[3]。而发改委发布《关于加快构建全国一体化大数据中心协同创新体系的指导意见》指出,到2025 年,东西部数据中心实现结构性平衡,大型、超大型数据中心运行PUE降到1.3 以下[4];
2021 年10 月《关于严格能效约束推动重点领域节能降碳的若干意见》中,鼓励重点行业利用绿色数据中心等新型基础设施实现节能降耗。新建大型、超大型数据中心电能利用效率不超过1.3。到2025年,数据中心电能利用效率普遍不超过1.5[5]。
地方政府也对PUE 值管控提出了严格的标准。《上海市推进新一代信息基础设施建设助力提升城市能级和核心竞争力三年行动计划(2018-2020年)》明确要求存量改造数据中心PUE不高于1.4,新建数据中心PUE 限制在1.3 以下[6];
北京市《关于印发进一步加强数据中心项目节能审查若干规定的通知》中,对于超过标准限定值(PUE值1.4)的数据中心,将由北京市电力公司按月征收差别电价电费[7];
《广东省5G 基站和数据中心总体布局规划(2021-2025 年)》要求,到2022 年,全省数据中心设计PUE 值平均小于1.3,到2025 年,全省数据中心设计PUE值平均小于1.25[8]。
数据中心制冷系统和IT设备的电耗开销,占据了数据中心总电耗的80%以上,其中制冷系统耗电占比约30% ~ 40%。从PUE 计算方式可以看出,降低制冷系统能耗,是数据中心节能减排和压降PUE 最直接也是最常用的方法。传统节能方案包括建筑围护结构改造、气流组织优化、高效设备更替等方式。其中前两者主要是静态改造,节能空间有限,后者需要对制冷设备进行升级,往往周期长并伴随施工风险。传统方案都会对数据中心进行物理改变,对业务连续性可能存在影响,因此对在网运行的数据中心不够友好。
针对数据中心空调系统的各类网管工具如动环、DCIM、BA 等,通常侧重于设备的运行状态跟踪、监测和故障告警,较少会进行主动控制,对于空调设备运行能效的提升效果有限,而且仍然需要人工经验参与指导,通常关注的是多个局部而非整体。
数据中心机房内部不同区域的热量堆积受季节、天气以及IT系统负载变化影响,呈现波动趋势,因此,对冷量的需求也动态变化。传统管理手段无法达到对制冷设备的精细化调优,仅粗放的管理方式势必存在制冷量和能耗的浪费。
而通过AI和大数据等技术,可实时和自动采集并分析机房温度、气象环境、设备耗电以及运行信号,然后基于时序预测方法来确定机房不同区域的制冷需求,并精确关联至每台制冷设备的运行工况。通过对制冷设备能效建模来分析精密空调、冷水机组、水泵、冷却塔等设备的状态,并且输出全局最优调节参数,最终通过数据中心动环、群控等管理系统实现控制指令自动下发,达到精准制冷同时降低能耗的效果。
2.1 技术路线分析
经过多年的技术演进,当前对数据中心内制冷系统的节能手段的技术主要分为传统节能手段和创新节能手段,两种类型内具代表性的技术路线分析见表2-1。
表2-1 数据中心制冷系统节能技术路线类型
由此可见,在创新节能领域,利用AI 技术在数据中心制冷系统中进行智能节能已经具备较为可行的成熟方案,具备推广落地应用的条件。
但是AI 智能节能各厂商产品及技术良莠不齐,市场缺乏其在有效性、先进性、安全性等方面的评价标准,下述章节将从三个角度分析相关技术优劣。
2.2 AI节能技术路线评估
2.2.1 有效性
结合当前市场各类AI节能厂商的技术方案、调控方式、实施案例等情况,建议按调控对象、自动化程度、改造程度、节能效果、落地案例这些维度来评估其AI节能方案,见图2-1。
图2-1 AI节能能力评估
2.2.2 先进性
在上述五个维度中均处于优势地位时,其产品AI节能的综合能力较高,在此基础上进一步的节能效果比较,主要取决于产品内AI算法的优劣和模型的完善程度。
此部分为AI节能厂商的核心技术,均不对外公开,因此建议可从落地项目案例侧面评估,案例越多、节能效果越好,则意味着产品核心的模型设计越完善、AI算法越合理。
2.2.3 安全性
基于AI节能的原理为全局寻优,在每个工况下均存在系统理论节能极限,因此系统的安全保障机制同样重要。AI节能系统越稳定、安全保障机制越完善,意味着其能够保证长期稳定运行节能策略,才能够达到最大化节能。
3.1 AI技术智能节能应用概述
研究和应用通过AI 技术在数据中心制冷系统中进行智能节能,成为当前数据中心制冷系统节能手段中投入小、见效快、效果优、安全性高的一种技术手段,并且该技术可以叠加传统节能手段,进一步提升数据中心制冷系统的节能空间。
智能算法和控制模型既可以兼容匹配新设备、新工艺和新技术,也能很好利用围护结构改造和气流组织优化带来的便利,辅助达到最佳的空调运行状态。通过密集的数据采集、算法强化学习和高频自动控制,该技术可以取代传统人工经验积累,加上长时间的曲线跟踪以及现场操作的运维模式,建立一套自动化运维和长期无人值守的控制模式,对空调系统进行持续的、自学习优化的节能控制,实现最大化节能收益。
3.2 系统设计思路
目前大部分数据中心的冷源侧与精密空调末端仍采用传统的控制模式,造成冷源与末端无法交互协同、系统动态调节性差、自然冷却不充分等一系列问题,使得数据中心平均PUE值始终处于较高的位置。而传统节能升级改造方案往往伴随着实施周期长、风险大等弊端。基于AI算法的数据机房节能优化控制平台的研发旨在利用高新技术,提升数据中心制冷系统能效,达成节能减排和降低PUE的目标,促进绿色可持续发展,相较传统方案更加科学高效,同时不相冲突,二者结合节能效果更佳。
AI 智能节能系统旨在利用大数据技术和AI 智能算法,分析机房全局能耗数据,通过AI 建模预测设备发热量和温场趋势,动态生成空调设备控制参数,并通过软件实时下发,以达到最佳节能效果。主要目标包括:
1)根据机房历史温度数据建立温场模型,查找机房冷热点,结合预测机房发热模型,生成最优的空调控制参数。
2)实现前端数据采集、数据存储、数据分析以及设备控制全流程。智能设备开箱即用,支持主流连接控制协议,兼容指定环境的空调型号,无需改变机房内部结构。
3)实现对空调、温感数据的采集,和空调控制指令的自动下发,减少人工干预。
4)实现对末端空调的风机、温度设定等参数的实时控制,在保障安全生产的同时,达到节能效果。
3.3 系统架构设计
系统架构设计见图3-1所示。
图3-1 AI智能节能系统架构设计
AI 智能节能系统架构设计主要功能包括数据采集、数据存储、算法训练、算法模型输出、算法模型应用输出节能策略、节能成效分析,安全检测等。支持对接动环平台采集机房末端空调及温感数据、对接能耗平台采集IT 和制冷能耗数据、对接群控系统采集冷站设备数据,将采集数据存储至时序数据库从而形成完整的数据管理体系。采集数据可支撑AI节能算法的模型训练和发布,训练后的AI 节能模型可支持线上部署并动态输出相关节能策略。支持对冷站、机楼、机房侧节能成效进行分析和展示。同时为保证机房服务器的运行安全,可对机房环境及冷站侧设备参数变化情况进行动态监测,从而保证可及时发现异常并采取相应安全保障措施。
3.4 核心功能设计
3.4.1 AI模型训练
AI 智能节能系统基于采集的历史数据集可建立制冷影响力模型、空调能耗与制冷量关联模型、机房温度预测模型、空调控制逻辑模型以及空调制冷量冗余度模型;
并可基于实时数据集推理和验证模型准确度。
基于制冷设备相关信号数据以及环境数据预测空调核心功能模块的运行状态,从而实现核心模块的精准控制。
通过AI算法对当地气象数据进行建模分析,预测连续低温时段,最大利用传统BA 难以控制的自然冷却时间,结合末端联动冷站调优。
3.4.2 AI节能数据分析预测
AI智能节能系统可预测机房温度在未来1 h内在当前空调配置参数下温度的变化趋势,基于该预测结果,可判断该机房温度是否偏低或偏高,生成相应的控制策略,并评估空调在新策略下运行是否会触发温度告警。
系统基于采集的机房温感实时数据,通过在线组态技术可实现机房热力图的动态展示,实时查看和监控机房温场变化情况。同时AI 节能算法可基于历史数据预测机房区域温度趋势,根据热平衡方程计算所需冷量大小及时刻及时输出相关调控策略,调节机房温场的热平衡,通过精准调控可合理分配机房冷量,从而降低整体制冷能耗达到节能减排的效果。
3.4.3 AI节能调控
AI 智能节能系统通过对接动环平台可实现对机房末端空调的实时参数调控,运维人员通过AI节能系统手动操作或AI 节能算法程序输出节能策略下发可自动调整精密空调运行参数(开关机、回风温度、风机运行频率范围等),使其达到合理制冷量输出时能耗最低状态,实现精密空调的运行省电。
3.4.4 节能成效分析
AI 智能节能系统基于制冷和生产能耗数据的采集,可对机房、机楼的整体节电量、节能率以及PUE 数据变化等作出评估和分析。AI 节能系统支持通过图表方式对机楼和机房作PUE分析,分析机房PUE变化趋势,支持查看设备采集实时数据的变化趋势,支持设备用电量报表,包括日报表、月报表和年报表的统计和查询,支持区域用电量报表,包括日报表、月报表和年报表的统计和查询。
3.5 系统先进性和主要创新点
该系统目前在全国范围内均无完全一致技术路线的同类产品,相较于传统数据中心节能手段具备创新型、先进性,其主要创新点如下:
1)数据采集:通过智能传感器和网关设备,采集相关静态和动态数据,包括环境温湿度、设备能耗和空调运行工况,结合机房和传感器物理分布情况,构建静态点位数据和动态信号量的关联数据集。
2)AI 数据建模:基于历史数据集建立制冷影响力模型、空调能耗与制冷量关联模型、机房温度预测模型、空调控制逻辑模型以及空调制冷量冗余度模型;
基于实时数据集推理和验证模型准确度。
3)AI 分析决策:预测机房温度在未来1 h 内在当前空调配置参数下温度的变化趋势,基于该预测结果,判断该机房温度是否偏低或偏高,生成相应的控制策略,并评估空调在新策略下运行是否会触发温度告警。
4)物联控制:通过人工操作或程序下发自动调整精密空调运行参数(开关机、回风温度、风机运行频率范围等),使其达到合理制冷量输出时能耗最低状态,实现精密空调的运行省电。
5)AI 能力封装:封装具备实时数据采集、AI 算法训练、AI 算法模型发布、节能策略管理、告警监控、节能成效分析等功能的AI 节能平台,满足AI 节能算法对冷站侧和机房末端侧的联合调控需求。
6)节能管理:可根据不同特征的机房定制模型进行智能分析,输出个性化的节能建议。另外定义平台节能策略的类别和级别,可对节能策略的执行进行控制。既可以实现实时策略智能控制,也可以对部分节能策略进行安全审计,满足数据中心安全要求。
3.6 系统对生产安全性的保障
AI 智能节能系统本身在数据容错、调控策略、异常恢复等方面,均具备完善的安全性考虑,能够确保其自动运行过程中的异常情况可以及时规避、恢复、告警。
1)采集数据容错
当出现数据采集延迟、丢失时,算法可根据实际情况判断当前策略是否具备时效性,对于没有时效性的策略进行剔除并记录。
2)调控策略回滚
可支持自动和手动回滚方式,并支持设置默认参数值,例如:只要有1 条子策略执行失败,自动执行整组AI调控策略回退;
管理员可手动选择过去任意时间点进行AI 调控策略回退;
管理员可自定义设置默认策略和制冷系统参数模板,在需要时可一键设置制冷系统运行参数为指定状态。
3)异常恢复能力
AI调控策略下发后,系统可支持实时监控温度变化,当出现异常时可选择自动恢复至预先定义的安全策略。
异常情况支持自定义,例如:
(1)出现1个及以上温感高温告警,且温度超出告警阈值2 ℃;
(2)出现1个及以上温感高温告警,且持续时间超过10 min;
(3)某个机房同时出现超过1/3 数量的温感高温告警;
(4)指定了某台空调为不能关机、实际却触发了关机操作。
作为算力基础设施的核心物理载体,数据中心是近年来信息通信投资的热门领域。工信部数据显示,2022 年我国在用数据中心机架总规模超过590万标准机架,服务器规模约2 000万台,数据中心存储容量年均增长速度超50%。数据中心一般要求全年运行不中断,年运行时长达到8 760 h。
在全社会数据与算力需求爆发的背景下,数据中心功耗不可避免地迅速提升。据中国信息通信研究院云计算与大数据研究所测算,到2030年,我国数据中心耗电量将超过3 800 亿kWh,碳排放量将超过2亿t。
由此可见,无论是现在还是未来很长一段时间内,对于数据中心制冷系统的节能技术都是社会关注的问题,基于AI节能算法的数据中心制冷系统节能技术的推广和应用能够降低数据中心对于用电量的需求,在实现自身绿色低碳发展的同时,以推动新型基础设施发展为依托,提升赋能数字经济绿色发展能力,为国家碳达峰、碳中和贡献行业力量。
猜你喜欢 制冷系统机房数据中心 酒泉云计算大数据中心机械研究与应用(2022年4期)2022-09-15R290/R170单级压缩回热制冷系统模拟研究煤气与热力(2021年10期)2021-12-02民航绿色云数据中心PUE控制电子测试(2018年11期)2018-06-26N通信公司机房节能技改实践通信电源技术(2016年6期)2016-04-20奥迪A6L车制冷系统工作异常汽车维护与修理(2016年3期)2016-02-28新型有线电视机房UPS系统的配置西部广播电视(2015年10期)2016-01-18大功率发射机房冷却送风改造西部广播电视(2015年8期)2016-01-16基于云计算的交通运输数据中心实现与应用中国交通信息化(2015年3期)2015-06-05Overlay Network技术在云计算数据中心中的应用河南科技(2014年11期)2014-02-27制冷系统节电控制改造的研究河南科技(2014年10期)2014-02-27