冷却AI:冷却架构保持数据中心可持续运行
AI几乎在我们的日常生活中无处不在,从导航和语音助手到社交媒体推荐和智能客户服务。在这些应用程序背后,有数以千计的服务器默默工作。这些服务器集中在被称为“数据中心”的地方,像计算城市一样运行,全年高效且不停地运转。然而,服务器长时间高速运转会产生大量热量。如果这些热量没有得到适当散发,不仅会降低效率,还会损坏设备,就像智能手机在夏天过热一样。因此,冷却系统已成为数据中心不可或缺的一部分。
让 AI 服务器降温最直观的方法是使用空调,类似于家用空调,以在服务器机房内保持稳定的低温。这种方法虽然简单,但在大型 AI 数据中心中能耗较高。许多数据中心设计了“冷通道”用于吹入冷空气,“热通道”用于排出热空气,以防止冷空气和热空气混合,从而提高冷却效率。
然而,随着AI模型规模的扩大和耗能的增加,传统的空调已不再足够。这时,液冷技术发挥了作用,采用导电液体而不是空气来直接从服务器中导出热量。这种方法冷却速度更快,且更节能。
冷却系统在AI数据中心中的作用不仅仅是“降温”。它还涉及整体能源效率和可持续性。冷却系统维持AI操作的稳定性和安全性,减少整体能耗,降低碳排放,节省电力成本,并提高运营效率。许多数据中心现在甚至回收热量用于再利用,例如加热建筑用水或提供温暖,确保没有热量被浪费。
在未来,AI 数据中心不仅象征效率,还代表绿色科技。从智能冷却到环保设计,每一个创新都是与技术和环境共存的努力。正如我们需要空调来舒适生活一样,AI 需要冷却系统来持续提供智能并在每一刻为我们服务。
为了提高AI数据中心冷却系统的效率,Arrow及其合作伙伴一直致力于开发相关解决方案。在即将到来的PCIM Asia 2025展会上,您将看到这些努力的成果。
AI数据中心的冷却系统:液体冷却和浸入式冷却
随着AI应用变得更加普及,AI数据中心的计算负载迅速增加,服务器的热量达到如同夏季路面般炽热的水平。传统的空气冷却(使用空气制冷,如空调)逐渐无法满足高密度、高热量的计算需求。此时,两项新技术,“液冷”和“浸没冷却”开始发挥作用。
液体冷却涉及使用液体而不是空气来从服务器中散热。最常见的方法是通过靠近服务器中高温组件(如CPU和GPU)的特殊管道循环水或其他冷却液,有效地“冷却”AI的“大脑”并快速去除热量。此方法提供高冷却效率,特别适合高性能AI计算。与空气冷却相比,它更节能、环保、减少服务器内温度差异,并有助于延长服务器的使用寿命。
浸没式冷却进一步通过将整个服务器浸没在对设备无害的特殊绝缘冷却液中,将热量快速从服务器表面传递到液体中,然后通过冷却系统排出。该方法提供极高的冷却效率,使其成为极高密度AI训练场景的理想选择。它几乎消除了对风扇的需求,减少了噪音和能耗,同时节省空间,使得数据中心设计更加紧凑。
随着人工智能模型日益复杂,如大型语言模型、视觉识别和实时翻译,需要庞大的计算能力。传统空气冷却不仅效率低下,还可能导致高电费和碳排放。液冷和浸没冷却不仅更加节能,还确保AI的长期稳定、安全运行,标志着绿色数据中心的重大进步。冷却技术已经从简单的降温工具演变为AI基础设施不可或缺的一部分。液冷和浸没冷却是推动AI与可持续发展并行发展的关键技术,确保AI智能、冷静地运行。这是智能与环境责任携手并进新时代的象征。
冷却解决方案使 AI 数据中心更稳定且更具环保性
Arrow Electronics及其合作伙伴一直致力于通过提供广泛的冷却解决方案,使AI数据中心更加稳定,提高能源效率。下面我们将根据应用类型介绍这些解决方案,包括电力转换、电机控制和智能互连。
1. 电力转换
在液体和浸没式冷却系统中,电源转换就像冷却系统背后的“电源枢纽”,负责将电力转换为驱动泵、风扇(如果需要)和冷却模块所需的适当电压和电流。其主要任务包括将电网输入转换为冷却设备所需的稳定低压电力,控制泵或换热单元的运行效率,并与传感器系统集成实现智能调节以避免能源浪费。通过高效的电源转换解决方案,液体和浸没系统可以稳定且节能地运行,为AI数据中心提供可靠的冷却。
3相3级T型双向电力转换器,带并网功能 — 此方案是高功率三相有源整流器(AFE)双向整流器。基于三级T型拓扑广泛用于工业电源、电动汽车快速充电和大功率电机驱动应用。它具有完全数字控制功能,为ST的高性能微控制器提供PF、THD、双向功率流和并网DC-AC功能的全面控制。采用3级T型拓扑,提供更高效率和更低功率损耗。
2. 电机控制
在液体和浸没式冷却系统中,电机控制就像冷却系统的指挥者,精确驱动液体循环系统中的关键设备,如水泵、风扇或电机。其主要功能包括控制冷却液的流量和压力以确保有效的热量移除,根据温度变化实时调整电机速度以提高能效,并减少设备磨损和噪音以延长系统寿命。通过智能电机控制,液体和浸没式冷却系统可以更加稳定、安静和高效地运行,为AI数据中心提供不间断的冷却动力。
智能风扇演示 — 此演示使用远红外热传感器检测热源,并通过 LED 板指示。当检测区中央检测到热源时,电机启动。温度越高,电机旋转越快。它使用 NXP 的 MCU MXCA153 接收温度数据,并通过 PWM 控制电机。当温度超过阈值时,风扇速度增加。此智能风扇演示结合了边缘 AI、电机控制和多点热检测,使其适合在各个领域中的智能应用。
SP210AC系列冷却控制板——由Syslab Electronics开发,SP210AC系列是一个具有主动PFC支持的变频驱动器。它接受220V±15%(50/60Hz)的输入电压,提供最大输出功率2kW,支持最大输入电流10A和最大输出相电流10A。功率因数≥0.99,提供6个数字输出和5个数字输入,以及11个模拟输入。通过RS485×3/CAN×1进行通信,并可选扩展为DC/AC风扇控制板。

10 kW PMSM电机驱动器——由STMicroelectronics (ST)推出的这款电机驱动控制板基于STM32G4平台,包含一个三相Vienna PFC电机和一个MCU,以实现高效冷却。这种高功率冷却系统可用于数据中心基础设施管理,例如直接液冷AI服务器和电信基站。它采用WBG材料,电机变速驱动可以根据当前需求调整电机速度,节省20-60%。驱动器根据负载(SRM)优化电机磁通量,节省高达20%,并支持分布式dPFC以改善电力质量。系统分析能够优化冷却,节省约30%的电力。
3. 智能连接
在液体和浸没式冷却系统中,智能互连就像神经网络一样,连接传感器、控制器、马达和能源系统,实现实时监测和智能协作整个冷却过程。智能互连的主要功能包括传输温度、压力和流量等数据以进行精确控制,实现远程监测和诊断以提高维护效率,并与AI数据中心的能源和计算管理系统集成以实现整体优化。通过智能互连,冷却系统不再是独立的机械设备,而成为AI数据中心智能运行的一部分,使整个系统更加节能和可靠。

OSFP互连系统 — Molex的八通道小型可插拔(OSFP)互连系统和电缆组件提供每通道56或112 Gbps的PAM-4单端口8通道I/O连接。OSFP连接器系统支持16个通道,速率为112 Gbps的PAM-4,每行有4个接收对和4个发射对,为400和800 Gbps的聚合数据速率提供优化接口。它改善了热管理,并符合IEEE和OSFP行业标准。紧凑型DAC、AOC、ACC和光模块为数据中心解决方案、通信/网络高密度交换应用提供灵活性,满足AI、机器学习(ML)、高速网络及其他高速应用的不断增长需求。
结论
随着AI不断推动创新,其背后的数据中心也在悄然发展。从液体到浸没式冷却,这些不断优化的冷却技术是确保AI稳定、高效运行,并且低碳排放的关键力量。冷却不仅是技术细节,更是对可持续发展的承诺。在我们让AI变得更智能的同时,也要确保每一千瓦的电力和每一滴冷却液都将我们带向未来的绿色标准。
文章标签