“今年市场需求非常好!”在6月11日到13日举行的第11届上海国际数据中心产业展览会上,液冷赛道参展商纷纷给出积极的市场信号。
随着AI浪潮席卷各行各业,数据中心作为智算中心的载体迎来了建设热潮。新建数据中心算力密度不断加大的同时,也面临更严峻的能耗挑战。为了提高数据中心功效,减少散热耗能,液冷技术已成为新建数据中心的必选项,上市公司纷纷入局掘金。
智算增长呼唤数据中心节能技术
“以前和数据中心的业主方坐下来,我要先讲解什么叫液冷,要不要用液冷;现在变成了直接谈用多大比例的液冷,落地哪种方案。”网宿科技副总裁、绿色云图总经理胡世轩告诉记者。
2022年起,绿色云图成为多家头部互联网企业的合格供应商,如今客户以互联网企业为主,也涵盖央国企、高校科研机构等。
展会现场 刘怡鹤/摄
在AI大模型的训练和应用热潮下,我国智能算力正在快速增长。《中国人工智能计算力发展评估报告》(下文简称《报告》)显示,2024年,中国智能算力规模达725.3百亿亿次/秒(EFLOPS),同比增长74.1%,增幅是同期通用算力增幅(20.6%)的3倍以上;市场规模为190亿美元,同比增长86.9%。
《报告》预计,2025年,中国智能算力规模将达到1037.3EFLOPS,较2024年增长43%;中国人工智能算力市场规模将达到259亿美元,较2024年增长36.2%。
智能算力增长的背后,随着一座座数据中心建设投用,其能耗也急剧增长。IDC预测,2025年,人工智能数据中心IT能耗将达到77.7太瓦时(TWh),是2023年能耗量的两倍,2027年将增长至146.2太瓦时,2022—2027年五年年复合增长率为44.8%,五年间实现六倍增长。
液冷技术作为关键突破,可以显著提升计算密度,降低数据中心的总能耗。2024年7月,马斯克旗下AI初创公司xAI启动了位于田纳西州孟菲斯的超级计算机集群,该集群就由10万块英伟达液冷H100GPU组成。仅仅5个月后,xAI计划将这个集群扩大十倍,用来容纳至少100万块GPU。该集群用于训练xAI的大模型Grok,和OpenAI竞争。
“越先进的芯片,算力越大,功率也越大,传统风冷几乎无法满足散热需求。”胡世轩说。目前,英伟达的H100GPU单颗功率为700W,英特尔、AMD的CPU功率已突破500W,国产芯片的功率也普遍达到了300W。
上市公司竞逐液冷赛道
从技术路径来看,液冷技术主要分为冷板式液冷、浸没式液冷和喷淋式液冷等技术类型。据绿色云图的估算,假设一台服务器功率为100W(其中风扇占20%,元器件占80%),使用冷板方案的总功率较风冷方案降低约16.1%,浸没式液冷的总功率较风冷方案降低32.3%。
绿色云图液冷机柜 刘怡鹤/摄
绿色云图液冷机柜 刘怡鹤/摄
其中,冷板式液冷技术是当前成熟度最高、应用最广泛的液冷散热方案。“北交所IDC温控第一股”曙光数创产品总监白泽阳告诉记者,冷板液冷和浸没式液冷最大的区别在于,冷板式液冷对服务器本身的改造很小,市场接受度更高。浸没式液冷基本要重新开发服务器,周期较长。
此外,浸没式液冷服务器的后期运维也更为复杂。不过,随着算力密度越来越大,节能水平更高的浸没式液冷与冷板式液冷的比例将逐渐接近。
为更贴近当前的市场需求,多家上市公司针对提升冷板式液冷的安全性、换热能力等推出创新方案。
“数据安全对于各行各业越来越重要,特别是对于涉及国计民生的行业来说,必须确保万无一失。”胡世轩说。冷板式液冷技术通常采用水基冷却剂,随着时间的推移,冷却剂会导致金属部件腐蚀,甚至可能引发水泄漏,导致服务器等设备的短路和损坏。
绿色云图推出“飓风无水”冷板解决方案,采用自主研发的非水基不导电介质风液CDU作为冷却剂,更新架构设计,即使发生泄漏也不会损坏设备。
“行业想尽办法杜绝漏液,而我们的思路是不怕漏,漏了也不会带来损失。”胡世轩说。由于冷板系统中的液体用量不多,新产品的价格提升也几乎可以忽略不计。
曙光数创发布了相变间接液冷数据中心整体解决方案C7000-F,创新优化了冷却液、冷板材料和结构等。方案通过强化沸腾技术,由冷却液遇热汽化带走热量,后端再冷凝回流,从而实现散热能力提升,总体温度下降5℃以上。其使用的冷却液同样不导电、安全稳定,彻底解决了传统水冷板在水质和系统安全方面的困扰。
展会现场 刘怡鹤/摄
参会者围绕曙光数创液冷产品参观 刘怡鹤/摄
前不久,川润股份申请了一项名为“一种数据中心负压CDU处理系统及方法”的专利。记者从现场工作人员处了解到,这一专利旨在通过压力方式防止液体泄漏,即使管路出现破损,也能保持内部压力。川润股份是润滑设备领域第一家上市公司,向新能源、储能等多领域提供液冷解决方案,近年来也入局数据中心液冷赛道。