人工智能(AI)的迅猛发展推动了数据中心处理能力的显著增长。如图1所示,英飞凌预测单台GPU的功耗将呈指数级上升,预计到2030年将达到约2000W [1],而AI服务器机架的峰值功耗将突破惊人的300kW。这一趋势促使数据中心机架的AC和DC配电系统进行架构升级,重在减少从电网到核心设备的电力转换和配送过程中的功率损耗。
图2(右)展示了开放计算项目(OCP)机架供电架构的示例。每个电源架由三相输入供电,可容纳多台PSU;每台PSU由单相输入供电。机架将直流电压(例如,50V)输出到母线,母线则连接到IT和电池架。
AI的发展趋势要求对PSU功率进行革新,如图2(左)所示。接下来,我们将通过各代PSU的拓扑结构和器件技术建议示例,来逐步介绍这些PSU的演变。
图1 基于x86和Arm®架构的服务器CPU
与GPU和TPU的电力需求对比
图2 AI服务器PSU的功率演变(左);服务器机架架构示例(右)。
AI服务器机架PSU的趋势和功率演进
▴ 第一代AI PSU:在相同的架构下提升功率,~5.5-8kW、50Vout、277Vac、单相
当前的AI服务器PSU大多遵循ORv3-HPR标准[9]。相较于先前的ORv3 3 kW标准[9],该标准的大部分要求(包括输入和输出电压以及效率)保持不变,但增加了与AI服务器需求相关的更新,例如,更高的功率和峰值功率要求(稍后详述)。此外,由于与BBU架的通信方式有所调整,输出电压的调节范围变得更窄。
尽管每个电源架都通过三相输入(400-480 Vac L-L)供电(见图2),但每台PSU的输入仍为单相(230-277 Vac)。图3展示了符合ORv3-HPR标准的第一代PSU的部署示例:PFC级可以采用两个交错的图腾柱拓扑结构,其中,650V CoolSiC™ MOSFET用于快臂开关,600V CoolMOS™ SJ MOSFET用于慢臂开关。DC-DC级可以选用650V CoolGaN™晶体管的全桥LLC,次级全桥整流器和ORing则使用80V OptiMOS™ Power MOSFET。此外,示例还展示了一个中间级,也称“延长保持时间”或“小型升压”,其作用是减小大容量电容器的尺寸。该中间级由一个升压转换器组成,在线路周期掉电事件期间,通过储能电容器放电,以调节LLC输入电压。在正常运行期间,升压转换器保持空闲状态,并通过低阻抗的600V CoolMOS™ SJ MOSFET旁路。