随着人工智能从学习转向推理,处理数万亿代币产生的巨大热量正迫使计算基础设施进行彻底的重新设计。 人工智能的飞速发展正将电力需求推向空前高度。预计到2026年,高性能数据中心的单个服务器机柜将需要一兆瓦的电力。这一增长源于人工智能重心的转移:从最初的模型训练转向活跃的“推理”阶段,即模型实时生成响应的过程。