在本周举行的开放计算项目(OCP)全球峰会上,微软做出多项新贡献,优化各层面基础设施,助力人工智能取得突破。
其中一个重点是数据中心冷却,以支持来自 AI 系统的更高功率负载。微软展示了一种先进的液体冷却热交换器的设计,以便在全球范围内更轻松地部署。该系统采用模块化设计,可高效地从处理 AI 工作负载的越来越密集的机架中散热。
微软表示,电力输送是另一个需要创新的领域。它展示了微软和 Meta 如何合作开发分体式 400 高压直流 (VDC) 机架设计。模块化电源架构可将机架从数百千瓦扩展到 1 兆瓦,以增加每个机架的 AI 加速器数量,从而确保您的基础设施规模能够适应不断变化的工作负载需求。
这是一种新的分解式机架设计,旨在解决关键的空间和功率限制问题。该解决方案采用分解式 400 高压直流 (VDC) 单元,功率范围从数百千瓦到 1 兆瓦,使每个服务器机架中的 AI 加速器数量增加 15% 到 35%。这种模块化方法允许在分解式电源机架中进行功率调整,以满足不同推理和训练 SKU 不断变化的需求。
微软还预告了加强人工智能对抗新一代量子攻击机器的措施。它正在通过Caliptra硅信任根项目将 Adams Bridge 抗量子加速器开源。
量子计算机能力的不断增强给硬件安全带来了挑战,因为在整个硬件安全领域广泛使用的经典非对称加密算法很容易被足够强大的量子计算机攻破。在认识到这一风险后,美国国家标准与技术研究院 (NIST) 发布了针对新型量子弹性算法的标准。
此外,微软还联合创办了 OCP-SAFE 计划,以对硬件和固件进行一致的安全审计。除了 Caliptra 等项目外,该计划还进一步提高了供应链的透明度和完整性,这对于实现硬件信任至关重要。