10/11/2025,,在OpenAI积极规划自建数据中心之际,微软首席执行官Satya Nadella通过一则推文向业界展示了其已投入运营的大规模AI系统。这套被Nvidia称为AI“工厂”的系统,现已成为微软Azure全球数据中心网络中运行OpenAI工作负载的首个实例,Nadella明确表示这仅是“众多同类系统中的第一个”。
该AI工厂集群由超过4600台Nvidia GB300机架式计算机构成,这些设备搭载了市场需求旺盛的Blackwell Ultra GPU芯片,并通过Nvidia的InfiniBand超高速网络技术实现互联。值得一提的是,Nvidia首席执行官Jensen Huang早在2019年就以69亿美元收购Mellanox公司,这一前瞻性布局使其在InfiniBand技术领域占据了市场主导地位。
微软承诺将在全球范围内部署“数十万颗Blackwell Ultra GPU”以扩展这些系统。除了系统规模令人瞩目外,公司还分享了大量技术细节供硬件爱好者深入研究。此次发布的时机同样值得关注——就在此前不久,与其既合作又竞争的OpenAI刚刚与Nvidia和AMD签署了两项备受瞩目的数据中心协议。
根据业内估算,OpenAI在2025年已获得总额约1万亿美元的数据中心建设承诺。该公司首席执行官Sam Altman本周更表示还将继续扩大建设规模。微软此时发布消息,显然意在向世界表明:公司已在34个国家拥有300多座数据中心,这些设施“独具优势”,能够“满足当前前沿AI的需求”。微软强调,这些巨型AI系统同样具备运行参数规模达“数万亿级”的下一代模型的能力。
业界预计本月晚些时候将获悉更多关于微软提升AI工作负载服务能力的细节。微软首席技术官Kevin Scott已确认将在10月27日至29日于旧金山举行的TechCrunch Disrupt大会上发表演讲。