徐直军首先系统披露了华为AI与通用计算未来三年路线图,并发布全球首个万卡“超节点”互联协议——灵衢(UnifiedBus)。他表示,华为将以“超节点+集群”新范式,持续破解中国AI算力瓶颈,支撑人工智能走向AGI。
DeepSeek的横空出世给AI产业带来了巨大的冲击,尽管DeepSeek模式可以大幅减少算力需求,但要走向AGI、要走向物理AI,华为认为,算力过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键。
在芯片路标方面,华为一口气亮出四颗新芯:
2026年Q1发布Ascend 950PR,主打推理Prefill与推荐场景;
2026年Q4发布Ascend 950DT,面向Decode与训练,互联带宽2 TB/s;
2027年Q4推出Ascend 960,规格全面翻倍并支持自研4bit格式HiF4;
2028年Q4计划发布Ascend 970,FP8/FP4算力再翻番,内存带宽提升1.5倍。
在超节点方面,基于新芯片,华为带来三款超节点:
Atlas 950:8192卡,FP8算力8 EFLOPS,2026年Q4上市;
Atlas 960:15488卡,FP8算力30 EFLOPS,2027年Q4上市;
TaiShan 950:全球首款通用计算超节点,16节点、48 TB内存,2026年Q1上市,号称“大型机终结者”。
此外,万卡规模对互联提出极限挑战。华为首次发布自研“灵衢2.0”协议,实现200米长距离、2.1微秒低时延、16 PB/s超大带宽,并将技术规范对外开源,邀请产业共建生态。
集群层面,华为同步推出:
Atlas 950 SuperCluster:64个Atlas 950超节点、52万卡,FP8算力524 EFLOPS,2026年Q4交付;
Atlas 960 SuperCluster:百万卡规模,FP8算力2 ZFLOPS,2027年Q4交付,规模与算力均超当前全球最大集群。
徐直军强调,基于中国可获得的工艺,华为通过芯片、架构、协议三位一体创新,已具备年交付“万卡级一台计算机”的能力。“灵衢”不仅服务AI,也将赋能通用计算、数据库、推荐系统等场景,持续为人工智能乃至数字经济提供澎湃算力。