时间:2025-07-27 08:12 作者:中华田园蓝猫
华为首次展出“算力核弹”真机,获评镇馆之宝
(文/观察者网 吕栋)
7月26日,观察者网在世界人工智能大会(WAIC 2025)现场了解到,华为首次展出了昇腾384超节点真机,并且获评“WAIC镇馆之宝”。在展台上,华为还全方位展现了昇腾算力底座的创新能力、训练及推理解决方案、开源开放的软硬件生态,以及在互联网、运营商、金融、能源、教育科研等千行万业的丰富实践。
在当下,大模型训练和推理对算力需求的爆炸式增长,但传统计算架构面临资源利用率低,故障频发等挑战,难以支撑AI技术的代际跃迁,这就算力集群的系统工程能力提出更高要求。
纵观国内,目前使用全国产芯片构建超节点,还能全面超越英伟达NVL72的,只有华为。昇腾384超节点通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,它的算力总规模达300Pflops,是英伟达NVL72的1.7倍;网络互联总带宽达269TB/s,比英伟达NVL72提升107%;内存总带宽达1229TB/s,比英伟达NVL72提升113%;单卡推理吞吐量跃升到2300 Tokens/s。
更重要的是,通过最佳负载均衡组网等方案,昇腾超节点还能进一步扩展为包含数万卡的Atlas 900 SuperCluster超节点集群,未来可以支撑更大规模的模型演进。
观察者网获得的性能测试数据显示,在昇腾超节点集群上,LLaMA3等千亿稠密模型性能相比传统集群提升2.5倍以上;在通信需求更高的Qwen、DeepSeek等多模态、MoE模型上,性能提升可达3倍以上,较业界其他集群高出1.2倍,在行业中处于领先地位。
“单芯片制程从7纳米到5纳米、3纳米、2纳米,每代性能提升不超过20%,总体能提升50%左右。华为通过高效的超节点系统,提升了芯片算力利用率。在硬件什么也没有改变的情况下,通过系统工程的优化,资源的高效调度,一定程度弥补了芯片工艺的不足。”华为专家曾对观察者网表示。
观察者网了解到,本次参展WAIC,华为展台面积超过800平方米,除了展示昇腾软硬件能力,训练、推理解决方案和开源开放的软硬件生态,还携手伙伴共同展示互联网、运营商、金融、政务、医疗、油气、交通等11大行业解决方案实践,供与会者现场参观交流。
本文系观察者网独家稿件,未经授权,不得转载。
1、外媒观察|全球贸易不确定性下的“中欧峰会”:相互尊重,不因分歧影响合作大局
2、船记:球队已有14人不太可能签满 泰泰-华盛顿大概率不是正式合同
3、打造藏滇中南半岛孟加拉输电大通道,孟加拉国与中国合作建火电站的优势