为什么昇腾384超节点能成为“镇馆之宝”?
文 观察者网
吕栋
机器人不仅能调酒、分拣还能格斗,AI眼镜不仅能翻译、导航还能支付,医疗大模型不仅能识别病理切片还能自动生成诊断报告,金融数字员工正从辅助工具变身“专业研究员”......这些画面并不是科幻电影,而是世界人工智能大会(WAIC 2025)被火爆围观的场景。
在这里,每个人都能感受到,中国AI应用创新正呈现百花齐放之势。但不可否认的是,无论AI技术在哪个场景落地,都离不开算力底座的支撑。尤其是在当下,随着全球AI竞争进入白热化,美国不断收紧技术出口管制,中国产业界更加呼唤底层软硬件的技术突破。
适配和开发超80个大模型,孵化6000+个行业解决方案等数据,充分证明了昇腾绝对不是“花架子”,而是已形成技术、应用和生态的正向循环。
在这种趋势下,华为充分发挥在通信、存储、基础软件等方面的大杂烩优势,通过非摩尔补摩尔、数学补物理等系统工程创新,成功实现业界最大规模的384颗昇腾NPU高速总线互联,构建了昇腾384超节点。它由12个计算柜和4个总线柜构成,算力总规模达300 PFLOPS。
并且,昇腾384超节点还可以通过灵活分配资源,更好地支持混合专家MoE大模型的训推,实现384卡“一卡一专家”,是业界唯一支持DeepSeekV3/R1在一个超节点域内即可完成所有的专家并行(EP)的方案,也是MoE模型的最佳训练/推理方案。
之所以能实现这种超强性能,是因为昇腾超节点并非修补式改进,而是彻底重构系统。一是打破以CPU为中心的冯诺依曼架构,计算单元通过总线直接互访,转变为更高效、更灵活的全对等架构;其次,新的总线技术重新定义通信互联协议,减少系统开销,内存统一编址,超节点内全局TB级内存统一访问;第三,突破传统服务器间通信能力不足带来的系统性能瓶颈,实现通信能力10倍提升,让计算不再等待通信,提升算力利用率和整体性能。
枝繁叶茂,昇腾已走进千行万业
1、《南京照相馆》:日本真实罪行照片多罪恶?,南京国际照相馆的前身
2、市值涨超4000亿!601138,中国AI“超级牛股”,燃起来了!
3、澳大利亚麦夸里岛附近海域发生6.9级地震,澳大利亚发生5.9级地震