“九天”通用基础大模型3.0发布 模型能力多维升级 多项技术成果开源
7月26日,在2025世界人工智能大会“AI焕新 产业共赢”企业人工智能产业发展论坛上,中国移动焕新发布“九天”基础大模型3.0,向业界展现了中国移动在大模型领域的深厚自研能力和持续创新能力。
本次发布的“九天”基础大模型3.0是国务院国资委战新“百大工程”的重要成果,进一步强化了“高安全、高可控、全国产、全行业”四大特性,重点实现三大焕新:
一、九天众擎语言大模型实现架构与性能双重跃迁。模型突破性采用可扩展至万亿级的MoE架构,以15T token多阶段配比预训练数据与全流程治理体系强化推理能力,创新构建113域×53能力的二维分级后训练框架,结合动态强化学习策略,驱动复杂推理能力提升35%。模型权威在榜单成绩斐然。在GPQA-Diamond评测中,“九天”以77.67分斩获全球第二,超越DeepSeekR1和Qwen3;在ArenaHard V1.0中,以67.2分位居全球第一;在BFCL V3评测中,达到68分。性能跃升的同时,模型进一步强化了可控生成能力,破解沉浸式角色演绎,精确流程内置等技术细节,实现了专业场景零幻觉。
基于最新的语言大模型,中国移动此次也推出多个专项模型。九天代码大模型使用两阶段的持续训练技术,支持代码生成、注释生成、单元测试生成、代码智能问答等多种任务,支持Python、Java、JS、TS、Go、C++等10+种主流编程语言。指标方面,在EvalPlus、MHPP、LivecodeBenchv6等多个代码生成榜单上成绩领先。九天数学大模型,短思考、长思考模式均达到业界SOTA水平,多项指标超过Qwen 2.5 Math、Qwen3、DeepSeek Math、DeepSeek R1-Distill等同参数量级模型。
中国移动九天人工智能研究院已计划8月推出此次发布内容的技术深度解读,将通过“九天人工智能”视频号等渠道视频直播,敬请业界关注。
1、欧美达成贸易协议,法国炸锅:协议失衡,欧洲不能再当傻瓜,欧美贸易争端
2、全国已累计帮扶超680万监测对象稳定消除返贫致贫风险,全国扶贫累计投入