时间:2025-07-29 15:53 作者:哈如卡
“九天”通用基础大模型3.0发布 模型能力多维升级 多项技术成果开源
本次发布的“九天”基础大模型3.0是国务院国资委战新“百大工程”的重要成果,进一步强化了“高安全、高可控、全国产、全行业”四大特性,重点实现三大焕新:
基于最新的语言大模型,中国移动此次也推出多个专项模型。九天代码大模型使用两阶段的持续训练技术,支持代码生成、注释生成、单元测试生成、代码智能问答等多种任务,支持Python、Java、JS、TS、Go、C++等10+种主流编程语言。指标方面,在EvalPlus、MHPP、LivecodeBenchv6等多个代码生成榜单上成绩领先。九天数学大模型,短思考、长思考模式均达到业界SOTA水平,多项指标超过Qwen 2.5 Math、Qwen3、DeepSeek Math、DeepSeek R1-Distill等同参数量级模型。
二、九天善智多模态大模型全面提升生成可控性与理解能力。模型基于复杂时空建模、流匹配图片视频渐进式联合训练、端到端局部可控注意力机制等创新,同时引入多模态理解信息提升对文本指令和输入条件图像视频的感知能力,联合图文交织数据训练,实现既能生成高质量的图像视频,又能进行多轮对话式高可控精确编辑操作,显著提升了视觉生成的灵活便利性。例如,在图片生成功能方面可支持多轮精准局部修改,如修改文字、修改背景、增加元素等。模型在图理解和视频理解方面的性能表现也全面提升。图理解方面,在MMStar、HallusionBench和OCRBench等图理解任务中,九天模型分别获得了82.2、64.3和94.9的高分,处于业界领先水平;视频理解方面,九天模型在Videomme和MVbench两个任务中均表现领先超过Qwen2-VL和InternVideo2。
中国移动九天人工智能研究院已计划8月推出此次发布内容的技术深度解读,将通过“九天人工智能”视频号等渠道视频直播,敬请业界关注。
1、男网又一35岁老将退役,德约科维奇动情告别老友,德约科维奇网球
2、17点女足亚洲杯抽签⚽卫冕冠军中国女足落位二档,12强争8出线
3、北京:关闭全市所有景区,暂停旅行社旅游活动,北京暂停旅游公告