业界首个!蚂蚁开源万亿参数混淆线性思索模子,,,, ,,,,IMO金牌水平
2026-03-01 01:52:02

智工具作者 程茜编辑 李水青

智工具2月13日新闻,,,, ,,,,今天,,,, ,,,,蚂蚁集团开源全球首个基于混淆线性架构的万亿参数思索模子Ring-2.5-1T。。。 。。。

凭证官方信息,,,, ,,,,相比蚂蚁2025年10月宣布的万亿级思索模子Ring-1T,,,, ,,,,Ring-2.5-1T在天生效率、推理深度和长时程使命执行能力三个要害维度上实现提升,,,, ,,,,且在长文本天生、数学推理与智能体使命执行上抵达开源领先水平。。。 。。。

在天生效率上,,,, ,,,,Ring-2.5-1T在32K以上长文本天生场景中,,,, ,,,,比照上代模子访存规模降低至1/10,,,, ,,,,天生吞吐提升3倍以上。。。 。。。

在深度思索能力方面,,,, ,,,,该模子在国际数学奥林匹克竞赛(IMO 2025)和中国数学奥林匹克(CMO 2025)自测均抵达金牌水平,,,, ,,,,IMO为35分、CMO为105分。。。 。。。

现在,,,, ,,,,该模子已经适配Claude Code等智能体框架与OpenClaw小我私家AI助理,,,, ,,,,支持多步妄想与工具挪用。。。 。。。

Ring-2.5-1T的模子权重与推理代码已在Hugging Face、ModelScope等主流开源平台宣布,,,, ,,,,官方平台Chat体验页和API效劳将在近期上线。。。 。。。

Hugging Face:https://huggingface.co/inclusionAI/Ring-2.5-1T

ModelScape:https://modelscope.cn/organization/inclusionAI

一、拿下多项开源SOTA,,,, ,,,,达IMO金牌水平

为了评估Ring-2.5-1T的深度思索与长时使命执行能力,,,, ,,,,蚂蚁研究职员选择了具有代表性的开源思索模子DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking和闭源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking作为较量。。。 。。。

蚂蚁集团宣布的多项权威基准测试效果显示,,,, ,,,,Ring-2.5-1T在数学、编程和逻辑推理的IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2等高难度推理使命以及Agent搜索、工具挪用和软件工程Gaia2-search、Tau2-bench和SWE-Bench Verified等长时使命执行方面均实现了最先进的开源性能。。。 。。。

别的,,,, ,,,,蚂蚁还对深度思索(Heavy Thinking)模式下的模子性能举行了特殊测试,,,, ,,,,Ring-2.5-1T在IMOAnswerBench、HMMT-25等数学竞赛推理基准和LiveCodeBench-v6代码天生基准中逾越所有比照模子。。。 。。。

其中,,,, ,,,,在IMO 2025(满分42分)中,,,, ,,,,Ring-2.5-1T获得35分,,,, ,,,,抵达金牌水平;;; ;;;在CMO 2025(满分126分)中,,,, ,,,,该模子获得105分,,,, ,,,,凌驾金牌分数线78分和国家队集训队选拔线87分。。。 。。。

研究职员较量了Ring-2.5-1T和Ring-1T的谜底发明,,,, ,,,,前者在推理逻辑的严谨性、高级数学证实手艺的应用以及谜底表述的完整性方面均有提升。。。 。。。

在智能体搜索使命Gaia2-search中,,,, ,,,,Ring-2.5-1T在开源模子中取得了SOTA性能。。。 。。。Gaia2情形强调跨应用工具协作和重大使命执行能力,,,, ,,,,Ring-2.5-1T在妄想天生和多步工具挪用方面均展现出较高的效率和准确性。。。 。。。

二、三大概害维度提升,,,, ,,,,能快速适配Claude Code、OpenClaw

相比蚂蚁2025年10月宣布的万亿级思索模子Ring-1T,,,, ,,,,Ring-2.5-1T在天生效率、推理深度和长时程使命执行能力三个要害维度上有显著刷新。。。 。。。

首先在天生效率方面,,,, ,,,,通过接纳高比例线性注重力机制,,,, ,,,,Ring-2.5-1T将内存会见开销降低至1/10,,,, ,,,,并将凌驾32K token序列的天生吞吐量提高了3倍以上,,,, ,,,,适用于深度思索和长时程使命执行。。。 。。。

其次在深度思索层面,,,, ,,,,该模子在RLVR(基于可验证奖励的强化学习)基础上引入麋集奖励机制,,,, ,,,,为推理历程提供严酷性反响,,,, ,,,,使Ring-2.5-1T同时抵达IMO 2025和CMO 2025(自测)的金奖水平。。。 。。。

最后是长程使命执行,,,, ,,,,Ring-2.5-1T通过大规模完全异步智能体RL(强化学习)训练,,,, ,,,,增强相识决重大使命的长时程自主执行能力,,,, ,,,,使其能快速适配Claude Code等智能体编程框架和OpenClaw小我私家AI助手。。。 。。。

三、引入混淆线性注重力架构,,,, ,,,,可提升长程推理场景吞吐量

Ring-2.5-1T基于Ling 2.5架构,,,, ,,,,通过优化注重力机制,,,, ,,,,可提升长文本推理的效率与稳固性。。。 。。。

作为实现自主模子架构的要害希望,,,, ,,,,Ling 2.5架构在Ling 2.0架构的基础上引入了一种混淆线性注重力架构。。。 。。。通过增量训练,,,, ,,,,研究职员将Ling 2.0架构中的GQA(分组盘问注重力)升级为MLA(多头线性注重力)+Lightning Linear结构的1:7比例。。。 。。。

详细来说,,,, ,,,,基于其先前宣布的Ring-flash-linear-2.0手艺蹊径图,,,, ,,,,研究职员将部分GQA层转换为Lightning Linear注重力,,,, ,,,,以提升长时程推理场景中的吞吐量。。。 。。。

同时为了进一步压缩KV缓存,,,, ,,,,研究职员将剩余的GQA层近似转换为MLA,,,, ,,,,同时针对QK Norm(盘问-核归一化)和Partial RoPE(部分旋转位置编码)等特征举行针对性刷新,,,, ,,,,从而增强Ling 2.5架构的表达能力。。。 。。。

在此基础上,,,, ,,,,模子激活参数规模以前代的51B提升至63B,,,, ,,,,并且在混淆线性注重力架构的支持下,,,, ,,,,其推理效率相比Ling 2.0仍实现大幅提升。。。 。。。

与仅具备32B激活参数的Kimi K2架构相比,,,, ,,,,在1T总参数目下,,,, ,,,,Ling 2.5架构在长序列推理使命中的吞吐体现优势显著,,,, ,,,,且随着生生长度增添,,,, ,,,,效率优势一连扩大。。。 。。。

▲在一台配备8块H20-3e GPU的机械上,,,, ,,,,批处置惩罚巨细=64,,,, ,,,,较量差别生生长度下的解码吞吐量

▲在一台配备8块H200 GPU的机械上,,,, ,,,,批处置惩罚巨细=64,,,, ,,,,较量差别生生长度下的解码吞吐量

结语:从短对话到重大妄想,,,, ,,,,大模子需突破长文本瓶颈

随着AI大模子应用从短对话向长文档处置惩罚、跨文件代码明确、重大使命妄想等场景扩展,,,, ,,,,Ring-2.5-1T可以缓解模子在长输进场景下盘算开销高、推理速率慢的问题。。。 。。。

此前,,,, ,,,,古板架构在面临超长文本、多模态内容、重大营业流程时,,,, ,,,,普遍面临算力本钱高、响应延迟大、安排难度高等问题,,,, ,,,,蚂蚁百灵团队此次通过底层架构立异,,,, ,,,,或为行业提供一条兼顾性能、本钱与扩展性的手艺路径。。。 。。。