Ring-1T:蚂蚁开源的万亿参数思考大模型,数学推理达IMO银牌水平

AI模型2周前发布 向东
24 0

1. Ring-1T是什么

Ring-1T是蚂蚁集团在2025年10月14日正式推出的万亿参数思考大模型,这是全球首个开源的万亿级推理模型。该模型基于Ling 2.0 MoE架构,在20万亿token的高质量语料上完成预训练,并通过自研的强化学习系统ASystem进行深度训练。作为蚂蚁百灵大模型家族的旗舰产品,Ring-1T支持128K上下文窗口,在数学推理、代码生成等复杂任务中表现卓越。

在国际竞赛中,Ring-1T展现出接近顶级闭源模型的实力。在AIME 2025数学测试中得分92.6分,接近GPT-5的94.6分。更令人瞩目的是,Ring-1T在IMO 2025国际奥数竞赛中一次性解出第1、3、4、5题,达到银牌水平,成为首个在国际奥数赛题上取得获奖级成绩的开源系统。在代码生成方面,Ring-1T在Codeforces测试中评分达2092,超越GPT-5的2073分。

Ring-1T:蚂蚁开源的万亿参数思考大模型,数学推理达IMO银牌水平

2. Ring-1T有什么主要功能

  1. 强大的数学推理能力:在AIME 2025测试中取得92.6分的优异成绩,能够解决高难度数学竞赛问题,在IMO国际奥数竞赛中达到银牌水平。
  2. 卓越的代码生成能力:在Codeforces编程竞赛中评分达2092分,超越GPT-5,在LiveCodeBench等编程基准测试中位列开源模型榜首。
  3. 复杂逻辑推理:能够处理多层次的逻辑问题,准确识别不同条件下的推理关系,并通过系统化分析给出正确答案。
  4. 通用对话能力:在Arena-Hard V2人类偏好对齐测试中,成功率达81.59%,居开源模型榜首,逼近GPT-5的82.91%。
  5. 专业领域应用:在医疗问答HealthBench测评中取得开源领域最高分,展现出在严谨专业领域的优秀表现。
  6. 开源协作:模型权重和训练配方完全开源,发布在Hugging Face和魔搭社区,便于研究者和开发者使用。

3. Ring-1T的技术原理

  1. Ling 2.0 MoE架构:采用混合专家模型(Mixture of Experts)架构,总参数量达1万亿,激活参数为500亿。这种设计让模型能够按需调用专家层,既保证性能又提升效率。
  2. 大规模预训练:在20万亿token的高质量语料上完成预训练,涵盖代码、数学、科学文献和网络文本,确保模型学习到丰富的知识和语言模式。
  3. 强化学习训练系统:通过自研的ASystem强化学习系统进行RLVR(可验证奖励强化学习)和RLHF(人类反馈强化学习)训练,显著提升推理能力和通用表现。
  4. 棒冰算法优化:采用自研的”棒冰(icepop)”算法,用带掩码的双向截断技术解决训练-推理精度差异问题,确保长序列、长周期训练的稳定性。
  5. 高效显存管理:针对万亿参数模型的显存管理和权重交换问题进行精细优化,实现单机显存碎片秒级回收和权重零冗余交换。
  6. FP8混合精度训练:采用FP8混合精度训练技术,带来显著的显存节省和15%以上的端到端加速。

4. Ring-1T的官网或项目地址

5. Ring-1T的使用场景有哪些

  • 教育培训:数学竞赛辅导、复杂题目解答、逻辑推理训练
  • 软件开发:代码生成与优化、程序调试、算法实现
  • 科学研究:学术论文写作辅助、数据分析、研究方法探索
  • 医疗健康:医疗问答、诊断辅助、专业知识查询
  • 企业服务:智能客服、知识管理、内容推荐
  • 创意写作:文案创作、内容生成、写作辅助
  • 多智能体应用:结合AWorld框架进行复杂推理任务测试和探索
  • AI研究开发:为研究者提供高性能开源推理基座,推动大模型生态发展
© 版权声明

相关文章