Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Ring-lite:仅2.75B激活参数,蚂蚁技术开源轻量级推理模型刷新SOTA
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > Ring-lite:仅2.75B激活参数,蚂蚁技术开源轻量级推理模型刷新SOTA
AI 工具AIGC 资讯

Ring-lite:仅2.75B激活参数,蚂蚁技术开源轻量级推理模型刷新SOTA

站外新闻
最近更新: 2026年6月7日 下午8:25
MoE架构 强化学习 蚂蚁技术 轻量级推理模型
SHARE

💡 站外导读:随着AI模型参数量飙升,计算成本与部署门槛成为行业核心痛点。尤其是在边缘计算和资源受限的场景下,对高性能且轻量级的模型需求日益迫切。蚂蚁技术团队近期开源了Ring-lite,一个基于MoE架构的轻量级推理模型,旨在以极低的激活参数实现顶尖的推理性能,为开发者提供了高效且经济的新选择,标志着轻量化AI推理进入了一个新阶段。

Ring-lite是什么

Ring-lite是蚂蚁技术AntTech团队推出的基于MoE架构的轻量级推理模型。模型用Ling-lite-1.5为基础,基于独创的C3PO强化学习训练方法,在多项推理Benchmark上达到SOTA效果,仅用2.75B激活参数。Ring-lite基于稳定强化学习训练、优化Long-CoT SFT与RL的训练比重、解决多领域任务联合训练难题等技术创新,实现高效推理。Ring-lite开源了技术栈,包括模型权重、训练代码、数据集等,推动轻量级MoE推理模型的发展。

阅读目录
  • Ring-lite是什么
  • Ring-lite的主要功能
  • Ring-lite的技术原理
  • Ring-lite的项目地址
  • Ring-lite的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Ring-lite

Ring-lite的主要功能

  • 高效推理:Ring-lite能在多项复杂的推理任务中实现高效推理,如数学推理、编程竞赛和科学推理等。
  • 轻量级设计:Ring-lite的总参数量为16.8B,激活参数仅为2.75B,在保持高性能的同时,具有较低的计算资源需求,适合在资源受限的环境中使用。
  • 多领域推理:Ring-lite能处理多个领域的推理任务,包括数学、编程和科学等。它通过联合训练和分阶段训练的方法,实现在不同领域之间的协同增益,提高模型的泛化能力。
  • 稳定训练:Ring-lite基于C3PO强化学习训练方法,解决传统强化学习训练中的不稳定性问题,提高训练过程的稳定性和效率。

Ring-lite的技术原理

  • MoE架构:Ring-lite基于Mixture-of-Experts(MoE)架构,基于多个专家网络的组合处理输入数据。每个专家网络负责处理特定的子任务或数据特征,提高模型的推理能力和效率。
  • C3PO强化学习训练方法:C3PO(Constrained Contextual Computation Policy Optimization)是创新的强化学习训练方法。基于固定每个训练步骤的总训练token数,消除由于生成回复长度波动带来的优化不稳定和吞吐波动问题。C3PO基于熵损失(entropy loss)的策略选择合适的起点模型,进一步稳定训练过程。
  • Long-CoT SFT与RL的结合:Ring-lite基于Long-CoT(长推理链)监督微调(SFT)和强化学习(RL)相结合的两阶段训练方法。用Long-CoT SFT,模型能学习到复杂的推理模式;基于RL,模型能在特定任务上进一步优化性能。Ring-lite基于实验确定最佳的SFT和RL训练比重,在token效率和性能之间取得平衡。
  • 多领域数据联合训练:Ring-lite在训练过程中采用数学、编程和科学等多个领域的数据。基于分阶段训练的方法,在数学任务上进行训练,然后在代码和科学任务上进行联合训练,有效地解决多领域数据联合训练中的领域冲突问题。

Ring-lite的项目地址

  • GitHub仓库:https://github.com/inclusionAI/Ring
  • HuggingFace模型库:https://huggingface.co/inclusionAI/Ring-lite
  • arXiv技术论文:https://arxiv.org/pdf/2506.14731

Ring-lite的应用场景

  • 教育领域:辅助学生解决复杂的数学和科学问题,提供详细的解题步骤和推理过程,帮助学生更好地理解和掌握知识。
  • 科研领域:辅助研究人员验证和探索复杂的数学和科学问题,提供详细的推理步骤和解决方案,支持理论研究和实验设计。
  • 工业和商业领域:处理和分析复杂的数据,提供推理过程和解决方案,用于金融、医疗和市场营销等领域的预测和决策支持。
  • 智能助手:集成到智能助手中,提供更智能的推理和解答能力,处理复杂的查询和任务,提升用户体验。
  • 医疗领域:辅助医生和研究人员分析和处理复杂的医学数据,提供详细的推理过程和解决方案,支持疾病诊断和治疗方案制定。

📝 站长洞察 (Editor’s Insight)

Ring-lite的发布不仅仅是另一个开源模型,它精准地击中了当前AI发展的关键瓶颈:效率。在“大力出奇迹”的思维主导下,模型越来越大,但部署成本高昂。Ring-lite用MoE架构和创新的C3PO训练方法,在2.75B激活参数下实现SOTA,展现了“小模型大能力”的技术路径。这预示着未来AI竞争将从单纯比拼参数规模,转向架构创新与训练效率的深度较量。其开源策略,更是将技术红利直接赋予社区,加速了轻量化推理模型在工业界、边缘端和垂直领域的落地进程,是推动AI民主化、普惠化的重要一步。

s1 – 斯坦福和华盛顿大学推出低成本、高性能的AI推理模型
PySpur – 开源 AI 代理构建工具,拖拽式构建 AI 工作流
OpenAI推理模型自主破解80年数学难题:AI从研究助理迈入科学发现者新纪元
文心大模型X1 – 百度推出的深度思考模型
SyncAnimation – 南科大等推出的实时音频驱动生成头部运动框架
TAGGED:MoE架构强化学习蚂蚁技术轻量级推理模型
分享
Email 复制链接 打印
Share
上一篇 港科大、美团联手发布PosterCraft:告别模板,用AI生成高美学海报的统一框架
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

港科大、美团联手发布PosterCraft:告别模板,用AI生成高美学海报的统一框架
AI 工具 AIGC 资讯
网易有道开源数学推理模型子曰3:140亿参数,成本仅为通用模型十分之一,GAOKAO-Bench得分98.5
AI 工具 AIGC 资讯
微软Mu模型发布:仅3.3亿参数,性能媲美Phi3.5,如何革新边缘AI体验?
AI 工具 AIGC 资讯
腾讯Hunyuan-GameCraft:实时交互式游戏视频生成框架,键盘鼠标精准控制,支持百万级AAA游戏场景
AI 工具 AIGC 资讯

相关推荐

AI 工具

DeepSeek-OCR 2 开源:二代模型以91.09%综合得分重塑文档解析范式,引领语义级OCR技术突破

站外新闻
DeepSeek-OCR OCR大模型 开源模型 文档解析 视觉Token
AIGC 资讯

Amazon Nova Premier – 亚马逊推出的多模态AI模型

站外新闻
AI 工具

Merlin

remaker
AIGC 资讯

SongGen – 上海 AI Lab 和北航、港中文推出的歌曲生成模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.