Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 蚂蚁百灵Ling-V2:160亿参数MoE模型开源,14亿激活参数实现7倍效率飞跃
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 蚂蚁百灵Ling-V2:160亿参数MoE模型开源,14亿激活参数实现7倍效率飞跃
AI 工具AIGC 资讯

蚂蚁百灵Ling-V2:160亿参数MoE模型开源,14亿激活参数实现7倍效率飞跃

站外新闻
最近更新: 2026年6月7日 下午8:17
FP8训练 MoE架构 大型语言模型 开源模型 蚂蚁百灵
SHARE

💡 站外导读:在算力成本高企、模型部署效率成为落地关键瓶颈的行业背景下,如何以更低的激活参数实现更强的性能,是大模型进化的核心命题。蚂蚁百灵团队推出的Ling-V2系列,特别是其首个版本Ling-mini-2.0,通过创新的MoE架构设计,在仅激活14亿参数的极小计算单元下,实现了对标7-8亿密集模型的强大推理能力,并配套开源了高效的FP8训练方案,直指降低研究与部署门槛的行业痛点。

Ling-V2是什么

Ling-V2 是蚂蚁百灵团队推出的基于 MoE 架构的大型语言模型家族,首个版本 Ling-mini-2.0 拥有 160 亿总参数,每个输入标记仅激活 14 亿参数。模型在 20 万亿高质量数据标记上训练,经多阶段监督微调和强化学习增强,在复杂推理和指令遵循方面表现出色。Ling-mini-2.0 用 1/32 激活比率的 MoE 架构,实现 7 倍等效密集性能杠杆,生成速度快,训练和推理效率高,开源了 FP8 高效训练解决方案,提供多种预训练检查点,支持持续训练,是 MoE 研究的理想起点。

阅读目录
  • Ling-V2是什么
  • Ling-V2的主要功能
  • Ling-V2的技术原理
  • Ling-V2的项目地址
  • Ling-V2的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Ling-V2

Ling-V2的主要功能

  • 强大的推理能力:在编码、数学以及跨领域知识密集型推理任务中表现出色,与10亿以下的密集模型和更大规模的MoE模型相比,展现出卓越的推理能力。
  • 高效率:采用1/32激活比率的MoE架构,实现7倍等效密集性能杠杆,激活14亿参数能提供相当于7-8亿密集模型的性能,在简单问答场景中生成速度可达300+ token/s,处理128K上下文长度时相对速度提升可达7倍以上。
  • 高效的训练解决方案:整个训练过程中用FP8混合精度训练,开源了FP8训练解决方案,基于tile/blockwise FP8缩放,进一步引入FP8优化器等,实现极致的内存优化,在8/16/32个80G GPU上,与LLaMA 3.1 8B和Qwen3 8B相比,训练吞吐量显著提升。
  • 开放的开源策略:除发布经过训练的版本外,开源了五个预训练检查点,支持更深入的研究和更广泛的应用。

Ling-V2的技术原理

  • MoE架构:基于混合专家(MoE)架构,通过将模型分解为多个专家网络,在每个输入标记上仅激活部分专家,实现模型的稀疏性,在保持高性能的同时提高计算效率。
  • 优化设计:在专家粒度、共享专家比率、注意力比率、无辅助损失+sigmoid路由策略、MTP损失、QK-Norm、半RoPE等方面进行经验优化设计,进一步提升模型的性能和效率。
  • FP8混合精度训练:在训练过程中用FP8混合精度,与BF16相比,在超过1万亿训练标记的实验中,损失曲线和下游基准性能几乎相同,同时开源FP8训练解决方案,支持社区在有限的计算资源下进行高效的持续预训练和微调。
  • 多阶段训练:模型在超过20万亿高质量数据标记上进行训练,通过多阶段的监督微调和强化学习进行增强,在复杂推理和指令遵循方面取得显著的改进。

Ling-V2的项目地址

  • GitHub仓库:https://github.com/inclusionAI/Ling-V2
  • HuggingFace模型库:https://huggingface.co/collections/inclusionAI/ling-v2-68bf1dd2fc34c306c1fa6f86

Ling-V2的应用场景

  • 自然语言处理(NLP)任务:高效处理各种自然语言处理任务,如文本分类、情感分析、机器翻译等,提供准确且高效的解决方案。
  • 智能客服:作为智能客服的核心引擎,快速响应用户问题,提供精准的解答,提升用户体验和客服效率。
  • 内容创作:辅助内容创作,生成高质量的文本内容,如新闻报道、创意写作、广告文案等,帮助创作者提高创作效率和质量。
  •  教育领域:用于教育领域,如智能辅导、自动批改作业、个性化学习计划等,为学生和教师提供个性化的教育支持。
  • 医疗健康:Ling-V2能处理医疗文本数据,辅助医生进行病例分析、医疗文献检索等,提高医疗决策的准确性和效率。

📝 站长洞察 (Editor’s Insight)

Ling-V2的发布,标志着大模型竞争已从单纯的参数军备竞赛,全面转向‘效率-性能’的精细化比拼。其1/32激活比率和7倍性能杠杆,精准踩中了当前行业追求‘降本增效’的主旋律。这不仅是技术优化,更是一种生态战略:通过开源极具性价比的模型与训练方案,吸引开发者基于其生态进行创新,从而在开源社区中构建影响力。未来,能够以最小算力消耗解决最复杂问题的‘高效模型’,将成为驱动AI普及、尤其是在边缘端和垂直场景落地的关键。Ling-V2及其开源的FP8训练方案,为资源有限的团队参与前沿模型研发提供了新可能,可能加速MoE架构成为下一代模型主流范式的进程。

Solve Intelligence
CustomVideoX – 中科大联合浙大等推出的个性化视频生成框架
Anthropic完成史诗级H轮融资650亿美元,Claude Opus 4.8模型同步发布,AI巨头估值飙升逼近万亿美元里程碑
DiffSplat – 北大联合字节推出的 3D 生成框架
MOCR:3B参数开源文档解析模型,图形重建能力超越Gemini 3 Pro
TAGGED:FP8训练MoE架构大型语言模型开源模型蚂蚁百灵
分享
Email 复制链接 打印
Share
上一篇 腾讯开源FastMTP:大模型推理加速2倍且质量无损,实战代码/数学场景速览
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

腾讯开源FastMTP:大模型推理加速2倍且质量无损,实战代码/数学场景速览
AI 工具 AIGC 资讯
小米开源MiMo-Audio:首个端到端语音大模型发布,性能超越GPT-4o与Gemini
AI 工具 AIGC 资讯
Decart AI开源Lucy Edit Dev:一句话指令即可编辑视频,保留原生运动与构图的革命性AI模型
AI 工具 AIGC 资讯
阿里通义开源Wan2.2-Animate:AI动作生成模型实现视频角色替换与表情驱动
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

OpenAI开源Symphony:彻底解放工程师的AI Agent编排系统,自动化从编码到部署全流程

站外新闻
Agent编排 AIGC工具 openai Symphony 自动化开发
AIGC 资讯最新趋势

GPT-4.5 通过图灵测试胜率73%超真人!AI如何学会‘完美撒谎’颠覆信任

站外新闻
AI伦理 GPT-4.5 PNAS 图灵测试 大语言模型
AI 工具AIGC 资讯

MimiClaw开源:基于ESP32的超轻量AI助手,无需操作系统,隐私本地化引领边缘AI革命

站外新闻
ESP32-S3 工具调用 开源AI助手 边缘AI 隐私本地化
AIGC 资讯

Cognita – 面向生产环境的开源、模块化 RAG 框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 世界模型 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 智谱AI 月之暗面 本地AI 清华大学 生成式AI 知识管理 科大讯飞 端侧AI 端侧部署 美团 腾讯 腾讯混元 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 赛博朋克 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.