Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 百度重磅开源ERNIE-4.5-21B-A3B-Thinking:210亿参数MoE模型,128K长上下文赋能复杂推理与多智能体应用
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 百度重磅开源ERNIE-4.5-21B-A3B-Thinking:210亿参数MoE模型,128K长上下文赋能复杂推理与多智能体应用
AI 工具AIGC 资讯

百度重磅开源ERNIE-4.5-21B-A3B-Thinking:210亿参数MoE模型,128K长上下文赋能复杂推理与多智能体应用

站外新闻
最近更新: 2026年6月7日 下午8:18
AI推理模型 ERNIE-4.5-21B-A3B-Thinking MoE 混合专家模型 百度
SHARE

💡 站外导读:在AI大模型竞赛进入白热化阶段的今天,企业与开发者面临的痛点已不再是“有无模型可用”,而是如何在有限算力下实现更复杂、更深度的推理能力。传统稠密模型在处理长文档分析、多步骤逻辑链和跨领域问题时,常受限于计算成本与上下文长度。百度此次推出的ERNIE-4.5-21B-A3B-Thinking,正是瞄准了这一核心矛盾——以MoE架构大幅降低推理成本,同时以128K长上下文和强化学习技术,将模型能力从“文本生成”推向“深度思考”,为程序合成、科学解答等高阶任务提供了新解法。

ERNIE-4.5-21B-A3B-Thinking是什么

ERNIE-4.5-21B-A3B-Thinking 是百度推出的专注于推理任务的大型语言模型。采用混合专家(MoE)架构,总参数量达210亿,每个token激活30亿参数,支持128K的长上下文窗口,适用于复杂推理任务。模型通过文本预训练构建语言核心骨干,在推理增强后训练阶段,利用监督式微调(SFT)和渐进式强化学习(PRL)等技术,显著提升了逻辑推理、数学计算、科学问题解答等能力。支持高效的工具调用,可与vLLM、Transformers 4.54+和FastDeploy等集成,适用于程序合成、符号推理及多智能体工作流等场景。

阅读目录
  • ERNIE-4.5-21B-A3B-Thinking是什么
  • ERNIE-4.5-21B-A3B-Thinking的主要功能
  • ERNIE-4.5-21B-A3B-Thinking的技术原理
  • ERNIE-4.5-21B-A3B-Thinking的项目地址
  • ERNIE-4.5-21B-A3B-Thinking的应用场景
      • 📝 站长洞察 (Editor’s Insight)

ERNIE-4.5-21B-A3B-Thinking

ERNIE-4.5-21B-A3B-Thinking的主要功能

  • 强大的推理能力:ERNIE-4.5-21B-A3B-Thinking在逻辑推理、数学计算、科学问题解答等需要推理能力的领域表现出色,能处理复杂的推理任务,为用户提供准确的答案。
  • 高效的工具调用:模型支持结构化的工具和函数调用,能与vLLM、Transformers 4.54+和FastDeploy等进行集成,实现更高效的任务执行和功能扩展。
  • 长上下文理解:具备128K的上下文窗口,能理解和处理长文本信息,适用于需要长上下文的复杂推理任务,如长篇文档分析和多步骤推理。
  • 多领域应用:广泛应用于程序合成、符号推理以及多智能体工作流等场景,为不同领域的复杂任务提供解决方案,满足多样化的业务需求。
  • 开源与易用:在Apache-2.0许可下开源,可在Hugging Face等平台上使用,方便开发者进行研究和商业部署,降低了使用门槛。

ERNIE-4.5-21B-A3B-Thinking的技术原理

  • 混合专家架构:ERNIE-4.5-21B-A3B-Thinking采用混合专家(MoE)架构,将模型参数分为多个专家模块,每个输入token只激活部分专家模块,在保持模型性能的同时,显著提高了计算效率。
  • 长上下文窗口:模型支持128K的上下文窗口,能处理长文本输入,这对于需要长上下文理解的任务(如复杂推理和长篇文档分析)至关重要。
  • 推理增强训练:通过监督式微调(SFT)和渐进式强化学习(PRL)等技术,对模型进行专门的推理能力训练,使其在逻辑推理、数学计算和科学问题解答等任务上表现出色。
  • 激活机制:模型设计了高效的激活机制,每个token激活3B参数,确保在大规模参数下仍能高效运行,同时保持了模型的灵活性和适应性。

ERNIE-4.5-21B-A3B-Thinking的项目地址

  • HuggingFace模型库:https://huggingface.co/baidu/ERNIE-4.5-21B-A3B-Thinking

ERNIE-4.5-21B-A3B-Thinking的应用场景

  • 复杂推理任务:适用于逻辑推理、数学计算、科学问题解答等需要深度思考和推理的场景,提供准确的分析和解决方案。
  • 代码生成与优化:能生成和优化代码,帮助开发者提高编程效率,适用于程序合成、符号推理等任务。
  • 多智能体工作流:支持多智能体协作,可用于构建复杂的自动化工作流,提高任务执行效率。
  • 长文本分析:凭借长上下文窗口,能处理长篇文档分析、复杂文本推理等任务,适用于学术研究、商业报告分析等场景。
  • 工具调用与集成:支持结构化的工具和函数调用,可与多种平台和工具集成,拓展应用场景,满足多样化的业务需求。

📝 站长洞察 (Editor’s Insight)

ERNIE-4.5-21B-A3B-Thinking的发布,标志着国产大模型正式进入“推理特化”新阶段。在行业从拼参数规模转向拼应用效能的当下,百度此举极具战略意义:其MoE架构与“210亿总参/30亿激活”的设计,精准回应了产业界对“成本可控的强推理”需求。更值得关注的是,模型通过渐进式强化学习(PRL)进行推理增强训练,这与OpenAI等国际巨头的技术路径不谋而合,显示全球前沿正收敛于“后训练强化”范式。128K长上下文与结构化工具调用的结合,则直指未来多智能体协作与企业级复杂工作流落地的关键瓶颈。在Apache-2.0许可下开源,百度不仅是在发布一个模型,更是在降低推理AI的使用门槛,试图构建以文心大模型为核心的开发者生态。这既是应对行业同质化竞争的技术亮剑,也是抢占“AI+产业”深水区应用标准的卡位战。

Kiln AI- 开源 AI 原型设计和数据集协作开发工具,微调专属模型
SimpleAR – 复旦大学联合字节 Seed 团队推出的图像生成模型
Zeemo
Questflow
智谱AI发布SCAIL:影视级角色动画生成框架,一键实现多人复杂交互与照片驱动动画
TAGGED:AI推理模型ERNIE-4.5-21B-A3B-ThinkingMoE混合专家模型百度
分享
Email 复制链接 打印
Share
上一篇 阿里达摩院FunAudio-ASR端到端语音大模型:RAG+CTC技术破解幻觉难题,企业级语音识别新标杆
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

阿里达摩院FunAudio-ASR端到端语音大模型:RAG+CTC技术破解幻觉难题,企业级语音识别新标杆
AI 工具 AIGC 资讯
GPT-5-Codex深度解析:OpenAI Agent编程模型实现7小时独立编码,代码审查错误率仅4.4%
AI 工具 AIGC 资讯
ROMA:Sentient AGI开源递归多智能体框架,重塑深度研究与金融分析
AI 工具
Grok 4 Fast:xAI推出极速AI模型,响应提速10倍,每秒生成75个token
AI 工具 AIGC 资讯

相关推荐

AI 工具

LeiaPix Converter

remaker
AI 工具

TreeMind树图

remaker
AI 工具

Outerbase

remaker
AI 工具AIGC 资讯

MemPrivacy:记忆张量与荣耀AI联合开源,端云协同隐私保护框架,如何为Agent长期记忆筑牢安全防线?

站外新闻
Agent记忆 端云协同 荣耀AI 记忆张量 隐私保护框架
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 早报 智谱AI 月之暗面 本地AI 清华大学 知识管理 科大讯飞 端侧AI 端侧部署 美团 腾讯 腾讯混元 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 赛博朋克 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.