阶跃星辰开源 Step 3.7 Flash：196B参数MoE架构，400 Tokens/s极速推理，专为智能体生产落地优化

最近更新: 2026年5月29日上午9:32

💡 站外导读：随着AI智能体（Agent）从概念验证迈向规模化生产落地，开发团队普遍面临三大核心痛点：模型推理速度过慢导致多轮交互体验卡顿；复杂视觉信息（如UI界面、图表）解析能力不足；以及智能体工作流编排复杂、工具调用不稳定。这些瓶颈严重制约了企业级应用的开发效率和部署规模，行业亟需专为Agent场景深度优化的新一代基础模型。

国内大模型赛道迎来新突破，阶跃星辰今日正式发布并开源了新一代 Flash 模型 —— Step 3.7 Flash。该模型专为智能体（Agent）的生产化落地而设计，针对代码编写、联网搜索及多模态工作流进行了深度的系统级优化。

这款模型的核心架构采用了创新的稀疏混合专家（MoE）设计，其总参数规模高达1960亿。得益于这一先进结构，它的生成速度峰值可达每秒400个Token，从而大幅缩短了高频次、多轮次对话场景下的响应等待时间。

原生多模态与搜索增强

Step 3.7 Flash 具备强大的原生多模态理解能力，可以直接识别并解析 UI 界面、图表和文档等复杂视觉信息。这使得模型能够将视觉内容快速转化为结构化数据，甚至直接生成相应的执行代码。

另一方面，新版本模型在网络信息检索和图像搜索能力上实现了重要升级。它具备在互联网环境中自主采集文本与图像等多维度信息的能力，并能通过交叉验证机制，有效保障所获取信息的真实可靠。

高可靠编排与生态兼容

为了满足复杂任务的需求，该模型在长链路、多轮次的智能体工作流中表现出极高的工具调用稳定性。它可以顺畅地驱动 API、浏览器、终端及 Office 工具，有效降低了任务执行失败或跑偏的概率。

此外，该模型还对当前主流的智能体开发框架及工具调用接口进行了全面的适配与优化。这极大地简化了开发者的接入流程，使得智能工作流的构建与生态系统的集成部署变得更加顺畅和高效。

📝 站长洞察 (Editor’s Insight)

Step 3.7 Flash的发布，标志着大模型竞赛正从单纯的参数规模比拼，转向对垂直场景（尤其是Agent）的工程化深度优化。其400 tokens/s的极速推理，直接回应了实时交互场景的核心需求。更值得关注的是其‘原生多模态+高可靠编排’的组合拳：这并非简单堆砌功能，而是瞄准了Agent落地的全链路——从感知（视觉理解）、决策（联网搜索增强）到执行（稳定工具调用）。这种系统级优化思路，比单一性能指标更能体现一个团队的工程落地能力。开源此模型，不仅能快速构建开发者生态，更是为自身在即将到来的Agent平台化竞争中卡位。这预示着未来大模型的价值将更多体现在‘即插即用’的生产效率上，而非实验室跑分。

TAGGED:MoE架构多模态阶跃星辰

Asana 7500万美元收购无代码AI智能体公司StackAI：重塑「人机团队操作系统」

7500万美元收购StackAI！Asana剑指人机协作操作系统，AI原生办公时代来了？

发表评价

阶跃星辰开源 Step 3.7 Flash：196B参数MoE架构，400 Tokens/s极速推理，专为智能体生产落地优化

📝 站长洞察 (Editor’s Insight)

发表评价取消回复

最近更新

OpenAI开源Codex安全扫描工具，把漏洞检测塞进开发者命令行

Anthropic 披露 Claude Mythos 破译两项加密算法，60小时攻破后量子候选方案

360发布企业智能体平台“纳米Work”，首批用户获1亿Token试用额度

OpenAI 给机器装上更灵的耳朵：两款转录模型上线，Whisper 被甩开一倍差距

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

Support

📝 站长洞察 (Editor’s Insight)

发表评价 取消回复

最近更新

相关推荐

发表评价取消回复