Step 3.7 Flash 重磅开源发布：198B MoE架构实现400TPS推理，Agent效率与可靠性新时代已至

💡 站外导读：当前AI Agent正从概念走向核心应用，但普遍面临执行效率低下、多模态理解与行动脱节、部署成本高昂等痛点。开发者亟需一个在速度、成本和可靠性上取得精妙平衡的模型，来支撑下一代智能工作流的构建。Step 3.7 Flash的开源发布，正是对这一行业迫切需求的直接回应，它旨在打通从感知到行动的闭环，真正提升Agent的实战能力。

今日，Step3.7Flash 正式亮相，这款开源模型直指 Agent 时代核心痛点——效率、可靠性和多模态执行能力，以开放权重（Apache2.0协议）的方式迅速引发业界关注。

⚡️ Step 3.7 Flash is here_ The new frontier is age.jpg

基准测试领跑，实战能力突出

Step3.7Flash 在多项关键评测中取得亮眼成绩:

ClawEval-1.1排名第一（67.1分）
SimpleVQA Search 排名第一（79.2分）
SWE-PRO 排名第二（56.3分）
V* Python 得分高达95.3

这些成果充分表明，它在处理智能体任务、生成代码、进行视觉搜索等多种复杂应用时，均展现出领先的实力。

核心参数:速度、成本与能力的均衡之作

作为一款专为 Agentic、代码、搜索和多模态工作流设计的模型，Step3.7Flash 在速度与效能上实现显著突破:

推理速度:达到400TPS
架构:198B 稀疏 MoE 结构，活跃参数约11B
上下文长度:支持256K
推理层级:提供3种推理级别

该模型不仅性能出众，还能大幅削减实际部署所需的成本，为开发者提供了一个兼具效率与经济性的优质选项。

多模态理解 + 可靠执行，真正“看见就能做”

Step3.7Flash 的最大亮点在于其强大的感知 – 行动闭环能力。它能够理解 UI 界面、图表、文档和图像等视觉内容，并据此自主编写代码或调用工具完成操作。

其升级后的 Web+ 视觉搜索能力，能够接入更广泛的信息渠道，并支持对搜索结果进行深入的追踪提问。此外，工具调用的稳定性得到了显著增强，在τ²-bench 的所有难度测试中，成功率均超过98%，从而有效改善了常见的目标偏移和调用失败现象。

生态兼容与本地部署友好

模型已与 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP 等协议实现良好兼容。同时，它支持在 Mac Studio M4Max、DGX Spark、AMD AI Max+395等硬件上本地运行，为本地化部署和隐私敏感场景提供了便利。

AIbase 评论：Step3.7Flash 的发布，意味着开源智能体模型正从最初的‘可用’阶段，朝着‘易用、可靠、高效’的方向迈出了关键一步。在智能体日益成为 AI 核心应用模式的今天，像这样能够在运行速度、使用成本与任务执行可靠性之间取得良好平衡的模型，有望成为开发者打造下一代智能工作流的关键基础。

项目地址：https://github.com/stepfun-ai/Step-3.7-Flash

📝 站长洞察 (Editor’s Insight)

Step 3.7 Flash的发布，绝非一次简单的模型迭代，它精准地切中了AI Agent产业化的核心脉搏——从‘演示酷炫’转向‘生产可靠’。其198B稀疏MoE架构与仅11B活跃参数的组合，是工程上的一次优雅折衷，体现了在极限性能与部署经济性之间寻找‘甜蜜点’的深刻思考。高达400TPS的推理速度与98%的工具调用成功率，将直接转化为开发者的运维成本和用户体验。更值得玩味的是其深度的生态兼容性，这并非封闭系统的自我强化，而是选择成为开源协作生态中的一个关键节点，加速整个Agent基础设施的成熟。在AI竞争日趋白热化的今天，这种‘于开放中构筑护城河’的策略，或许定义了下一代基础模型公司最重要的竞争维度。

Step 3.7 Flash 重磅开源发布：198B MoE架构实现400TPS推理，Agent效率与可靠性新时代已至

基准测试领跑，实战能力突出

核心参数:速度、成本与能力的均衡之作

多模态理解 + 可靠执行，真正“看见就能做”

生态兼容与本地部署友好

📝 站长洞察 (Editor’s Insight)

发表评价取消回复

最近更新

GPT-Rosalind – OpenAI 推出的生命科学专用推理模型

Kimi K2.6 – 月之暗面开源的最新旗舰模型

Sage – 商汤绝影推出的端侧多模态智能体基座大模型

MiMo-V2.5 – 小米推出的全模态 Agent 大模型系列

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

Support

基准测试领跑，实战能力突出

核心参数:速度、成本与能力的均衡之作

多模态理解 + 可靠执行，真正“看见就能做”

生态兼容与本地部署友好

📝 站长洞察 (Editor’s Insight)

发表评价 取消回复

最近更新

相关推荐

发表评价取消回复