💡 站外导读:当AI从“辅助工具”迈向“自主科学家”,我们已站在科研范式变革的临界点。然而,让AI独立承担长达数十小时的复杂机器学习任务,仍面临目标漂移、经验遗忘、资源爆炸等严峻挑战。国际巨头竞相布局,中国力量能否脱颖而出?ML-Master 2.0的发布给出了响亮答案——它不仅是一个智能体,更是中国在AI自主科研领域发出的最强音。
ML-Master 2.0是什么
ML-Master 2.0 是上海交通大学人工智能学院、上海算法创新研究院、深势科技组成的SciMaster团队推出的面向真实机器学习科研任务的自主智能体。ML-Master 2.0基于国产开源大模型 DeepSeek,具备超长程自主能力,能在长时间科研任务中不断试错、积累经验和自我演化。ML-Master 2.0层次化认知缓存机制可高效管理知识与智慧,显著提升科研效率。在 OpenAI 的 MLE-bench 测试中,ML-Master 2.0 击败谷歌、Meta 等国际顶尖团队,取得全球第一的成绩,展现了中国在 AI 自主科研领域的强大实力,目前已应用于具身智能、理论物理等前沿领域。

ML-Master 2.0的主要功能
-
长期科研任务的自主探索:能在长达数十小时的复杂任务中持续工作,围绕同一科研目标进行探索。
-
经验积累与知识沉淀:从失败中总结规律,将经验转化为可复用的知识和在新任务中迁移应用。
-
代码生成与调试:自动生成、调试代码,完成实验设计、代码实现、结果分析等完整闭环。
-
多任务适应性:通过层次化认知缓存机制,跨任务复用高层策略,提升任务适应性。
-
高效资源管理:在长时间运行中保持稳定的科研节奏,避免上下文爆炸或遗忘历史经验。
ML-Master 2.0的技术原理
- 超长程自主(Ultra-Long-Horizon Autonomy):ML-Master 2.0 通过模拟真实科研过程,设计超长程自主机制,能在长时间任务中保持目标一致性,主动避开无效路径。
- 层次化认知缓存(Hierarchical Cognitive Caching, HCC):将认知分为三个层次:经验(Experience)、知识(Knowledge)和智慧(Wisdom)。经验用于即时决策,知识是经过验证的稳定结论,智慧是跨任务可复用的高层策略。不同层次的认知在任务中各司其职,通过动态筛选和提升,确保有价值的信息沉淀和噪声信息的淘汰。
- 深度探索与推理集成:结合探索(Exploration)和推理(Reasoning)能力,通过自适应记忆机制选择性地捕捉和总结关键信息,确保两者相互强化。
- 基于国产开源大模型 DeepSeek:用国产开源大模型 DeepSeek-V3.2-Speciale,结合高性能 AI 基础设施,实现高效计算和推理能力。
ML-Master 2.0的项目地址
- 项目官网:https://sjtu-sai-agents.github.io/ML-Master/
- GitHub仓库:https://github.com/sjtu-sai-agents/ML-Maste
ML-Master 2.0的应用场景
- 具身智能机器人训练:ML-Master 2.0能帮助机器人在复杂环境中自主学习和优化行为策略,提升适应性和决策能力。
- 理论物理模拟与发现:系统能设计复杂物理模拟实验,助力科学家发现新物理规律,加速理论物理研究进程。
- 机器学习工程任务:ML-Master 2.0 能自动化完成机器学习模型开发、优化等工程任务,通过高效管理知识和经验提升开发效率。
- 复杂系统建模与优化:用于金融风险模型、气候模型等复杂系统的建模和优化,适应系统动态变化提高模型精度。
- 自动化科学研究:ML-Master 2.0 能协助科学家设计实验、分析数据和提出假设,推动生物医学、材料科学等领域的研究发展。
📝 站长洞察 (Editor’s Insight)
ML-Master 2.0的发布,标志着AI Agent的竞争已从简单的问答与内容生成,深入到需要长期规划、复杂试错和知识沉淀的硬核科研领域。其核心亮点“层次化认知缓存”极具启发性,它模拟了人类专家的经验、知识、智慧三级认知结构,这或许是破解大模型“健忘”和“无规划”难题的关键钥匙。基于国产DeepSeek大模型取得全球第一,更彰显了中国AI生态在底层模型与上层应用协同创新上的巨大潜力。这不再仅仅是技术的胜利,更是体系化科研创新能力的胜利。未来,拥有“科研大脑”的AI将深刻改变生物医药、材料科学、理论物理等高精尖领域的研发节奏,一个“人机协同、AI主驱”的科研新范式正加速到来。
