Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 击败谷歌Meta登顶MLE-bench!ML-Master 2.0:国产DeepSeek驱动的自主机器学习智能体,开启AI科研新范式
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 击败谷歌Meta登顶MLE-bench!ML-Master 2.0:国产DeepSeek驱动的自主机器学习智能体,开启AI科研新范式
AI 工具AIGC 资讯

击败谷歌Meta登顶MLE-bench!ML-Master 2.0:国产DeepSeek驱动的自主机器学习智能体,开启AI科研新范式

站外新闻
最近更新: 2026年6月7日 下午8:09
DeepSeek MLE-bench 层次化认知缓存 机器学习智能体 自主科研
SHARE

💡 站外导读:当AI从“辅助工具”迈向“自主科学家”,我们已站在科研范式变革的临界点。然而,让AI独立承担长达数十小时的复杂机器学习任务,仍面临目标漂移、经验遗忘、资源爆炸等严峻挑战。国际巨头竞相布局,中国力量能否脱颖而出?ML-Master 2.0的发布给出了响亮答案——它不仅是一个智能体,更是中国在AI自主科研领域发出的最强音。

ML-Master 2.0是什么

ML-Master 2.0 是上海交通大学人工智能学院、上海算法创新研究院、深势科技组成的SciMaster团队推出的面向真实机器学习科研任务的自主智能体。ML-Master 2.0基于国产开源大模型 DeepSeek,具备超长程自主能力,能在长时间科研任务中不断试错、积累经验和自我演化。ML-Master 2.0层次化认知缓存机制可高效管理知识与智慧,显著提升科研效率。在 OpenAI 的 MLE-bench 测试中,ML-Master 2.0 击败谷歌、Meta 等国际顶尖团队,取得全球第一的成绩,展现了中国在 AI 自主科研领域的强大实力,目前已应用于具身智能、理论物理等前沿领域。

阅读目录
  • ML-Master 2.0是什么
  • ML-Master 2.0的主要功能
  • ML-Master 2.0的技术原理
  • ML-Master 2.0的项目地址
  • ML-Master 2.0的应用场景
      • 📝 站长洞察 (Editor’s Insight)

ML-Master 2.0

ML-Master 2.0的主要功能

  • 长期科研任务的自主探索:能在长达数十小时的复杂任务中持续工作,围绕同一科研目标进行探索。
  • 经验积累与知识沉淀:从失败中总结规律,将经验转化为可复用的知识和在新任务中迁移应用。
  • 代码生成与调试:自动生成、调试代码,完成实验设计、代码实现、结果分析等完整闭环。
  • 多任务适应性:通过层次化认知缓存机制,跨任务复用高层策略,提升任务适应性。
  • 高效资源管理:在长时间运行中保持稳定的科研节奏,避免上下文爆炸或遗忘历史经验。

ML-Master 2.0的技术原理

  • 超长程自主(Ultra-Long-Horizon Autonomy):ML-Master 2.0 通过模拟真实科研过程,设计超长程自主机制,能在长时间任务中保持目标一致性,主动避开无效路径。
  • 层次化认知缓存(Hierarchical Cognitive Caching, HCC):将认知分为三个层次:经验(Experience)、知识(Knowledge)和智慧(Wisdom)。经验用于即时决策,知识是经过验证的稳定结论,智慧是跨任务可复用的高层策略。不同层次的认知在任务中各司其职,通过动态筛选和提升,确保有价值的信息沉淀和噪声信息的淘汰。
  • 深度探索与推理集成:结合探索(Exploration)和推理(Reasoning)能力,通过自适应记忆机制选择性地捕捉和总结关键信息,确保两者相互强化。
  • 基于国产开源大模型 DeepSeek:用国产开源大模型 DeepSeek-V3.2-Speciale,结合高性能 AI 基础设施,实现高效计算和推理能力。

ML-Master 2.0的项目地址

  • 项目官网:https://sjtu-sai-agents.github.io/ML-Master/
  • GitHub仓库:https://github.com/sjtu-sai-agents/ML-Maste

ML-Master 2.0的应用场景

  • 具身智能机器人训练:ML-Master 2.0能帮助机器人在复杂环境中自主学习和优化行为策略,提升适应性和决策能力。
  • 理论物理模拟与发现:系统能设计复杂物理模拟实验,助力科学家发现新物理规律,加速理论物理研究进程。
  • 机器学习工程任务:ML-Master 2.0 能自动化完成机器学习模型开发、优化等工程任务,通过高效管理知识和经验提升开发效率。
  • 复杂系统建模与优化:用于金融风险模型、气候模型等复杂系统的建模和优化,适应系统动态变化提高模型精度。
  • 自动化科学研究:ML-Master 2.0 能协助科学家设计实验、分析数据和提出假设,推动生物医学、材料科学等领域的研究发展。

📝 站长洞察 (Editor’s Insight)

ML-Master 2.0的发布,标志着AI Agent的竞争已从简单的问答与内容生成,深入到需要长期规划、复杂试错和知识沉淀的硬核科研领域。其核心亮点“层次化认知缓存”极具启发性,它模拟了人类专家的经验、知识、智慧三级认知结构,这或许是破解大模型“健忘”和“无规划”难题的关键钥匙。基于国产DeepSeek大模型取得全球第一,更彰显了中国AI生态在底层模型与上层应用协同创新上的巨大潜力。这不再仅仅是技术的胜利,更是体系化科研创新能力的胜利。未来,拥有“科研大脑”的AI将深刻改变生物医药、材料科学、理论物理等高精尖领域的研发节奏,一个“人机协同、AI主驱”的科研新范式正加速到来。

字节跳动Vidi2发布:多模态视频理解与生成大模型,重新定义智能剪辑与内容创作
MiniCPM5-1B – 面壁智能联合清华开源的端侧文本基座模型
谷歌DeepMind发布AlphaGenome:100万碱基对AI模型革新基因变异预测与疾病研究
Pageone
Kimi K2.5开源发布:月之暗面推出视觉文本融合全能AI模型,支持百Agent集群协作
TAGGED:DeepSeekMLE-bench层次化认知缓存机器学习智能体自主科研
分享
Email 复制链接 打印
Share
上一篇 Zen Browser:开源AI浏览器评测:垂直标签页+深度定制,重塑你的多任务工作流
下一篇 FrontierScience基准测试:OpenAI如何用竞赛级题目精准评估大模型科学推理能力
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

流光脑波AI大脑占位特色图
2026年3月美国AI榜单巨变:Claude单月狂飙130%紧追ChatGPT,格局突变信号已现
AIGC 资讯 最新趋势
得物实战揭秘:AI Coding工具如何突破数仓开发’失忆’痛点,Harness工程引领新范式
AI 工具 AIGC 资讯
全息流体渐变通用占位特色图
历史性和解!Meta妥协规避审判,美国首例学校诉社交媒体成瘾案落幕,揭示行业司法风向
AIGC 资讯
量子芯片科技感占位特色图
Spotify与环球音乐联手:AI翻唱混音工具上线,正版版权终结Suno野蛮生长
AI 工具 AIGC 资讯 最新趋势

相关推荐

AI 工具AIGC 资讯

Seed-OSS:字节跳动开源360亿参数大模型,长文本推理与智能代理能力引领行业

站外新闻
AIGC 字节跳动 长文本处理
AI 工具

Quick Creator

remaker
AIGC 资讯

Heygem – 硅基智能推出的开源数字人模型

站外新闻
AIGC 资讯

Zonos – ZyphraAI 开源的多语言 TTS 模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.