Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 斯坦福&英伟达发布TTT-Discover:测试时强化学习实现低成本AI科学发现
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > 斯坦福&英伟达发布TTT-Discover:测试时强化学习实现低成本AI科学发现
AIGC 资讯

斯坦福&英伟达发布TTT-Discover:测试时强化学习实现低成本AI科学发现

站外新闻
最近更新: 2026年6月7日 下午8:06
AI科学发现 开源模型 斯坦福 测试时强化学习 英伟达
SHARE

💡 站外导读:当前AI模型在科学发现等复杂任务中往往依赖海量数据与天价算力训练,且模型在部署后性能固定,无法从具体问题中实时进化。这限制了AI在解决开放性、前沿科学问题上的潜力。斯坦福与英伟达等机构最新提出的TTT-Discover方法,旨在打破这一僵局,通过创新的测试时强化学习框架,让AI模型在推理过程中动态学习,实现低成本、高性能的定向科学突破。

TTT-Discover是什么

TTT-Discover(Test-Time Training to Discover)是斯坦福、英伟达等机构推出的AI科学发现方法。TTT-Discover在测试阶段对模型进行强化学习训练,非冻结权重仅做搜索。通过熵目标函数优化最大奖励,结合PUCT启发的状态重用机制,让模型从具体问题的尝试中实时学习。TTT-Discover基于开源模型gpt-oss-120b,在数学、GPU内核工程、算法竞赛和生物信息学等领域达到SOTA,单问题成本仅数百美元。

阅读目录
  • TTT-Discover是什么
  • TTT-Discover的主要功能
  • TTT-Discover的技术原理
  • TTT-Discover的项目地址
  • TTT-Discover的应用场景
      • 📝 站长洞察 (Editor’s Insight)

TTT-Discover

TTT-Discover的主要功能

  • 测试时持续学习:在解决具体问题时动态更新模型权重,使AI从失败尝试中实时积累经验,实现定向进化。
  • 科学发现优化:针对数学、工程、算法、生物等领域的开放问题,寻找超越现有知识的最优解。
  • 高效搜索策略:通过熵目标函数聚焦高奖励动作,结合PUCT机制智能重用历史状态,平衡探索与利用。
  • 低成本高性能:使用开源模型即可在多项任务中达到SOTA,单问题训练成本仅需几百美元。

TTT-Discover的技术原理

  • 熵目标函数:优化目标为 Jβ​(θ)=E[logE[eβR]] 。当β→∞ 时,目标收敛于最大化最大奖励而非平均奖励,确保模型专注寻找单一极优解。采用自适应β(s) 控制KL散度,维持训练稳定性。
  • PUCT启发状态重用:维护历史解缓冲区,用评分函数Q(s)+c⋅P(s)⋅1+n(s)1+T​​ 选择初始状态。其中Q(s) 取子节点最大奖励(非平均值),P(s) 为基于奖励排名的先验,兼顾高潜力状态利用与多样性探索。

TTT-Discover的项目地址

  • arXiv技术论文:https://arxiv.org/pdf/2601.16175

TTT-Discover的应用场景

  • 数学研究:优化Erdős最小重叠问题、自相关不等式等开放数学问题的边界值,发现新的构造性证明。
  • GPU内核工程:帮助自动生成高性能计算内核,如AlphaFold的TriMul算子、DeepSeek的MLA解码,速度超越人类专家。
  • 算法竞赛:TTT-Discover能解决AtCoder等编程竞赛中的NP-hard优化问题,如几何计算、生产规划等复杂任务。
  • 生物信息学:TTT-Discover能改进单细胞RNA测序去噪算法,提升基因表达数据分析精度。

📝 站长洞察 (Editor’s Insight)

TTT-Discover标志着AI发展范式从“静态推理”向“动态学习与进化”的关键跃迁。它不仅仅是又一个算法优化,更是将强化学习与测试时训练深度结合,让模型在部署后持续自我迭代,这直击了当前大模型“学而不用”、无法适应具体复杂问题的痛点。其开源模型实现SOTA成绩,且成本极低,预示着AI科学研究可能从“重训练”时代迈入“重优化”时代,赋能更多研究者。结合近期AI Agent与自主进化系统的趋势,TTT-Discover提供的“实时学习-定向进化”框架,或将成为下一代AI解决复杂科学工程问题的核心范式,值得所有关注AI前沿的从业者深度关注。

LG EXAONE 4.0混合推理大模型发布:32B专业版+1.2B端侧版,数学编程能力登顶MMLU-Pro
谷歌 Gemini 3 重磅发布:1501 Elo 登顶,多模态推理新王如何重塑 AI 开发与应用?
Mistral Small 3.1 – Mistral AI 开源的多模态 AI 模型
Umi-OCR – 免费 OCR 文字识别工具,支持截图、批量图片排版解析
小鹏人形机器人量产时间表敲定:2026年底量产,2027年进店导购,全栈自研引领具身智能商业化
TAGGED:AI科学发现开源模型斯坦福测试时强化学习英伟达
分享
Email 复制链接 打印
Share
上一篇 Project Genie:谷歌DeepMind AI世界模型来袭,文字秒生可交互虚拟宇宙
下一篇 MOVA:中国首个端到端开源音视频生成大模型,320亿参数实现电影级口型同步
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

流光脑波AI大脑占位特色图
2026年3月美国AI榜单巨变:Claude单月狂飙130%紧追ChatGPT,格局突变信号已现
AIGC 资讯 最新趋势
得物实战揭秘:AI Coding工具如何突破数仓开发’失忆’痛点,Harness工程引领新范式
AI 工具 AIGC 资讯
全息流体渐变通用占位特色图
历史性和解!Meta妥协规避审判,美国首例学校诉社交媒体成瘾案落幕,揭示行业司法风向
AIGC 资讯
量子芯片科技感占位特色图
Spotify与环球音乐联手:AI翻唱混音工具上线,正版版权终结Suno野蛮生长
AI 工具 AIGC 资讯 最新趋势

相关推荐

AIGC 资讯

NotaGen – 中央音乐学院联合北航、清华等推出的音乐生成模型

站外新闻
AI 工具AIGC 资讯

Hume AI EVI 3发布:实时情感语音交互模型,超越GPT-4o的表现力与速度

站外新闻
EVI 3 GPT-4o Hume AI 情感交互 语音语言模型
AI 工具AIGC 资讯

Anthropic发布Claude Opus 4.8:代码缺陷率暴跌75%,速度提升2.5倍碾压GPT-5.5

站外新闻
AIGC Anthropic Claude Opus 4.8 智能体编程
AIGC 资讯

Pemo – AI文档管理工具,支持一键翻译智能总结文献摘要

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.