Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 斯坦福&英伟达发布TTT-Discover:测试时强化学习实现低成本AI科学发现
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > 斯坦福&英伟达发布TTT-Discover:测试时强化学习实现低成本AI科学发现
AIGC 资讯

斯坦福&英伟达发布TTT-Discover:测试时强化学习实现低成本AI科学发现

站外新闻
最近更新: 2026年6月7日 下午8:06
AI科学发现 开源模型 斯坦福 测试时强化学习 英伟达
SHARE

💡 站外导读:当前AI模型在科学发现等复杂任务中往往依赖海量数据与天价算力训练,且模型在部署后性能固定,无法从具体问题中实时进化。这限制了AI在解决开放性、前沿科学问题上的潜力。斯坦福与英伟达等机构最新提出的TTT-Discover方法,旨在打破这一僵局,通过创新的测试时强化学习框架,让AI模型在推理过程中动态学习,实现低成本、高性能的定向科学突破。

TTT-Discover是什么

TTT-Discover(Test-Time Training to Discover)是斯坦福、英伟达等机构推出的AI科学发现方法。TTT-Discover在测试阶段对模型进行强化学习训练,非冻结权重仅做搜索。通过熵目标函数优化最大奖励,结合PUCT启发的状态重用机制,让模型从具体问题的尝试中实时学习。TTT-Discover基于开源模型gpt-oss-120b,在数学、GPU内核工程、算法竞赛和生物信息学等领域达到SOTA,单问题成本仅数百美元。

阅读目录
  • TTT-Discover是什么
  • TTT-Discover的主要功能
  • TTT-Discover的技术原理
  • TTT-Discover的项目地址
  • TTT-Discover的应用场景
      • 📝 站长洞察 (Editor’s Insight)

TTT-Discover

TTT-Discover的主要功能

  • 测试时持续学习:在解决具体问题时动态更新模型权重,使AI从失败尝试中实时积累经验,实现定向进化。
  • 科学发现优化:针对数学、工程、算法、生物等领域的开放问题,寻找超越现有知识的最优解。
  • 高效搜索策略:通过熵目标函数聚焦高奖励动作,结合PUCT机制智能重用历史状态,平衡探索与利用。
  • 低成本高性能:使用开源模型即可在多项任务中达到SOTA,单问题训练成本仅需几百美元。

TTT-Discover的技术原理

  • 熵目标函数:优化目标为 Jβ​(θ)=E[logE[eβR]] 。当β→∞ 时,目标收敛于最大化最大奖励而非平均奖励,确保模型专注寻找单一极优解。采用自适应β(s) 控制KL散度,维持训练稳定性。
  • PUCT启发状态重用:维护历史解缓冲区,用评分函数Q(s)+c⋅P(s)⋅1+n(s)1+T​​ 选择初始状态。其中Q(s) 取子节点最大奖励(非平均值),P(s) 为基于奖励排名的先验,兼顾高潜力状态利用与多样性探索。

TTT-Discover的项目地址

  • arXiv技术论文:https://arxiv.org/pdf/2601.16175

TTT-Discover的应用场景

  • 数学研究:优化Erdős最小重叠问题、自相关不等式等开放数学问题的边界值,发现新的构造性证明。
  • GPU内核工程:帮助自动生成高性能计算内核,如AlphaFold的TriMul算子、DeepSeek的MLA解码,速度超越人类专家。
  • 算法竞赛:TTT-Discover能解决AtCoder等编程竞赛中的NP-hard优化问题,如几何计算、生产规划等复杂任务。
  • 生物信息学:TTT-Discover能改进单细胞RNA测序去噪算法,提升基因表达数据分析精度。

📝 站长洞察 (Editor’s Insight)

TTT-Discover标志着AI发展范式从“静态推理”向“动态学习与进化”的关键跃迁。它不仅仅是又一个算法优化,更是将强化学习与测试时训练深度结合,让模型在部署后持续自我迭代,这直击了当前大模型“学而不用”、无法适应具体复杂问题的痛点。其开源模型实现SOTA成绩,且成本极低,预示着AI科学研究可能从“重训练”时代迈入“重优化”时代,赋能更多研究者。结合近期AI Agent与自主进化系统的趋势,TTT-Discover提供的“实时学习-定向进化”框架,或将成为下一代AI解决复杂科学工程问题的核心范式,值得所有关注AI前沿的从业者深度关注。

NPOA – 开源舆情检测工具,实时监控网络舆情与分析
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
UniAct – 清华、商汤、北大、上海AI Lab共同推出的具身基础模型框架
PP-TableMagic – 百度飞桨团队开源的表格识别工具
InsForge:AI编程Agent的终极后端平台,开源颠覆全栈开发!
TAGGED:AI科学发现开源模型斯坦福测试时强化学习英伟达
分享
Email 复制链接 打印
Share
上一篇 Project Genie:谷歌DeepMind AI世界模型来袭,文字秒生可交互虚拟宇宙
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Project Genie:谷歌DeepMind AI世界模型来袭,文字秒生可交互虚拟宇宙
AI 工具 AIGC 资讯
宇树科技重磅开源UnifoLM-VLA-0:基于Qwen2.5-VL-7B,单一模型实现12类机器人操作,准确率98.7%
AI 工具 AIGC 资讯
生数科技Vidu Q3重磅发布:全球首款16秒音画同步AI视频生成模型,技术原理与应用场景全解析
AI 工具 AIGC 资讯
阶跃星辰开源Step 3.5 Flash:1960亿参数MoE模型,350TPS极速推理与Agent性能比肩顶尖闭源模型
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯最新趋势

MiniMax M3大模型前瞻:稀疏注意力架构破局,百万Token上下文处理效率飙升10倍+,引领长文本AI新范式

站外新闻
AI效率 MiniMax 稀疏注意力 长上下文
量子芯片科技感占位特色图
AI 工具AIGC 资讯

朱自清《荷塘月色》AI率60%真相:算法误判背后,经典文学成大模型”牺牲品”

站外新闻
AIGC AI检测 AI率 AI生成内容
全息流体渐变通用占位特色图
AIGC 资讯

腾讯重拳出击!《三角洲行动》AI视觉外挂遭封号十年+刑事追诉,游戏反作弊进入’AI反制AI’时代

站外新闻
AI视觉外挂 三角洲行动 刑事追诉 游戏反作弊 腾讯
AIGC 资讯

Mega-ASR – NTU、NUS、上海AI Lab开源的语音识别模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 小红书 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 本地AI 海报设计 清华大学 生成式AI 科幻 端侧AI 网络安全 腾讯 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 阿里通义千问 面壁智能 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.