Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Absolute Zero – 清华大学等机构推出的语言模型推理训练方法
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Absolute Zero – 清华大学等机构推出的语言模型推理训练方法
AIGC 资讯

Absolute Zero – 清华大学等机构推出的语言模型推理训练方法

站外新闻
最近更新: 2026年6月8日 上午9:59
SHARE

Absolute Zero是什么

Absolute Zero是清华大学 LeapLab 团队联合北京通用人工智能研究院 NLCo 实验室和宾夕法尼亚州立大学推出的全新语言模型推理训练方法。Absolute Zero基于模型自我提出任务自主解决,实现自我进化式学习,无需依赖人类标注数据或预定义任务。模型在提出任务时获得可学习性奖励,在解决问题时获得解答奖励,基于与环境交互不断优化自身推理能力。Absolute Zero的核心在于推动推理模型从依赖人类监督向依赖环境监督转变,让模型用真实环境的反馈生成可验证的任务提升性能。

阅读目录
  • Absolute Zero是什么
  • Absolute Zero的主要功能
  • Absolute Zero的技术原理
  • Absolute Zero的项目地址
  • Absolute Zero的应用场景

Absolute Zero

Absolute Zero的主要功能

  • 任务自主生成:模型自主提出具有可学习性的任务,任务不过于简单,也不过于复杂,能为模型提供有效的学习信号。
  • 任务自主解决:模型作为求解者,尝试解决自己提出或生成的任务,基于环境反馈验证解答的正确性。
  • 推理能力提升:不断提出和解决任务,模型的推理能力(如归纳、演绎、溯因等)得到持续增强。
  • 跨领域泛化:模型基于自我学习获得的通用推理能力,迁移到新的任务和领域中。
  • 零数据训练:完全不依赖人工标注数据或人类设计的任务,基于与环境的交互和反馈进行学习。

Absolute Zero的技术原理

  • 双重角色模型:模型同时扮演任务提出者(Proposer)和任务求解者(Solver)两个角色。提出者生成任务,求解者尝试解决任务,两者共享模型参数同步优化。
  • 环境反馈机制:模型与环境(如代码执行器)交互,环境验证任务的可解性提供反馈。提出的任务获得可学习性奖励(基于任务的难度和模型的解答成功率),求解的任务获得解答奖励(基于解答的正确性)。
  • 强化学习优化:用强化学习算法(如TRR++)优化模型参数,结合可学习性奖励和解答奖励,实现多任务下的自我进化学习。
  • 推理模式支持:支持三种基本推理模式,演绎(Deduction)、溯因(Abduction)和归纳(Induction)。每种推理模式对应不同的任务类型,模型解决这些任务提升特定推理能力。
  • 自博弈闭环:模型不断提出新任务、求解任务,根据环境反馈更新策略,形成一个闭环的自博弈学习过程。闭环机制确保模型持续优化自身能力,无需外部数据支持。

Absolute Zero的项目地址

  • 项目官网:https://andrewzh112.github.io/absolute-zero-reasoner/
  • GitHub仓库:https://github.com/LeapLabTHU/Absolute-Zero-Reasoner
  • HuggingFace模型库:https://huggingface.co/collections/andrewzh/absolute-zero-reasoner
  • arXiv技术论文:https://www.arxiv.org/pdf/2505.03335

Absolute Zero的应用场景

  • 通用人工智能(AGI):推动模型自主学习和进化,逐步接近人类智能水平。
  • 代码生成:自动生成高效代码,解决复杂编程问题,提升开发效率。
  • 数学推理:提升模型在数学问题上的泛化能力,辅助数学教育和研究。
  • 自然语言处理(NLP):基于自我学习提升语言理解和生成能力,优化文本生成和问答系统。
  • 安全与伦理:研究AI自主进化中的行为模式,确保系统安全性和伦理性。
Odyssey发布Agora-1:全球首个多智能体世界模型,4人实时共享AI生成游戏世界
名创优品Q1营收猛增28.5%,8.75亿AI投资收益撑起利润,主业承压背后藏着什么秘密?
CodeGraph – 开源代码知识图谱工具,加速代码理解和分析
MiniMax发布MMX-CLI:专为AI Agent打造的全模态命令行神器,一键集成七大生成能力
商汤绝影发布端侧智能体基座Sage:3B激活参数超越云端模型,重塑智能座舱
分享
Email 复制链接 打印
Share
上一篇 BizGen – 清华大学联合微软推出的AI信息图生成工具
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

BizGen – 清华大学联合微软推出的AI信息图生成工具
AIGC 资讯
工作流迈向工程化!国内开源 AI 智能体 Runtime 框架 MateClaw 发布 v1.5.0 重磅更新
AIGC 资讯
日日新SenseNova V6 – 商汤推出的多模态融合模型系列
AIGC 资讯
全息流体渐变通用占位特色图
能力与安全的博弈!OpenAI 上线 ChatGPT“封锁模式”,宁可断网也要防数据泄露
AIGC 资讯

相关推荐

流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

OpenAI 2.34亿美金落子新加坡:揭秘首个海外AI实验室的战略野心与全球布局

站外新闻
AI人才培养 openai 人工智能实验室 全球AI枢纽 新加坡
AIGC 资讯

零乐理基础男子利用AI写歌实现月入十几万40秒可生成全曲风歌曲

站外新闻
AIGC 资讯

Awesome MCP Servers – 开源的MCP资源聚合平台,覆盖多个垂直领域

站外新闻
AI 工具AIGC 资讯

商汤SenseNova U1发布:原生统一多模态大模型,一模型打通理解生成,性能比肩闭源模型

站外新闻
AIGC SenseNova U1 商汤科技 多模态大模型 统一模型
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.