Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Absolute Zero – 清华大学等机构推出的语言模型推理训练方法
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Absolute Zero – 清华大学等机构推出的语言模型推理训练方法
AIGC 资讯

Absolute Zero – 清华大学等机构推出的语言模型推理训练方法

站外新闻
最近更新: 2026年6月8日 上午9:59
SHARE

Absolute Zero是什么

Absolute Zero是清华大学 LeapLab 团队联合北京通用人工智能研究院 NLCo 实验室和宾夕法尼亚州立大学推出的全新语言模型推理训练方法。Absolute Zero基于模型自我提出任务自主解决,实现自我进化式学习,无需依赖人类标注数据或预定义任务。模型在提出任务时获得可学习性奖励,在解决问题时获得解答奖励,基于与环境交互不断优化自身推理能力。Absolute Zero的核心在于推动推理模型从依赖人类监督向依赖环境监督转变,让模型用真实环境的反馈生成可验证的任务提升性能。

阅读目录
  • Absolute Zero是什么
  • Absolute Zero的主要功能
  • Absolute Zero的技术原理
  • Absolute Zero的项目地址
  • Absolute Zero的应用场景

Absolute Zero

Absolute Zero的主要功能

  • 任务自主生成:模型自主提出具有可学习性的任务,任务不过于简单,也不过于复杂,能为模型提供有效的学习信号。
  • 任务自主解决:模型作为求解者,尝试解决自己提出或生成的任务,基于环境反馈验证解答的正确性。
  • 推理能力提升:不断提出和解决任务,模型的推理能力(如归纳、演绎、溯因等)得到持续增强。
  • 跨领域泛化:模型基于自我学习获得的通用推理能力,迁移到新的任务和领域中。
  • 零数据训练:完全不依赖人工标注数据或人类设计的任务,基于与环境的交互和反馈进行学习。

Absolute Zero的技术原理

  • 双重角色模型:模型同时扮演任务提出者(Proposer)和任务求解者(Solver)两个角色。提出者生成任务,求解者尝试解决任务,两者共享模型参数同步优化。
  • 环境反馈机制:模型与环境(如代码执行器)交互,环境验证任务的可解性提供反馈。提出的任务获得可学习性奖励(基于任务的难度和模型的解答成功率),求解的任务获得解答奖励(基于解答的正确性)。
  • 强化学习优化:用强化学习算法(如TRR++)优化模型参数,结合可学习性奖励和解答奖励,实现多任务下的自我进化学习。
  • 推理模式支持:支持三种基本推理模式,演绎(Deduction)、溯因(Abduction)和归纳(Induction)。每种推理模式对应不同的任务类型,模型解决这些任务提升特定推理能力。
  • 自博弈闭环:模型不断提出新任务、求解任务,根据环境反馈更新策略,形成一个闭环的自博弈学习过程。闭环机制确保模型持续优化自身能力,无需外部数据支持。

Absolute Zero的项目地址

  • 项目官网:https://andrewzh112.github.io/absolute-zero-reasoner/
  • GitHub仓库:https://github.com/LeapLabTHU/Absolute-Zero-Reasoner
  • HuggingFace模型库:https://huggingface.co/collections/andrewzh/absolute-zero-reasoner
  • arXiv技术论文:https://www.arxiv.org/pdf/2505.03335

Absolute Zero的应用场景

  • 通用人工智能(AGI):推动模型自主学习和进化,逐步接近人类智能水平。
  • 代码生成:自动生成高效代码,解决复杂编程问题,提升开发效率。
  • 数学推理:提升模型在数学问题上的泛化能力,辅助数学教育和研究。
  • 自然语言处理(NLP):基于自我学习提升语言理解和生成能力,优化文本生成和问答系统。
  • 安全与伦理:研究AI自主进化中的行为模式,确保系统安全性和伦理性。
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
RSIDiff – 基于合成数据提升图像生成质量的递归自训练框架
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
Moonlight-16B-A3B – 月之暗面开源的 MoE 模型
腾讯混元3D-Omni框架发布:多模态控制信号驱动,精准生成高保真3D资产
分享
Email 复制链接 打印
Share
上一篇 BizGen – 清华大学联合微软推出的AI信息图生成工具
下一篇 Gemini 2.0 Flash – Google推出的多模态 AI 模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

快手OneRec:颠覆传统推荐!端到端生成式AI系统引爆观看时长与GMV
AI 工具 AIGC 资讯
Kimi-Researcher:月之暗面端到端强化学习Agent,深度研究基准测试超Claude 4 Opus
AI 工具 AIGC 资讯
华为盘古大模型5.5震撼发布:7180亿参数Ultra MoE领衔,五大模型重塑产业智能
AI 工具 AIGC 资讯
腾讯清华重磅开源MindOmni:强化学习驱动的多模态推理生成模型,重塑视觉AI边界
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

OpenAI广告平台全面开放:免费ChatGPT用户成精准流量池,CPC定价与投放策略全解析

站外新闻
chatgpt CPC openai 商业化 广告平台
AIGC 资讯

NEXUS-O – 多模态AI模型,实现对语言、音频和视觉全方位感知与交互

站外新闻
AIGC 资讯

苹果俄亥俄州立大学联手发布FS-DFM扩散语言模型:8步生成媲美千步效果,速度飙升128倍

站外新闻
AIGC FS-DFM 扩散语言模型 离散流匹配 苹果
AIGC 资讯

ImageRAG – 基于检索增强生成的图像生成技术

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.