Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 阿里通义WebShaper:AI自动出题训练数据合成系统,革新智能体训练范式
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 阿里通义WebShaper:AI自动出题训练数据合成系统,革新智能体训练范式
AI 工具AIGC 资讯

阿里通义WebShaper:AI自动出题训练数据合成系统,革新智能体训练范式

站外新闻
最近更新: 2026年6月7日 下午8:22
AI训练数据 WebShaper 强化学习 阿里通义
SHARE

💡 站外导读:当前,AI智能体(Agent)训练面临高质量、复杂度可控数据稀缺的瓶颈。传统方法依赖人工标注或低效合成,成本高且难以扩展,制约了模型处理真实世界复杂推理任务的能力。阿里通义实验室推出的WebShaper系统,创新性地提出让AI自己生成训练数据,通过形式化建模和智能体扩展机制,实现了训练数据的自动化、高质量与可扩展生产,为突破AI智能体训练的数据困境提供了全新路径。

WebShaper是什么

WebShaper 是阿里巴巴通义实验室推出的创新的 AI 训练数据合成系统。通过形式化建模和智能体扩展机制,为 AI 智能体(Agent)的训练提供了高质量、可扩展的数据。WebShaper 首次引入了基于集合论的“知识投影”(Knowledge Projection, KP)概念,通过 KP 的交集、并集和递归操作,构造复杂的问题结构,精准控制推理路径和任务复杂度。WebShaper 的 Expander 智能体能从简单的“种子问题”出发,逐步扩展成复杂的推理任务,让 AI 自己“出题”。训练策略结合了监督微调(SFT)和 GRPO 强化学习,使模型在复杂信息检索任务中表现出色。

阅读目录
  • WebShaper是什么
  • WebShaper的主要功能
  • WebShaper的技术原理
  • WebShaper的项目地址
  • WebShaper的应用场景
      • 📝 站长洞察 (Editor’s Insight)

WebShaper

WebShaper的主要功能

  • 形式化建模:WebShaper 首次提出了基于集合论的 IS(信息搜寻)任务形式化建模方法。通过“知识投影”(Knowledge Projection, KP)将复杂的信息搜寻任务分解为多个集合操作(如交集、并集、递归操作)。每个 KP 是一个包含特定实体的集合,通过这些操作可以构造出复杂的问题结构,精准控制推理路径和任务复杂度。
  • 智能体扩展机制:WebShaper 的一大创新是让 AI 自己“出题”。通过 Expander 智能体,系统从一个简单的“种子问题”开始,逐步扩展成复杂的推理任务。Expander 智能体调用搜索、摘要、验证等工具,逐步构造出更复杂、逻辑清晰的问题,并验证答案的正确性。确保了推理链条清晰,任务结构可控。
  • 高质量数据生成:WebShaper 通过形式化建模和智能体扩展机制,生成的训练数据不再是“靠猜题”,而是可控、可解释、可扩展的高质量任务。突破了预检索数据的边界,实现了更广泛的任务类型、能力激发和知识覆盖,减少了数据合成中的错误和冗余信息。
  • Agent 训练策略:WebShaper 采用监督微调(SFT)和 GRPO 强化学习的组合策略,让 AI 智能体在模糊、多跳信息中逐步掌握推理与检索能力。训练从高质量的训练轨迹开始,通过奖励机制引导模型进行多步推理,避免“走捷径”或“猜答案”。

WebShaper的技术原理

  • 形式化驱动框架:WebShaper 采用集合论对信息检索任务进行系统形式化,核心是“知识投影”(Knowledge Projections, KP)概念。KP 是基于特定关系的实体集合,
  • 知识投影操作
    • R-并集:用于处理不确定性条件,例如“2000-2010年参赛的球员”可以通过并集操作表示。
    • 交集:用于处理多条件约束,例如“2000年参赛且90年代出生的球员”。
  • 任务扩展机制:WebShaper 通过“种子任务”开始,利用扩展器(Expander)逐步扩展问题复杂度。扩展器基于形式化框架,结合检索和验证工具,将简单问题扩展为复杂问题,确保逻辑一致性和任务难度。
  • 数据合成与训练:生成的复杂问题被转换为训练数据,通过监督微调(SFT)和强化学习(如 GRPO 算法)进行模型训练,提升模型在复杂信息检索任务中的推理能力。

WebShaper的项目地址

  • Github仓库:https://github.com/Alibaba-NLP/WebAgent
  • HuggingFace模型库:https://huggingface.co/datasets/Alibaba-NLP/WebShaper
  • arXiv技术论文:https://arxiv.org/pdf/2507.15061

WebShaper的应用场景

  • 文献整理与分析:WebShaper 可以帮助研究人员快速收集和整理相关文献,进行跨学科的知识发现。
  • 市场调研:WebShaper 可以用于市场调研、竞争分析和投资决策支持。企业分析师可以让 AI 系统自动收集行业数据、分析市场趋势、评估竞争对手的策略。
  • 智能学习助手:WebShaper 可以成为智能学习助手,帮助学生进行深度学习和研究性学习。
  • 生活决策:WebShaper 可以在出行规划、健康查询、生活决策等场景下,即开即用,为用户提供个性化的信息支持。
  • 医疗信息查询:WebShaper 可以帮助用户查询医疗健康信息,提供专业的医疗建议和健康咨询。

📝 站长洞察 (Editor’s Insight)

WebShaper的发布,标志着AI训练范式正从“数据喂养”向“数据自生长”演进。其核心创新在于用形式化方法(集合论)将模糊的“信息搜寻”任务结构化、可控化,并引入Expander智能体实现任务的自动化、复杂化扩展,这解决了高质量训练数据合成的可解释性与可控性难题。更深远看,它预示了AI发展的新循环:让模型参与甚至主导自身训练数据的构建,形成更高效的“自举”式进化。结合SFT与GRPO强化学习的混合策略,也体现了当前业界提升Agent推理能力的主流技术融合路径。对于整个行业而言,此类技术将加速专用AI智能体的开发进程,降低对人工数据标注的依赖,是推动AI走向更深、更复杂应用场景的关键基础设施。

Sitcom-Crafter – 北航联合港中文等高校推出的 3D 人类动作生成系统
QuickQR Art
Seed-Coder – 字节跳动开源的代码模型系列
SyncAnimation – 南科大等推出的实时音频驱动生成头部运动框架
Perplexity发布pplx-embed系列模型:参数低至0.6B,MTEB与ConTEB基准测试SOTA,存储压缩高达32倍的文本嵌入新突破
TAGGED:AI训练数据WebShaper强化学习阿里通义
分享
Email 复制链接 打印
Share
上一篇 昆仑万维开源Skywork UniPic:1.5B参数多模态模型,媲美GPT-4o,支持图像理解、生成与编辑
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

昆仑万维开源Skywork UniPic:1.5B参数多模态模型,媲美GPT-4o,支持图像理解、生成与编辑
AI 工具 AIGC 资讯
Qwen3-30B-A3B-Instruct-2507:阿里通义开源MoE模型,305亿参数仅激活33亿,本地部署首选
AI 工具 AIGC 资讯
SeedEdit 3.0深度评测:字节跳动AI图像编辑神器,一句话指令重塑创作效率
AI 工具 AIGC 资讯
微软重磅开源!Agent Lightning:基于强化学习的AI Agent训练框架,无缝集成LangChain、AutoGen等主流平台
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

Search-o1 – 人大联合清华推出自主知识检索增强的推理框架

站外新闻
AI 工具AIGC 资讯

Realtime TTS-2:Inworld AI 实时语音合成模型革新,多轮感知与跨语言控制引领下一代对话AI

站外新闻
Inworld AI Realtime TTS-2 多语言语音合成 实时语音合成 对话式AI
AI 工具AIGC 资讯

OpenAI重磅发布ChatGPT for PowerPoint插件:一句话生成PPT,智能分析揪出逻辑Bug,彻底重塑职场效率

站外新闻
AIGC AI办公 chatgpt openai PowerPoint
AIGC 资讯

Toolkami – 开源 AI Agent 框架,七种核心工具支持运行

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程模型 AI视频生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 边缘计算 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.