Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 阿里通义DeepResearch:开源30B参数深度研究智能体,赋能AI Agent新范式
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 阿里通义DeepResearch:开源30B参数深度研究智能体,赋能AI Agent新范式
AI 工具AIGC 资讯

阿里通义DeepResearch:开源30B参数深度研究智能体,赋能AI Agent新范式

站外新闻
最近更新: 2026年6月7日 下午8:18
AI Agent 开源大模型 深度研究智能体 通义DeepResearch 阿里云
SHARE

💡 站外导读:在信息爆炸的时代,企业和研究者面临海量数据筛选与深度分析的挑战,传统搜索引擎和单一AI工具难以应对多步骤、长周期的复杂推理任务。行业亟需能自主规划、迭代研究的智能体,以提升决策效率与准确性。阿里推出的通义DeepResearch,正是一款为此痛点而生的开源解决方案,标志着深度研究智能体从理论迈向大规模应用。

通义DeepResearch是什么

通义DeepResearch 是阿里巴巴推出的开源深度研究智能体,专为长周期、深度信息检索任务设计。拥有 300 亿参数,每次激活 30 亿参数,支持 ReAct 模式和深度模式(Heavy Mode),后者通过迭代研究范式(IterResearch)提升复杂推理能力。智能体采用全流程合成数据方案,无需人工干预即可生成高质量数据集,突破智能体能力上限。训练流程涵盖智能体持续预训练(Agentic CPT)、监督微调(SFT)和强化学习(RL),形成完整的端到端训练链路。通义 DeepResearch 已赋能阿里巴巴内部多个应用,如高德地图的 AI 原生出行 Agent 和法律领域的“通义法睿”。

阅读目录
  • 通义DeepResearch是什么
  • 通义DeepResearch的主要功能
  • 通义DeepResearch的技术原理
  • 通义DeepResearch的项目地址
  • 通义 DeepResearch 的家族成员
  • 通义DeepResearch的应用场景
      • 📝 站长洞察 (Editor’s Insight)

通义 DeepResearch

通义DeepResearch的主要功能

  • 长周期深度信息检索:专为复杂、长周期的信息检索任务设计,能处理多步骤的推理和规划,适用于学术研究、市场分析、政策制定等场景。
  • 多模式推理支持:支持 ReAct 模式和深度模式(Heavy Mode)。ReAct 模式严格遵循“思考-行动-观察”循环,适合评估模型的核心能力;深度模式通过迭代研究范式(IterResearch)提升复杂推理能力。
  • 全流程合成数据生成:采用自研的全流程合成数据方案,无需人工干预即可生成高质量数据集,突破智能体能力上限,支持从预训练到微调再到强化学习的完整训练链路。
  • 端到端强化学习:通过定制化的强化学习算法(如 Group Relative Policy Optimization, GRPO),确保智能体的行为与高阶目标保持一致,提升模型在动态环境中的适应性和稳定性。
  • 实际应用赋能:已成功应用于阿里巴巴内部多个场景,如高德地图的 AI 原生出行 Agent 和法律领域的“通义法睿”,展现出强大的实用性和价值。
  • 开源共建:项目完全开源,提供完整的代码、模型和数据,鼓励开发者参与共建,推动深度研究智能体的发展和创新。

通义DeepResearch的技术原理

  • 全流程合成数据方案:无需人工干预,自动生成高质量数据集,支持从预训练到微调再到强化学习的完整训练链路,突破智能体能力上限。
  • 迭代研究范式(IterResearch):将复杂任务分解为多个研究回合,每个回合动态重构精简工作区,通过“思考-综合-行动”流程,提升复杂推理能力和决策质量。
  • 端到端强化学习:采用定制化的强化学习算法,如 Group Relative Policy Optimization (GRPO),确保学习信号与模型当前能力精准匹配,提升模型在动态环境中的适应性和稳定性。
  • 大规模持续预训练:利用持续更新的知识文档、爬虫数据、知识图谱等构建开放世界知识记忆,生成多风格的(问题,答案)对,持续扩展模型能力。
  • 自动化数据管理:在训练动态的指导下实时优化数据,通过全自动数据合成和数据漏斗动态调整训练集,确保训练的稳定性和性能提升。
  • 稳定高效的工具沙盒:开发统一的沙盒环境,处理并发和故障,确保工具调用的稳定性和可靠性,为智能体提供快速且鲁棒的交互环境。

通义DeepResearch的项目地址

  • 项目官网:https://tongyi-agent.github.io/blog/introducing-tongyi-deep-research/
  • Github仓库:https://github.com/Alibaba-NLP/DeepResearch
  • HuggingFace模型库:https://huggingface.co/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B

通义 DeepResearch 的家族成员

  • WebWalker:专注于网页遍历任务,用于评估语言模型在网页导航中的表现。
  • WebDancer:致力于实现自主信息寻求能力,推动智能体在信息检索中的自主性。
  • WebSailor:用于导航复杂的网页环境,提升智能体的超人级推理能力。
  • WebShaper:通过信息寻求的形式化,实现智能体数据的合成,提升数据质量和模型性能。
  • WebWatcher:探索视觉语言智能体的新边界,结合视觉和语言能力进行深度研究。
  • WebResearcher:释放长周期智能体的无界推理能力,提升其在复杂任务中的表现。
  • ReSum:通过上下文总结解锁长周期搜索智能,优化智能体的信息管理能力。
  • WebWeaver:利用动态提纲结构化网络规模的证据,支持开放式的深度研究。
  • WebSailor-V2:通过合成数据和可扩展的强化学习,缩小与专有智能体的差距。

通义DeepResearch的应用场景

  • 学术研究:能快速整理文献综述,帮助学者们高效完成复杂的学术研究任务,提升研究效率。
  • 市场分析:为企业提供竞争对手分析、行业趋势报告等,助力企业制定精准的市场策略。
  • 法律研究:在法律领域,如“通义法睿”应用,自动检索法条、类案和裁判文书,进行深度归纳分析,为法律从业者提供强大的生产力工具。
  • 出行规划:与高德地图合作,推出 AI 原生出行 Agent,结合实时数据为用户提供精准的出行建议和规划。
  • 复杂信息检索:适用于需要多步骤推理和规划的复杂信息检索任务,如跨领域研究、政策制定等,帮助用户快速获取和整合信息。

📝 站长洞察 (Editor’s Insight)

通义DeepResearch的发布,是AI Agent领域从“工具调用”向“自主研究”跃迁的关键节点。其核心突破在于两点:一是全流程合成数据方案,解决了高质量、长链条训练数据稀缺的瓶颈,为智能体自我进化提供了燃料;二是迭代研究范式(IterResearch),让智能体能在动态环境中持续优化工作区,模拟人类专家的研究过程。这不仅是技术迭代,更是范式创新——它预示着未来AIGC将不再局限于内容生成,而是升级为具备深度分析、自主决策的“知识工作者”。开源策略更显阿里生态野心,通过吸引开发者共建,有望在科研、法律、金融等专业领域快速孵化垂直应用,重塑生产力工具形态。

Asana 7500万美元收购无代码AI智能体公司StackAI:重塑「人机团队操作系统」
OpenAI发布GPT-5.3-Codex-Spark:Cerebras芯片赋能,千倍速实时编程模型来了!
TripoSF – VAST AI 开源的新一代 3D 基础模型
LatentSync – 字节联合北交大开源的端到端唇形同步框架
DeepSeek-Prover-V2 – DeepSeek推出的开源数学推理大模型
TAGGED:AI Agent开源大模型深度研究智能体通义DeepResearch阿里云
分享
Email 复制链接 打印
Share
上一篇
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

2026年6月21日
AI 工具 AIGC 资讯
阿里通义开源WebResearcher:迭代式深度研究Agent,自主拆解复杂问题的AI研究助手
AI 工具 AIGC 资讯
阿里通义发布Qwen3Guard:全球首款支持119种语言的大模型安全防护标杆
AI 工具 AIGC 资讯
AntSK FileChunk开源工具:基于AI语义分析的智能文档切片,彻底告别传统分割的语义割裂
AI 工具

相关推荐

AIGC 资讯

Gemini 2.5 Pro – 谷歌推出的最新 AI 思考模型

站外新闻
全息流体渐变通用占位特色图
AIGC 资讯

马斯克千亿资本腾挪:SpaceX低息贷款置换高息债,年省10亿美元利息

站外新闻
SpaceX 企业集团化 债务重组 资本运作 马斯克
AIGC 资讯

LangGraph – 基于图结构构建与部署多代理动态工作流的开源框架

站外新闻
AI 工具AIGC 资讯

Step3-VL-10B:阶跃星辰开源10B参数多模态模型,性能对标200B级巨模,端侧部署新标杆

站外新闻
多模态大模型 开源模型 强化学习 端侧部署 视觉语言模型
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 智谱AI 月之暗面 本地AI 清华大学 知识管理 科大讯飞 端侧AI 端侧部署 美团 腾讯 腾讯混元 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 赛博朋克 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.