Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 规划是 AI 智能体的一种核心设计模式[译]
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > 强化 AI 学习 > 规划是 AI 智能体的一种核心设计模式[译]
强化 AI 学习

规划是 AI 智能体的一种核心设计模式[译]

宝玉的分享
最近更新: 2025年4月12日 下午9:25
SHARE

规划是 AI 智能体的一种核心设计模式,其中我们利用大语言模型 (LLM) 自主选择一系列步骤,以完成一个较大的任务。比如,如果我们指派一个智能体去网上研究某个主题,我们可能就会用 LLM 帮助它将这个大任务拆分成若干小任务,例如具体研究几个子主题、整合研究成果、以及撰写报告。

很多人在 ChatGPT 刚发布时就体验到了“ChatGPT 时刻”——他们试用了这个工具,并惊喜地发现它的能力远超过了他们对 AI 的预期。如果你还没有体验过这样的“AI 智能体时刻”,我希望你很快就会。我自己就在几个月前的一个现场演示中有过这样的经历,我展示了一个可以使用多种在线搜索工具的研究智能体。

那时,我已经在私下里多次测试过这个智能体,它总是能够利用网络搜索工具来搜集资料并进行总结。但在那次公开的演示中,网络搜索 API 突然报告了一个频率限制的错误,我本以为这次演示会当众失败,心里非常忐忑。出乎意料的是,这个智能体很机智地切换到了我曾经设定但已经忘记的维基百科搜索工具,并成功使用维基百科完成了任务。

这是一个 AI 智能体给我带来的惊喜时刻。我相信,许多还未体验过这样时刻的人们,在未来几个月里也将有机会体验到。看到一个智能体自己决定用你没有预见的方式去解决问题,并且成功了,这真是太美妙了!

有很多任务无法仅通过一个步骤或一个工具就完成。但是,智能体可以自行决定需要执行哪些步骤。举个例子,根据 HuggingGPT 的论文简化的一个例子,如果你想让一个智能体考虑一张男孩的照片,并绘制一个相同姿势的女孩,这个任务可以分为两步:

  • (一)识别男孩照片中的姿势;
  • (二)根据这个姿势来绘制女孩。

一个 LLM 可以被微调或通过少样本提示来生成一个执行计划,例如输出:

{ "tool": "pose-detection", "input": "image.jpg", "output": "temp1" }
{ "tool": "pose-to-image", "input": "temp1", "output": "final.jpg" }

这样的结构化输出定义了需要执行的两个步骤,随后会触发软件依次调用姿势检测工具和姿势转换图像工具来完成这个任务。(这只是一个示例,实际上 HuggingGPT 使用的是另一种格式。)

可以说,很多 AI 智能体的操作不必依赖于复杂的规划。例如,你可能设置一个智能体来多次反思并优化它的输出,这种情况下它的操作步骤是预定好的、一成不变的。但对于那些你不能提前定义清楚步骤的复杂任务,规划功能就显得尤为重要,它允许智能体灵活地确定接下来的行动方案。

规划功能虽然强大,却也使得结果变得不那么可预测。在我的经验中,虽然我能够通过反思和使用工具等设计模式稳定地提升应用性能,规划却还不够成熟,很难预测它的行为。不过,这个领域正在迅速进步,我相信规划的能力不久将得到大幅提升。

如果你想更深入了解如何使用大语言模型来进行规划,我推荐以下读物:

*《思维链提示促使大语言模型进行推理》(Chain-of-Thought Prompting Elicits Reasoning in Large Language Models),Wei 等(2022 年)
*《HuggingGPT:用 ChatGPT 及其在 Hugging Face 中的伙伴解决 AI 任务》(HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face),Shen 等(2023 年)
*《理解大语言模型智能体的规划:一项调查》(Understanding the planning of LLM agents: A survey),Huang 等(2024 年)

面向大语言模型的检索增强生成技术:调查 [译]
如何成功地与你的雇主建立良好关系 [译]
Voyager:结合大语言模型的创新虚拟智能体 [译]
大语言模型真的需要这么多层吗? [译]
llamafile:让大众轻松拥有大语言模型 (LLMs),甚至在您的个人电脑上 [译]
分享
Email 复制链接 打印
Share
上一篇 访谈记录:Ezra Klein 采访 Dario Amodei [译]
下一篇 美国芯片制造的重大失误 [译]
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Claude Opus 4.1 深度评测:74.5% SWE-bench 登顶!编程、Agent与安全性全面超越GPT-4.1
AI 工具 AIGC 资讯
Lumina AI开源Chunkr:一键将PDF/PPT转为RAG结构化数据的终极文档处理API
AI 工具
小红书Hi Lab重磅开源dots.vlm1:12亿参数视觉编码器+DeepSeek V3,多模态大模型性能直逼闭源SOTA
AI 工具 AIGC 资讯
阿里Qwen3闪电模型上线:性能飙升、百万token上下文、价格屠夫级定价,AIGC普惠化新标杆
AI 工具 AIGC 资讯

相关推荐

强化 AI 学习

6 个残酷真相,让你成为更好的人 [译]

宝玉的分享
在艺术与编程的交汇中,“标识符”呈现出葡萄色、青柠色、橙色和草莓色。
强化 AI 学习

苹果 Pascal“语法”海报的历史,1979-80 [译]

宝玉的分享
强化 AI 学习

为何你应该计划完成更少的任务 [译]

宝玉的分享
强化 AI 学习

利用 GPT 的视觉能力和 TTS API 来处理视频并添加旁白 [译]

宝玉的分享
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大模型推理 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 端侧部署 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 边缘计算 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.