Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 规划是 AI 智能体的一种核心设计模式[译]
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > 强化 AI 学习 > 规划是 AI 智能体的一种核心设计模式[译]
强化 AI 学习

规划是 AI 智能体的一种核心设计模式[译]

宝玉的分享
最近更新: 2025年4月12日 下午9:25
SHARE

规划是 AI 智能体的一种核心设计模式,其中我们利用大语言模型 (LLM) 自主选择一系列步骤,以完成一个较大的任务。比如,如果我们指派一个智能体去网上研究某个主题,我们可能就会用 LLM 帮助它将这个大任务拆分成若干小任务,例如具体研究几个子主题、整合研究成果、以及撰写报告。

很多人在 ChatGPT 刚发布时就体验到了“ChatGPT 时刻”——他们试用了这个工具,并惊喜地发现它的能力远超过了他们对 AI 的预期。如果你还没有体验过这样的“AI 智能体时刻”,我希望你很快就会。我自己就在几个月前的一个现场演示中有过这样的经历,我展示了一个可以使用多种在线搜索工具的研究智能体。

那时,我已经在私下里多次测试过这个智能体,它总是能够利用网络搜索工具来搜集资料并进行总结。但在那次公开的演示中,网络搜索 API 突然报告了一个频率限制的错误,我本以为这次演示会当众失败,心里非常忐忑。出乎意料的是,这个智能体很机智地切换到了我曾经设定但已经忘记的维基百科搜索工具,并成功使用维基百科完成了任务。

这是一个 AI 智能体给我带来的惊喜时刻。我相信,许多还未体验过这样时刻的人们,在未来几个月里也将有机会体验到。看到一个智能体自己决定用你没有预见的方式去解决问题,并且成功了,这真是太美妙了!

有很多任务无法仅通过一个步骤或一个工具就完成。但是,智能体可以自行决定需要执行哪些步骤。举个例子,根据 HuggingGPT 的论文简化的一个例子,如果你想让一个智能体考虑一张男孩的照片,并绘制一个相同姿势的女孩,这个任务可以分为两步:

  • (一)识别男孩照片中的姿势;
  • (二)根据这个姿势来绘制女孩。

一个 LLM 可以被微调或通过少样本提示来生成一个执行计划,例如输出:

{ "tool": "pose-detection", "input": "image.jpg", "output": "temp1" }
{ "tool": "pose-to-image", "input": "temp1", "output": "final.jpg" }

这样的结构化输出定义了需要执行的两个步骤,随后会触发软件依次调用姿势检测工具和姿势转换图像工具来完成这个任务。(这只是一个示例,实际上 HuggingGPT 使用的是另一种格式。)

可以说,很多 AI 智能体的操作不必依赖于复杂的规划。例如,你可能设置一个智能体来多次反思并优化它的输出,这种情况下它的操作步骤是预定好的、一成不变的。但对于那些你不能提前定义清楚步骤的复杂任务,规划功能就显得尤为重要,它允许智能体灵活地确定接下来的行动方案。

规划功能虽然强大,却也使得结果变得不那么可预测。在我的经验中,虽然我能够通过反思和使用工具等设计模式稳定地提升应用性能,规划却还不够成熟,很难预测它的行为。不过,这个领域正在迅速进步,我相信规划的能力不久将得到大幅提升。

如果你想更深入了解如何使用大语言模型来进行规划,我推荐以下读物:

*《思维链提示促使大语言模型进行推理》(Chain-of-Thought Prompting Elicits Reasoning in Large Language Models),Wei 等(2022 年)
*《HuggingGPT:用 ChatGPT 及其在 Hugging Face 中的伙伴解决 AI 任务》(HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face),Shen 等(2023 年)
*《理解大语言模型智能体的规划:一项调查》(Understanding the planning of LLM agents: A survey),Huang 等(2024 年)

为何有科学家不用 ChatGPT?他们这样说 [译]
大语言模型的“破解”研究:仅需二十次尝试 [译]
7 个帮助最小化 RAG 模型风险的指标 [译]
台积电在美国郊区建造芯片工厂的艰辛历程 [译]
Google 真正的“登月项目”(Moonshot) [译]
分享
Email 复制链接 打印
Share
上一篇 访谈记录:Ezra Klein 采访 Dario Amodei [译]
下一篇 美国芯片制造的重大失误 [译]
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

量子芯片科技感占位特色图
ElevenLabs Music v2重磅更新:实现‘一曲多变’与商业版权无忧,AI音乐进入生产力时代
AI 工具 AIGC 资讯
小米发布「招聘Agent」:基于xiaomimimo大模型,简历精准匹配+校招问答全AI化
AI 工具 AIGC 资讯
流光脑波AI大脑占位特色图
阿里语音大模型横扫Artificial Analysis三冠:Fun-Realtime-TTS全球第五,ASR、Chat、TTS国产登顶,实时合成技术引领深度智能时代
AIGC 资讯 最新趋势
流光脑波AI大脑占位特色图
Snowflake与AWS签下60亿美元天价合同:AI算力新战场转向CPU自研,英伟达霸主地位受挑战
AIGC 资讯 最新趋势

相关推荐

强化 AI 学习

一些有价值的职场建议 [译]

宝玉的分享
强化 AI 学习

通过模拟一切视频生成将带我们走向通用人工智能,终有一天你可以在视频模型上运行 ChatGPT [译]

宝玉的分享
1次查看
一个“工程化”提示词的构成
强化 AI 学习

我试验了高级 AI 提示词的效果,结论:它们并不值得 [译]

宝玉的分享
强化 AI 学习

提示工程 [译]

宝玉的分享
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent Agentic Coding AI AI Agent AIGC AI安全 AI工具 AI幻觉 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI芯片 AI视频 AI视频生成 AI设计 AI音乐 Anthropic AWS chatgpt Claude Claude Code Claude Mythos DALL-E3 DuckDuckGo excel Gemini MCP协议 meta Midjourney MiniMax NVIDIA openai Pika prompt Qwen3.7-Max SpaceX Stability AI stable diffusion SWE-Bench 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 咒语 图像生成模型 多模态AI 多模态大模型 大模型 大模型API 大语言模型 字节跳动 室内设计 家居 展台 建筑 建筑设计 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 提示词 支付宝 教程 新闻 早报 智能体 智能体编程 智谱AI 月之暗面 海报设计 清华大学 游戏 破碎 科幻 端侧AI 网络安全 背景 腾讯 腾讯混元 英伟达 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.