Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 针对 Claude 2.1 的长篇幅提示技巧 [译]
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > 强化 AI 学习 > 针对 Claude 2.1 的长篇幅提示技巧 [译]
强化 AI 学习

针对 Claude 2.1 的长篇幅提示技巧 [译]

宝玉的分享
最近更新: 2024年3月9日 下午7:15
SHARE

2023 年 12 月 6 日

阅读目录
  • 深入探索长文本理解难题
  • 如何高效利用 Claude 2.1 的 20 万 Token 上下文窗口

Claude 2.1 在处理高达 20 万 Token 的庞大上下文时,检索特定句子的能力令人瞩目。我们通过实验发现,利用精心设计的提示技巧,可以引导 Claude 更准确地回忆出相关信息。

  • Claude 2.1 在处理高达 20 万 Token 的庞大上下文时表现卓越
  • 不过,它在回答基于文档中某个特定句子的问题时可能会有所保留,特别是当这个句子突兀地插入或者位置不合适时
  • 通过微小的提示调整,可以消除这种犹豫,使其在这类任务上表现更加出色

我们最近推出的Claude 2.1是我们的最新产品,它拥有高达 20 万 Token 的上下文窗口,相当于约 500 页文本信息。Claude 2.1 在处理长篇幅上下文的真实世界检索任务中表现非常出色。

Claude 2.1 的训练基于大量的用户反馈,针对的是用户认为重要的长文档任务,例如总结一份 S-1 长度的文件。这包括了在真实文件上执行的真实任务,目的是训练 Claude 更少犯错,避免发表无依据的声明。

正因为受到了这种在真实世界中复杂检索任务的训练,Claude 2.1 与之前的 Claude 2.0 相比,错误回答减少了 30%,错误声称文档支持某一主张的情况也减少了 3 到 4 倍。

此外,Claude 在处理这些极长的上下文时的记忆能力也有所提升:

深入探索长文本理解难题

Claude 2.1 搭载了一项强大的功能——200K Token 的长文本窗口,这不仅展现了其强大能力,同时也意味着在使用时需要精心设计提示语。

一项近期的评估[1] 测试了 Claude 2.1 在长篇文章中回溯特定句子的能力。这篇文章是由 Paul Graham 关于创业的系列文章 构成的。文章中嵌入了这样一句话:“在旧金山,最棒的事莫过于晴朗天气下,在多洛雷斯公园边吃着三明治。”当模型浏览这篇包含上述句子的长文章时,它被询问:“在旧金山最有趣的活动是什么?”

在这次评估中,Claude 2.1 的回应多少有些出人意料。它回答说:“遗憾的是,文章并没有明确指出旧金山最有趣的活动是什么。”换句话说,它倾向于报告文章没有提供足够的信息来回答这个问题,而不是去查找文中嵌入的那个句子。

我们在一次内部实验中也复现了这一现象。我们取了最新的 综合拨款法案,并在其中加入了一句“宣布 11 月 21 日为‘全国寻针日’”。虽然 Claude 识别出了这一引用,但它仍不愿断言“全国寻针日”是一个真实存在的节日:

Claude 2.1 的训练数据混合了多种资料,目的是降低信息不准确性。这包括在文档中没有足够的信息来支持一个回答时,模型就不会基于该文档作出回应。我们认为,这可能是由于一般性或针对特定任务的数据减少了此类错误,使得模型在面对嵌入在更广泛上下文中的不合适句子时,不太可能给出回答。

然而,对于原本就存在于长文档中、因而并不显得突兀的句子,Claude 表现出了更多的灵活性。例如,被提及的长文档一开始就包含了这样一行,来自 Paul Graham 关于 Viaweb 的文章:“在 1998 年 6 月雅虎宣布收购前几小时,我对 Viaweb 网站进行了快照拍摄。”

为了测试 Claude 2.1 的上下文理解能力,我们将一篇文章在 20 万字的上下文窗口中的位置随机变换,并向 Claude 2.1 提出了这样一个问题:“雅虎被收购宣布前几小时,作者做了什么?”

不论这个问题的答案在文本中的具体位置如何变化,Claude 都能准确给出答案,并且这个过程中没有对原实验中使用的提示格式进行任何修改。这表明,Claude 2.1 在面对较长的上下文时,如果某个句子显得格格不入,它就会变得更加谨慎,倾向于表示无法根据所给上下文作出回答。而这种在长文本上下文中的谨慎性,是之前针对现实场景长文本检索任务的评估所未能覆盖到的。

如何高效利用 Claude 2.1 的 20 万 Token 上下文窗口

在处理长篇上下文检索问题时,如果 Claude 显得犹豫不决,用户该如何应对?我们的研究发现,即便在 Claude 能够回答但表现出犹豫的情况下,对提示稍作修改也能产生截然不同的效果。在内部进行的相同评估中,仅仅在提示中加入一句话,就显著提高了 Claude 2.1 在处理 20 万 Token 上下文窗口时的准确度。

在 Claude 的回答开头添加 “这是上下文中最相关的一句话:” 这句话,我们在相同的评估中获得了显著更佳的结果。这个小小的改变就足以将 Claude 2.1 在原始评估中的得分从 27% 提升至 98%。

实际上,通过引导模型优先考虑相关句子,这种提示方式有效克服了 Claude 面对单个可能显得突兀的句子时的回应迟疑。

这种方法也提升了 Claude 对上下文中单句回答(即不显得突兀的句子)的处理效果。为了证明这一点,我们使用修改后的提示在之前分享的 Yahoo/Viaweb 示例上达到了 90-95% 的准确率:

我们正在不断地训练 Claude,使其在这类任务上表现得更加出色,并对社区进行的有趣实验和提出的改进建议表示感谢。

利用 ChatGPT 在技术面试中作弊到底有多容易?我们做了个实验来探究 [译]
令人难以置信!用这项新技术在仅有 4GB GPU 的设备上运行 70B 大语言模型推理 [译]
OpenAI 官方提示工程指南 [译]
八位 Google 员工开创了现代 AI 的新纪元,揭秘他们的故事 [译]
100 年前的人们对 2024 年的各种预言,今天都应验了哪些? [译]
分享
Email 复制链接 打印
Share
上一篇 什么是“专家混合模型”(Mixture-of-Experts,MoE)? [译]
下一篇 为忙碌人士准备的大语言模型(LLM)速览 [译]
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

MiniMax-M1开源发布:4560亿参数MoE架构,百万上下文推理模型性价比之王
AI 工具 AIGC 资讯
FlowDirector:无需训练,一文看懂西湖&中南大学如何用ODE革新AI视频编辑,精准指令直达
AI 工具 AIGC 资讯
字节跳动DreamActor-H1:DiT框架革新电商视频生成,3D动作引导+身份保留引领AIGC商业化
AI 工具
Kimi-Dev 72B 开源代码模型登顶SWE-bench!月之暗面发布,超越DeepSeek-R1,编程能力堪比闭源模型
AI 工具 AIGC 资讯

相关推荐

强化 AI 学习

大语言模型的类比推理能力[译]

宝玉的分享
一个展示构建副驾驶的高层过程的图表,包括每个步骤的示例活动。
强化 AI 学习

构建产品副驾驶(Copilot)的痛点 [译]

宝玉的分享
[照片]
强化 AI 学习

回望我在谷歌的 18 年 [译]

宝玉的分享
强化 AI 学习

聊天 GPT 与语气:如何避免发出机器人的声音 [译]

宝玉的分享
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.