Prompt 语宙Prompt 语宙
  • 首页
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • Remaker AI
    • Free Image Splitter
    • AIGC 工具
    • Prompt 咒语生成器
  • 社区
    • 知识星球
    • 公众号
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 针对 Claude 2.1 的长篇幅提示技巧 [译]
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • Remaker AI
    • Free Image Splitter
    • AIGC 工具
    • Prompt 咒语生成器
  • 社区
    • 知识星球
    • 公众号
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > 强化 AI 学习 > 针对 Claude 2.1 的长篇幅提示技巧 [译]
强化 AI 学习

针对 Claude 2.1 的长篇幅提示技巧 [译]

宝玉的分享
最近更新: 2024年3月9日 下午7:15
SHARE

2023 年 12 月 6 日

阅读目录
深入探索长文本理解难题如何高效利用 Claude 2.1 的 20 万 Token 上下文窗口

Claude 2.1 在处理高达 20 万 Token 的庞大上下文时,检索特定句子的能力令人瞩目。我们通过实验发现,利用精心设计的提示技巧,可以引导 Claude 更准确地回忆出相关信息。

  • Claude 2.1 在处理高达 20 万 Token 的庞大上下文时表现卓越
  • 不过,它在回答基于文档中某个特定句子的问题时可能会有所保留,特别是当这个句子突兀地插入或者位置不合适时
  • 通过微小的提示调整,可以消除这种犹豫,使其在这类任务上表现更加出色

我们最近推出的Claude 2.1是我们的最新产品,它拥有高达 20 万 Token 的上下文窗口,相当于约 500 页文本信息。Claude 2.1 在处理长篇幅上下文的真实世界检索任务中表现非常出色。

Claude 2.1 的训练基于大量的用户反馈,针对的是用户认为重要的长文档任务,例如总结一份 S-1 长度的文件。这包括了在真实文件上执行的真实任务,目的是训练 Claude 更少犯错,避免发表无依据的声明。

正因为受到了这种在真实世界中复杂检索任务的训练,Claude 2.1 与之前的 Claude 2.0 相比,错误回答减少了 30%,错误声称文档支持某一主张的情况也减少了 3 到 4 倍。

此外,Claude 在处理这些极长的上下文时的记忆能力也有所提升:

深入探索长文本理解难题

Claude 2.1 搭载了一项强大的功能——200K Token 的长文本窗口,这不仅展现了其强大能力,同时也意味着在使用时需要精心设计提示语。

一项近期的评估[1] 测试了 Claude 2.1 在长篇文章中回溯特定句子的能力。这篇文章是由 Paul Graham 关于创业的系列文章 构成的。文章中嵌入了这样一句话:“在旧金山,最棒的事莫过于晴朗天气下,在多洛雷斯公园边吃着三明治。”当模型浏览这篇包含上述句子的长文章时,它被询问:“在旧金山最有趣的活动是什么?”

在这次评估中,Claude 2.1 的回应多少有些出人意料。它回答说:“遗憾的是,文章并没有明确指出旧金山最有趣的活动是什么。”换句话说,它倾向于报告文章没有提供足够的信息来回答这个问题,而不是去查找文中嵌入的那个句子。

我们在一次内部实验中也复现了这一现象。我们取了最新的 综合拨款法案,并在其中加入了一句“宣布 11 月 21 日为‘全国寻针日’”。虽然 Claude 识别出了这一引用,但它仍不愿断言“全国寻针日”是一个真实存在的节日:

Claude 2.1 的训练数据混合了多种资料,目的是降低信息不准确性。这包括在文档中没有足够的信息来支持一个回答时,模型就不会基于该文档作出回应。我们认为,这可能是由于一般性或针对特定任务的数据减少了此类错误,使得模型在面对嵌入在更广泛上下文中的不合适句子时,不太可能给出回答。

然而,对于原本就存在于长文档中、因而并不显得突兀的句子,Claude 表现出了更多的灵活性。例如,被提及的长文档一开始就包含了这样一行,来自 Paul Graham 关于 Viaweb 的文章:“在 1998 年 6 月雅虎宣布收购前几小时,我对 Viaweb 网站进行了快照拍摄。”

为了测试 Claude 2.1 的上下文理解能力,我们将一篇文章在 20 万字的上下文窗口中的位置随机变换,并向 Claude 2.1 提出了这样一个问题:“雅虎被收购宣布前几小时,作者做了什么?”

不论这个问题的答案在文本中的具体位置如何变化,Claude 都能准确给出答案,并且这个过程中没有对原实验中使用的提示格式进行任何修改。这表明,Claude 2.1 在面对较长的上下文时,如果某个句子显得格格不入,它就会变得更加谨慎,倾向于表示无法根据所给上下文作出回答。而这种在长文本上下文中的谨慎性,是之前针对现实场景长文本检索任务的评估所未能覆盖到的。

如何高效利用 Claude 2.1 的 20 万 Token 上下文窗口

在处理长篇上下文检索问题时,如果 Claude 显得犹豫不决,用户该如何应对?我们的研究发现,即便在 Claude 能够回答但表现出犹豫的情况下,对提示稍作修改也能产生截然不同的效果。在内部进行的相同评估中,仅仅在提示中加入一句话,就显著提高了 Claude 2.1 在处理 20 万 Token 上下文窗口时的准确度。

在 Claude 的回答开头添加 “这是上下文中最相关的一句话:” 这句话,我们在相同的评估中获得了显著更佳的结果。这个小小的改变就足以将 Claude 2.1 在原始评估中的得分从 27% 提升至 98%。

实际上,通过引导模型优先考虑相关句子,这种提示方式有效克服了 Claude 面对单个可能显得突兀的句子时的回应迟疑。

这种方法也提升了 Claude 对上下文中单句回答(即不显得突兀的句子)的处理效果。为了证明这一点,我们使用修改后的提示在之前分享的 Yahoo/Viaweb 示例上达到了 90-95% 的准确率:

我们正在不断地训练 Claude,使其在这类任务上表现得更加出色,并对社区进行的有趣实验和提出的改进建议表示感谢。

大语言模型提示工程综述:技巧与应用领域 [译]
如何用计算思维看待人工智能、宇宙与万物 [译]
软件工程中的心理健康问题 [译]
Rabbit R1: 几乎无法评测 [译]
Gemini 介绍:我们的超级 AI 模型 [译]
分享
Email 复制链接 打印
Share
上一篇 什么是“专家混合模型”(Mixture-of-Experts,MoE)? [译]
下一篇 为忙碌人士准备的大语言模型(LLM)速览 [译]
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

数学与AI之间的文化鸿沟
强化 AI 学习
50位 a16z 合伙人对 2025 年科技领域发展趋势的预测
强化 AI 学习
Apple AI 的平台转型潜力
强化 AI 学习
论文:《自动化的反讽》(Ironies of Automation)[译]
强化 AI 学习

相关推荐

强化 AI 学习

蔡崇信谈为什么阿里巴巴全力投入 AI [译]

宝玉的分享
强化 AI 学习

什么是“专家混合模型”(Mixture-of-Experts,MoE)? [译]

宝玉的分享
强化 AI 学习

大语言模型抽象简明指南 [译]

宝玉的分享
强化 AI 学习

为什么随着年龄增长,我们感觉时间似乎流逝得更快 [译]

宝玉的分享
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

3D AI AIGC AI人像 AI创作小助手 AI工具 AI换脸 AI海报设计 AI生成视频 AI绘画 AI视频 AI设计 app图标 chatgpt DALL-E3 excel GPT meta Midjourney openai Pika prompt runway SDXL stable diffusion UI设计 专业 丛林 乐高 人像 人物 光晕 动物 吉卜力 咒语 图标设计 圣诞 壁纸 女性 奶牛 实验室 宠物 客厅 室内设计 家居 局部重绘 展台 山景 帅哥 建筑 建筑设计 影谱科技 微摄影 怪物 提示词 摄影 教程 新闻 日本排放核污水 早报 星光 枯木 植物 模特 水果 泳池 海报 海报设计 清华大学 温馨的家 游戏 游戏美术 炫光 炫彩 玻璃 白茶花 矢量插画 研究报告 破碎 科幻 穿搭 窗 美食 背景 节日 芭比 花 花卉 茶园一角 草原 荷兰奶源 表情包 赛博朋克 超现实主义 软件 运动 金毛 风景 食物 香水
Prompt 语宙Prompt 语宙
Follow US
© 2009-2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Welcome Back!

Sign in to your account

Username or Email Address
Password

忘记密码