Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 每家大语言模型公司都在挑战搜索技术:未来的大语言模型检索系统展望 [译]
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > 强化 AI 学习 > 每家大语言模型公司都在挑战搜索技术:未来的大语言模型检索系统展望 [译]
强化 AI 学习

每家大语言模型公司都在挑战搜索技术:未来的大语言模型检索系统展望 [译]

宝玉的分享
最近更新: 2026年5月23日 下午6:22
SHARE

搜索技术是计算机科学中极具挑战性的领域之一,仅有少数产品如 Google、Amazon 和 Instagram 能够做到出色。

直至不久前,大多数产品并不依赖高效的搜索功能——它并非用户体验的关键部分。

然而,随着大语言模型及其检索系统的迅猛发展,每个大语言模型公司都迫切需要将顶尖的搜索功能融入产品中,以确保其正常运作。

面对这种新兴的需求,新一代 AI 公司将如何解决搜索问题?

检索功能是大语言模型系统不可或缺的组成部分,这一点未来也不会改变。

检索增强生成 (retrieval-augmented generation, RAG) 系统为大语言模型提供必要的信息,帮助其回答问题。这种方式确保了生成的内容既真实又贴切。

设想一下,当大语言模型在回答历史考试问题时,没有 RAG 就像是闭卷考试,需要依靠记忆;而有了 RAG,就仿佛是开卷考试,模型会同时得到包含答案的教科书段落。显然,后者更为简单。

在大量数据中寻找正确的信息绝非易事。试想在庞大的代码库中寻找特定代码片段,或是在数千份发票中找到关键项,检索系统正是为解决这些问题而设计的。

随着新型大语言模型采用更长的上下文窗口,它们能够一次性处理更多数据。如果可以整本书载入,何必只寻找单一段落呢?

即使在拥有超过一百万 token 的上下文窗口时,我们认为检索功能仍将存在:

  • 公司可能拥有多个版本的相似文档,一次性呈现可能会导致信息冲突。
  • 多数复杂的应用场景需要基于角色和环境的访问控制,以确保安全。
  • 即便计算效率得到极大提升,也无需承担处理大量不必要数据的时间和成本。

随着大语言模型原型开发的兴起,人们迅速采用了基于语义的相似度搜索方法。

这种方法已经应用了几十年之久。首先,将数据分成若干块,如一个 Word 文档中的各个段落。然后,每一块数据都通过一个文本嵌入模型进行处理,该模型会输出一个向量,这个向量包含了该数据块的语义意义。在检索过程中,系统会先嵌入搜索查询,然后找出与查询语义最接近的数据块。

尽管构建语义相似性模型相对简单,它通常只能提供平庸的搜索结果。这种方法的主要局限性包括:

  • 它可能会遗漏那些语义与查询不同的重要内容。用户有时无法明确自己的需求,或者他们的查询缺乏足够的上下文(如,客户对产品的描述不够具体,或未提及近期的购买)。
  • 此方法对所使用的嵌入模型非常敏感,一般的文本嵌入模型可能不适合特定领域的需求。
  • 系统对数据的处理方式极为敏感,不同的解析、转换和分块方式会导致系统的运作效果各异。处理不同类型的数据(如表格)也相当复杂。
  • 即使进行了优化,计算文本嵌入也非常耗费资源,这限制了对数据摄取和嵌入流程进行迭代的能力,以及提供几乎实时数据的应用的能力。

值得一提的是,这种方法仅根据查询的语义意义进行搜索。观察那些搜索表现出色的公司,你会发现语义相似性只是他们解决方案的一部分。

搜索的真正目的是提供最佳的结果,而不仅仅是最相似的结果。

例如,YouTube 将搜索查询的含义与根据全球受欢迎程度及你的观看历史所作出的视频向量化预测相结合。而亚马逊则确保在搜索结果中优先显示你之前购买过的商品,因为它知道这些是你可能想要重新购买的。

检索系统未来的发展方向

谷歌最初是基于 PageRank 算法建立的,这是一种简单的网页排名方法。然而,如果让创始团队见到今天的谷歌搜索,他们可能都会感到陌生,因为现在的谷歌搜索系统已经变得极其复杂,采用了多种方法来确保搜索结果的优质性。

类似地,初步构建 RAG(Retrieval Augmented Generation)系统的团队从简单的语义相似性搜索起步。我们认为,这些系统将逐渐演进,最终演变为类似于当今的搜索或推荐系统。这些系统在核心问题上没有太大差异:即从大量可能的选择中筛选出最有可能帮助实现特定目标的少数几个选项。

现在,大部分检索系统的外观如下:

将来的系统可能会是这样的:

检索系统将极大地提升大语言模型的应用效能,包括它们的有效记忆力、响应质量、可靠性以及性能和响应速度。我们认为,对于许多应用程序来说,这些系统将比大语言模型本身更能够提升其核心能力。

正因如此,我们相信大多数公司会把这些系统作为其核心竞争力并在内部自行开发。这些开发者将依靠一系列全新的基础设施来打造适应其特定应用需求的检索系统。

迄今为止,大部分的投资都流向了用于存储向量并检索最近邻的数据库。然而,在未来的技术架构中,数据库仅是解决方案的一部分。

为了构建这些新型系统,我们需要更完善的工具:

  • 创建、操作并利用能够编码不同信号类型的多种向量(如将语义搜索与推荐或行为向量相结合)。Superlinked(一个属于 Theory 的公司)正在开发这类工具。
  • 输入、解析和处理各类输入数据。
  • 构建并实时执行检索系统;这些操作(特别是生成嵌入向量的过程)成本较高,许多应用无法接受长时间的延迟。
  • 对检索系统进行观测和监控。

虽然大部分公司倾向于自建检索系统,但未来这些系统可能通过几种方式合并:

  • 基础设施服务商可能扩大其服务范围,包括数据摄取、处理及存储等基础设施层面。
  • 企业可能会开发针对特定场景的“检索即服务”产品,比如专为电商网站或聊天应用设计的检索系统。

我们对检索及搜索技术作为产品推动力的进步感到期待。如果您正在开发检索系统的基础设施或为新应用打造检索系统,我们非常希望与您交流!

大语言模型在长上下文中的信息检索应用 [译]
针对 Claude 2.1 的长篇幅提示技巧 [译]
Nicolai 对微软 CEO Satya Nadella 的访谈 [译]
苹果是如何做到严格保密的? [译]
AlphaCodium:引领代码生成新境界,从提示工程到流程工程 [译]
分享
Email 复制链接 打印
Share
上一篇 Perplexity 产品开发的新模式 [译]
下一篇 Sam Altman 在斯坦福创业者思维领导研讨会上的对话 [译]
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

xAI被曝曾利用Claude输出数据训练编码模型,因Anthropic撤销权限转入地下提取
AIGC 资讯
全息流体渐变通用占位特色图
从基本变量预测到复杂现象死磕!全球海洋现象智能预报大模型“琅琊”2. 0 正式发布
AIGC 资讯
Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版
AIGC 资讯
Llasa TTS – 香港科技大学开源的文本转语音模型
AIGC 资讯

相关推荐

强化 AI 学习

提示工程最佳实践 [译]

宝玉的分享
图 23:WebArena 上模型的表现情况 (b) 回应的平均长度
强化 AI 学习

Gemini 语言能力深度剖析 [译]

宝玉的分享
卡通 904308b6
强化 AI 学习

童话故事的策略规划:系统化的战略布局 [译]

宝玉的分享
图 9: 展示大型语言模型准确性百分比的热图。
强化 AI 学习

探讨 LLaMA-1/2 与 GPT-3.5/4,你只需有原则的指令 [译]

宝玉的分享
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.