Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 阿里通义实验室MaskSearch:揭秘如何让AI大模型成为顶级信息检索专家,性能暴涨!
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 阿里通义实验室MaskSearch:揭秘如何让AI大模型成为顶级信息检索专家,性能暴涨!
AI 工具AIGC 资讯

阿里通义实验室MaskSearch:揭秘如何让AI大模型成为顶级信息检索专家,性能暴涨!

站外新闻
最近更新: 2026年6月7日 下午8:26
AIGC 检索增强生成 阿里巴巴通义
SHARE

💡 站外导读:在AI大模型竞争白热化的今天,其“幻觉”与知识滞后问题严重制约了在真实场景中的应用。如何让大模型不仅“能说会道”,更能主动、精准地获取和利用外部最新知识,成为突破瓶颈的核心挑战。MaskSearch正是在此背景下应运而生,它并非简单的RAG升级,而是通过一种创新的预训练范式,将“检索与推理”能力深度植入模型骨髓,旨在从根本上提升智能体的搜索与决策水平。

MaskSearch是什么

MaskSearch是阿里巴巴通义实验室推出的新型通用预训练框架,提升大型语言模型(LLM)的智能体搜索能力。通过检索增强掩码预测(RAMP)任务,让模型在输入文本中对关键信息掩码,借助外部知识库调用搜索工具预测被掩盖的片段,涵盖命名实体、日期、数字、本体知识等关键信息,增加任务难度,促使模型精细化处理信息。在生成监督微调(SFT)数据时,采用多智能体系统,包括规划者、重写者、观察者等角色,协同生成思维链数据,提升数据质量。训练方法结合了SFT和强化学习(RL),使用动态采样策略优化(DAPO)算法构建混合奖励系统,采用课程学习,按掩码数量分级样本难度,让模型逐步学习。

阅读目录
  • MaskSearch是什么
  • MaskSearch的主要功能
  • MaskSearch的技术原理
  • MaskSearch的项目地址
  • MaskSearch的应用场景
      • 📝 站长洞察 (Editor’s Insight)

MaskSearch

MaskSearch的主要功能

  • 提升问答性能:显著增强LLM在开放域多跳问答场景中的性能,特别是在领域内和领域外下游任务上,提升模型对复杂问题的理解和回答能力。
  • 适应多种任务:通过RAMP任务和多智能体生成的思维链数据,模型能够更好地适应多种问答任务,提升在不同场景下的表现。
  • 多种训练方法兼容:兼容SFT和RL两种训练方法,可以根据不同的任务需求选择合适的训练策略。
  • 数据集扩展:通过构建大规模预训练数据集(如1000万样本),提升模型的训练效果和可扩展性。

MaskSearch的技术原理

  • 检索增强掩码预测(RAMP)任务:MaskSearch的核心是RAMP任务,受BERT掩码机制启发,让模型在输入文本序列中对关键信息进行掩码处理,然后主动借助外部知识库,调用搜索工具来预测这些被掩盖的文本片段。除了常见的命名实体、日期和数字外,还考虑了本体知识、特定术语和数值等关键信息,增加了任务难度,促使模型在检索和推理过程中更加精细化地处理信息。
  • 多智能体协同生成思维链(CoT)数据:为了生成用于监督微调(SFT)的思维链数据,MaskSearch采用多智能体系统,包括规划者、重写者、观察者等角色,协同进行思维链的生成任务,最终由一个LLM负责答案判断,仅保留正确答案的思维链。为快速扩展数据集并保持高质量,使用已有数据训练后的教师模型,直接生成推理轨迹,逐步迭代教师模型,逐步提升数据质量。
  • 强化学习(RL):在强化学习部分,MaskSearch采用了动态采样策略优化(DAPO)算法,构建混合奖励系统,包括格式奖励和回答奖励。格式奖励检查模型输出是否符合指定格式,回答奖励则评估生成答案与标准答案的一致性。最终选择基于模型的奖励函数,使用Qwen2.5-72B-Instruct模型作为评判,为生成答案和标准答案的一致性进行打分。
  • 课程学习:MaskSearch引入了课程学习策略,依据掩码数量对训练样本进行难度分级,让模型从易到难依次学习,逐步提升能力。

MaskSearch的项目地址

  • Github仓库:https://github.com/Alibaba-NLP/MaskSearch
  • arXiv技术论文:https://arxiv.org/pdf/2505.20285

MaskSearch的应用场景

  • 智能客服:在智能客服领域,MaskSearch能帮助客服系统更准确地理解用户问题,快速检索到相关的答案和信息,提高客服效率和用户满意度。
  • 教育领域:在教育领域,MaskSearch可以用于构建智能辅导系统,帮助学生更好地理解和解决复杂的学术问题。能根据学生的问题,检索相关的知识点和解答,提供个性化的学习支持。
  • 企业级搜索系统:企业级搜索系统需要处理大量的内部数据和复杂的查询需求。MaskSearch可以增强企业搜索系统的检索能力,能更准确地理解用户查询意图,从海量数据中快速检索到相关信息,提高企业决策效率。
  • 机器学习模型的调试与优化:MaskSearch还可以用于机器学习模型的调试与优化。例如,在调试图像分类模型时,MaskSearch可以帮助用户通过掩码属性查询图像数据库,识别模型学习到的虚假相关性,探索模型显著性与人类注意力之间的差异。

📝 站长洞察 (Editor’s Insight)

MaskSearch的发布,标志着AI模型从被动接收知识向主动构建知识体系的范式跃迁。它巧妙融合了BERT的掩码思想与强化学习,让大模型在训练阶段就学会“带着问题去搜索”。这不仅是技术层面的突破,更预示着未来智能体的发展方向:一个能够自我质疑、自我验证、并连接外部世界的“认知引擎”。对于企业而言,这意味着构建可靠、低幻觉的行业应用(如金融分析、法律咨询、医疗诊断)将拥有更坚实的底座。我们正站在“自主式AI”的门槛上,MaskSearch是推开这扇门的关键手柄之一。

Dog Identifier狗狗品种识别器
Bernini – 字节跳动开源的统一视频生成与编辑框架
突破推理长度瓶颈!阿里通义FIPO算法实现Token级精准奖惩,纯RL训练超越o1-mini
字节跳动Seedream 5.0 Lite发布:多模态AI创作模型,支持联网检索与实时生图
Stable Audio Open Small – Stability AI和Arm推出的文本到音频生成模型
TAGGED:AIGC检索增强生成阿里巴巴通义
分享
Email 复制链接 打印
Share
上一篇 浙大北大联手突破!InftyThink:无限深度推理范式,重塑大模型思考极限
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

浙大北大联手突破!InftyThink:无限深度推理范式,重塑大模型思考极限
AI 工具 AIGC 资讯
OpenAI o3-pro重磅发布:最强推理模型全面解析,性能碾压o3与o1-pro
AI 工具 AIGC 资讯
Mistral AI发布Magistral推理模型:开源与企业版双线出击,透明推理引领多语言AI新范式
AI 工具 AIGC 资讯
Fluxions-AI开源Vui:轻量级语音对话模型,4万小时训练,消费级设备本地部署
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

蚂蚁集团Ming-flash-omni-2.0全模态大模型开源:100B参数MoE架构,实现语音、图像、视频、文本端到端理解与生成

站外新闻
AIGC 全模态大模型 大模型开源 混合专家模型 蚂蚁集团
AIGC 资讯

子曰翻译2.0 – 网易有道推出的最新翻译大模型

站外新闻
AIGC 资讯

VersaGen – 实现文本到图像合成中视觉控制能力的生成式 AI 代理

站外新闻
AI 工具

Rembg AI

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.