Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统
AIGC 资讯

MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统

站外新闻
最近更新: 2026年6月9日 上午4:16
SHARE

MiniRAG是什么

MiniRAG是香港大学推出的新型检索增强型生成(RAG)系统,专为在资源受限的场景下高效部署小型语言模型(SLMs)设计。MiniRAG基于两个关键技术实现这一目标:一是语义感知的异构图索引机制,将文本片段和命名实体结合,减少对复杂语义理解的依赖;二是轻量级拓扑增强检索方法,用图结构进行高效知识发现,无需高级语言能力。MiniRAG在实验中展现出与大型语言模型(LLMs)方法相当的性能,同时仅需25%的存储空间。MiniRAG提供全面的基准数据集,评估轻量级RAG系统在现实设备场景下的表现,推动资源受限环境下高效、私密的RAG系统的发展。

阅读目录
  • MiniRAG是什么
  • MiniRAG的主要功能
  • MiniRAG的技术原理
  • MiniRAG的项目地址
  • MiniRAG的应用场景

MiniRAG

MiniRAG的主要功能

  • 高效的知识检索:基于独特的异构图索引机制,快速准确地从大量数据中检索出与用户查询最相关的知识,为生成准确的回答提供支持。
  • 轻量级的模型兼容性:专为小型语言模型(SLMs)设计,在不牺牲太多性能的前提下,显著降低对计算资源和存储空间的需求,使其更适合在资源受限的设备上运行。
  • 强大的推理能力:借助查询引导的推理路径发现机制,MiniRAG能处理复杂的、多步骤的推理任务,即使在SLMs的语义理解能力有限的情况下,也能有效地找到正确的答案。
  • 适应性强:MiniRAG能适应不同的应用场景,包括即时通讯、个人内容管理、本地文档检索等,为用户提供个性化的信息检索和生成服务。

MiniRAG的技术原理

  • 语义感知的异构图索引机制:
    • 文本块节点(Vc):保留原始文本的上下文完整性,直接参与检索阶段,确保识别出最相关的上下文内容。
    • 实体节点(Ve):从文本块中提取的关键语义元素,如事件、地点、时间引用和领域特定概念,用在锚定语义理解。
    • 实体-实体连接(Eα):捕捉命名实体之间的语义关系、层次结构和时空依赖关系。
    • 实体-文本块连接(Eβ):连接命名实体及其对应的上下文,保持上下文相关性和语义连贯性。
    • 边的语义描述:基于语言模型生成的描述,为连接的节点提供明确的关系上下文,增强图的语义理解能力。
  • 轻量级拓扑增强检索方法:
    • 查询语义映射:用实体提取和轻量级句子嵌入模型,将用户输入的查询与图索引数据进行对齐,识别与查询相关的文本块。
    • 查询驱动的推理路径发现:基于智能查询引导机制,在异构图中构建推理路径,综合考虑查询与实体节点的语义相关性和实体之间的结构连贯性。
    • 拓扑增强的图检索:结合基于嵌入的相似性搜索和图结构的拓扑信息,识别与查询相关的高质量实体-实体连接,基于路径发现机制提取逻辑相关的推理链。
    • 查询相关文本块的检索:基于实体-文本块连接,收集与推理路径相关的文本块,计算输入查询与文本块及其边描述的语义相似性,最终选择最相关的文本块用在后续的生成任务。
    • 融合增强生成:将检索到的关键关系和最优文本块与先前确定的答案节点基于设计的融合策略进行整合,构建全面且结构化的输入表示,用在最终的增强生成过程。

MiniRAG的项目地址

  • GitHub仓库:https://github.com/HKUDS/MiniRAG/
  • arXiv技术论文:https://arxiv.org/pdf/2501.06713

MiniRAG的应用场景

  • 即时通讯:快速检索历史聊天记录,生成智能回复,提供知识辅助。
  • 个人内容管理:检索个人笔记,生成内容总结和提醒,管理日程。
  • 本地文档检索:检索本地文档内容,整合多文档信息,生成智能摘要。
  • 隐私敏感应用:安全管理医疗和金融信息,保护隐私的问答服务。
  • 边缘设备应用:在智能手表、智能音箱等设备上提供快速响应和智能服务。
谷歌Gemini 3.1 Flash-Lite发布:性价比碾压GPT-5 mini,多模态AI如何重塑开发范式?
Magentic-UI – 微软开源的人机协作AI Agent研究原型
GameFactory – 香港大学和快手联合推出的可泛化游戏场景框架
VoltAgent – 开源的AI Agent构建和编排框架
k1.5 – Kimi推出的多模态思考模型
分享
Email 复制链接 打印
Share
上一篇 StreamBridge – 苹果联合复旦推出的端侧视频大语言模型框架
下一篇 PSHuman – 开源的单图像3D人像重建技术,仅需一张照片
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

DataClaw开源发布:一键导出AI对话,自动生成安全训练集,助力大模型微调
AI 工具 AIGC 资讯
OpenSandbox:阿里巴巴开源AI应用安全沙箱平台,为Agent与代码执行构建企业级隔离环境
AI 工具 AIGC 资讯
Goose:Block开源本地AI Agent框架,自主Debug、多模型切换,颠覆传统开发!
AI 工具 AIGC 资讯
阿里通义Fun-CosyVoice3.5重磅发布:一句话控制语气语速,13语种低延迟语音生成
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

Cube 3D – Roblox 推出的 AI 3D 生成模型

站外新闻
AI 工具AIGC 资讯

Cursor发布Composer 2.5:自研Agentic编程模型,性能比肩Opus 4.7、成本仅1/10

站外新闻
Agentic编程模型 AI编程工具 Composer 2.5 Cursor SWE-Bench
AIGC 资讯

Hunyuan3D 2.0 – 腾讯推出的大规模 3D 资产生成系统

站外新闻
AI 工具AIGC 资讯

昆仑万维Matrix-Game 3.0发布:720p@40FPS实时交互世界模型,开启AI游戏新纪元

站外新闻
AI游戏生成 Matrix-Game 3.0 实时交互世界模型 扩散模型 昆仑万维
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.