Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: DeepSeek联合北大推出Engram:突破GPU显存限制的LLM记忆革命,性能飙升!
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > DeepSeek联合北大推出Engram:突破GPU显存限制的LLM记忆革命,性能飙升!
AI 工具AIGC 资讯

DeepSeek联合北大推出Engram:突破GPU显存限制的LLM记忆革命,性能飙升!

站外新闻
最近更新: 2026年6月7日 下午8:09
DeepSeek Engram GPU显存限制 MoE 北京大学 大语言模型 条件记忆模块
SHARE

💡 站外导读:随着大语言模型参数规模持续膨胀,GPU显存已成为制约模型扩展的关键瓶颈。同时,LLM在处理知识密集型任务时,常面临推理效率低下、长上下文理解困难等挑战。如何在不增加计算成本的前提下,突破硬件限制并提升模型性能,成为业界焦点。DeepSeek联合北京大学提出的Engram条件记忆模块,正是瞄准这一核心痛点,通过创新的计算与存储解耦架构,为LLM的效率与能力带来双重突破。

Engram是什么

Engram 是DeepSeek团队联合北京大学推出的条件记忆模块,能提升大语言模型(LLM)的性能。Engram通过引入现代化的 -gram 嵌入表,将静态知识存储在独立的内存中,用稀疏检索和上下文感知门控技术实现高效的知识查找。Engram 与混合专家模型(MoE)互补,能显著提升模型在知识密集型任务、长上下文处理和推理能力上的表现,不增加计算量,还能突破 GPU 显存限制,支持大规模参数扩展。

阅读目录
  • Engram是什么
  • Engram的主要功能
  • Engram的技术原理
  • Engram的项目地址
  • Engram的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Engram

Engram的主要功能

  • 知识检索:通过静态嵌入表快速查找固定知识,减少对计算资源的依赖。
  • 长上下文处理:释放注意力机制的容量,使其专注于全局上下文,提升长文本推理能力。
  • 计算与存储解耦:支持从主机内存异步预取数据,突破 GPU 显存限制,实现大规模参数扩展。
  • 性能提升:在不增加计算量的情况下,显著提升模型在知识密集型任务、通用推理、代码和数学任务上的表现。

Engram的技术原理

  • 分词器压缩:通过预计算的满射函数将原始 Token ID 映射为规范化 ID,减少词表冗余,提高 -gram 的覆盖效率。
  • 多头哈希检索:用哈希方法和多头机制将局部上下文映射到嵌入表中,解决直接参数化 -gram 组合的难题。
  • 上下文感知门控:用当前隐藏状态作为动态 Query,检索到的嵌入作为 Key 和 Value,通过门控机制抑制噪声,确保语义一致性。
  • 稀疏性分配:在给定的参数预算下,重新分配 MoE 专家参数给 Engram 内存,发现计算与记忆之间的 U 型权衡曲线,找到最优分配比例。
  • 系统实现:用 Engram 的确定性检索特性,实现计算与存储的解耦,通过预取和重叠机制掩盖数据传输延迟,突破 GPU 显存限制。

Engram的项目地址

  • 技术论文:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

Engram的应用场景

  • 知识问答:Engram 可快速检索知识库中的事实信息,提升问答系统的响应速度和准确性。
  • 文本生成:通过高效的知识检索,Engram 能在文本生成中快速匹配固定短语和模式,提高生成效率。
  • 长文本处理:Engram 能优化长上下文建模,增强模型对长文本的推理能力,适用于法律、学术等长文本分析。
  • 代码辅助:Engram 能快速检索代码中的常见模式和结构,提升代码生成、补全和理解的效率。
  • 数学推理:Engram 能快速检索数学公式和定理,辅助解决数学问题,提升推理效率。

📝 站长洞察 (Editor’s Insight)

Engram的推出标志着LLM架构设计正从‘暴力堆算力’转向‘精细化资源管理’。其核心价值在于将‘记忆’从‘计算’中剥离,这与当前混合专家模型(MoE)的发展脉络高度契合——MoE优化了计算分配,而Engram则优化了知识存储与检索。两者互补,共同勾勒出下一代高效LLM的蓝图。从更宏观的视角看,Engram代表了一种趋势:通过软件和算法创新,来突破硬件物理限制。它不像追求更大显存那样‘奢侈’,而是用智能的内存管理(如异步预取、确定性检索)来‘四两拨千斤’。这对降低AI部署成本、推动大模型在更多场景落地具有深远意义。未来,类似Engram的‘外挂式’智能记忆模块,或将成为LLM标配,使模型在知识更新、长期记忆管理等方面更加灵活高效。

Right after in the Online dating Culture in the usa and European countries
200B+参数刷新SOTA!智象未来「原生全模态」旗舰模型HiDream-O1-Image-Pro深度解析
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
星火医疗大模型X1 – 讯飞医疗推出的深度推理大模型
TAGGED:DeepSeekEngramGPU显存限制MoE北京大学大语言模型条件记忆模块
分享
Email 复制链接 打印
Share
上一篇 百川智能Baichuan-M3开源发布:医疗AI大模型问诊能力超GPT-5.2及人类医生,医疗幻觉率全球最低
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

百川智能Baichuan-M3开源发布:医疗AI大模型问诊能力超GPT-5.2及人类医生,医疗幻觉率全球最低
AIGC 资讯
智谱华为联合开源GLM-Image:国产芯片训练的SOTA多模态图像生成模型,攻克文字渲染难题
AI 工具 AIGC 资讯
VidBee:开源音视频下载神器,支持YouTube/Bilibili等1000+网站一键下载
AI 工具
BabyVision评测集发布:AI视觉能力远逊人类,顶尖模型准确率不足50%引行业深思
AI 工具 AIGC 资讯

相关推荐

AI 工具

JungGPT

remaker
AI 工具AIGC 资讯

英伟达重磅开源NemoClaw!企业级AI Agent安全框架,深度适配RTX/DGX硬件,赋能GaaS新时代

站外新闻
AI Agent GaaS OpenClaw 企业级安全 英伟达
全息流体渐变通用占位特色图
AIGC 资讯

OpenAI表态支持特朗普AI行政令:愿在模型发布前接受政府安全评估

站外新闻
AI 工具

开源AI视频翻译神器!牛津大学Violin:33种语言配音+口型同步,免费商用

站外新闻
AI视频翻译 大语言模型 开源AI工具 视频本地化 语音合成
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek Gemini GPT-5.4 GPT-5.5 MCP协议 Midjourney MiniMax Mistral AI MoE MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 教程 早报 昆仑万维 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 端侧部署 网络安全 腾讯 腾讯混元 英伟达 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.