Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: DeepSeek联合北大推出Engram:突破GPU显存限制的LLM记忆革命,性能飙升!
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > DeepSeek联合北大推出Engram:突破GPU显存限制的LLM记忆革命,性能飙升!
AI 工具AIGC 资讯

DeepSeek联合北大推出Engram:突破GPU显存限制的LLM记忆革命,性能飙升!

站外新闻
最近更新: 2026年6月7日 下午8:09
DeepSeek Engram GPU显存限制 MoE 北京大学 大语言模型 条件记忆模块
SHARE

💡 站外导读:随着大语言模型参数规模持续膨胀,GPU显存已成为制约模型扩展的关键瓶颈。同时,LLM在处理知识密集型任务时,常面临推理效率低下、长上下文理解困难等挑战。如何在不增加计算成本的前提下,突破硬件限制并提升模型性能,成为业界焦点。DeepSeek联合北京大学提出的Engram条件记忆模块,正是瞄准这一核心痛点,通过创新的计算与存储解耦架构,为LLM的效率与能力带来双重突破。

Engram是什么

Engram 是DeepSeek团队联合北京大学推出的条件记忆模块,能提升大语言模型(LLM)的性能。Engram通过引入现代化的 -gram 嵌入表,将静态知识存储在独立的内存中,用稀疏检索和上下文感知门控技术实现高效的知识查找。Engram 与混合专家模型(MoE)互补,能显著提升模型在知识密集型任务、长上下文处理和推理能力上的表现,不增加计算量,还能突破 GPU 显存限制,支持大规模参数扩展。

阅读目录
  • Engram是什么
  • Engram的主要功能
  • Engram的技术原理
  • Engram的项目地址
  • Engram的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Engram

Engram的主要功能

  • 知识检索:通过静态嵌入表快速查找固定知识,减少对计算资源的依赖。
  • 长上下文处理:释放注意力机制的容量,使其专注于全局上下文,提升长文本推理能力。
  • 计算与存储解耦:支持从主机内存异步预取数据,突破 GPU 显存限制,实现大规模参数扩展。
  • 性能提升:在不增加计算量的情况下,显著提升模型在知识密集型任务、通用推理、代码和数学任务上的表现。

Engram的技术原理

  • 分词器压缩:通过预计算的满射函数将原始 Token ID 映射为规范化 ID,减少词表冗余,提高 -gram 的覆盖效率。
  • 多头哈希检索:用哈希方法和多头机制将局部上下文映射到嵌入表中,解决直接参数化 -gram 组合的难题。
  • 上下文感知门控:用当前隐藏状态作为动态 Query,检索到的嵌入作为 Key 和 Value,通过门控机制抑制噪声,确保语义一致性。
  • 稀疏性分配:在给定的参数预算下,重新分配 MoE 专家参数给 Engram 内存,发现计算与记忆之间的 U 型权衡曲线,找到最优分配比例。
  • 系统实现:用 Engram 的确定性检索特性,实现计算与存储的解耦,通过预取和重叠机制掩盖数据传输延迟,突破 GPU 显存限制。

Engram的项目地址

  • 技术论文:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

Engram的应用场景

  • 知识问答:Engram 可快速检索知识库中的事实信息,提升问答系统的响应速度和准确性。
  • 文本生成:通过高效的知识检索,Engram 能在文本生成中快速匹配固定短语和模式,提高生成效率。
  • 长文本处理:Engram 能优化长上下文建模,增强模型对长文本的推理能力,适用于法律、学术等长文本分析。
  • 代码辅助:Engram 能快速检索代码中的常见模式和结构,提升代码生成、补全和理解的效率。
  • 数学推理:Engram 能快速检索数学公式和定理,辅助解决数学问题,提升推理效率。

📝 站长洞察 (Editor’s Insight)

Engram的推出标志着LLM架构设计正从‘暴力堆算力’转向‘精细化资源管理’。其核心价值在于将‘记忆’从‘计算’中剥离,这与当前混合专家模型(MoE)的发展脉络高度契合——MoE优化了计算分配,而Engram则优化了知识存储与检索。两者互补,共同勾勒出下一代高效LLM的蓝图。从更宏观的视角看,Engram代表了一种趋势:通过软件和算法创新,来突破硬件物理限制。它不像追求更大显存那样‘奢侈’,而是用智能的内存管理(如异步预取、确定性检索)来‘四两拨千斤’。这对降低AI部署成本、推动大模型在更多场景落地具有深远意义。未来,类似Engram的‘外挂式’智能记忆模块,或将成为LLM标配,使模型在知识更新、长期记忆管理等方面更加灵活高效。

高通与字节跳动签署AI芯片大单:数百万颗定制ASIC助力量级AI智能体基础设施
Vidds AI Video Generator
Video-T1 – 清华联合腾讯推出的视频生成技术
OpenAI重磅发布GPT-5.5 Instant:幻觉率暴降52.5%,ChatGPT免费用户迎来AI新纪元
MT-Color – 上海交大联合哔哩哔哩推出的可控图像着色框架
TAGGED:DeepSeekEngramGPU显存限制MoE北京大学大语言模型条件记忆模块
分享
Email 复制链接 打印
Share
上一篇 百川智能Baichuan-M3开源发布:医疗AI大模型问诊能力超GPT-5.2及人类医生,医疗幻觉率全球最低
下一篇 Oh My OpenCode:AI编程助手革命性插件,自动调度多模型Agent团队,一键提升开发效率
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

流光脑波AI大脑占位特色图
2026年3月美国AI榜单巨变:Claude单月狂飙130%紧追ChatGPT,格局突变信号已现
AIGC 资讯 最新趋势
得物实战揭秘:AI Coding工具如何突破数仓开发’失忆’痛点,Harness工程引领新范式
AI 工具 AIGC 资讯
全息流体渐变通用占位特色图
历史性和解!Meta妥协规避审判,美国首例学校诉社交媒体成瘾案落幕,揭示行业司法风向
AIGC 资讯
量子芯片科技感占位特色图
Spotify与环球音乐联手:AI翻唱混音工具上线,正版版权终结Suno野蛮生长
AI 工具 AIGC 资讯 最新趋势

相关推荐

AI 工具AIGC 资讯

腾讯LeVo:3秒克隆音色的AI唱歌模型,Suno4.5级别的音乐生成革命

站外新闻
AIGC AI音乐生成 Suno 腾讯AI实验室 音色克隆
AIGC 资讯

pdf-craft – 开源 PDF 转 Markdown 工具

站外新闻
AI 工具AIGC 资讯

DeepSeek-V3.2正式发布:DSA稀疏注意力机制引领AI效率革命,推理与Agent能力全面超越GPT-5

站外新闻
Agent智能体 AI大模型 DeepSeek-V3.2 开源AI 稀疏注意力
AIGC 资讯

Ovis2 – 阿里国际推出的多模态大语言系列模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.