Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: ELF:何恺明团队革命性扩散语言模型,32步生成、数据效率提升10倍,终结自回归时代?
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > ELF:何恺明团队革命性扩散语言模型,32步生成、数据效率提升10倍,终结自回归时代?
AI 工具AIGC 资讯

ELF:何恺明团队革命性扩散语言模型,32步生成、数据效率提升10倍,终结自回归时代?

站外新闻
最近更新: 2026年5月24日 上午2:28
AIGC ELF 何恺明 扩散语言模型 自回归模型
SHARE

💡 站外导读:在AI文本生成领域,自回归模型长期占据主导,但其推理缓慢、数据饥渴的瓶颈日益凸显。何恺明团队最新推出的ELF扩散语言模型,首次在连续嵌入空间中执行去噪生成,仅需32步和少量数据即达到顶级性能,为高效、自然的文本生成开辟了新路径。本文将深入剖析ELF如何挑战传统范式,并探讨其对行业应用与未来研究的深远影响。

ELF是什么

ELF(Embedded Language Flows)是何恺明团队推出的首个扩散语言模型,采用连续扩散范式替代传统自回归路线。模型全程在连续 embedding 空间中去噪生成文本,在最后一步离散化为 token。模型用 105M 参数、45B 训练 token 和 32 步采样,在 OpenWebText 上实现 24 的生成困惑度,用少近 10 倍的训练数据超越主流离散扩散模型,在无条件生成、翻译和摘要等任务上表现优异。

阅读目录
  • ELF是什么
  • ELF的主要功能
  • ELF的技术原理
  • 如何使用ELF
  • ELF的核心优势
  • ELF的项目地址
  • ELF的同类竞品对比
  • ELF的应用场景
      • 📝 站长洞察 (Editor’s Insight)

ELF

ELF的主要功能

  • 连续空间文本生成:全程在连续 embedding 空间执行去噪,在最终时间步(t=1)通过 unembedding 层将连续表示投影为离散 token。
  • 无条件语言生成:从纯高斯噪声出发,经 32 步迭代生成自然、低困惑度的人类风格文本。
  • 条件文本任务:支持机器翻译(WMT14)、文本摘要(XSum)等条件生成任务,性能超越现有扩散语言模型及部分自回归基线。
  • 训练-推理统一架构:去噪网络与最终解码网络共享同一套参数,通过二值 mode token(去噪/解码模式)切换,无需额外训练独立 decoder。

ELF的技术原理

  • Continuous Embedding 编码:离散 token 先经 T5 预训练编码器映射为双向 contextual embedding,仅在训练阶段使用,推理时不增加额外模块。
  • Flow Matching + x-prediction:在连续空间定义从噪声到干净数据的 rectified flow 轨迹;网络直接预测干净 embedding(x-prediction),非速度场,训练目标为 MSE 损失,在高维表示上更稳定。
  • Final-step Discretization:最后一步将连续 embedding 通过可学习的 unembedding 矩阵投影为 token logits,训练时加入 token-level corruption 防止任务过简,损失为交叉熵。
  • Self-conditioning CFG:引入图像生成中的 classifier-free guidance 思想,采用 training-time CFG作为条件信号,无推理开销。

如何使用ELF

  • 访问代码仓库:访问 GitHub克隆项目代码。
  • 准备环境:安装依赖库(PyTorch 等),配置 GPU 环境。
  • 数据预处理:将文本数据经 T5 编码器转换为连续 embedding 格式。
  • 模型训练:使用 Flow Matching + x-prediction 目标函数训练去噪网络,支持 MSE 或 CE 损失。
  • 文本生成:从高斯噪声出发,调用 ELF 去噪网络迭代 32 步,最后一步切换为解码模式输出 token。
  • 下游任务微调:在 WMT14、XSum 等数据集上进行条件生成微调。

ELF的核心优势

  • 数据效率极高:用 45B token 训练,相比 MDLM、Duo、FLM 等对手的 500B+ token 少一个数量级。
  • 采样步数极少:32 步可达到甚至超越对手 1024 步的生成质量。
  • 生成质量更优:OpenWebText 生成困惑度低至 24,文本更自然、AI 痕迹更弱。
  • 架构简洁统一:去噪与解码共享网络,无需额外 decoder 模块,避免 latent diffusion 中 decoder 训练的开销与误差累积。

ELF的项目地址

  • GitHub仓库:https://github.com/lillian039/ELF
  • arXiv技术论文:https://arxiv.org/pdf/2605.10938

ELF的同类竞品对比

对比维度 ELF MDLM LLaDA
技术路线 连续扩散(embedding空间全程去噪,最后一步离散化) 离散扩散(直接在token空间操作,每步维护离散状态) 离散扩散(基于BERT架构的掩码扩散语言模型)
参数规模 105M 350M / 1.3B 8B
训练数据 45B token(少一个数量级) 500B+ token 数万亿 token
采样步数 32步 1024步(标准)/ 64步(需蒸馏) 64~128步
生成困惑度 24(OpenWebText,32步无蒸馏) ~35(1024步)/ ~60(32步无蒸馏) ~30(128步)
架构设计 去噪与解码共享同一网络,无额外模块 每步在词表空间做离散状态转移 基于掩码预测的Transformer,每步预测被掩码token
核心优势 数据效率极高、采样极快、架构最简 与语言离散性天然契合,理论直观 大规模参数带来强表达能力,可扩展性好
主要劣势 依赖预训练encoder提供embedding 训练数据需求大、采样步数多、生成质量对步数敏感 推理成本高、需要大量训练数据、推理步数仍较多

ELF的应用场景

  • 低资源高效文本生成:用 45B token 可训练出高质量模型,适合数据预算有限的企业和研究者快速部署自然语言生成能力。
  • 机器翻译:在 WMT14 等翻译任务上超越现有扩散模型和部分自回归基线,可作为非自回归翻译系统的核心引擎。
  • 文本摘要与内容改写:在 XSum 等摘要任务中表现稳定,适合新闻摘要、文档提炼等需要保留关键信息的场景。
  • 创意写作与对话生成:生成困惑度低至 24,文本自然度高、AI 痕迹弱,适合长篇小说、营销文案等类人风格内容创作。
  • 扩散语言模型研究基线:首次验证”连续到底”路线在文本生成的可行性,为后续大模型架构探索提供重要参考和基础框架。

📝 站长洞察 (Editor’s Insight)

ELF的出现标志着扩散模型在文本领域的重大突破,其“连续到底”的架构设计极具前瞻性。在当前大模型算力与数据成本高企的背景下,ELF以极高的数据效率和极少的采样步数,展示了不依赖海量数据也能实现卓越生成质量的可能。这不仅挑战了自回归模型的霸主地位,更可能推动行业向更高效、更可持续的AI生成范式转型。对于关注AIGC落地的企业和研究者而言,ELF不仅是技术亮点,更是未来架构演进的重要信号,值得密切关注其后续发展与生态构建。

OpenAI豪掷2.34亿美元新加坡建海外首个AI实验室,剑指全球AI枢纽
Vidds AI Video Generator
爱诗科技发布PixVerse R1:全球首个通用实时世界模型,AI视频生成迈入「即时互动」新时代
Fourier N1 – 傅利叶推出的首款开源人形机器人
Co-Sight – 中兴通讯开源的超级智能体项目
TAGGED:AIGCELF何恺明扩散语言模型自回归模型
分享
Email 复制链接 打印
Share
上一篇 OpenMontage: 全球首个开源Agentic视频制作系统,12条生产线+52工具,零成本AI全流程自动成片
下一篇 量子芯片科技感占位特色图 谷歌 Gemini 算力计费引爆全球用户怒火!紧急宣布额度永久翻 3 倍补偿
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

腾讯混元Tencent-HY-MT1.5开源翻译模型:1.8B端侧量化仅需1GB,33种语言离线秒译
AI 工具
AutoMV: 多智能体协作开源AI系统,一键将歌曲生成节奏同步的音乐视频(附项目地址)
AI 工具 AIGC 资讯
阿里通义重磅开源Qwen3-VL-Reranker:跨模态检索精度飙升,多模态AI应用新引擎
AI 工具 AIGC 资讯
香港大学开源DeepTutor:基于知识图谱的AI学习助手,多智能体架构助你高效构建个人知识库
AI 工具

相关推荐

AI 工具

Synthesys X

remaker
AI 工具

DeepCuts

remaker
AIGC 资讯

AutoBE – AI驱动的后端服务器代码生成工具

站外新闻
AIGC 资讯

RSIDiff – 基于合成数据提升图像生成质量的递归自训练框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek Gemini GPT-5.4 GPT-5.5 MCP协议 Midjourney MiniMax Mistral AI MoE MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 教程 早报 昆仑万维 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 知识管理 科大讯飞 科幻 端侧AI 端侧大模型 端侧部署 网络安全 腾讯 腾讯混元 英伟达 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.