Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: ELF:何恺明团队革命性扩散语言模型,32步生成、数据效率提升10倍,终结自回归时代?
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > ELF:何恺明团队革命性扩散语言模型,32步生成、数据效率提升10倍,终结自回归时代?
AI 工具AIGC 资讯

ELF:何恺明团队革命性扩散语言模型,32步生成、数据效率提升10倍,终结自回归时代?

站外新闻
最近更新: 2026年5月24日 上午2:28
AIGC ELF 何恺明 扩散语言模型 自回归模型
SHARE

💡 站外导读:在AI文本生成领域,自回归模型长期占据主导,但其推理缓慢、数据饥渴的瓶颈日益凸显。何恺明团队最新推出的ELF扩散语言模型,首次在连续嵌入空间中执行去噪生成,仅需32步和少量数据即达到顶级性能,为高效、自然的文本生成开辟了新路径。本文将深入剖析ELF如何挑战传统范式,并探讨其对行业应用与未来研究的深远影响。

ELF是什么

ELF(Embedded Language Flows)是何恺明团队推出的首个扩散语言模型,采用连续扩散范式替代传统自回归路线。模型全程在连续 embedding 空间中去噪生成文本,在最后一步离散化为 token。模型用 105M 参数、45B 训练 token 和 32 步采样,在 OpenWebText 上实现 24 的生成困惑度,用少近 10 倍的训练数据超越主流离散扩散模型,在无条件生成、翻译和摘要等任务上表现优异。

阅读目录
  • ELF是什么
  • ELF的主要功能
  • ELF的技术原理
  • 如何使用ELF
  • ELF的核心优势
  • ELF的项目地址
  • ELF的同类竞品对比
  • ELF的应用场景
      • 📝 站长洞察 (Editor’s Insight)

ELF

ELF的主要功能

  • 连续空间文本生成:全程在连续 embedding 空间执行去噪,在最终时间步(t=1)通过 unembedding 层将连续表示投影为离散 token。
  • 无条件语言生成:从纯高斯噪声出发,经 32 步迭代生成自然、低困惑度的人类风格文本。
  • 条件文本任务:支持机器翻译(WMT14)、文本摘要(XSum)等条件生成任务,性能超越现有扩散语言模型及部分自回归基线。
  • 训练-推理统一架构:去噪网络与最终解码网络共享同一套参数,通过二值 mode token(去噪/解码模式)切换,无需额外训练独立 decoder。

ELF的技术原理

  • Continuous Embedding 编码:离散 token 先经 T5 预训练编码器映射为双向 contextual embedding,仅在训练阶段使用,推理时不增加额外模块。
  • Flow Matching + x-prediction:在连续空间定义从噪声到干净数据的 rectified flow 轨迹;网络直接预测干净 embedding(x-prediction),非速度场,训练目标为 MSE 损失,在高维表示上更稳定。
  • Final-step Discretization:最后一步将连续 embedding 通过可学习的 unembedding 矩阵投影为 token logits,训练时加入 token-level corruption 防止任务过简,损失为交叉熵。
  • Self-conditioning CFG:引入图像生成中的 classifier-free guidance 思想,采用 training-time CFG作为条件信号,无推理开销。

如何使用ELF

  • 访问代码仓库:访问 GitHub克隆项目代码。
  • 准备环境:安装依赖库(PyTorch 等),配置 GPU 环境。
  • 数据预处理:将文本数据经 T5 编码器转换为连续 embedding 格式。
  • 模型训练:使用 Flow Matching + x-prediction 目标函数训练去噪网络,支持 MSE 或 CE 损失。
  • 文本生成:从高斯噪声出发,调用 ELF 去噪网络迭代 32 步,最后一步切换为解码模式输出 token。
  • 下游任务微调:在 WMT14、XSum 等数据集上进行条件生成微调。

ELF的核心优势

  • 数据效率极高:用 45B token 训练,相比 MDLM、Duo、FLM 等对手的 500B+ token 少一个数量级。
  • 采样步数极少:32 步可达到甚至超越对手 1024 步的生成质量。
  • 生成质量更优:OpenWebText 生成困惑度低至 24,文本更自然、AI 痕迹更弱。
  • 架构简洁统一:去噪与解码共享网络,无需额外 decoder 模块,避免 latent diffusion 中 decoder 训练的开销与误差累积。

ELF的项目地址

  • GitHub仓库:https://github.com/lillian039/ELF
  • arXiv技术论文:https://arxiv.org/pdf/2605.10938

ELF的同类竞品对比

对比维度 ELF MDLM LLaDA
技术路线 连续扩散(embedding空间全程去噪,最后一步离散化) 离散扩散(直接在token空间操作,每步维护离散状态) 离散扩散(基于BERT架构的掩码扩散语言模型)
参数规模 105M 350M / 1.3B 8B
训练数据 45B token(少一个数量级) 500B+ token 数万亿 token
采样步数 32步 1024步(标准)/ 64步(需蒸馏) 64~128步
生成困惑度 24(OpenWebText,32步无蒸馏) ~35(1024步)/ ~60(32步无蒸馏) ~30(128步)
架构设计 去噪与解码共享同一网络,无额外模块 每步在词表空间做离散状态转移 基于掩码预测的Transformer,每步预测被掩码token
核心优势 数据效率极高、采样极快、架构最简 与语言离散性天然契合,理论直观 大规模参数带来强表达能力,可扩展性好
主要劣势 依赖预训练encoder提供embedding 训练数据需求大、采样步数多、生成质量对步数敏感 推理成本高、需要大量训练数据、推理步数仍较多

ELF的应用场景

  • 低资源高效文本生成:用 45B token 可训练出高质量模型,适合数据预算有限的企业和研究者快速部署自然语言生成能力。
  • 机器翻译:在 WMT14 等翻译任务上超越现有扩散模型和部分自回归基线,可作为非自回归翻译系统的核心引擎。
  • 文本摘要与内容改写:在 XSum 等摘要任务中表现稳定,适合新闻摘要、文档提炼等需要保留关键信息的场景。
  • 创意写作与对话生成:生成困惑度低至 24,文本自然度高、AI 痕迹弱,适合长篇小说、营销文案等类人风格内容创作。
  • 扩散语言模型研究基线:首次验证”连续到底”路线在文本生成的可行性,为后续大模型架构探索提供重要参考和基础框架。

📝 站长洞察 (Editor’s Insight)

ELF的出现标志着扩散模型在文本领域的重大突破,其“连续到底”的架构设计极具前瞻性。在当前大模型算力与数据成本高企的背景下,ELF以极高的数据效率和极少的采样步数,展示了不依赖海量数据也能实现卓越生成质量的可能。这不仅挑战了自回归模型的霸主地位,更可能推动行业向更高效、更可持续的AI生成范式转型。对于关注AIGC落地的企业和研究者而言,ELF不仅是技术亮点,更是未来架构演进的重要信号,值得密切关注其后续发展与生态构建。

Tweetify It
Shuffll AI视频
阿里通义Qwen3.7-Max旗舰大模型发布:全能智能体基座,编程推理全面领先,定义AI Agent新标杆
Alpha3D
Designs AI
TAGGED:AIGCELF何恺明扩散语言模型自回归模型
分享
Email 复制链接 打印
Share
上一篇 OpenMontage: 全球首个开源Agentic视频制作系统,12条生产线+52工具,零成本AI全流程自动成片
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

OpenMontage: 全球首个开源Agentic视频制作系统,12条生产线+52工具,零成本AI全流程自动成片
AI 工具 AIGC 资讯
WinClaw 龙虾永久免费 Token 限时抢!8000个名额领完即止,AI Agent 办公自动化全攻略
AI 工具 AIGC 资讯
高德与阿里重磅开源AGenUI:三端原生A2UI框架,让AI Agent输出直接变为可交互界面
AI 工具 AIGC 资讯
小米OneVL开源:0.24秒延迟!具身智能团队发布SOTA级自动驾驶VLA世界模型
AI 工具 AIGC 资讯

相关推荐

AI 工具

Latte

remaker
AI 工具

Face26

remaker
AI 工具

Chat CV人工智能制作简历

remaker
AI 工具

Snappy AI

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

3D AI AI Agent AIGC AI人像 AI工具 AI换脸 AI智能体 AI海报设计 AI生成视频 AI绘画 AI编程 AI编程工具 AI视频 AI设计 Andrej Karpathy app图标 b站 chatgpt DALL-E3 excel meta Midjourney openai Pika prompt runway SDXL Stability AI stable diffusion UI设计 世界模型 丛林 乐高 人像 人工智能 人物 办公自动化 动物 吉卜力 咒语 图像生成 图标设计 壁纸 多模态大模型 大模型 大模型API 大模型应用 大语言模型 女性 字节跳动 室内设计 家居 局部重绘 展台 帅哥 建筑 建筑设计 开源工具 开源平台 开源模型 微摄影 微软 怪物 提示词 摄影 教程 新闻 日本排放核污水 早报 智能体 智谱AI 水果 海报 海报设计 游戏 游戏美术 玻璃 矢量插画 破碎 科幻 穿搭 窗 美食 背景 腾讯混元 芭比 花 表情包 视频编辑 语音合成 赛博朋克 超现实主义 软件 运动 阿里通义 阿里通义千问 风景 食物 香水
Prompt 语宙Prompt 语宙
Follow US
© 2009-2023 Prompt 语宙. Paooo.com. All Rights Reserved.