Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: LLaDA – 人大高瓴AI联合蚂蚁推出的扩散大语言模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > LLaDA – 人大高瓴AI联合蚂蚁推出的扩散大语言模型
AIGC 资讯

LLaDA – 人大高瓴AI联合蚂蚁推出的扩散大语言模型

站外新闻
最近更新: 2026年6月9日 上午7:01
SHARE

LLaDA是什么

LLaDA(Large Language Diffusion with mAsking)是中国人民大学高瓴AI学院李崇轩、文继荣教授团队和蚂蚁集团共同推出的新型大型语言模型,基于扩散模型框架而非传统的自回归模型(ARM)。LLaDA基于正向掩蔽过程和反向恢复过程建模文本分布,用Transformer作为掩蔽预测器,优化似然下界实现生成任务。LLaDA在预训练阶段使用2.3万亿标记的数据,基于监督微调(SFT)提升指令遵循能力。LLaDA在可扩展性、上下文学习和指令遵循等方面表现出色,在反转推理任务中解决传统ARM的“反转诅咒”问题。其8B参数版本在多项基准测试中与LLaMA3等强模型相当,展现了扩散模型作为自回归模型替代方案的巨大潜力。

阅读目录
  • LLaDA是什么
  • LLaDA的主要功能
  • LLaDA的技术原理
  • LLaDA的项目地址
  • LLaDA的应用场景

LLaDA

LLaDA的主要功能

  • 高效生成文本:能生成高质量、连贯的文本内容,适用于写作、对话、内容创作等场景。
  • 强大的上下文学习能力:根据上下文快速适应新任务。
  • 指令遵循能力:能更好地理解和执行人类指令,适用于多轮对话、问答和任务执行等场景。
  • 双向推理能力:解决传统自回归模型的“反转诅咒”,在正向和反向推理任务中均表现出色,例如诗歌补全任务。
  • 多领域适应性:在语言理解、数学、编程、中文理解等多个领域表现出色,具有广泛的适用性。

LLaDA的技术原理

  • 扩散模型框架:基于正向掩蔽过程(逐渐将文本中的标记掩蔽)和反向恢复过程(逐步恢复被掩蔽的标记)建模文本分布。支持模型用非自回归的方式生成文本,避免传统自回归模型的顺序生成限制。
  • 掩蔽预测器:用普通的Transformer架构作为掩蔽预测器,输入部分掩蔽的文本序列,预测所有掩蔽标记。让模型能捕捉双向依赖关系,而不仅仅是单向的左到右生成。
  • 优化似然下界:基于优化似然下界训练模型,在生成建模中是原理性的,确保模型在大规模数据和模型参数下的可扩展性和生成能力。
  • 预训练与监督微调:LLaDA基于预训练和监督微调(SFT)相结合的方式。预训练阶段用大规模文本数据进行无监督学习,SFT阶段基于标注数据提升模型的指令遵循能力。
  • 灵活的采样策略:在生成过程中,LLaDA支持多种采样策略(如随机掩蔽、低置信度掩蔽、半自回归掩蔽等),平衡生成质量和效率。

LLaDA的项目地址

  • 项目官网:https://ml-gsai.github.io/LLaDA
  • GitHub仓库:https://github.com/ML-GSAI/LLaDA
  • arXiv技术论文:https://arxiv.org/pdf/2502.09992

LLaDA的应用场景

  • 多轮对话:用于智能客服、聊天机器人等,支持流畅的多轮交流。
  • 文本生成:适用于写作辅助、创意文案等,能生成高质量文本。
  • 代码生成:帮助开发者生成代码片段或修复错误,提升编程效率。
  • 数学推理:解决数学问题,提供解题步骤,可用于教育领域。
  • 语言翻译:实现多语言翻译,促进跨文化交流。
PreenCut开源AI视频剪辑工具:基于WhisperX与大模型,实现自然语言秒搜定位,高效视频剪辑新革命
AI算力需求激增!美德州将建2.5GW核燃混合电站,创新‘气转核’模式破局
ThinkChain开源框架:实时反馈工具结果,让AI(如Claude)思考更智能、决策更精准
FacePoke – 开源的实时面部编辑工具,拖拽操作面部表情
OpenAI推理模型自主破解80年数学难题:AI从研究助理迈入科学发现者新纪元
分享
Email 复制链接 打印
Share
上一篇 Sonic – 腾讯联合浙大推出的音频驱动肖像动画框架
下一篇 OpenThinker-32B – 斯坦福、UC 伯克利等机构联合开源的推理模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

GPT-5.4重磅发布:OpenAI旗舰模型首次在电脑操作上超越人类,专业工作效率提升83%
AI 工具 AIGC 资讯
蚂蚁集团发布Ming-flash-omni-2.0:开源全模态大模型,引领AI理解与生成一体化新范式
AI 工具 AIGC 资讯
OpenAI发布GPT-5.3-Codex-Spark:1000+ tokens/s实时编程模型,速度提升80%的开发神器
AI 工具 AIGC 资讯
GPT-5.3 Instant深度解析:免费轻量级对话模型,幻觉率降27%全面升级
AI 工具 AIGC 资讯

相关推荐

量子芯片科技感占位特色图
AI 工具AIGC 资讯

朱自清《荷塘月色》AI率60%真相:算法误判背后,经典文学成大模型”牺牲品”

站外新闻
AIGC AI检测 AI率 AI生成内容
AIGC 资讯

SocraticLM – 中科大和科大讯飞共同推出的苏格拉底教学大模型

站外新闻
AIGC 资讯

国产大模型掀起新一轮上市潮,阶跃星辰冲刺香港近年来最大AI IPO

站外新闻
AI 工具AIGC 资讯

美团开源EvoCUA:56.7%准确率登顶,多模态AI代理如何自动化你的电脑操作?

站外新闻
OSWorld基准测试 多模态AI模型 美团开源 自动化办公 计算机使用代理
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.