Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 京东开源JoyAI-LLM-Flash:48B参数MoE架构,3B激活参数实现128K超长上下文与高效推理
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 京东开源JoyAI-LLM-Flash:48B参数MoE架构,3B激活参数实现128K超长上下文与高效推理
AI 工具AIGC 资讯

京东开源JoyAI-LLM-Flash:48B参数MoE架构,3B激活参数实现128K超长上下文与高效推理

站外新闻
最近更新: 2026年6月7日 下午8:06
FiberPO优化框架 MoE大模型 多Token预测 智能体交互 混合专家架构
SHARE

💡 站外导读:在追求模型性能与部署效率平衡的AI竞赛中,如何以更低的计算成本实现更强的智能?京东开源的JoyAI-LLM-Flash给出了一个创新答案:它采用混合专家架构,总参数48B,但每个token仅激活3B参数,大幅降低推理成本。模型支持128K超长上下文,解决了长文档处理的痛点,并创新性地将纤维丛理论引入强化学习,结合多Token预测技术提升吞吐量。这不仅为端侧设备本地化AI助手铺平了道路,也为大规模企业级Agent应用提供了高效、经济的解决方案,直击当前大模型落地应用的核心挑战。

JoyAI-LLM-Flash是什么

JoyAI-LLM-Flash 是京东开源的中型指令大模型,采用混合专家(MoE)架构,总参数量 48B,激活参数量仅 3B,支持 128K 超长上下文。模型创新性地引入 FiberPO 优化框架——首次将纤维丛理论应用于强化学习,结合 Muon 优化器进行 SFT、DPO 及 RL 训练;同时采用稠密多 Token 预测(MTP)技术,相较非 MTP 版本吞吐量提升 1.3-1.7 倍。基于 20 万亿 Token 预训练数据,JoyAI-LLM-Flash 在前沿知识理解、逻辑推理、代码生成及智能体交互等任务上表现出色,适用于端侧高效推理、企业级 Agent 开发及长文本处理等场景。

阅读目录
  • JoyAI-LLM-Flash是什么
  • JoyAI-LLM-Flash的主要功能
  • JoyAI-LLM-Flash的技术原理
  • JoyAI-LLM-Flash的项目地址
  • JoyAI-LLM-Flash的应用场景
      • 📝 站长洞察 (Editor’s Insight)

JoyAI-LLM-Flash

JoyAI-LLM-Flash的主要功能

  • 超长上下文处理:支持 128K Token 上下文长度,可处理长文档、长对话及复杂多轮交互任务。
  • 高效 MoE 推理:总参数量 48B,激活参数仅 3B,256 个专家动态路由,每 Token 激活 8 个专家,兼顾性能与低推理成本。
  • 多 Token 预测(MTP):采用稠密 MTP 技术,吞吐量较非 MTP 版本提升 1.3-1.7 倍,显著提升生成效率。
  • 代码生成能力:基于 20 万亿 Token 预训练,擅长逻辑推理与代码生成,支持多种编程语言辅助开发。
  • 智能体交互:针对 Agent 场景优化,支持复杂任务规划、工具调用及多步骤推理。
  • 前沿知识理解:覆盖广泛领域知识,具备强大的语义理解和知识问答能力。
  • 指令遵循优化:通过 SFT、DPO 及 RL 多阶段训练,精准理解并执行用户指令。

JoyAI-LLM-Flash的技术原理

  • 混合专家架构(MoE):采用稀疏激活的 MoE 设计,总参数量 48B 但每 Token 仅激活 3B 参数,通过 256 个专家模块动态路由(每 Token 选择 8 个专家),大幅降低推理成本的同时保持高性能。
  • 稠密多 Token 预测(Dense MTP):创新性地引入稠密 MTP 机制,单次前向传播并行预测多个未来 Token,解决传统模型规模扩展时的不稳定问题,吞吐量提升 1.3-1.7 倍。
  • FiberPO 优化框架:首次将纤维丛理论(Fiber Bundle Theory)引入强化学习优化,结合 Muon 优化器进行参数更新,提升训练稳定性和收敛效率。
  • 多阶段训练策略:采用 SFT(监督微调)+ DPO(直接偏好优化)+ RL(强化学习)三阶段训练流程,逐步优化模型的指令遵循能力和输出质量。
  • MLA 注意力机制:使用多头潜在注意力(Multi-head Latent Attention),隐藏维度 2048,支持 32 头注意力,高效处理长序列依赖关系。
  • SwiGLU 激活函数:采用 SwiGLU 作为非线性激活,结合 129K 词表大小,提升模型表达能力和训练稳定性。

JoyAI-LLM-Flash的项目地址

  • HuggingFace模型库:https://huggingface.co/jdopensource/JoyAI-LLM-Flash

JoyAI-LLM-Flash的应用场景

  • 端侧高效推理:激活参数仅 3B,适合部署在手机、IoT 设备等资源受限的端侧场景,实现本地化 AI 助手。
  • 智能客服系统:支持 128K 超长上下文,可处理复杂多轮对话,适用于电商、金融等领域的大规模客服自动化。
  • 代码辅助开发:擅长逻辑推理与代码生成,可为开发者提供实时代码补全、Bug 修复及技术文档解读。
  • 企业级 Agent 平台:针对智能体交互优化,支持任务规划、工具调用及多步骤推理,适用于 RPA、自动化办公等场景。
  • 长文档处理:128K 上下文能力支持论文分析、合同审查、研报总结等需要处理大量文本的专业场景。
  • 内容创作辅助:基于 20 万亿 Token 预训练,可辅助撰写营销文案、产品描述、新闻稿件等商业内容。

📝 站长洞察 (Editor’s Insight)

京东此次开源JoyAI-LLM-Flash,标志着大模型竞赛从’规模军备’转向’效能实用’的关键拐点。其MoE架构的精细设计(48B总参/3B激活)直击企业级部署的核心痛点——推理成本。更值得玩味的是其技术融合:将深奥的纤维丛理论(FiberPO)引入RL优化,是理论驱动工程创新的典范;而稠密MTP技术显著提升吞吐量,意味着在同等硬件条件下,模型能处理更多并发请求。这精准呼应了AI落地的三大趋势:端侧智能的崛起(3B激活参数适配边缘设备)、长上下文成为刚需(128K支撑复杂Agent任务与文档处理),以及开源模型开始系统性优化’最后一公里’的部署效率。京东此举不仅是技术实力展示,更是以开源生态抢占智能体时代基础设施标准的战略布局,预示着行业将从’比谁大’转向’比谁更会用’。

快手Kwai Keye-VL:开源多模态大模型,高考数学140分+视频理解全面突破
Carlos
Dog Identifier狗狗品种识别器
VidSketch – 浙江大学推出的视频动画生成框架
PoplarML
TAGGED:FiberPO优化框架MoE大模型多Token预测智能体交互混合专家架构
分享
Email 复制链接 打印
Share
上一篇 蚂蚁集团Ming-omni-tts重磅开源:16.8B参数统一音频生成大模型,粤语情感控制超93%,超越SeedTTS引领AIGC音频新范式
下一篇 LobsterAI 有道龙虾:网易有道发布7×24小时全场景AI Agent,手机一句话远程操控电脑办公
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

流光脑波AI大脑占位特色图
2026年3月美国AI榜单巨变:Claude单月狂飙130%紧追ChatGPT,格局突变信号已现
AIGC 资讯 最新趋势
得物实战揭秘:AI Coding工具如何突破数仓开发’失忆’痛点,Harness工程引领新范式
AI 工具 AIGC 资讯
全息流体渐变通用占位特色图
历史性和解!Meta妥协规避审判,美国首例学校诉社交媒体成瘾案落幕,揭示行业司法风向
AIGC 资讯
量子芯片科技感占位特色图
Spotify与环球音乐联手:AI翻唱混音工具上线,正版版权终结Suno野蛮生长
AI 工具 AIGC 资讯 最新趋势

相关推荐

AI 工具AIGC 资讯

阿里Qwen3-Next开源发布:80B参数仅激活3B,混合架构大模型重新定义效率与成本

站外新闻
MoE专家系统 Qwen3-Next 混合架构大模型 长文本处理 阿里通义
AIGC 资讯

Kimi-VL – 月之暗面开源的轻量级多模态视觉语言模型

站外新闻
AIGC 资讯

DeepEP – DeepSeek 开源的专家并行通信库,专为 MoE 训练和推理设计

站外新闻
AI 工具

MiniMax-Remover:两阶段AI视频移除黑科技,6步搞定高效去物体

站外新闻
AIGC AI视频 MiniMax-Remover 目标移除 视频编辑
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.