Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 京东开源JoyAI-LLM-Flash:48B参数MoE架构,3B激活参数实现128K超长上下文与高效推理
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 京东开源JoyAI-LLM-Flash:48B参数MoE架构,3B激活参数实现128K超长上下文与高效推理
AI 工具AIGC 资讯

京东开源JoyAI-LLM-Flash:48B参数MoE架构,3B激活参数实现128K超长上下文与高效推理

站外新闻
最近更新: 2026年6月7日 下午8:06
FiberPO优化框架 MoE大模型 多Token预测 智能体交互 混合专家架构
SHARE

💡 站外导读:在追求模型性能与部署效率平衡的AI竞赛中,如何以更低的计算成本实现更强的智能?京东开源的JoyAI-LLM-Flash给出了一个创新答案:它采用混合专家架构,总参数48B,但每个token仅激活3B参数,大幅降低推理成本。模型支持128K超长上下文,解决了长文档处理的痛点,并创新性地将纤维丛理论引入强化学习,结合多Token预测技术提升吞吐量。这不仅为端侧设备本地化AI助手铺平了道路,也为大规模企业级Agent应用提供了高效、经济的解决方案,直击当前大模型落地应用的核心挑战。

JoyAI-LLM-Flash是什么

JoyAI-LLM-Flash 是京东开源的中型指令大模型,采用混合专家(MoE)架构,总参数量 48B,激活参数量仅 3B,支持 128K 超长上下文。模型创新性地引入 FiberPO 优化框架——首次将纤维丛理论应用于强化学习,结合 Muon 优化器进行 SFT、DPO 及 RL 训练;同时采用稠密多 Token 预测(MTP)技术,相较非 MTP 版本吞吐量提升 1.3-1.7 倍。基于 20 万亿 Token 预训练数据,JoyAI-LLM-Flash 在前沿知识理解、逻辑推理、代码生成及智能体交互等任务上表现出色,适用于端侧高效推理、企业级 Agent 开发及长文本处理等场景。

阅读目录
  • JoyAI-LLM-Flash是什么
  • JoyAI-LLM-Flash的主要功能
  • JoyAI-LLM-Flash的技术原理
  • JoyAI-LLM-Flash的项目地址
  • JoyAI-LLM-Flash的应用场景
      • 📝 站长洞察 (Editor’s Insight)

JoyAI-LLM-Flash

JoyAI-LLM-Flash的主要功能

  • 超长上下文处理:支持 128K Token 上下文长度,可处理长文档、长对话及复杂多轮交互任务。
  • 高效 MoE 推理:总参数量 48B,激活参数仅 3B,256 个专家动态路由,每 Token 激活 8 个专家,兼顾性能与低推理成本。
  • 多 Token 预测(MTP):采用稠密 MTP 技术,吞吐量较非 MTP 版本提升 1.3-1.7 倍,显著提升生成效率。
  • 代码生成能力:基于 20 万亿 Token 预训练,擅长逻辑推理与代码生成,支持多种编程语言辅助开发。
  • 智能体交互:针对 Agent 场景优化,支持复杂任务规划、工具调用及多步骤推理。
  • 前沿知识理解:覆盖广泛领域知识,具备强大的语义理解和知识问答能力。
  • 指令遵循优化:通过 SFT、DPO 及 RL 多阶段训练,精准理解并执行用户指令。

JoyAI-LLM-Flash的技术原理

  • 混合专家架构(MoE):采用稀疏激活的 MoE 设计,总参数量 48B 但每 Token 仅激活 3B 参数,通过 256 个专家模块动态路由(每 Token 选择 8 个专家),大幅降低推理成本的同时保持高性能。
  • 稠密多 Token 预测(Dense MTP):创新性地引入稠密 MTP 机制,单次前向传播并行预测多个未来 Token,解决传统模型规模扩展时的不稳定问题,吞吐量提升 1.3-1.7 倍。
  • FiberPO 优化框架:首次将纤维丛理论(Fiber Bundle Theory)引入强化学习优化,结合 Muon 优化器进行参数更新,提升训练稳定性和收敛效率。
  • 多阶段训练策略:采用 SFT(监督微调)+ DPO(直接偏好优化)+ RL(强化学习)三阶段训练流程,逐步优化模型的指令遵循能力和输出质量。
  • MLA 注意力机制:使用多头潜在注意力(Multi-head Latent Attention),隐藏维度 2048,支持 32 头注意力,高效处理长序列依赖关系。
  • SwiGLU 激活函数:采用 SwiGLU 作为非线性激活,结合 129K 词表大小,提升模型表达能力和训练稳定性。

JoyAI-LLM-Flash的项目地址

  • HuggingFace模型库:https://huggingface.co/jdopensource/JoyAI-LLM-Flash

JoyAI-LLM-Flash的应用场景

  • 端侧高效推理:激活参数仅 3B,适合部署在手机、IoT 设备等资源受限的端侧场景,实现本地化 AI 助手。
  • 智能客服系统:支持 128K 超长上下文,可处理复杂多轮对话,适用于电商、金融等领域的大规模客服自动化。
  • 代码辅助开发:擅长逻辑推理与代码生成,可为开发者提供实时代码补全、Bug 修复及技术文档解读。
  • 企业级 Agent 平台:针对智能体交互优化,支持任务规划、工具调用及多步骤推理,适用于 RPA、自动化办公等场景。
  • 长文档处理:128K 上下文能力支持论文分析、合同审查、研报总结等需要处理大量文本的专业场景。
  • 内容创作辅助:基于 20 万亿 Token 预训练,可辅助撰写营销文案、产品描述、新闻稿件等商业内容。

📝 站长洞察 (Editor’s Insight)

京东此次开源JoyAI-LLM-Flash,标志着大模型竞赛从’规模军备’转向’效能实用’的关键拐点。其MoE架构的精细设计(48B总参/3B激活)直击企业级部署的核心痛点——推理成本。更值得玩味的是其技术融合:将深奥的纤维丛理论(FiberPO)引入RL优化,是理论驱动工程创新的典范;而稠密MTP技术显著提升吞吐量,意味着在同等硬件条件下,模型能处理更多并发请求。这精准呼应了AI落地的三大趋势:端侧智能的崛起(3B激活参数适配边缘设备)、长上下文成为刚需(128K支撑复杂Agent任务与文档处理),以及开源模型开始系统性优化’最后一公里’的部署效率。京东此举不仅是技术实力展示,更是以开源生态抢占智能体时代基础设施标准的战略布局,预示着行业将从’比谁大’转向’比谁更会用’。

Rytr
GPT-5.6后端日志泄露:150万Token上下文窗口定义新基准,AI六月决战将重塑开发范式
Magic Studio
Microsoft Scout – 微软推出的 AI 个人助手
OpenAI 2.34亿美金落子新加坡:揭秘首个海外AI实验室的战略野心与全球布局
TAGGED:FiberPO优化框架MoE大模型多Token预测智能体交互混合专家架构
分享
Email 复制链接 打印
Share
上一篇 蚂蚁集团Ming-omni-tts重磅开源:16.8B参数统一音频生成大模型,粤语情感控制超93%,超越SeedTTS引领AIGC音频新范式
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

蚂蚁集团Ming-omni-tts重磅开源:16.8B参数统一音频生成大模型,粤语情感控制超93%,超越SeedTTS引领AIGC音频新范式
AI 工具 AIGC 资讯
ClawWork深度解析:HKUDS开源AI Agent经济生存基准测试框架,挑战大模型“赚钱”能力
AI 工具 最新趋势
Google DeepMind发布Lyria 3:AI音乐生成模型重大突破,一句话生成带人声的30秒完整歌曲
AI 工具 AIGC 资讯
EvoMap:全球首个AI Agent进化协作平台,破解经验孤岛,实现智能体能力跨个体遗传与进化
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

AvatarFX – Character.AI 推出的 AI 视频生成模型

站外新闻
AI 工具AIGC 资讯

OpenMontage: 全球首个开源Agentic视频制作系统,12条生产线+52工具,零成本AI全流程自动成片

站外新闻
Agentic视频制作 AIGC视频生成 AI自动化剪辑 开源AI视频 视频制作系统
AI 工具

Autodraw

remaker
AIGC 资讯

VoiceCanvas – 开源AI语音合成平台,支持多语言、多音色、声音克隆服务

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 小红书 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 科幻 端侧AI 网络安全 联想 腾讯 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.