Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 阿里Qwen3-Next开源发布:80B参数仅激活3B,混合架构大模型重新定义效率与成本
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 阿里Qwen3-Next开源发布:80B参数仅激活3B,混合架构大模型重新定义效率与成本
AI 工具AIGC 资讯

阿里Qwen3-Next开源发布:80B参数仅激活3B,混合架构大模型重新定义效率与成本

站外新闻
最近更新: 2026年6月7日 下午8:19
MoE专家系统 Qwen3-Next 混合架构大模型 长文本处理 阿里通义
SHARE

💡 站外导读:在大模型参数军备竞赛愈演愈烈之际,高昂的推理成本与资源消耗成为企业落地AI的核心痛点。阿里通义此次开源的Qwen3-Next,直击这一行业难题,通过创新的混合架构与极致激活策略,在80B总参数中实现仅3B参数的轻量化激活,为高并发、长上下文场景提供了兼具性能与经济性的新范式,标志着大模型从“比大”向“比效”的关键转折。

Qwen3-Next是什么

Qwen3-Next是阿里通义开源的新一代混合架构大模型,包含指令版(Qwen3-Next-80B-A3B-Instruct )和思维版(Qwen3-Next-80B-A3B-Thinking)两个版本。模型用全球首创的Gated DeltaNet和Gated Attention混合架构,实现更快的处理速度、更强的效果和更省的资源消耗。模型总参数量达80B,每次推理仅激活约3B参数。模型预训练加速机制使长文生成速度显著提升。Qwen3-Next适用长上下文推理、高并发和低延迟需求场景,模型现已上线阿里云百炼支持API调用和QwenChat网页版支持在线体验。

阅读目录
  • Qwen3-Next是什么
  • Qwen3-Next的主要功能
  • Qwen3-Next的技术原理
  • Qwen3-Next的项目地址
  • Qwen3-Next的性能表现
  • 如何使用Qwen3-Next
  • Qwen3-Next的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Qwen3-Next

Qwen3-Next的主要功能

  • 指令理解和执行:特别优化的指令版(Instruct)擅长理解和执行用户的指令。
  • 深度思考和推理:思维版(Thinking)支持多步推理和深度思考问题。
  • 长文本处理:模型能处理和理解长达32K以上的长文本输入。
  • 高效率推理:基于混合动力引擎,结合速度和精度,实现快速且准确的推理。
  • 节省资源:在保持大模型能力的同时,通过激活部分参数节省计算资源。

Qwen3-Next的技术原理

  • 混合架构:结合75%的Gated DeltaNet和25%的Gated Attention,平衡速度和精度。
    • Gated DeltaNet:用在处理长文本,提供快速的推理速度和线性增长的内存占用。
    • Gated Attention:负责精确召回关键信息,确保模型在处理长文本时不会丢失重点。
  • 极致省钱架构:模型总参数量为80B,每次推理时仅激活约3B参数,显著降低计算成本。
  • 预训练加速机制:通过原生MTP(Multi-Token Prediction)加速技术,模型在预训练阶段就能一次预测多个token,在生成长文本时减少推理步数,提高吞吐量。
  • 专家系统(MoE):模型包含512个专家,每次处理请求时动态选择最相关的10个专家和1个共享专家来工作,实现负载均衡和资源优化。

Qwen3-Next的项目地址

  • HuggingFace模型库:https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d

Qwen3-Next的性能表现

  • Instruct 模型表现:在多个基准测试中,Qwen3-Next-80B-A3B-Instruct 模型的指令能力与235B旗舰模型相当,并且在处理长文本方面表现更强。
  • Thinking 模型表现:Qwen3-Next-80B-A3B-Thinking 模型在推理能力方面超越Gemini Flash,部分指标甚至逼近235B旗舰模型。

Qwen3-Next

如何使用Qwen3-Next

  • 阿里云百炼:访问阿里云百炼官网,搜索Qwen3-Next,根据提供的API参考进行模型调用。
  • QwenChat 网页版:直接访问QwenChat官网,在线与模型进行交互。
  • Hugging Face:在Hugging Face上,找到Qwen3-Next模型集合,进行模型调用和体验。

Qwen3-Next的应用场景

  • 智能客服:利用模型指令理解和执行能力,提供自动化的客户服务和支持。
  • 内容生成:在新闻、博客、社交媒体等领域,能自动生成文章、故事或其他文本内容。
  • 数据分析:数据分析人员分析大量文本数据,提取关键信息,支持市场研究和商业智能。
  • 教育辅助:在教育领域,辅助学生学习,提供个性化教学内容和辅导。
  • 法律咨询:法律人士分析法律文件,提供法律咨询和研究支持。

📝 站长洞察 (Editor’s Insight)

Qwen3-Next的发布,绝非一次简单的模型迭代,而是阿里在“高效大模型”这一前沿赛道上的关键落子。其混合架构(Gated DeltaNet+Gated Attention)与MoE专家系统的深度融合,本质上是在解构传统Transformer的“暴力计算”路径,转向更精细的“智能调度”范式。这背后是行业对模型边际成本与收益的重新审视——当通用能力逼近天花板,如何以更低的边际成本服务更广的垂直场景,将成为下一阶段的竞争焦点。阿里此举,既是对自身云服务成本结构的优化,也为开源社区提供了“够用、好用、省用”的新标杆,可能引发一波关于模型架构“轻量化重构”的行业思潮。

MAI-Code-1-Flash – 微软推出的轻量级代码生成模型
豆包·语音播客模型 – 火山引擎推出的语音播客模型
Gemini 3.5 生产环境严重失控:越权删光两万行代码并编造修复报告,AI 开发信任危机再升级
标小智NameGPT名称生成器
PhysGen3D – 清华等高校联合推出的单图创建交互式 3D 场景
TAGGED:MoE专家系统Qwen3-Next混合架构大模型长文本处理阿里通义
分享
Email 复制链接 打印
Share
上一篇 AutoDocs:开源代码文档自动化神器,内置MCP服务器实现智能深度搜索,赋能敏捷开发与大型协作
下一篇 腾讯混元SRPO:10分钟极速优化,文生图模型真实感与审美双重突破
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

蚂蚁集团开源Ming-Flash-Omni 2.0:100B参数全模态大模型如何重塑AI交互?
AI 工具 AIGC 资讯
GPT-5.3-Codex-Spark震撼发布:OpenAI首款实时编程模型,速度破千Token/秒,开发者协作体验颠覆
AI 工具 AIGC 资讯
GPT-5.3 Instant 发布:OpenAI免费开放,对话更自然,幻觉率降低27%
AI 工具 AIGC 资讯
OpenAI GPT-5.4重磅发布:原生操作电脑、百万Token上下文,专业任务首次超越人类
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

OpenDeepResearcher – 开源 AI 研究工具,自动完成搜索、评估、提取和报告生成

站外新闻
AIGC 资讯

A2A – 谷歌开源的首个标准智能体交互协议

站外新闻
AIGC 资讯

MangaNinja – 基于参考图像的线稿着色技术

站外新闻
AI 工具AIGC 资讯

PersonaLive开源:澳门大学重磅发布,12G显卡跑无限时长AI直播换脸

站外新闻
AI换脸 TensorRT 开源工具 扩散模型 数字人直播
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI图像生成 AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程模型 AI视频生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai prompt RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型应用 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 智谱AI 月之暗面 混合专家模型 清华大学 知识管理 科大讯飞 端侧AI 端侧部署 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 赛博朋克 边缘计算 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.