Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 阿里通义千问重磅开源Qwen3.5:3970亿参数模型性能超越GPT-5.2,API价格仅为1/15,开启多模态大模型新时代
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 阿里通义千问重磅开源Qwen3.5:3970亿参数模型性能超越GPT-5.2,API价格仅为1/15,开启多模态大模型新时代
AI 工具AIGC 资讯

阿里通义千问重磅开源Qwen3.5:3970亿参数模型性能超越GPT-5.2,API价格仅为1/15,开启多模态大模型新时代

站外新闻
最近更新: 2026年6月7日 下午8:06
MoE架构 Qwen3.5 多模态AI 开源大模型 通义千问
SHARE

💡 站外导读:在算力成本高昂、模型部署复杂的当下,中小企业与开发者对高性能、低成本的AI模型需求迫切。传统大模型虽强大,但推理开销巨大,限制了其规模化落地。阿里通义千问开源的Qwen3.5,以创新的MoE架构实现“以小胜大”,不仅性能碾压部分万亿参数模型,更将API成本压至行业新低,并支持消费级显卡微调,直击AI应用普及的核心痛点。

Qwen3.5是什么

Qwen3.5是阿里巴巴通义千问团队正式发布并开源的新一代原生多模态大模型。首发开源版本Qwen3.5-397B-A17B采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合,总参数达3970亿但每次推理仅激活170亿参数,实现”以小胜大”——性能超越万亿参数的Qwen3-Max,部署显存降低60%,推理吞吐量最高提升至19倍。作为原生视觉-语言模型,通过早期文本-视觉融合与M-RoPE、3D位置编码技术,统一处理文本、图像、视频任务,语言支持从119种扩展至201种。在多项权威评测中,Qwen3.5在MMLU-Pro得分87.8超越GPT-5.2,GPQA得分88.4高于Claude 4.5,IFBench指令遵循评分76.5刷新历史纪录。API定价每百万Token仅0.8元,为Gemini 3 Pro的1/18,开发者可通过魔搭社区、HuggingFace或阿里云百炼获取模型权重与接口。

阅读目录
  • Qwen3.5是什么
  • Qwen3.5的主要功能
  • Qwen3.5的技术原理
  • Qwen3.5的项目地址
  • 如何使用Qwen3.5
  • Qwen3.5的模型定价
  • Qwen3.5的应用场景
      • 📝 站长洞察 (Editor’s Insight)

阿里通义千问最新发布了Qwen3.5系列的新成员——一系列参数规模更小的模型,涵盖0.8B、2B、4B以及9B等不同版本。这些模型均构建于同一个Qwen3.5基础架构之上。该项目遵循Apache 2.0许可证,完全开源且允许商业使用。用户可以根据需求采用LoRA或全量微调的方式进行模型定制,并且仅需消费级显卡即可启动适配工作,从而以较低成本将模型应用于各类垂直业务场景。具体来看,0.8B和2B版本适合在手机等移动设备以及物联网边缘节点上部署;4B版本则专门为轻量级智能体应用而设计;而旗舰版9B的性能表现,据称已可与参数规模达120B的gpt-oss模型相媲美。

Qwen3.5

Qwen3.5的主要功能

  • 原生多模态理解:统一处理文本、图像、视频,通过早期视觉-语言融合实现跨模态推理。
  • 智能体能力:支持工具调用、任务规划与执行,在BFCL-V4等Agent评测中表现优异。
  • 高效推理架构:采用Gated DeltaNet+MoE混合设计,397B参数仅激活17B即可达到顶级性能。
  • 长上下文处理:支持最高1M上下文长度,256K场景下解码吞吐量是前代的19倍。
  • 多语言支持:覆盖201种语言与方言,词表扩展至25万,编码效率提升10-60%。
  • 代码生成:具备强大的编程能力,支持多语言代码编写、调试与复杂项目开发。
  • 视觉识别:细粒度图像理解、目标检测、OCR文档解析与空间关系推理。
  • 搜索增强:集成BrowseComp等搜索Agent能力,实现联网信息检索与整合。

Qwen3.5的技术原理

  • 混合注意力架构:融合Gated DeltaNet线性注意力与Gated Attention稀疏注意力,实现自适应计算资源分配。
  • MoE稀疏激活:总参数397B仅激活17B(约4.3%),通过1个共享专家+512个路由专家(每次激活10个)降低推理成本。
  • 门控机制优化:采用head-specific sigmoid门控替代传统softmax注意力,该成果获2025年NeurIPS最佳论文奖。
  • 原生多模态融合:利用M-RoPE和3D位置编码将时空信息原生嵌入LLM,实现视觉-语言早期融合。
  • 异构训练框架:视觉与语言组件解耦并行策略,稀疏激活实现跨模块计算重叠,训练吞吐接近纯文本基线。
  • FP8混合精度:原生FP8流水线对激活、MoE路由与GEMM采用低精度,敏感层保持BF16,显存降低50%以上。
  • 异步强化学习:构建可扩展异步RL框架支持全尺寸模型,实现训推分离与动态负载均衡,端到端加速3-5倍。

Qwen3.5

Qwen3.5的项目地址

  • Hugging Face模型库:https://huggingface.co/collections/Qwen/qwen35
  • GitHub仓库:https://github.com/QwenLM/Qwen3.5

如何使用Qwen3.5

  • 网页端体验:访问 Qwen Chat 或下载千问APP/PC客户端,直接输入文字或上传图片/视频进行多模态交互。
  • API调用:通过阿里云百炼平台获取API密钥,以每百万Token 0.8元的低价接入模型服务。
  • 本地部署:从HuggingFace或魔搭社区下载开源权重 Qwen3.5-397B-A17B,在本地或私有云环境部署运行。
  • 智能体开发:利用模型原生Agent能力,结合工具调用接口开发自动化任务执行、数据分析等应用。
  • 多语言应用:直接输入201种支持语言中的任意一种进行对话,无需额外配置翻译模块。
  • 长文档处理:上传超长文本、PDF或视频,模型自动处理最高1M上下文的复杂推理任务。

Qwen3.5的模型定价

  • 输入价格:每百万Token仅需0.8元,为全球顶级模型中最低价位之一
  • 价格对比:仅为Gemini 3 Pro的1/18,GPT-5.2的1/15,性价比优势显著
  • 开源免费:Qwen3.5-397B-A17B模型权重完全开源,开发者可免费下载本地部署

Qwen3.5的应用场景

  • 智能客服:支持201种语言的多轮对话与复杂问题解答,适用于全球化企业客服系统。
  • 内容创作:辅助文案撰写、视频脚本生成、多语言翻译与本地化内容适配。
  • 代码开发:提供代码生成、调试、重构服务,支持复杂软件项目开发与维护。
  • 视觉分析:实现图像识别、文档OCR、视频内容理解与细粒度视觉问答。
  • 智能体自动化:构建自动化工作流,执行数据分析、信息检索、任务调度等Agent任务。
  • 教育辅助:支持多语言教学、作业批改、个性化学习路径规划与知识问答。

📝 站长洞察 (Editor’s Insight)

Qwen3.5的发布标志着开源大模型进入“效率革命”新阶段。其核心突破在于通过Gated DeltaNet与MoE的混合架构,将性能与成本解耦,这呼应了行业从“参数竞赛”转向“实用效能”的深层趋势。该模型在多模态原生融合上的尝试,预示着下一代AI交互将以视觉-语言无缝处理为标准。更值得关注的是,其极低的API定价与消费级硬件友好的微调方案,正在重塑AI产业的商业化门槛,可能加速垂直领域Agent应用的爆发。这不仅是技术迭代,更是阿里在生态卡位战中的关键落子,推动大模型从实验室走向真正的规模化产业应用。

月之暗面 Kimi K2.6 开源旗舰模型发布:性能对标GPT-5.4,支持300个Agent并行协作与5天自主运行
SellScale
Fuk.ai
LlamaV-o1 – 多模态视觉推理模型,采用逐步推理学习方法解决复杂任务
Runway Gen-4 – Runway 推出最新的AI视频生成模型
TAGGED:MoE架构Qwen3.5多模态AI开源大模型通义千问
分享
Email 复制链接 打印
Share
上一篇 小红书开源FireRed-Image-Edit:SOTA级图像编辑模型,文本引导编辑、老照片修复、虚拟试穿一步到位
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

小红书开源FireRed-Image-Edit:SOTA级图像编辑模型,文本引导编辑、老照片修复、虚拟试穿一步到位
AI 工具 AIGC 资讯
LobsterAI 有道龙虾:网易有道发布7×24小时全场景AI Agent,手机一句话远程操控电脑办公
AI 工具 AIGC 资讯
京东开源JoyAI-LLM-Flash:48B参数MoE架构,3B激活参数实现128K超长上下文与高效推理
AI 工具 AIGC 资讯
蚂蚁集团Ming-omni-tts重磅开源:16.8B参数统一音频生成大模型,粤语情感控制超93%,超越SeedTTS引领AIGC音频新范式
AI 工具 AIGC 资讯

相关推荐

AI 工具

Eesel AI

remaker
AIGC 资讯

Mistral Medium 3 – Mistral AI推出的多模态语言模型

站外新闻
AIGC 资讯

Video-T1 – 清华联合腾讯推出的视频生成技术

站外新闻
AI 工具

NameSnack

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 小红书 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 本地AI 海报设计 清华大学 生成式AI 科幻 端侧AI 网络安全 联想 腾讯 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.