Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 智谱GLM-4.5开源SOTA模型发布:MoE架构引领效率革命,价格仅Claude十分之一
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 智谱GLM-4.5开源SOTA模型发布:MoE架构引领效率革命,价格仅Claude十分之一
AI 工具AIGC 资讯

智谱GLM-4.5开源SOTA模型发布:MoE架构引领效率革命,价格仅Claude十分之一

站外新闻
最近更新: 2026年6月7日 下午8:22
GLM-4.5 MoE架构 开源大模型 智谱AI
SHARE

💡 站外导读:在AIGC应用爆发与AI智能体概念兴起的当下,开发者与企业亟需一款既能处理复杂推理、生成高质量代码,又能无缝驱动智能体、且兼顾成本效益的‘全能型’开源模型。智谱AI此次推出的GLM-4.5,正是瞄准这一核心痛点,以混合专家(MoE)架构实现参数效率与性能的双重突破,旨在降低顶尖AI能力的使用门槛,推动开源生态迈入新阶段。

GLM-4.5是什么

GLM-4.5 是智谱推出的新一代旗舰模型,专为智能体应用打造,是首款原生融合推理、代码和智能体能力的开源 SOTA 模型。采用混合专家(MoE)架构,有两个版本:GLM-4.5(3550 亿参数,320 亿激活)和 GLM-4.5-Air(1060 亿参数,120 亿激活)。模型在多个评测基准中表现卓越,综合性能达到开源模型的顶尖水平,尤其在代码智能体场景中表现优异。支持混合推理模式,提供思考模式和非思考模式,兼顾复杂任务和即时响应需求。

阅读目录
  • GLM-4.5是什么
  • GLM-4.5的主要特点
  • GLM-4.5的技术亮点
  • GLM-4.5的项目地址
  • GLM-4.5的技术指标
  • 如何使用GLM-4.5
  • GLM-4.5的模型定价
  • GLM-4.5的应用场景
      • 📝 站长洞察 (Editor’s Insight)

在效率与成本上实现双重飞跃:模型参数效率显著提升,API调用价格仅为Claude的十分之一,且响应速度最高可达每秒100个tokens。更关键的是,该模型率先在单一架构内完成了多种核心能力的原生融合,并取得了重大技术突破——单个模型便同时集成了出色的推理能力、代码生成能力以及智能体交互能力。目前,该模型已在智谱清言和Z.ai平台开放免费体验。

GLM-4.5

GLM-4.5的主要特点

  • 多能力融合:首次在单个模型中实现了推理、代码生成和智能体能力的原生融合,能满足复杂智能体应用的需求。
  • 推理能力:在多个推理评测基准中表现优异,支持复杂推理任务,推理性能达到开源模型的顶尖水平。
  • 代码生成:在代码生成和编程任务中表现出色,支持多种编程语言,能生成高质量的代码片段,胜任全栈开发任务。
  • 智能体应用:支持工具调用、网页浏览等功能,能接入代码智能体框架,如 Claude Code 和 Roo Code,适用于智能体任务。
  • 混合推理模式:提供“思考模式”用于复杂推理和工具使用,以及“非思考模式”用于即时响应,兼顾效率和性能。

GLM-4.5的技术亮点

  • 混合专家(MoE)架构:GLM-4.5 采用了混合专家(Mixture of Experts, MoE)架构,是一种高效的模型扩展方法。MoE 架构通过将模型参数划分为多个专家模块(Experts),在每个前向传播过程中动态选择部分专家进行激活,实现参数的稀疏激活。在保持模型强大表达能力的同时,显著降低了计算成本和内存占用。
    • GLM-4.5:总参数量为 3550 亿,激活参数为 320 亿。
    • GLM-4.5-Air:总参数量为 1060 亿,激活参数为 120 亿。
  • 多模态能力:GLM-4.5 支持多模态输入和输出,能处理文本、图像等多种数据类型。使模型能更好地理解和生成复杂的智能体应用内容,例如在智能体任务中处理网页浏览、工具调用等多模态交互场景。
  • 混合推理模式:GLM-4.5 提供两种推理模式:
    • 思考模式(Thinking Mode):适用于复杂推理和工具使用场景,模型会进行更深入的思考和推理,以生成更准确的结果。
    • 非思考模式(Non-Thinking Mode):适用于即时响应场景,模型会快速生成结果,满足低延迟的需求。
  • 高效的训练流程:GLM-4.5 的训练流程包括三个阶段:
    • 通用数据预训练:在 15 万亿 token 的通用数据上进行预训练,以学习语言和知识的基础表示。
    • 针对性训练:在代码、推理、智能体等领域的 8 万亿 token 数据上进行针对性训练,以增强模型在特定任务上的表现。
    • 强化学习优化:通过强化学习进一步优化模型的推理、代码生成和智能体能力,以提升模型在实际应用中的表现。
  • 参数效率优化:GLM-4.5 在参数效率上实现了显著提升。尽管参数量仅为 DeepSeek-R1 的 1/2 和 Kimi-K2 的 1/3,但在多项标准基准测试中表现更为出色。例如,在 100B 总参数 – 10B 激活参数规模的模型系列中,GLM-4.5 在 Artificial Analysis 基准测试中的推理性能媲美甚至超越了其他国际顶级模型。

GLM-4.5的项目地址

  • GitHub仓库:https://github.com/zai-org/GLM-4.5
  • HuggingFace仓库: https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
  • ModelScope仓库:https://modelscope.cn/collections/GLM-45-b8693e2a08984f
  • 体验地址:
    • HuggingFace: https://huggingface.co/spaces/zai-org/GLM-4.5-Space
    • ModelScope:https://modelscope.cn/studios/ZhipuAI/GLM-4.5-Demo

GLM-4.5的技术指标

  • 综合性能SOTA:最具有代表性的12个评测基准,包括 MMLU Pro、AIME 24、MATH 500、SciCode、GPQA 、HLE、LiveCodeBench、SWE-Bench Verified、Terminal-Bench、TAU-Bench、BFCL v3 和BrowseComp。综合平均分,GLM-4.5 取得了全球模型第三、国产模型第一,开源模型第一。

GLM-4.5

  • 更高的参数效率:GLM-4.5 参数量为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,但在多项标准基准测试中表现得更为出色,这得益于GLM模型的更高参数效率。在衡量模型代码能力的 SWE-bench Verified 榜单上,GLM-4.5 系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5 系列实现了最佳性能。

GLM-4.5

  • 低成本、高速度:在性能优化之外,GLM-4.5 系列也在成本和效率上实现突破,由此带来远低于主流模型定价:API 调用价格低至输入 0.8 元/百万 tokens,输出 2 元/百万 tokens。同时,高速版本实测生成速度最高可至 100 tokens/秒,支持低延迟、高并发的实际部署需求,兼顾成本效益与交互体验。

GLM-4.5
GLM-4.5

如何使用GLM-4.5

  • 体验平台
    • 智谱清言 (chatglm.cn):可以直接访问智谱清言平台,免费体验 GLM-4.5 的满血版功能。用户可以进行对话生成、代码生成、推理任务等多种操作,感受模型的强大能力。
    • Z.ai:用户也可以通过 Z.ai 平台体验 GLM-4.5 的功能。
  • API 调用
    • BigModel.cn:智谱 AI 提供了 API 接口,用户可以通过 BigModel平台进行 API 调用。API 接口支持多种功能,包括文本生成、代码生成、推理任务等。

GLM-4.5的模型定价

API 调用价格低至:输入 0.8 元/百万 tokens、输出 2 元/百万 tokens,生成速度最高可达 100 tokens/秒,支持低延迟和高并发部署。

GLM-4.5的应用场景

  • 全栈开发任务:GLM-4.5 能胜任复杂的全栈开发任务,支持编写较为复杂的应用、游戏、交互网页等。
  • 代码生成:GLM-4.5 在代码生成方面表现出色,能生成高质量的代码片段,支持多种编程语言。可以帮助开发者快速生成代码框架、修复代码错误、优化代码结构等。
  • 编程辅助:模型可以作为编程辅助工具,提供代码补全、代码生成建议、代码注释等功能,提高开发效率。
  • 内容生成:模型可以生成各种类型的内容,如文章、新闻报道、创意文案等,适用于内容创作、文案撰写等场景。
  • 学术研究:GLM-4.5 可以用于学术研究,帮助研究人员探索自然语言处理、人工智能等领域的前沿问题。

📝 站长洞察 (Editor’s Insight)

GLM-4.5的发布,标志着开源大模型的竞争已从‘参数规模’的军备竞赛,转向‘能力融合’与‘工程效率’的深水区。其‘推理-代码-智能体’的原生融合,精准切中了下一代AI应用——自主智能体的核心需求。采用MoE架构并实现参数效率翻倍,是应对高昂算力成本、推动模型落地的关键技术路径。将价格压至Claude的十分之一,更是直击商业化痛点,展现了开源模型在成本上的碾压性优势。这不仅是智谱的一次产品迭代,更是对‘AI民主化’的一次强力推进,预示着未来模型将更‘聪明’、更‘普惠’、更‘专精’,加速智能体从概念走向大规模应用。

llmware – 专为企业级应用设计的开源统一框架
OpenAI发布GPT-5.3-Codex-Spark:1000+ tokens/秒,实时编程交互革命
GPT-5.4发布:OpenAI旗舰模型如何以75%成功率超越人类,重新定义专业工作自动化?
科大讯飞开源企业级AI智能体平台 Astron Agent:一键部署高可用工作流,集成RPA实现决策到行动闭环
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
TAGGED:GLM-4.5MoE架构开源大模型智谱AI
分享
Email 复制链接 打印
Share
上一篇 阿里重磅开源通义万相Wan2.2:270亿参数MoE架构,消费级显卡畅享电影级AI视频生成
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

阿里重磅开源通义万相Wan2.2:270亿参数MoE架构,消费级显卡畅享电影级AI视频生成
AI 工具 AIGC 资讯
阿里通义WebShaper:AI自动出题训练数据合成系统,革新智能体训练范式
AI 工具 AIGC 资讯
昆仑万维开源Skywork UniPic:1.5B参数多模态模型,媲美GPT-4o,支持图像理解、生成与编辑
AI 工具 AIGC 资讯
Qwen3-30B-A3B-Instruct-2507:阿里通义开源MoE模型,305亿参数仅激活33亿,本地部署首选
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

Xiaomi MiMo – 小米开源的首个推理大模型

站外新闻
AIGC 资讯

GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型

站外新闻
AIGC 资讯

Open Avatar Chat – 阿里开源的实时数字人对话系统

站外新闻
AIGC 资讯

DeepSeek Artifacts – Hugging Face推出的AI编程工具,基于DeepSeek V3

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程模型 AI视频生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 边缘计算 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.