Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 谷歌Gemma 4开源发布:2B参数跑手机、31B性能超Qwen 397B,Apache 2.0真商用
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 谷歌Gemma 4开源发布:2B参数跑手机、31B性能超Qwen 397B,Apache 2.0真商用
AI 工具AIGC 资讯

谷歌Gemma 4开源发布:2B参数跑手机、31B性能超Qwen 397B,Apache 2.0真商用

站外新闻
最近更新: 2026年5月25日 下午10:28
Gemma 4 多模态大模型 开源大模型 端侧AI 谷歌大模型
SHARE

💡 站外导读:当大模型参数竞赛陷入“军备内卷”,开发者面临三重困境:巨型模型部署成本高昂、端侧隐私场景难以覆盖、开源协议暗藏商业限制。谷歌最新发布的Gemma 4系列,以26B MoE仅激活3.8B参数、31B密集模型Arena评分开源第三的成绩,直击“参数效率”行业痛点。更关键的是,E2B/E4B版本可在手机、树莓派完全离线运行,配合Apache 2.0完全开源协议,正在重塑边缘AI与企业私有化部署的游戏规则。

Gemma 4是什么

Gemma 4是Google开源的多模态大模型系列,基于Gemini 3架构。模型包含E2B/E4B(手机/树莓派可跑)、26B MoE(仅激活3.8B参数)和31B Dense(Arena评分开源第三)四个版本。模型支持文本、图像、视频、音频输入及256K长上下文,内置函数调用与Agent能力。Gemma 4以极小参数实现超越百亿级模型的性能,主打端侧离线部署与高效推理。

阅读目录
  • Gemma 4是什么
  • Gemma 4的主要功能
  • 如何使用Gemma 4
  • Gemma 4的项目地址
  • Gemma 4的关键信息和使用要求
  • Gemma 4的核心优势
  • Gemma 4的同类竞品对比
  • Gemma 4的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Gemma 4

Gemma 4的主要功能

  • 全模态处理:支持文本、图像、视频及原生音频输入(端侧版本),具备 OCR、图表理解、视觉问答能力。
  • Agent 原生架构:内置函数调用、结构化 JSON 输出和系统指令,可直接构建自主 Agent 工作流,支持多步推理与工具调用。
  • 代码与数学推理:模型支持高质量代码生成(LiveCodeBench v6 达 80%)和复杂数学推理(AIME 2026 达 89.2%),支持长代码库分析(最高 256K 上下文)。
  • 端侧离线部署“”E2B/E4B 版本可在手机、树莓派、Jetson Orin Nano 等设备完全离线运行,零延迟处理语音与视觉任务。
  • 多语言支持“”原生支持 140+ 种语言,适用全球化应用开发。
  • 灵活硬件适配:提供从 2B 端侧模型到 31B 高性能版本,覆盖手机到 H100 工作站,支持消费级 GPU 本地运行。

如何使用Gemma 4

  • 访问 Hugging Face 网站:进入模型页面获取模型标识符并下载权重文件。
  • 安装依赖库:在终端执行 pip install transformers accelerate torch 命令安装模型推理所需的 Python 环境。
  • 加载模型与分词器:在代码中使用 AutoModelForCausalLM.from_pretrained("google/gemma-4-31B-it") 和对应的分词器初始化模型实例。
  • 执行推理:将输入文本通过分词器编码为张量后传入模型生成回复,将输出张量解码为可读文本完成推理。

Gemma 4的项目地址

  • 项目官网:https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
  • HuggingFace模型库:https://huggingface.co/collections/google/gemma-4

Gemma 4的关键信息和使用要求

  • 模型规格:共 4 个版本——E2B(端侧,激活 2B)、E4B(端侧,激活 4B)、26B MoE(激活 3.8B,Arena 1441 分)、31B Dense(Arena 1452 分,开源第三)。
  • 技术底座:基于 Gemini 3 架构,支持 140+ 语言、256K 上下文、文本/图像/视频/音频多模态,原生支持函数调用与 Agent 工作流。
  • 硬件门槛:
    • E2B/E4B:手机、树莓派、Jetson Orin Nano(完全离线)。
    • 26B MoE:量化版可在 24GB MacBook/RTX 3090 运行。
    • 31B Dense:未量化需单张 80GB H100,量化版支持消费级 GPU。

Gemma 4的核心优势

  • 极致参数效率:31B 密集模型 Arena 评分 1452(开源第三),超越参数量大 10-20 倍的 Qwen3.5-397B 和 DeepSeek v3.2;26B MoE 仅激活 3.8B 参数即达到开源第六水平,实现”以小胜大”的性能跃迁。
  • 全场景端侧覆盖:E2B/E4B 可在手机、树莓派、Jetson Orin Nano 完全离线运行,支持 128K 上下文与原生音频/视觉处理,实现零延迟、零云依赖的端侧 AI。
  • 真开源商业化:全面采用 Apache 2.0 协议(替代以往受限许可),可任意商用、修改、再分发,无需付费,内置专利保护,解决企业法务顾虑。
  • Agent 原生架构:内置函数调用、结构化 JSON 输出与系统指令,支持 256K 长上下文与多步推理,可直接构建自主 Agent 工作流,无需额外适配层。

Gemma 4的同类竞品对比

对比维度 Gemma 4 (31B Dense) GLM-5 Qwen 3.5 (397B-A17B)
参数量 31B(密集) 745B 397B(激活17B MoE)
Arena评分 1452(开源第3) 1456(略高) 1450(略低)
开源协议 Apache 2.0(完全商用) 闭源/自定义限制 Apache 2.0(完全商用)
端侧支持 支持(E2B/E4B手机/树莓派离线) 不支持 不支持
上下文长度 256K 未公开 未明确
参数效率 1/24体积达到同等性能 参数量巨大 12倍体积略低性能

Gemma 4的应用场景

  • 端侧隐私计算:E2B/E4B 版本支持在手机、树莓派及 IoT 设备完全离线运行,满足医疗影像初筛、金融数据本地处理等隐私敏感场景的零延迟智能体需求。
  • 企业自动化:模型可构建私有代码库问答、API 自动化调度及 140+ 语言支持的全球化商业 Agent 系统。
  • 科研教育:模型适用本地编程助手(IDE 插件形式)、生物信息学分析(如耶鲁大学基于 Gemma 的癌症靶点发现项目)及低成本边缘 AI 教学实验。
  • 多模态交互:模型支持 OCR 文档数字化、实时视频内容分析和语音视觉融合的跨模态智能应用。

📝 站长洞察 (Editor’s Insight)

Gemma 4的发布标志着开源大模型进入“效率驱动”的新阶段。其核心突破不在于参数规模,而在于三项范式重构:第一,以MoE架构实现1/24参数量达到同等性能,验证了“稀疏激活”路线在工业级落地的可行性;第二,首次在端侧模型中完整集成视觉-语音-Agent闭环,将IoT设备从“传感器”升级为“智能终端”;第三,Apache 2.0全面替代Google过往的受限许可,反映出科技巨头从“模型开源”向“生态开源”的战略转向。结合谷歌与DeepMind的合并动作,Gemma 4实为Gemini生态的“边缘触角”——通过覆盖手机到H100的全硬件梯度,构建从消费端到企业端的数据飞轮。值得关注的是,其140+语言支持与本地化离线能力,或将加速东南亚、非洲等新兴市场的AI平民化进程。

MM-StoryAgent – 上海交大联合阿里开源的多智能体故事绘本视频生成框架
欧洲央行紧急会议聚焦 Anthropic Claude Mythos:AI 揭露数千金融漏洞引发全球监管警报
万相首尾帧模型 – 阿里通义开源的首尾帧生视频模型
FastAPI-MCP – 一键将 FastAPI 转换为 MCP 服务器的开源工具
Finchat.io
TAGGED:Gemma 4多模态大模型开源大模型端侧AI谷歌大模型
分享
Email 复制链接 打印
Share
上一篇 InternSVG:上海AI Lab统一SVG建模套件发布,覆盖理解、编辑与生成,性能全面超越GPT-4o
下一篇 阿里Qwen3.6-Plus发布:百万上下文+超低参数量,编码智能体性能直逼Claude 4.5 Opus
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

腾讯混元2.0震撼发布:4060亿参数MoE架构大模型,256K上下文,国内推理能力登顶
AI 工具 AIGC 资讯
美团开源LongCat-Image:6B参数逼平闭源模型,8105汉字渲染+图像编辑全搞定
AI 工具
智谱GLM-4.6V多模态大模型开源:106B参数性能比肩235B,视觉工具调用引领AI Agent新范式
AI 工具 AIGC 资讯
蚂蚁集团开源Ming-Flash-Omni 2.0:100B参数全模态大模型,统一视觉、语音、图像生成的SOTA级AIGC引擎
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

FoloUp – 开源AI语音面试平台,自动生成定制化面试问题

站外新闻
AI 工具

Magical

remaker
AI 工具

Vocal Remover

remaker
AI 工具

QR Code AI

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek Gemini GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax MoE架构 NVIDIA openai OpenClaw prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 教程 早报 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 端侧部署 网络安全 腾讯 腾讯混元 英伟达 蚂蚁集团 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.