Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 谷歌Gemma 4开源发布:2B参数跑手机、31B性能超Qwen 397B,Apache 2.0真商用
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 谷歌Gemma 4开源发布:2B参数跑手机、31B性能超Qwen 397B,Apache 2.0真商用
AI 工具AIGC 资讯

谷歌Gemma 4开源发布:2B参数跑手机、31B性能超Qwen 397B,Apache 2.0真商用

站外新闻
最近更新: 2026年5月25日 下午10:28
Gemma 4 多模态大模型 开源大模型 端侧AI 谷歌大模型
SHARE

💡 站外导读:当大模型参数竞赛陷入“军备内卷”,开发者面临三重困境:巨型模型部署成本高昂、端侧隐私场景难以覆盖、开源协议暗藏商业限制。谷歌最新发布的Gemma 4系列,以26B MoE仅激活3.8B参数、31B密集模型Arena评分开源第三的成绩,直击“参数效率”行业痛点。更关键的是,E2B/E4B版本可在手机、树莓派完全离线运行,配合Apache 2.0完全开源协议,正在重塑边缘AI与企业私有化部署的游戏规则。

Gemma 4是什么

Gemma 4是Google开源的多模态大模型系列,基于Gemini 3架构。模型包含E2B/E4B(手机/树莓派可跑)、26B MoE(仅激活3.8B参数)和31B Dense(Arena评分开源第三)四个版本。模型支持文本、图像、视频、音频输入及256K长上下文,内置函数调用与Agent能力。Gemma 4以极小参数实现超越百亿级模型的性能,主打端侧离线部署与高效推理。

阅读目录
  • Gemma 4是什么
  • Gemma 4的主要功能
  • 如何使用Gemma 4
  • Gemma 4的项目地址
  • Gemma 4的关键信息和使用要求
  • Gemma 4的核心优势
  • Gemma 4的同类竞品对比
  • Gemma 4的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Gemma 4

Gemma 4的主要功能

  • 全模态处理:支持文本、图像、视频及原生音频输入(端侧版本),具备 OCR、图表理解、视觉问答能力。
  • Agent 原生架构:内置函数调用、结构化 JSON 输出和系统指令,可直接构建自主 Agent 工作流,支持多步推理与工具调用。
  • 代码与数学推理:模型支持高质量代码生成(LiveCodeBench v6 达 80%)和复杂数学推理(AIME 2026 达 89.2%),支持长代码库分析(最高 256K 上下文)。
  • 端侧离线部署“”E2B/E4B 版本可在手机、树莓派、Jetson Orin Nano 等设备完全离线运行,零延迟处理语音与视觉任务。
  • 多语言支持“”原生支持 140+ 种语言,适用全球化应用开发。
  • 灵活硬件适配:提供从 2B 端侧模型到 31B 高性能版本,覆盖手机到 H100 工作站,支持消费级 GPU 本地运行。

如何使用Gemma 4

  • 访问 Hugging Face 网站:进入模型页面获取模型标识符并下载权重文件。
  • 安装依赖库:在终端执行 pip install transformers accelerate torch 命令安装模型推理所需的 Python 环境。
  • 加载模型与分词器:在代码中使用 AutoModelForCausalLM.from_pretrained("google/gemma-4-31B-it") 和对应的分词器初始化模型实例。
  • 执行推理:将输入文本通过分词器编码为张量后传入模型生成回复,将输出张量解码为可读文本完成推理。

Gemma 4的项目地址

  • 项目官网:https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
  • HuggingFace模型库:https://huggingface.co/collections/google/gemma-4

Gemma 4的关键信息和使用要求

  • 模型规格:共 4 个版本——E2B(端侧,激活 2B)、E4B(端侧,激活 4B)、26B MoE(激活 3.8B,Arena 1441 分)、31B Dense(Arena 1452 分,开源第三)。
  • 技术底座:基于 Gemini 3 架构,支持 140+ 语言、256K 上下文、文本/图像/视频/音频多模态,原生支持函数调用与 Agent 工作流。
  • 硬件门槛:
    • E2B/E4B:手机、树莓派、Jetson Orin Nano(完全离线)。
    • 26B MoE:量化版可在 24GB MacBook/RTX 3090 运行。
    • 31B Dense:未量化需单张 80GB H100,量化版支持消费级 GPU。

Gemma 4的核心优势

  • 极致参数效率:31B 密集模型 Arena 评分 1452(开源第三),超越参数量大 10-20 倍的 Qwen3.5-397B 和 DeepSeek v3.2;26B MoE 仅激活 3.8B 参数即达到开源第六水平,实现”以小胜大”的性能跃迁。
  • 全场景端侧覆盖:E2B/E4B 可在手机、树莓派、Jetson Orin Nano 完全离线运行,支持 128K 上下文与原生音频/视觉处理,实现零延迟、零云依赖的端侧 AI。
  • 真开源商业化:全面采用 Apache 2.0 协议(替代以往受限许可),可任意商用、修改、再分发,无需付费,内置专利保护,解决企业法务顾虑。
  • Agent 原生架构:内置函数调用、结构化 JSON 输出与系统指令,支持 256K 长上下文与多步推理,可直接构建自主 Agent 工作流,无需额外适配层。

Gemma 4的同类竞品对比

对比维度 Gemma 4 (31B Dense) GLM-5 Qwen 3.5 (397B-A17B)
参数量 31B(密集) 745B 397B(激活17B MoE)
Arena评分 1452(开源第3) 1456(略高) 1450(略低)
开源协议 Apache 2.0(完全商用) 闭源/自定义限制 Apache 2.0(完全商用)
端侧支持 支持(E2B/E4B手机/树莓派离线) 不支持 不支持
上下文长度 256K 未公开 未明确
参数效率 1/24体积达到同等性能 参数量巨大 12倍体积略低性能

Gemma 4的应用场景

  • 端侧隐私计算:E2B/E4B 版本支持在手机、树莓派及 IoT 设备完全离线运行,满足医疗影像初筛、金融数据本地处理等隐私敏感场景的零延迟智能体需求。
  • 企业自动化:模型可构建私有代码库问答、API 自动化调度及 140+ 语言支持的全球化商业 Agent 系统。
  • 科研教育:模型适用本地编程助手(IDE 插件形式)、生物信息学分析(如耶鲁大学基于 Gemma 的癌症靶点发现项目)及低成本边缘 AI 教学实验。
  • 多模态交互:模型支持 OCR 文档数字化、实时视频内容分析和语音视觉融合的跨模态智能应用。

📝 站长洞察 (Editor’s Insight)

Gemma 4的发布标志着开源大模型进入“效率驱动”的新阶段。其核心突破不在于参数规模,而在于三项范式重构:第一,以MoE架构实现1/24参数量达到同等性能,验证了“稀疏激活”路线在工业级落地的可行性;第二,首次在端侧模型中完整集成视觉-语音-Agent闭环,将IoT设备从“传感器”升级为“智能终端”;第三,Apache 2.0全面替代Google过往的受限许可,反映出科技巨头从“模型开源”向“生态开源”的战略转向。结合谷歌与DeepMind的合并动作,Gemma 4实为Gemini生态的“边缘触角”——通过覆盖手机到H100的全硬件梯度,构建从消费端到企业端的数据飞轮。值得关注的是,其140+语言支持与本地化离线能力,或将加速东南亚、非洲等新兴市场的AI平民化进程。

Adobe联手密歇根大学发布4D-LRM:革命性4D重建模型,1.5秒重建动态场景
Stable Diffusion Webgpu
X-Dyna – 字节联合斯坦福等高校推出的动画生成框架
育碧《孤岛惊魂7》秘密测试生成式AI遭曝光!曝料人称效果“烂透了”,押注NPC智能交互能否翻盘?
Vidu Q2重磅发布:生数科技新一代AI“演技生成”模型,秒级运镜+微表情黑科技引爆AIGC革命
TAGGED:Gemma 4多模态大模型开源大模型端侧AI谷歌大模型
分享
Email 复制链接 打印
Share
上一篇 InternSVG:上海AI Lab统一SVG建模套件发布,覆盖理解、编辑与生成,性能全面超越GPT-4o
下一篇 阿里Qwen3.6-Plus发布:百万上下文+超低参数量,编码智能体性能直逼Claude 4.5 Opus
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

流光脑波AI大脑占位特色图
2026年3月美国AI榜单巨变:Claude单月狂飙130%紧追ChatGPT,格局突变信号已现
AIGC 资讯 最新趋势
得物实战揭秘:AI Coding工具如何突破数仓开发’失忆’痛点,Harness工程引领新范式
AI 工具 AIGC 资讯
全息流体渐变通用占位特色图
历史性和解!Meta妥协规避审判,美国首例学校诉社交媒体成瘾案落幕,揭示行业司法风向
AIGC 资讯
量子芯片科技感占位特色图
Spotify与环球音乐联手:AI翻唱混音工具上线,正版版权终结Suno野蛮生长
AI 工具 AIGC 资讯 最新趋势

相关推荐

AIGC 资讯

Seed1.5-VL – 字节跳动Seed推出的视觉语言多模态大模型

站外新闻
AI 工具AIGC 资讯

商汤「日日新V6.5」多模态推理大模型发布:推理成本暴降70%,性能超Gemini 2.5 Pro

站外新闻
AIGC 具身智能 商汤科技 多模态推理 日日新大模型
AI 工具AIGC 资讯

快手开源Auto Think大模型:自动切换快慢思考,告别AI过度推理,代码数学任务得分飙升20分

站外新闻
AI推理 Auto Think 强化学习 快手
AI 工具AIGC 资讯

Claude Sonnet 4.5 来了:Anthropic最强编程AI模型,连续工作超30小时,性能全面碾压

站外新闻
AI编程模型 Anthropic Claude Sonnet 4.5
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.