Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版
AIGC 资讯

Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版

站外新闻
最近更新: 2026年6月8日 上午10:02
SHARE

Gemma 3 QAT是什么

Gemma 3 QAT(Quantization-Aware Training)是谷歌推出的最新一代开源模型,是Gemma 3 的量化优化版本。通过量化感知训练技术,Gemma 3 QAT 在显著降低内存需求的同时,保持了高质量的性能。 Gemma 3 27B 的显存需求从 54GB 降低到 14.1GB,能够在消费级 GPU(如 NVIDIA RTX 3090)上本地运行。Gemma 3 12B 的显存需求从 24GB 降至 6.6GB,可以在笔记本电脑的 NVIDIA RTX 4060 GPU 上高效运行。使更多用户能在普通硬件上体验强大的 AI 功能。

阅读目录
  • Gemma 3 QAT是什么
  • Gemma 3 QAT的主要功能
  • Gemma 3 QAT的技术原理
  • Gemma 3 QAT的项目地址
  • Gemma 3 QAT的应用场景

Gemma 3 QAT

Gemma 3 QAT的主要功能

  • 显著降低显存需求:通过量化感知训练技术,Gemma 3 QAT 大幅减少了模型的显存占用。
    • Gemma 3 27B:显存需求从 54GB(BF16)降至 14.1GB(int4),使其能够在 NVIDIA RTX 3090(24GB VRAM)等消费级 GPU 上运行。
    • Gemma 3 12B:显存需求从 24GB(BF16)降至 6.6GB(int4),可在笔记本电脑的 NVIDIA RTX 4060(8GB VRAM)上高效运行。
    • 更小版本(4B、1B):甚至可以在手机等资源受限的设备上运行。
  • 保持高性能:Gemma 3 QAT 仍能保持与 BF16 原生模型相近的性能:在 Chatbot Arena Elo 分数上,Gemma 3 QAT 的量化版本仍具有竞争力,与顶尖语言模型相比毫不逊色。使用 QAT 技术,谷歌在约 5000 步的训练中,将困惑度下降幅度减少了 54%,确保模型在量化后仍能保持高准确性。
  • 多模态能力:支持处理图像输入和文本生成,适用于视觉问答(VQA)和文档分析等任务。
  • 长上下文支持:具备 128,000-token 的上下文窗口,通过混合注意力机制(本地滑动窗口注意力与全局注意力)优化,降低了 KV 缓存的内存占用。
  • 硬件支持:Gemma 3 QAT 可在多种消费级硬件上运行,包括桌面 GPU、笔记本 GPU 和边缘设备。
  • 框架支持:支持 Ollama、LM Studio、llama.cpp、MLX 等主流推理框架,用户可以轻松在不同平台上部署。

Gemma 3 QAT的技术原理

  • 伪量化操作:在训练的前向传播中,模型会通过“伪量化”节点模拟低精度运算,将权重和激活值四舍五入到量化后的值。
  • 高精度反向传播:在反向传播时,模型仍然使用高精度浮点数计算梯度,确保权重更新的准确性。
  • 训练与量化结合:通过这种方式,模型在训练阶段就学会了如何在低精度环境下保持性能,在实际量化后,精度损失极小。
  • KV 缓存优化:通过稀疏缓存和动态压缩技术,进一步降低长上下文任务中的内存占用。
  • 硬件加速:支持 SIMD 指令集优化,如 AVX512 和 NEON,使得推理速度提升 3 倍。

Gemma 3 QAT的项目地址

  • 项目官网:Gemma 3 QAT
  • HuggingFace模型库:https://huggingface.co/collections/google/gemma-3-qat

Gemma 3 QAT的应用场景

  • 视觉问答(VQA):Gemma 3 QAT 在多模态任务中表现出色,量化版本在 DocVQA 等任务上的性能接近 FP16。
  • 文档分析:支持长上下文窗口(128K tokens),适用于文档分析等需要处理大量文本的任务。
  • 长文本生成:通过 KV 缓存优化和分组查询注意力(GQA),Gemma 3 QAT 在 128K 上下文窗口下内存占用降低 40%,推理速度提升 1.8 倍。
  • 长序列推理:适用于需要处理长序列的任务,如长文档分析和复杂的语言模型推理。
  • 边缘设备部署:Gemma 3 QAT 的 1B 版本(529MB)可以在 Android 或 Web 端离线运行,延迟低至 10ms,适合隐私敏感场景(如医疗、金融)。
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
II-Agent – Intelligent Internet开源的通用AI Agent框架
Aether – 上海 AI Lab 开源的生成式世界模型
AnimeGamer – 腾讯联合香港城市大学推出的动漫生活模拟系统
Archon – 开源 AI 智能体框架,自主生成代码构建 AI 智能体
分享
Email 复制链接 打印
Share
上一篇 Llasa TTS – 香港科技大学开源的文本转语音模型
下一篇 全息流体渐变通用占位特色图 从基本变量预测到复杂现象死磕!全球海洋现象智能预报大模型“琅琊”2. 0 正式发布
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

快手OneRec:颠覆传统推荐!端到端生成式AI系统引爆观看时长与GMV
AI 工具 AIGC 资讯
Kimi-Researcher:月之暗面端到端强化学习Agent,深度研究基准测试超Claude 4 Opus
AI 工具 AIGC 资讯
华为盘古大模型5.5震撼发布:7180亿参数Ultra MoE领衔,五大模型重塑产业智能
AI 工具 AIGC 资讯
腾讯清华重磅开源MindOmni:强化学习驱动的多模态推理生成模型,重塑视觉AI边界
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

AvatarGO – 南洋理工联合上海 AI Lab 等推出的4D人体与物体交互生成框架

站外新闻
AI 工具AIGC 资讯

DeepMind推出CoF:视频模型的‘思维链’,让AI像人一样逐帧思考解决视觉难题

站外新闻
CoF deepmind 多模态大模型 视觉推理 视频生成
AIGC 资讯

NEXUS-O – 多模态AI模型,实现对语言、音频和视觉全方位感知与交互

站外新闻
AI 工具AIGC 资讯

阿里通义Qwen-TTS语音合成模型发布:支持中英文、方言与流式输出,助力智能交互新时代

站外新闻
AIGC TTS 语音合成 阿里通义
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.