Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版
AIGC 资讯

Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版

站外新闻
最近更新: 2026年6月8日 上午10:02
SHARE

Gemma 3 QAT是什么

Gemma 3 QAT(Quantization-Aware Training)是谷歌推出的最新一代开源模型,是Gemma 3 的量化优化版本。通过量化感知训练技术,Gemma 3 QAT 在显著降低内存需求的同时,保持了高质量的性能。 Gemma 3 27B 的显存需求从 54GB 降低到 14.1GB,能够在消费级 GPU(如 NVIDIA RTX 3090)上本地运行。Gemma 3 12B 的显存需求从 24GB 降至 6.6GB,可以在笔记本电脑的 NVIDIA RTX 4060 GPU 上高效运行。使更多用户能在普通硬件上体验强大的 AI 功能。

阅读目录
  • Gemma 3 QAT是什么
  • Gemma 3 QAT的主要功能
  • Gemma 3 QAT的技术原理
  • Gemma 3 QAT的项目地址
  • Gemma 3 QAT的应用场景

Gemma 3 QAT

Gemma 3 QAT的主要功能

  • 显著降低显存需求:通过量化感知训练技术,Gemma 3 QAT 大幅减少了模型的显存占用。
    • Gemma 3 27B:显存需求从 54GB(BF16)降至 14.1GB(int4),使其能够在 NVIDIA RTX 3090(24GB VRAM)等消费级 GPU 上运行。
    • Gemma 3 12B:显存需求从 24GB(BF16)降至 6.6GB(int4),可在笔记本电脑的 NVIDIA RTX 4060(8GB VRAM)上高效运行。
    • 更小版本(4B、1B):甚至可以在手机等资源受限的设备上运行。
  • 保持高性能:Gemma 3 QAT 仍能保持与 BF16 原生模型相近的性能:在 Chatbot Arena Elo 分数上,Gemma 3 QAT 的量化版本仍具有竞争力,与顶尖语言模型相比毫不逊色。使用 QAT 技术,谷歌在约 5000 步的训练中,将困惑度下降幅度减少了 54%,确保模型在量化后仍能保持高准确性。
  • 多模态能力:支持处理图像输入和文本生成,适用于视觉问答(VQA)和文档分析等任务。
  • 长上下文支持:具备 128,000-token 的上下文窗口,通过混合注意力机制(本地滑动窗口注意力与全局注意力)优化,降低了 KV 缓存的内存占用。
  • 硬件支持:Gemma 3 QAT 可在多种消费级硬件上运行,包括桌面 GPU、笔记本 GPU 和边缘设备。
  • 框架支持:支持 Ollama、LM Studio、llama.cpp、MLX 等主流推理框架,用户可以轻松在不同平台上部署。

Gemma 3 QAT的技术原理

  • 伪量化操作:在训练的前向传播中,模型会通过“伪量化”节点模拟低精度运算,将权重和激活值四舍五入到量化后的值。
  • 高精度反向传播:在反向传播时,模型仍然使用高精度浮点数计算梯度,确保权重更新的准确性。
  • 训练与量化结合:通过这种方式,模型在训练阶段就学会了如何在低精度环境下保持性能,在实际量化后,精度损失极小。
  • KV 缓存优化:通过稀疏缓存和动态压缩技术,进一步降低长上下文任务中的内存占用。
  • 硬件加速:支持 SIMD 指令集优化,如 AVX512 和 NEON,使得推理速度提升 3 倍。

Gemma 3 QAT的项目地址

  • 项目官网:Gemma 3 QAT
  • HuggingFace模型库:https://huggingface.co/collections/google/gemma-3-qat

Gemma 3 QAT的应用场景

  • 视觉问答(VQA):Gemma 3 QAT 在多模态任务中表现出色,量化版本在 DocVQA 等任务上的性能接近 FP16。
  • 文档分析:支持长上下文窗口(128K tokens),适用于文档分析等需要处理大量文本的任务。
  • 长文本生成:通过 KV 缓存优化和分组查询注意力(GQA),Gemma 3 QAT 在 128K 上下文窗口下内存占用降低 40%,推理速度提升 1.8 倍。
  • 长序列推理:适用于需要处理长序列的任务,如长文档分析和复杂的语言模型推理。
  • 边缘设备部署:Gemma 3 QAT 的 1B 版本(529MB)可以在 Android 或 Web 端离线运行,延迟低至 10ms,适合隐私敏感场景(如医疗、金融)。
杭州全息智能技术研究院揭牌六大AI联合实验室,打造产学研融合新引擎
OpenAI广告平台全面开放:免费ChatGPT用户成精准流量池,CPC定价与投放策略全解析
OpenAI重磅发布ChatGPT for PowerPoint插件:一句话生成PPT,智能分析揪出逻辑Bug,彻底重塑职场效率
Zoom投资Anthropic回报超13亿美元!AI浪潮下企业战略布局深度解析
TripoSG – VAST AI 开源的高保真 3D 形状合成技术
分享
Email 复制链接 打印
Share
上一篇 Llasa TTS – 香港科技大学开源的文本转语音模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Llasa TTS – 香港科技大学开源的文本转语音模型
AIGC 资讯
Gemini 2.0 Flash – Google推出的多模态 AI 模型
AIGC 资讯
Absolute Zero – 清华大学等机构推出的语言模型推理训练方法
AIGC 资讯
BizGen – 清华大学联合微软推出的AI信息图生成工具
AIGC 资讯

相关推荐

量子芯片科技感占位特色图
AI 工具AIGC 资讯

OpenClaw 工程师紧急警告:AI 生成代码质量隐患与开发成本危机

站外新闻
AI生成代码 OpenClaw 初创公司 安全隐患 开发成本
AI 工具AIGC 资讯

OpenAI开源Symphony:彻底解放工程师的AI Agent编排系统,自动化从编码到部署全流程

站外新闻
Agent编排 AIGC工具 openai Symphony 自动化开发
流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

万亿估值前夜!Anthropic IPO前最后一轮融资650亿美元,直逼OpenAI资本巅峰

站外新闻
AI融资 Anthropic IPO openai
AIGC 资讯

GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.