Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Gamma-World – 英伟达推出的多智能体世界模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Gamma-World – 英伟达推出的多智能体世界模型
AIGC 资讯

Gamma-World – 英伟达推出的多智能体世界模型

站外新闻
最近更新: 2026年6月7日 下午6:03
SHARE

Gamma-World是什么

Gamma-World 是 NVIDIA 推出的多智能体世界模型,能解决多个智能体在同一个模拟世界中平等交互、全局一致的问题。模型创新性地采用单纯形旋转编码保证智能体身份对称,配合稀疏枢纽注意力将通信复杂度从平方降至线性,实现实时、可扩展的多视角视频生成。模型能从双人交互零样本泛化至多人协作,是构建可交互虚拟世界的重要突破。

阅读目录
  • Gamma-World是什么
  • Gamma-World的主要功能
  • Gamma-World的技术原理
  • 如何使用Gamma-World
  • Gamma-World的核心优势
  • Gamma-World的项目地址
  • Gamma-World的应用场景

Gamma-World

Gamma-World的主要功能

  • 多智能体平等共融:支持任意数量的智能体在同一个动态世界中独立行动且平等交互,无需预设主从关系或固定身份。
  • 同步多视角视频生成:可同时生成多个视角一致、物理合理的视频帧序列,准确模拟智能体间的空间遮挡与因果互动。
  • 零样本泛化至未见数量:在双人交互数据上训练,无需微调即可直接生成四人甚至更多智能体的协同画面。
  • 实时交互级推理:通过工程优化达到24 FPS的实时生成速度,关键质量指标(FVD)相比基线模型平均降低40%以上。

Gamma-World的技术原理

  • 单纯形旋转智能体编码:采用高维空间中的正则单纯形顶点映射每个智能体,由于任意两顶点几何距离相等,每个智能体都获得了独特但完全等价的“身份”。无须任何可学习参数的编码方案,从原理上保证所有智能体的地位平等和置换对称性。
  • 稀疏枢纽注意力机制:引入一组可学习的共享“枢纽令牌”(hub token)作为所有智能体的信息中转站。每个智能体只需与枢纽令牌交互,形成 智能体→枢纽→智能体的两跳通信路径。轮辐式拓扑结构是降低计算复杂度的关键,将跨智能体的全连接稠密交互,变为稀疏、可控的线性交互。

如何使用Gamma-World

  • 获取代码:访问 Gamma-World 项目主页并克隆其 GitHub 仓库。
  • 配置环境:按 requirements.txt 安装 Python 与 PyTorch 依赖,准备 24GB 以上显存的 GPU。
  • 下载权重:从官方链接获取预训练模型文件,如 gamma_world_2agent.pth。
  • 运行生成:执行示例脚本,指定智能体数量与提示,输出多视角交互视频。
  • 自行训练:准备多智能体数据集,按三阶段策略启动训练脚本。

Gamma-World的核心优势

  • 突破性泛化能力:在双人数据上训练,可零样本生成四人甚至更多智能体的协同交互画面。
  • 线性计算复杂度:通过稀疏枢纽注意力,将多智能体通信从平方级降为线性级,8人场景计算量仅为传统方案的1/16。
  • 实时交互性能:达到24 FPS的推理速度,且生成质量(FVD)比基线平均降低40%以上。
  • 通用架构设计:无需可学习参数的单纯形编码保证智能体平等对称,可无缝适配游戏、机器人等不同领域。

Gamma-World的项目地址

  • 项目官网:https://research.nvidia.com/labs/sil/projects/gamma-world/
  • GitHub仓库:https://github.com/nv-tlabs/Gamma-World
  • arXiv技术论文:https://arxiv.org/pdf/2605.28816

Gamma-World的应用场景

  • 多人游戏开发:作为开放世界游戏的生成引擎,实时生成 NPC 与玩家间的复杂互动,支持动态剧情与多视角过场动画。
  • 机器人协同训练:在虚拟环境中模拟双臂或多机器人协作,生成无限多样、物理一致的训练数据,降低真实实验成本。
  • 自动驾驶仿真:同时模拟多辆智能车辆及行人的交互行为,生成多视角的交通场景,用于算法测试与安全评估。
  • 影视与虚拟制片:根据剧本提示自动生成多个角色在同一场景中的同步表演画面,辅助预可视化或创意扩展。
  • 具身智能研究:为家庭服务、仓库物流等多智能体任务提供高保真的“数字沙盘”,支持策略学习与 zero-shot 泛化测试。
Scenethesis – 英伟达推出的交互式3D场景生成框架
港股AI大模型板块狂飙:MiniMax涨8%、智谱跟涨5%,双子星引领行业投资新风向
GLM-TTS重磅开源:智谱AI发布声音克隆与情感语音合成模型,重塑多行业应用
StockMixer – 上海交大推出的股票价格预测架构
商汤开源 SenseNova-Skills:20+ 模块化 AI 办公技能,一键驱动 Agent 完成 PPT/Excel/信息图全流程
分享
Email 复制链接 打印
Share
上一篇 PaddleOCR-VL-1.6 – 百度推出的文档解析视觉语言模型
下一篇 ECC – 开源的跨平台 AI Agent 性能优化系统
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

华为盘古大模型5.5震撼发布:7180亿参数Ultra MoE领衔,五大模型重塑产业智能
AI 工具 AIGC 资讯
腾讯清华重磅开源MindOmni:强化学习驱动的多模态推理生成模型,重塑视觉AI边界
AI 工具 AIGC 资讯
联影智能发布‘元智’医疗大模型:多模态融合,一次CT扫描诊断37种疾病
AI 工具 AIGC 资讯
Dive3D重磅发布:北大x小红书联手破解文本生成3D多样性难题,SIM损失取代KL散度实现模式突破
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

快手Kwaipilot开源KAT-Dev-32B:SWE-Bench排名第五,62.4%解决率重塑AI编程

站外新闻
KAT-Dev-32B SWE-Bench 代码大模型 强化学习 快手Kwaipilot
AIGC 资讯

Kimina-Prover – 月之暗面联合 Numina 推出的数学定理证明模型

站外新闻
AIGC 资讯

Kiss3DGen – 基于图像扩散模型的3D资产生成框架

站外新闻
AIGC 资讯

AI芯片短缺危机!SpaceX Terafab晶圆厂成败难料,或重塑太空AI格局

站外新闻
AI芯片 SpaceX Terafab晶圆厂 半导体供应链 特斯拉
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.