Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: GameFactory – 香港大学和快手联合推出的可泛化游戏场景框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > GameFactory – 香港大学和快手联合推出的可泛化游戏场景框架
AIGC 资讯

GameFactory – 香港大学和快手联合推出的可泛化游戏场景框架

站外新闻
最近更新: 2026年6月9日 上午3:18
SHARE

GameFactory是什么

GameFactory 是香港大学和快手科技联合提出的创新框架,解决游戏视频生成中的场景泛化难题。框架基于预训练的视频扩散模型,结合开放域视频数据和小规模高质量的游戏数据集,通过多阶段训练策略,实现动作可控的游戏视频生成。

阅读目录
  • GameFactory是什么
  • GameFactory的主要功能
  • GameFactory的技术原理
  • GameFactory的项目地址
  • GameFactory的应用场景

GameFactory的主要功能

  • 场景泛化能力:GameFactory 能生成多样化的游戏场景,不局限于单一风格或预设的场景。使生成的视频更具真实感和多样性。
  • 动作可控性:通过动作控制模块,GameFactory 可以实现对生成视频中角色或物体动作的精确控制。
  • 高质量数据集支持:为了支持动作可控的视频生成,GameFactory 采用了 GF-Minecraft 数据集。该数据集包含 70 小时的《我的世界》游戏视频,具有多样化的场景和详细的动作标注。
  • 交互式视频生成:GameFactory 支持生成无限长度的交互式游戏视频。用户可以通过输入指令或交互信号来控制视频内容的变化。

GameFactory的技术原理

  • 预训练视频扩散模型:GameFactory 基于在开放域视频数据上预训练的视频扩散模型,能生成多样化的游戏场景,突破了传统方法对特定游戏风格和场景的限制。
  • 三阶段训练策略
    • 第一阶段:使用 LoRA(Low-Rank Adaptation)对预训练模型进行微调,使其适应目标游戏领域,同时保留大部分原始参数。确保模型在开放域的泛化能力得以保留。
    • 第二阶段:冻结预训练参数和 LoRA,专注于训练动作控制模块,避免风格与控制信号之间的纠缠。目标是确保生成的视频能根据用户输入进行准确的动作控制。
    • 第三阶段:移除 LoRA 权重,保留动作控制模块参数,使系统能在各种开放域场景中生成受控的游戏视频,不局限于特定的游戏风格。
  • 动作控制模块:GameFactory 引入了动作控制模块,支持自回归动作控制,能生成无限长度的交互式游戏视频。
  • GF-Minecraft 数据集:为了支持动作可控的视频生成,研究团队发布了高质量的动作标注视频数据集 GF-Minecraft。数据集包含 70 小时的《我的世界》游戏视频,具有多样化的场景和详细的动作标注。数据集的设计满足了以下三个关键需求:
    • 可定制的动作:支持大规模、低成本的数据收集。
    • 无偏的动作序列:确保动作组合的多样性和低概率事件的覆盖。
    • 多样化的场景:通过预设的环境配置(如不同的生物群落、天气条件和时间段)增强场景多样性。

GameFactory的项目地址

  • 项目官网:https://vvictoryuki.github.io/gamefactory
  • arXiv技术论文:https://arxiv.org/pdf/2501.08325

GameFactory的应用场景

  • 游戏开发:GameFactory 通过预训练的视频扩散模型和动作控制模块,能生成多样化的游戏场景和交互式视频内容。
  • 游戏内容创新:GameFactory 的开放域生成能力使其能够突破传统游戏引擎的限制,创造出全新的游戏风格和场景。
  • 自动驾驶:其动作控制模块和场景生成能力可以用于模拟自动驾驶环境,生成多样化的驾驶场景。
  • 具身智能(Embodied AI):通过生成多样化的交互场景,为具身智能的研究提供支持。
MT-MegatronLM – 摩尔线程开源的混合并行训练框架
LCVD – 川大推出的光照可控肖像动画生成框架
OmniTalker – 阿里推出的实时文本驱动说话头像生成框架
OpenMemory MCP – 基于MCP协议的本地AI记忆共享工具
HoloTime – 北大联合鹏城实验室推出的全景4D场景生成框架
分享
Email 复制链接 打印
Share
上一篇 Prometheus – 浙大联合蚂蚁等高校推出的3D感知潜在扩散模型
下一篇 DiffuEraser – 阿里通义实验室推出的视频修复模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

DiffuEraser – 阿里通义实验室推出的视频修复模型
AIGC 资讯
Prometheus – 浙大联合蚂蚁等高校推出的3D感知潜在扩散模型
AIGC 资讯
Step1X-3D – 阶跃星辰联合LightIllusions开源的3D资产生成框架
AIGC 资讯
FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架
AIGC 资讯

相关推荐

AI 工具AIGC 资讯

Models.dev 开源了!一站式 AI 模型数据库,开发者选型成本估算终极指南

站外新闻
AI模型数据库 OpenCode团队 开发者工具 成本估算 模型选型
AIGC 资讯

YAYI-Ultra – 中科闻歌推出的混合专家模型

站外新闻
AIGC 资讯

MoshiVis – Kyutai 开源的多模态实时语音模型

站外新闻
AI 工具AIGC 资讯

4秒生成百万面!Hyper3D Rodin Gen-2.5发布全球首个千万面级3D生成AI模型

站外新闻
3D生成AI AIGC Hyper3D Rodin Gen-2.5 SIGGRAPH 2025
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.