Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: FlexiAct – 清华联合腾讯推出的动作迁移模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > FlexiAct – 清华联合腾讯推出的动作迁移模型
AIGC 资讯

FlexiAct – 清华联合腾讯推出的动作迁移模型

站外新闻
最近更新: 2026年6月8日 下午12:29
SHARE

FlexiAct是什么

FlexiAct是清华大学和腾讯ARC实验室联合推出的新型动作迁移模型。FlexiAct能在给定目标图像的情况下,将参考视频中的动作迁移到目标主体上,在空间结构差异较大或跨域的异构场景中,实现精准的动作适配与外观一致性。模型引入轻量级的RefAdapter模块和频率感知动作提取(FAE)模块,解决现有方法在布局、视角和骨架结构差异方面的限制,保持身份一致性。FlexiAct在人物和动物的动作迁移上均表现出色,具有广泛的应用前景。

阅读目录
  • FlexiAct是什么
  • FlexiAct的主要功能
  • FlexiAct的技术原理
  • FlexiAct的项目地址
  • FlexiAct的应用场景

FlexiAct

FlexiAct的主要功能

  • 跨主体动作迁移:支持将动作从一个人物迁移到另一个人物,或从人物迁移到动物。
  • 保持外观一致性:在迁移动作的同时,确保目标主体的外观(如服装、发型等)与原始目标图像保持一致。
  • 灵活的空间结构适配:在参考视频和目标图像在布局、视角和骨架结构上存在差异时,也能实现动作的自然迁移。

FlexiAct的技术原理

  • RefAdapter(空间结构适配器):RefAdapter 是轻量级的图像条件适配器,主要作用是解决参考视频和目标图像之间的空间结构差异问题。在训练过程中随机选择视频帧作为条件图像,最大化空间结构的差异性。让模型能适应不同的姿态、布局和视角,同时保持外观一致性。注入少量可训练参数(如LoRA模块),在CogVideoX-I2V的MMDiT层中实现灵活的空间适配,避免传统方法中严格的约束。
  • 频率感知动作提取:FAE 是创新的动作提取模块,直接在去噪过程中完成动作提取,不依赖于独立的时空架构。FAE 观察到在去噪的不同时间步中,模型对运动(低频)和外观细节(高频)的关注程度不同,在早期时间步中,模型更关注运动信息;在后期时间步中,模型更关注外观细节。FAE 基于动态调整注意力权重,优先在早期时间步提取运动信息,在后期时间步关注外观细节,实现精准的动作提取和控制。

FlexiAct的项目地址

  • 项目官网:https://shiyi-zh0408.github.io/projectpages/FlexiAct/
  • GitHub仓库:https://github.com/shiyi-zh0408/FlexiAct
  • HuggingFace模型库:https://huggingface.co/shiyi0408/FlexiAct
  • arXiv技术论文:https://arxiv.org/pdf/2505.03730

FlexiAct的应用场景

  • 影视制作:快速生成逼真的角色动作,减少拍摄成本。
  • 游戏开发:为游戏角色生成多样化动作,提升游戏体验。
  • 广告营销:生成虚拟代言人动作,增强广告吸引力。
  • 教育培训:生成教学和康复训练动作,辅助学习和恢复。
  • 娱乐互动:支持用户创作有趣视频,提升娱乐体验。
QwQ-32B – 阿里通义千问开源的最新推理模型
杭州全息智能技术研究院揭牌六大AI联合实验室,打造产学研融合新引擎
苹果俄亥俄州立大学联手发布FS-DFM扩散语言模型:8步生成媲美千步效果,速度飙升128倍
o1-pro – OpenAI 推出的升级版推理模型
MimiClaw开源:基于ESP32的超轻量AI助手,无需操作系统,隐私本地化引领边缘AI革命
分享
Email 复制链接 打印
Share
上一篇 RF-DETR – Roboflow推出的实时目标检测模型
下一篇 R1-Omni – 阿里通义开源的全模态大语言模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Self Forcing: Adobe与德克萨斯大学联合推出实时视频生成模型,单GPU实现17FPS,告别传统AI视频生成延迟
AI 工具 AIGC 资讯
腾讯AI Lab重磅开源SongGeneration:AI音乐生成大模型,多轨合成、风格克隆,媲美商业模型
AI 工具 AIGC 资讯
快手OneRec:颠覆传统推荐!端到端生成式AI系统引爆观看时长与GMV
AI 工具 AIGC 资讯
Kimi-Researcher:月之暗面端到端强化学习Agent,深度研究基准测试超Claude 4 Opus
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

智谱GLM-5开源发布:744B参数挑战Claude Opus,登顶全球开源大模型榜首

站外新闻
Agent GLM-5 国产算力 开源大模型 智谱AI
量子芯片科技感占位特色图
AI 工具AIGC 资讯

谷歌AI搜索强推遭反噬?用户涌向DuckDuckGo,隐私搜索迎来爆发增长

站外新闻
AI搜索 AI疲劳 DuckDuckGo 用户隐私 谷歌
AI 工具AIGC 资讯

上海AI实验室重磅开源VLAC:具身智能奖励大模型,让机器人在真实世界实现自主学习与快速适应

站外新闻
上海人工智能实验室 具身智能 强化学习 机器人
AIGC 资讯最新趋势

理想汽车发布MindVLA-o1:原生多模态VLA架构,定义自动驾驶与具身智能新范式

站外新闻
MindVLA-o1 VLA架构 具身智能 理想汽车 自动驾驶基础模型
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.