Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: VidSketch – 浙江大学推出的视频动画生成框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > VidSketch – 浙江大学推出的视频动画生成框架
AIGC 资讯

VidSketch – 浙江大学推出的视频动画生成框架

站外新闻
最近更新: 2026年6月8日 上午10:40
SHARE

VidSketch是什么

VidSketch 是浙江大学 CAD&CG 国家重点实验室和软件学院推出的创新视频生成框架,根据手绘草图和简单文本提示生成高质量的视频动画。VidSketch基于“层级草图控制策略”动态调整草图的引导强度,适应不同绘画技能的用户,借助“时空注意力机制”增强视频的时空一致性,解决帧间连贯性问题。VidSketch 降低了视频创作的技术门槛,让普通用户轻松实现高质量动画创作,满足多样化的艺术需求。

阅读目录
  • VidSketch是什么
  • VidSketch的主要功能
  • VidSketch的技术原理
  • VidSketch的项目地址
  • VidSketch的应用场景

VidSketch

VidSketch的主要功能

  • 高质量视频动画生成:支持从手绘草图和简单文本描述中生成高质量、时空连贯的视频动画。
  • 适应不同绘画技能:自动评估草图的抽象程度,动态调整生成过程中的引导强度,适应从新手到专业用户的绘画水平。
  • 时空一致性增强:提升视频帧间的连贯性和流畅性,避免撕裂或闪烁问题。
  • 多样化风格支持:支持多种视觉风格(如现实主义、奇幻风格、像素艺术等),满足不同用户的审美需求。
  • 低门槛创作:无需专业视频编辑技能,普通用户轻松创作高质量的视频动画。

VidSketch的技术原理

  • 基于扩散模型的视频生成:用视频扩散模型(Video Diffusion Models, VDMs)作为基础框架。扩散模型基于逐步去除噪声生成图像或视频,VidSketch 将这一过程扩展到视频生成中,同时引入时空一致性控制。
  • 层级草图控制策略:基于定量分析草图的连续性、连通性和纹理细节,评估草图的抽象程度,根据抽象程度动态调整草图在生成过程中的引导强度。确保用户提供的草图非常抽象,生成的视频也能保持高质量和一致性。
  • 时空注意力机制:
  • 为解决视频帧间连贯性问题,VidSketch 引入时空注意力机制。基于当前帧的查询(Q)与前一帧、第二帧和第一帧的关键/值(K/V)计算注意力权重,增强视频帧间的时空一致性,避免生成的视频出现撕裂或闪烁。
  • 草图与文本的协同引导:用户输入的手绘草图和文本提示共同引导视频生成。草图提供视觉结构,文本提示提供语义信息,两者的结合使生成的视频符合草图的视觉布局,满足文本描述的内容。

VidSketch的项目地址

  • 项目官网:https://csfufu.github.io/vid_sketch
  • GitHub仓库:https://github.com/CSfufu/VidSketch
  • arXiv技术论文:https://arxiv.org/pdf/2502.01101v1

VidSketch的应用场景

  • 创意设计:设计师用手绘草图和简单文字生成创意视频,快速实现设计构思。
  • 教学辅助:教师用草图和教学内容生成教学动画,帮助学生更直观地理解知识。
  • 广告制作:营销人员用草图和产品描述生成广告视频,高效制作吸引人的广告内容。
  • 社交媒体:内容创作者用草图和创意文字生成个性化的视频,提升社交媒体的互动性。
  • 动画与影视:动画师用草图快速生成动画原型,验证创意,提高制作效率。
击败谷歌Meta登顶MLE-bench!ML-Master 2.0:国产DeepSeek驱动的自主机器学习智能体,开启AI科研新范式
StreamBridge – 苹果联合复旦推出的端侧视频大语言模型框架
AgentCPM-GUI – 清华联合面壁智能开源的端侧GUI智能体模型
奔腾4惊现AI复活赛!2006年古董CPU硬扛Meta Llama 3大模型,每秒仅0.21 Token背后藏何玄机?
MAGI-1 – Sand AI 开源的首个自回归视频生成模型
分享
Email 复制链接 打印
Share
上一篇 卢伟冰剧透发布会彩排:小米17T系列将登场,机器人互动成瞩目亮点
下一篇 EasyControl Ghibli – 免费生成吉卜力风格图像的 AI 模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

联影智能发布‘元智’医疗大模型:多模态融合,一次CT扫描诊断37种疾病
AI 工具 AIGC 资讯
Dive3D重磅发布:北大x小红书联手破解文本生成3D多样性难题,SIM损失取代KL散度实现模式突破
AI 工具 AIGC 资讯
PreenCut开源AI视频剪辑工具:基于WhisperX与大模型,实现自然语言秒搜定位,高效视频剪辑新革命
AI 工具 AIGC 资讯
阿里达摩院「灵枢」大模型:12种医学影像秒级分析,性能碾压GPT-4.1,开源引爆医疗AI新浪潮
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

群核科技SpatialLM 1.5深度解析:用自然语言秒生3D场景,重塑室内设计与机器人训练

站外新闻
3D场景生成 SpatialLM 1.5 大语言模型 机器人训练 群核科技
AIGC 资讯

Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版

站外新闻
AIGC 资讯

ArtCrafter – 清华联合鹏城实验室和联想共同推出的文本到图像风格迁移框架

站外新闻
AI 工具AIGC 资讯

Decart AI发布Lucy 2:实时视频生成模型实现1080p/30fps零延迟编辑,重塑AIGC内容创作与机器人训练

站外新闻
AIGC Decart AI Lucy 2 实时视频生成 机器人训练
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.