Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: VideoReward – 港中文、清华、快手等联合推出的视频生成偏好数据集及奖励模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > VideoReward – 港中文、清华、快手等联合推出的视频生成偏好数据集及奖励模型
AIGC 资讯

VideoReward – 港中文、清华、快手等联合推出的视频生成偏好数据集及奖励模型

站外新闻
最近更新: 2026年6月9日 上午10:53
SHARE

VideoReward是什么

VideoReward 是香港中文大学、清华大学、快手科技等联合创建的视频生成偏好数据集及奖励模型。包含182,000条标注数据,涵盖视觉质量、运动质量和文本对齐三个维度,用于优化视频生成模型。奖励模型基于人类反馈,通过多维度对齐算法(如Flow-DPO、Flow-RWR)和推理时技术(如Flow-NRG),显著提升视频生成的连贯性和文本对齐效果。Flow-NRG支持用户自定义权重,满足个性化需求。

阅读目录
  • VideoReward是什么
  • VideoReward的主要功能
  • VideoReward的技术原理
  • VideoReward的项目地址
  • VideoReward的应用场景

VideoReward

VideoReward的主要功能

  • 构建大规模偏好数据集:VideoReward包含182,000条标注数据,涵盖视觉质量(VQ)、运动质量(MQ)和文本对齐(TA)三个关键维度,用于捕捉用户对生成视频的偏好。
  • 多维度奖励模型:基于强化学习,VideoReward引入了三种对齐算法,包括训练时策略(如Flow-DPO和Flow-RWR)和推理时技术(如Flow-NRG),用于优化视频生成。
  • 个性化需求支持:Flow-NRG支持用户在推理时为多个目标分配自定义权重,满足个性化的视频质量需求。
  • 提升视频生成质量:通过人类反馈,VideoReward能显著提升视频生成的连贯性和与提示文本的对齐效果,优于现有的奖励模型。

VideoReward的技术原理

  • 对齐算法:VideoReward引入了三种对齐算法,这些算法扩展自扩散模型的方法,专门针对基于流的模型设计:
    • Flow-DPO(直接偏好优化):在训练阶段,直接优化模型以匹配人类偏好的视频对。
    • Flow-RWR(奖励加权回归):通过奖励加权的方式优化模型,使其更符合人类反馈。
    • Flow-NRG(噪声视频奖励引导):在推理阶段,直接将奖励引导应用于噪声视频,支持用户为多个目标分配自定义权重,满足个性化需求。
  • 人类反馈优化:通过人类反馈,VideoReward能显著提升视频生成的连贯性和与提示文本的对齐效果。实验结果表明,VideoReward在性能上优于现有的奖励模型,Flow-DPO相比Flow-RWR和标准监督微调方法表现更优。

VideoReward的项目地址

  • 项目官网:https://gongyeliu.github.io/videoalign/
  • arXiv技术论文:https://arxiv.org/pdf/2501.13918

VideoReward的应用场景

  • 视频生成质量优化:VideoReward 通过大规模人类偏好数据集和多维度奖励模型,显著提升了视频生成的质量,特别是在视觉质量、运动连贯性和文本对齐方面。
  • 个性化视频生成:VideoReward 的 Flow-NRG 技术支持用户在推理时为多个目标分配自定义权重,满足个性化的视频质量需求。
  • 视频生成模型的训练与微调:VideoReward 提供的多维度奖励模型和对齐算法(如 Flow-DPO 和 Flow-RWR)可用于训练和微调视频生成模型。
  • 用户偏好分析与研究:VideoReward 的大规模偏好数据集涵盖了视觉质量、运动质量和文本对齐等多个维度。
  • 视频内容创作与编辑:在视频内容创作和编辑领域,VideoReward 可以帮助生成更高质量的视频素材,提升创作效率。
VMix – 字节联合中科大推出增强模型生成美学质量的适配器
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
子曰-o1 – 网易有道推出国内首个输出分步式讲解的推理模型
能力与安全的博弈!OpenAI 上线 ChatGPT“封锁模式”,宁可断网也要防数据泄露
LLaVA-Rad – 微软推出的小型多模态模型,专注于临床放射学报告生成
分享
Email 复制链接 打印
Share
上一篇 PaSa – 字节跳动推出的学术论文检索智能体
下一篇 Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

大晓机器人Kairos 3.0-4B开源:全球首个端侧具身世界模型,推理速度提升72倍!
AI 工具 AIGC 资讯
Paperclip开源平台:用AI Agent组建「赛博公司」,自主运营降本增效新范式
AI 工具 最新趋势
斯坦福重磅开源OpenJarvis:本地AI智能体框架,隐私、成本、延迟全优化
AI 工具 AIGC 资讯
智谱AI发布GLM-5-Turbo:专为龙虾Agent优化,深度解决大模型工具调用与长任务失速难题
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

NMT – 阿里联合 UC Berkeley 推出的多任务学习框架

站外新闻
AIGC 资讯

Parakeet TDT 0.6B – 英伟达开源的自动语音识别模型

站外新闻
AIGC 资讯

ArtCrafter – 清华联合鹏城实验室和联想共同推出的文本到图像风格迁移框架

站外新闻
AIGC 资讯

MAI Transcribe-1.5 – 微软 MAI 推出的语音转文本模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI编程智能体 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 形式化验证 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.