Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Helios:北大字节联合开源,单卡H100实时生成分钟级长视频的革命性模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > Helios:北大字节联合开源,单卡H100实时生成分钟级长视频的革命性模型
AI 工具

Helios:北大字节联合开源,单卡H100实时生成分钟级长视频的革命性模型

站外新闻
最近更新: 2026年5月25日 下午10:30
AIGC 北京大学 字节跳动 实时生成 视频生成模型
SHARE

💡 站外导读:在AIGC浪潮席卷影视、广告和游戏产业的当下,高质量、长时序视频内容的生成效率与成本仍是核心瓶颈。传统模型受限于计算资源与推理速度,难以满足实时交互和规模化生产的需求。北京大学与字节跳动等机构联合推出的Helios模型,直面这一行业痛点,通过多项原创技术实现了在单张消费级H100 GPU上的分钟级长视频实时生成,为内容创作工业化和个人化带来了全新可能。

Helios是什么

Helios 是北京大学与字节跳动等联合推出的14B参数实时长视频生成模型,可在单张H100 GPU上以19.5 FPS生成分钟级视频。模型突破性地无需KV缓存、量化或因果掩码等常规加速技术,通过统一历史注入、深度压缩流和对抗分层蒸馏等创新,将计算成本降至1.3B模型水平。Helios原生支持文生视频、图生视频和视频续写,在质量与速度上均超越现有方案,代码与模型已开源。

阅读目录
  • Helios是什么
  • Helios的主要功能
  • Helios的技术原理
  • Helios的项目地址
  • Helios的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Helios

Helios的主要功能

  • 文本到视频:Helios支持文本到视频生成,根据文字描述直接生成高质量视频内容。
  • 图片到视频:Helios支持图像到视频生成,可将静态图片转化为动态视频。
  • 视频到视频:Helios支持视频到视频生成,能对已有视频进行续写或风格转换。
  • 交互生成:Helios支持实时交互式生成,允许用户在生成过程中动态修改提示词。
  • 长视频生成:Helios支持分钟级长视频生成,可稳定输出长达1440帧的连贯视频。

Helios的技术原理

  • 统一历史注入:Helios通过将历史帧与噪声帧拼接作为输入,把双向预训练模型改造为自回归生成器。历史帧时间步固定为0保持干净,噪声帧参与去噪,表示控制机制让同一架构自动适配三种任务模式——历史全零时为文生视频,仅末帧非零时为图生视频,任意历史帧非零时则为视频续写。
  • 引导注意力机制:Helios在自注意力层分别计算历史与噪声上下文的查询键值,通过头级放大令牌选择性调节历史信息强度;在交叉注意力层仅对噪声上下文注入文本语义,避免历史帧的语义重复叠加,解耦两类上下文的不同统计特性。
  • 简易抗漂移策略:Helios采用相对位置编码将时间索引范围固定,消除长视频生成的位置偏移;强制保留首帧作为全局视觉锚点抑制颜色漂移;在训练时对历史帧随机施加曝光调整、噪声添加或模糊等扰动,模拟推理时的误差累积,从源头消除重复运动。
  • 深度压缩流:Helios通过多期记忆分块将历史帧按远近采用不同压缩率,保持令牌预算恒定;采用金字塔统一预测校正器在多尺度潜空间分阶段采样,早期低分辨率确定全局结构,后期高分辨率细化细节,将14B模型的令牌计算量降至1.3B水平。
  • 对抗分层蒸馏:Helios用自回归教师模型为基准,分阶段反向仿真获取多尺度估计,通过动态重噪声调度实现课程式学习,引入对抗后训练突破教师模型性能上限,最终将采样步数从50步压缩至3步且无需分类器引导。

Helios的项目地址

  • 项目官网:https://pku-yuangroup.github.io/Helios-Page/
  • GitHub仓库:https://github.com/PKU-YuanGroup/Helios
  • HuggingFace模型库:https://huggingface.co/collections/BestWishYsh/helios
  • arXiv技术论文:https://arxiv.org/pdf/2603.04379

Helios的应用场景

  • 影视与广告制作:Helios的实时生成能力可大幅加速电影预告片、广告创意和动态分镜的制作流程,创作者能快速迭代视觉概念,将传统数小时的渲染时间缩短至分钟级。
  • 游戏与交互娱乐:作为世界模型的基础组件,Helios支持实时生成无限长度的游戏场景和动态环境,为开放世界游戏、虚拟 reality 体验和交互式叙事提供连贯的视觉内容流。
  • 社交媒体与内容创作:普通用户可用Helios将文字或图片瞬间转化为高质量短视频,降低专业视频制作门槛,赋能个人创作者快速产出电影级视觉内容。
  • 设计与原型验证:设计师能借助Helios的图生视频和视频续写功能,将静态设计稿转化为动态演示,实时预览产品动画效果,加速迭代反馈循环。

📝 站长洞察 (Editor’s Insight)

Helios的发布不仅仅是一个新模型的开源,它标志着视频生成技术正从“能用”走向“好用且普惠”的关键转折点。其核心价值在于三个层面的突破:第一,工程效率的跃迁,通过深度压缩流和对抗分层蒸馏,将14B大模型的推理成本压缩到1.3B的水平,这是将前沿研究推向商业落地的关键一步。第二,交互范式的创新,实时交互生成能力打破了传统单向生成的局限,为人机协同创作开辟了新路径。第三,架构设计的优雅,统一历史注入机制巧妙地将三种任务模式统一在一个框架内,展现了“第一性原理”式的技术思考。这预示着,未来的AIGC工具将不再仅仅是“黑箱生成器”,而是可定制、可干预、可实时反馈的“智能创作伙伴”。其开源举动,无疑将加速整个视频生成生态的成熟,催生出我们今天还无法想象的新应用和新职业。

Looti AI
Casper AI
Quicklines
Circleback
上海AI Lab开源Intern-S2-Preview:35B参数科学大模型,比肩万亿参数,首次实现晶体结构生成
TAGGED:AIGC北京大学字节跳动实时生成视频生成模型
分享
Email 复制链接 打印
Share
上一篇 开源免费!肉包Roubao:豆包手机助手平替,AI自动点外卖、发消息,无需Root
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

开源免费!肉包Roubao:豆包手机助手平替,AI自动点外卖、发消息,无需Root
AI 工具 AIGC 资讯
OpenAI开源Symphony:彻底解放工程师的AI Agent编排系统,自动化从编码到部署全流程
AI 工具 AIGC 资讯
JadeAI:开源AI简历生成器革新!拖拽编辑、智能优化、ATS匹配,一键打造高通过率简历
AI 工具
流光脑波AI大脑占位特色图
奥尔特曼最新反思:AI对白领岗位的冲击远低于预期,短期失业潮并未出现
AIGC 资讯 最新趋势

相关推荐

AI 工具AIGC 资讯

MiniMax发布MMX-CLI:专为AI Agent打造的全模态命令行神器,一键集成七大生成能力

站外新闻
AI Agent MiniMax MMX-CLI 全模态生成 自动化工作流
AI 工具

Gimme Summary AI

remaker
AI 工具

TinyWow

remaker
AI 工具

Lazy Cards

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent Agentic Coding AI AI Agent AIGC AI安全 AI工具 AI幻觉 AI搜索 AI智能体 AI生成内容 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐 Anthropic chatgpt Claude Claude Code Claude Mythos DALL-E3 DuckDuckGo excel Gemini MCP协议 meta Midjourney MiniMax MoE架构 NVIDIA openai Pika prompt Qwen3.7-Max Stability AI stable diffusion SWE-Bench 世界模型 丛林 人工智能 人物 具身智能 命令行工具 咒语 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 室内设计 家居 展台 建筑 建筑设计 开源 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 微软 提示词 支付宝 教程 新闻 早报 智能体 智能体编程 智谱AI 月之暗面 海报设计 清华大学 游戏 破碎 科幻 端侧AI 网络安全 背景 腾讯混元 视频生成模型 视频编辑 语音克隆 语音合成 谷歌 谷歌AI 赛博朋克 通义千问 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.