Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 腾讯AI Lab发布SongBloom:全长度AI歌曲生成模型,10秒样本生成2分半高质量音乐
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 腾讯AI Lab发布SongBloom:全长度AI歌曲生成模型,10秒样本生成2分半高质量音乐
AI 工具AIGC 资讯

腾讯AI Lab发布SongBloom:全长度AI歌曲生成模型,10秒样本生成2分半高质量音乐

站外新闻
最近更新: 2026年6月7日 下午8:16
AIGC AI音乐生成 开源模型 扩散模型 腾讯AI Lab
SHARE

💡 站外导读:随着AIGC技术的爆发,AI音乐生成正从“玩具”走向实用工具,但如何生成结构完整、音质卓越的全长度歌曲仍是巨大挑战。腾讯AI Lab最新推出的SongBloom框架,通过创新的“交错生成”技术,结合自回归与扩散模型,一举解决了这一痛点。用户只需提供10秒样本和歌词,就能获得长达2分30秒的专业级歌曲,这标志着AI音乐创作进入了新的实用化阶段。

SongBloom是什么

SongBloom 是腾讯 AI Lab 开发的全长度歌曲生成框架,结合了自回归草图绘制和基于扩散的细化技术,通过交错生成范式(Interleaved Generation)交替生成语义和声学上下文,生成高质量的完整歌曲。模型只需输入 10 秒音频样本和对应歌词,即可生成长达 2 分 30 秒的双通道、48kHz 音频。SongBloom 在音频质量和歌词准确性方面表现出色,接近领域最佳水平(SOTA),已成功开源。

阅读目录
  • SongBloom是什么
  • SongBloom的主要功能
  • SongBloom的技术原理
  • SongBloom的项目地址
  • SongBloom的应用场景
      • 📝 站长洞察 (Editor’s Insight)

SongBloom

SongBloom的主要功能

  • 高效歌曲生成:仅需 10 秒音频样本和对应歌词,即可生成长达 2 分 30 秒的完整歌曲,支持双通道、48kHz 高质量音频输出。
  • 创新生成范式:采用交错生成范式,结合自回归草图绘制和基于扩散的细化技术,交替生成语义和声学上下文,优化歌曲整体结构和音质。
  • 卓越音质与准确性:在音频质量和歌词准确性方面表现出色,接近领域最佳水平(SOTA),超越现有开源模型。
  • 开源与易用性:项目已开源,提供详细的使用指南和多种模型版本,支持低显存设备运行,方便用户快速上手。
  • 广泛的应用前景:为音乐创作、音频制作等领域提供了强大的工具,能够显著提升创作效率,激发音乐创作的新灵感。

SongBloom的技术原理

  • 交错生成范式:通过交替生成语义和声学上下文,动态切换生成过程,优化歌曲整体结构和音质。
  • 自回归草图绘制:利用自回归模型生成音乐草图,确保结构连贯性和音素对齐。
  • 扩散模型细化:结合扩散模型对生成的草图进行高保真细化,提升音频质量。
  • 离散与连续输出结合:使用离散的 sketch token 和 VAE latent 输出最终结果,兼顾结构和音质。
  • 多模态输入融合:输入包含歌词和音频样本,模型通过多模态融合实现精准生成。

SongBloom的项目地址

  • Github仓库:https://github.com/tencent-ailab/SongBloom
  • HuggingFace模型库:https://huggingface.co/CypressYang/SongBloom
  • arXiv技术论文:https://arxiv.org/pdf/2506.07634
  • 在线体验Demo:https://cypress-yang.github.io/SongBloom_demo/

SongBloom的应用场景

  • 音乐创作:为音乐人和创作者提供灵感,快速生成高质量的歌曲基础框架,帮助他们探索新的音乐风格和创作方向。
  • 音频制作:在影视、游戏、广告等行业的音频制作中,用于快速生成背景音乐或主题曲,提升制作效率。
  • 教育领域:作为音乐教育工具,帮助学生理解音乐结构和创作过程,激发学习兴趣。
  • 娱乐产业:在社交媒体、短视频等平台,为用户生成个性化的音乐内容,增强互动性和趣味性。
  • 商业应用:为企业和品牌生成定制化的音乐,用于产品推广、活动宣传等,提升品牌影响力。

📝 站长洞察 (Editor’s Insight)

SongBloom的发布不仅是技术上的突破,更揭示了AIGC领域下一个核心战场:高质量、长序列内容生成。它采用的“自回归草图+扩散细化”范式,巧妙地平衡了结构连贯性与音频保真度,这为解决视频、3D等领域的长程生成难题提供了新思路。更值得关注的是,腾讯将如此先进的模型开源,意在加速生态建设,这与当前大厂间“开放生态”的竞争策略不谋而合。可以预见,集成此类能力的AIGC平台,将彻底重塑游戏、影视、短视频行业的音频生产流程,催生全新的创作范式和商业模式。

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
腾讯「代号Craft」重磅发布:AIGC如何让「人人皆可开发游戏」成为现实?
OpenAI发布GPT Image 1.5:图像生成速度快4倍、API成本降20%,精准编辑功能全面解析
PhotoDoodle – 字节联合新加坡国立大学等推出的艺术化图像编辑框架
Keye-VL-2.0-30B-A3B – 快手开源的自研多模态大模型
TAGGED:AIGCAI音乐生成开源模型扩散模型腾讯AI Lab
分享
Email 复制链接 打印
Share
上一篇 微软重磅发布MAI-Image-1:自研图像生成AI模型,速度与创意兼备
下一篇 AI简历投递神器Get Jobs开源了!支持Boss直聘等主流平台自动化批量投递
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Decart AI开源Lucy Edit Dev:一句话指令即可编辑视频,保留原生运动与构图的革命性AI模型
AI 工具 AIGC 资讯
阿里通义开源Wan2.2-Animate:AI动作生成模型实现视频角色替换与表情驱动
AI 工具 AIGC 资讯
小米开源Lego-Edit:基于MLLM的下一代图像编辑框架,三阶段强化学习实现SOTA性能
AI 工具 AIGC 资讯
Codexia:革新AI编码体验的开源桌面神器,多会话管理与实时流式响应一网打尽
AI 工具

相关推荐

AI 工具

D-ID AI视频

remaker
AI 工具

Artflow AI

remaker
AI 工具AIGC 资讯

陈天桥团队重磅开源EverMemOS:AI长期记忆操作系统,让AI像人脑一样记忆

站外新闻
AI记忆系统 EverMemOS 盛大 长期记忆 陈天桥
AIGC 资讯

Qwen2.5-Max – 阿里通义千问推出的MoE模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 智谱AI 月之暗面 本地AI 清华大学 生成式AI 知识管理 科大讯飞 端侧AI 端侧部署 美团 腾讯混元 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 赛博朋克 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.