Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 腾讯清华联手开源SongGeneration 2:4B参数音乐大模型,性能超越Suno v5,1分钟生成完整歌曲
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 腾讯清华联手开源SongGeneration 2:4B参数音乐大模型,性能超越Suno v5,1分钟生成完整歌曲
AI 工具AIGC 资讯

腾讯清华联手开源SongGeneration 2:4B参数音乐大模型,性能超越Suno v5,1分钟生成完整歌曲

站外新闻
最近更新: 2026年6月7日 下午8:04
AIGC Suno 清华大学 腾讯 音乐生成大模型
SHARE

💡 站外导读:随着AIGC技术爆发,AI音乐生成正从实验走向商业应用,但高质量、可控、本地化部署仍是行业核心痛点。腾讯与清华大学联合开源的SongGeneration 2,正是对这一挑战的回应。这款4B参数模型凭借混合架构与分层表征,在音质、歌词准确度和生成效率上实现突破,其性能甚至超越了Suno v5等知名商业模型。它的开源,不仅降低了AI音乐创作的技术门槛,更预示着专业级音乐生成能力将加速普及,重塑内容创作产业链。

SongGeneration 2是什么

SongGeneration 2是腾讯与清华大学联合开源的4B参数音乐生成大模型,采用混合LLM-扩散架构与分层表征设计,实现商业级音乐生成质量。模型歌词准确率达8.55% PER,超越Suno v5等商业模型。SongGeneration 2支持中英文等多语种、复杂多轨编曲,可通过文本描述与音频提示精准控制风格。模型可在22GB显存消费级硬件本地运行,1分钟内可生成完整歌曲。

阅读目录
  • SongGeneration 2是什么
  • SongGeneration 2的主要功能
  • SongGeneration 2的技术原理
  • SongGeneration 2的项目地址
  • SongGeneration 2的应用场景
      • 📝 站长洞察 (Editor’s Insight)

SongGeneration 2

SongGeneration 2的主要功能

  • 高质量歌曲生成:基于混合LLM-扩散架构生成长达4分30秒、旋律优美且编曲层次丰富的完整歌曲。
  • 多语种歌词合成:支持中、英、西、日等多语种歌词,以8.55%的极低音素错误率实现清晰准确的发音。
  • 多样化生成模式:可灵活输出完整歌曲、纯音乐、纯人声或分离的人声与伴奏双音轨。
  • 精准风格控制:通过文本描述(性别、曲风、情绪、乐器)或10秒音频提示精确控制生成风格。
  • 灵活部署选项:支持22GB显存本地运行及HuggingFace Space在线快速体验,提供低显存适配方案。

SongGeneration 2的技术原理

  • 混合LLM-扩散架构:语言模型(LeLM)担任”作曲大脑”统筹全局音乐结构与演奏细节,扩散模型作为”高保真渲染器”在语言模型指导下合成复杂声学细节,二者分工协作平衡音乐性与音质。
  • 分层表征建模:采用并行建模设计,混合表征(Mixed Tokens)捕捉高层级旋律与结构语义,多轨表征(Dual-Track Tokens)分别建模人声与伴奏轨道的细粒度声学变化。
  • 自动化美学评估:基于11,717个专家标注样本构建细粒度评估框架,为模型训练注入音乐性先验知识,在推理阶段引入基于音乐性标签的CFG策略。
  • 三阶段渐进式后训练:通过SFT收窄数据分布构建高质量底座,大规模离线DPO利用20万对严格正负样本消除歌词幻觉,半在线DPO周期性更新模型以极致突破音乐性上限。

SongGeneration 2的项目地址

  • GitHub仓库:https://github.com/tencent-ailab/songgeneration
  • HuggingFace模型库:https://huggingface.co/tencent/SongGeneration

SongGeneration 2的应用场景

  • 音乐创作辅助:独立音乐人可快速生成demo验证灵感,降低编曲门槛与制作成本。
  • 视频配乐制作:自媒体创作者能依据视频风格与情绪需求,即时生成定制化背景音乐。
  • 游戏音频开发:游戏厂商可为不同场景、角色与剧情批量生成适配的主题音乐与音效。
  • 广告与营销内容:品牌方可按 campaign 调性生成专属 jingle,实现音频资产的快速迭代。
  • 教育与娱乐应用:音乐教学平台提供风格化伴奏生成,K歌与社交应用支持用户个性化歌曲创作。

📝 站长洞察 (Editor’s Insight)

SongGeneration 2的开源,绝不仅仅是一个新模型的发布,而是AIGC领域一次标志性的‘架构范式’胜利。它巧妙地将LLM的全局结构规划能力与扩散模型的高保真细节渲染能力结合,解决了音乐生成中‘音乐性’与‘音质’难以兼得的核心矛盾。这标志着行业正从追求单一参数的‘暴力美学’,转向更精巧的‘混合协同’架构设计。更重要的是,其‘22GB显存消费级硬件可运行’的特性,直击当前大模型落地‘云端成本高、本地门槛高’的痛点,为AI音乐从Demo走向真正的生产力工具铺平了道路。腾讯与清华的联手,展现了中国顶尖科技企业与学术机构在攻克AIGC‘最后一公里’难题上的强大合力。接下来,围绕音乐生成垂直领域的生态竞争,或将由此开启。

Artificial Art
Tara AI
Luma AI
WarriorCoder – 微软联合华南理工大学推出的代码生成大模型
Gemini Coder – AI 应用生成工具,文本描述实时生成代码和预览
TAGGED:AIGCSuno清华大学腾讯音乐生成大模型
分享
Email 复制链接 打印
Share
上一篇 谷歌Gemini Embedding 2重磅发布:首个原生多模态嵌入模型,统一文本图像音频向量空间
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

谷歌Gemini Embedding 2重磅发布:首个原生多模态嵌入模型,统一文本图像音频向量空间
AI 工具 AIGC 资讯
港大重磅开源CLI-Anything:一键将GIMP、Blender等软件代码库转为AI Agent原生工具,彻底告别脆弱GUI自动化
AI 工具 AIGC 资讯
Lightricks LTX-2.3 开源发布:220亿参数视频生成模型,支持4K竖屏与音视频同步
AI 工具
英伟达Nemotron 3 Super开源发布:1200亿参数Mamba-MoE架构,智能体推理速度提升3倍,性能直逼Claude Opus 4.6
AI 工具 AIGC 资讯

相关推荐

AI 工具

RhetorAI

remaker
AI 工具AIGC 资讯

YouTube播客AI升级:自动调速专治说话慢,Premium用户收听体验大革新

站外新闻
AI自动调速 Premium订阅 YouTube播客 智能推荐 音频流媒体
AI 工具AIGC 资讯

突破推理长度瓶颈!阿里通义FIPO算法实现Token级精准奖惩,纯RL训练超越o1-mini

站外新闻
FIPO Token级信用分配 大模型推理 强化学习 阿里通义
AIGC 资讯

Second Me – 心识宇宙开源的 AI 身份模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.