Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: CLaMP 3- 清华团队推出的音乐信息检索框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > CLaMP 3- 清华团队推出的音乐信息检索框架
AIGC 资讯

CLaMP 3- 清华团队推出的音乐信息检索框架

站外新闻
最近更新: 2026年6月9日 上午5:01
SHARE

CLaMP 3是什么

CLaMP 3是清华大学人工智能学院的朱文武教授团队推出的多模态、多语言的音乐信息检索框架。基于对比学习,将乐谱(如ABC符号)、音频(如MERT特征)和表演信号(如MIDI文本格式)与多种语言的文本描述对齐到一个共享的表示空间中。CLaMP 3支持27种语言,能泛化到100种语言,适用于跨模态检索任务,如文本到音乐、图像到音乐检索,零样本音乐分类和音乐语义相似性评估。

阅读目录
  • CLaMP 3是什么
  • CLaMP 3的主要功能
  • CLaMP 3的技术原理
  • CLaMP 3的项目地址
  • CLaMP 3的应用场景

CLaMP 3

CLaMP 3的主要功能

  • 跨模态音乐检索:
    • 文本到音乐检索:根据文本描述(支持100种语言)检索与之语义匹配的音乐。
    • 图像到音乐检索:通过图像生成的描述(如BLIP模型生成的caption)检索与之匹配的音乐。
    • 跨模态音乐检索:在不同音乐表示形式(如乐谱、MIDI、音频)之间进行检索。例如,用音频检索乐谱或用乐谱检索音频。
  • 零样本音乐分类:无需标注数据,基于语义相似性将音乐分类到特定类别(如风格、情绪等)。
  • 音乐推荐:基于语义相似性进行音乐推荐,支持同一模态内的推荐(如音频到音频)。

CLaMP 3的技术原理

  • 多模态数据对齐:将不同模态的音乐数据(如乐谱、MIDI、音频)和多语言文本统一到一个共享的语义空间。基于对比学习,模型学习将不同模态的数据映射到相似的向量表示,实现跨模态检索。
  • 对比学习框架:用对比学习(如CLIP的变体)训练模型。模型通过正样本对(如音乐与对应文本)和负样本对(随机配对的样本)学习区分语义相关和不相关的数据,优化表示空间。
  • 多语言支持:基于XLM-R(一种多语言预训练模型)实现多语言文本嵌入,支持27种语言的训练,并泛化到100种语言。
  • 大规模数据集训练:模型在大规模数据集(如M4-RAG)上进行训练,包含231万对高质量的音乐-文本对,覆盖27种语言和194个国家。
  • 特征提取与表示:
    • 乐谱:使用Interleaved ABC符号。
    • MIDI:转换为MIDI文本格式(MTF)。
    • 音频:提取MERT特征。

CLaMP 3的项目地址

  • 项目官网:https://sanderwood.github.io/clamp3/
  • GitHub仓库:https://github.com/sanderwood/clamp3
  • HuggingFace模型库:https://huggingface.co/sander-wood/clamp3
  • arXiv技术论文:https://arxiv.org/pdf/2502.10362
  • 在线体验Demo:https://huggingface.co/spaces/sander-wood/clamp3

CLaMP 3的应用场景

  • 音乐推荐:根据文本描述或音乐片段,推荐语义相似的音乐,支持个性化推荐。
  • 音乐创作辅助:通过文本生成匹配的音乐,帮助创作者找到灵感或调整音乐风格。
  • 音乐教育:检索相关音频、乐谱或教学资源,支持多语言学习。
  • 音乐分类与分析:零样本分类音乐风格、情绪等,评估音乐语义相似性。
  • 多媒体创作:为视频或图像匹配合适的音乐,提升内容制作效率。
谢赛宁团队开源Solaris:首个多人视频世界生成模型,突破AI世界模拟新边界
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
URO-Bench – AI基准测试工具,专为端到端语音对话模型设计
微软开源VibeVoice:实时流式TTS新突破,5亿参数实现90分钟多说话者对话音频生成
DINO-XSeek – IDEA 研究院推出的多模态目标检测模型
分享
Email 复制链接 打印
Share
上一篇 WorldSense – 小红书联合上海交大推出的多模态全面评测新基准
下一篇 WebLI-100B – 谷歌 DeepMind 推出的1000亿视觉语言数据集
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

流光脑波AI大脑占位特色图
2026年3月美国AI榜单巨变:Claude单月狂飙130%紧追ChatGPT,格局突变信号已现
AIGC 资讯 最新趋势
得物实战揭秘:AI Coding工具如何突破数仓开发’失忆’痛点,Harness工程引领新范式
AI 工具 AIGC 资讯
全息流体渐变通用占位特色图
历史性和解!Meta妥协规避审判,美国首例学校诉社交媒体成瘾案落幕,揭示行业司法风向
AIGC 资讯
量子芯片科技感占位特色图
Spotify与环球音乐联手:AI翻唱混音工具上线,正版版权终结Suno野蛮生长
AI 工具 AIGC 资讯 最新趋势

相关推荐

AIGC 资讯

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型

站外新闻
AIGC 资讯

MeteoRA – 南大推出高效可扩展的多任务嵌入框架

站外新闻
AI 工具AIGC 资讯

SPARK2026腾讯游戏发布会重磅盘点:超40款游戏动态与AI技术全面革新

站外新闻
AI游戏 代号Craft 游戏发布会 神经动态全局光照 腾讯游戏
AI 工具AIGC 资讯

阿里通义Qwen3-ASR-Flash语音识别模型发布:支持11种语言与歌声识别,多语种Benchmark表现最优

站外新闻
AIGC Qwen3 多模态模型 语音识别 语音转文字
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.