Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: CLaMP 3- 清华团队推出的音乐信息检索框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > CLaMP 3- 清华团队推出的音乐信息检索框架
AIGC 资讯

CLaMP 3- 清华团队推出的音乐信息检索框架

站外新闻
最近更新: 2026年6月9日 上午5:01
SHARE

CLaMP 3是什么

CLaMP 3是清华大学人工智能学院的朱文武教授团队推出的多模态、多语言的音乐信息检索框架。基于对比学习,将乐谱(如ABC符号)、音频(如MERT特征)和表演信号(如MIDI文本格式)与多种语言的文本描述对齐到一个共享的表示空间中。CLaMP 3支持27种语言,能泛化到100种语言,适用于跨模态检索任务,如文本到音乐、图像到音乐检索,零样本音乐分类和音乐语义相似性评估。

阅读目录
  • CLaMP 3是什么
  • CLaMP 3的主要功能
  • CLaMP 3的技术原理
  • CLaMP 3的项目地址
  • CLaMP 3的应用场景

CLaMP 3

CLaMP 3的主要功能

  • 跨模态音乐检索:
    • 文本到音乐检索:根据文本描述(支持100种语言)检索与之语义匹配的音乐。
    • 图像到音乐检索:通过图像生成的描述(如BLIP模型生成的caption)检索与之匹配的音乐。
    • 跨模态音乐检索:在不同音乐表示形式(如乐谱、MIDI、音频)之间进行检索。例如,用音频检索乐谱或用乐谱检索音频。
  • 零样本音乐分类:无需标注数据,基于语义相似性将音乐分类到特定类别(如风格、情绪等)。
  • 音乐推荐:基于语义相似性进行音乐推荐,支持同一模态内的推荐(如音频到音频)。

CLaMP 3的技术原理

  • 多模态数据对齐:将不同模态的音乐数据(如乐谱、MIDI、音频)和多语言文本统一到一个共享的语义空间。基于对比学习,模型学习将不同模态的数据映射到相似的向量表示,实现跨模态检索。
  • 对比学习框架:用对比学习(如CLIP的变体)训练模型。模型通过正样本对(如音乐与对应文本)和负样本对(随机配对的样本)学习区分语义相关和不相关的数据,优化表示空间。
  • 多语言支持:基于XLM-R(一种多语言预训练模型)实现多语言文本嵌入,支持27种语言的训练,并泛化到100种语言。
  • 大规模数据集训练:模型在大规模数据集(如M4-RAG)上进行训练,包含231万对高质量的音乐-文本对,覆盖27种语言和194个国家。
  • 特征提取与表示:
    • 乐谱:使用Interleaved ABC符号。
    • MIDI:转换为MIDI文本格式(MTF)。
    • 音频:提取MERT特征。

CLaMP 3的项目地址

  • 项目官网:https://sanderwood.github.io/clamp3/
  • GitHub仓库:https://github.com/sanderwood/clamp3
  • HuggingFace模型库:https://huggingface.co/sander-wood/clamp3
  • arXiv技术论文:https://arxiv.org/pdf/2502.10362
  • 在线体验Demo:https://huggingface.co/spaces/sander-wood/clamp3

CLaMP 3的应用场景

  • 音乐推荐:根据文本描述或音乐片段,推荐语义相似的音乐,支持个性化推荐。
  • 音乐创作辅助:通过文本生成匹配的音乐,帮助创作者找到灵感或调整音乐风格。
  • 音乐教育:检索相关音频、乐谱或教学资源,支持多语言学习。
  • 音乐分类与分析:零样本分类音乐风格、情绪等,评估音乐语义相似性。
  • 多媒体创作:为视频或图像匹配合适的音乐,提升内容制作效率。
Ling-2.6-flash:蚂蚁百灵打造‘干活’模型,104B参数仅激活7.4B,Token效率碾压同行
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
全球AI支付里程碑!支付宝AI原生支付突破3亿笔,Token Pay与AI钱包重塑支付未来
Baichuan-Audio – 百川智能开源的端到端语音交互模型
Sitcom-Crafter – 北航联合港中文等高校推出的 3D 人类动作生成系统
分享
Email 复制链接 打印
Share
上一篇 WorldSense – 小红书联合上海交大推出的多模态全面评测新基准
下一篇 WebLI-100B – 谷歌 DeepMind 推出的1000亿视觉语言数据集
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

谷歌Gemini Embedding 2重磅发布:首个原生多模态嵌入模型,统一文本图像音频向量空间
AI 工具 AIGC 资讯
港大重磅开源CLI-Anything:一键将GIMP、Blender等软件代码库转为AI Agent原生工具,彻底告别脆弱GUI自动化
AI 工具 AIGC 资讯
Lightricks LTX-2.3 开源发布:220亿参数视频生成模型,支持4K竖屏与音视频同步
AI 工具
英伟达Nemotron 3 Super开源发布:1200亿参数Mamba-MoE架构,智能体推理速度提升3倍,性能直逼Claude Opus 4.6
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

VLM-R1 – 浙大 Om AI Lab 推出的视觉语言模型

站外新闻
AIGC 资讯

UniFluid – 谷歌联合麻省理工推出的多模态图像生成与理解框架

站外新闻
流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

中国AI大模型调用量连续4周碾压美国!全球开发者正加速拥抱国产API

站外新闻
AIGC API调用 OpenRouter 智谱GLM
量子芯片科技感占位特色图
AI 工具AIGC 资讯

谷歌 Gemini 算力计费引爆全球用户怒火!紧急宣布额度永久翻 3 倍补偿

站外新闻
AI 工具 开发者工具 算力计费 谷歌 DeepMind 谷歌 Gemini
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI编程智能体 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 形式化验证 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.