Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: MeteoRA – 南大推出高效可扩展的多任务嵌入框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > MeteoRA – 南大推出高效可扩展的多任务嵌入框架
AIGC 资讯

MeteoRA – 南大推出高效可扩展的多任务嵌入框架

站外新闻
最近更新: 2026年6月9日 上午5:40
SHARE

MeteoRA是什么

MeteoRA 是南京大学计算机科学与技术系的研究团队推出的用于大型语言模型(LLM)的多任务嵌入框架,将多个任务特定的 LoRA(低秩适配器)集成到一个基础模型中,实现高效的参数复用和自主任务切换。MeteoRA基于混合专家(MoE)架构,用可训练的门控网络动态选择最适合当前输入的 LoRA 适配器,无需显式任务指令。MeteoRA 提出 MoE 前向加速策略,基于自定义 GPU 核算子显著提升了推理效率,同时保持低内存开销。在实验中,MeteoRA 在多种任务上展现出与传统微调方法相当的性能,在复合任务中表现出色,支持在一个推理过程中解决多个子问题。

阅读目录
  • MeteoRA是什么
  • MeteoRA的主要功能
  • MeteoRA的技术原理
  • MeteoRA的项目地址
  • MeteoRA的应用场景

MeteoRA

MeteoRA的主要功能

  • 多任务适配器集成:将多个任务特定的 LoRA(低秩适配器)嵌入到一个基础 LLM 中,同时处理多种任务。
  • 自主任务选择与切换:无需人工指定任务意图,实现任务的自主切换。
  • 高效推理:提升多任务适配器的推理效率,同时保持低内存开销。
  • 复合任务处理:在单次推理中解决多个子任务,例如连续回答多个不同领域的问答,提升模型的灵活性和实用性。
  • 扩展性:支持多种 LoRA 适配器的集成,适用于不同任务和领域,扩展 LLM 的应用场景。

MeteoRA的技术原理

  • LoRA(Low-Rank Adaptation):一种参数高效的微调方法,基于在 LLM 的线性层中注入低秩矩阵(A 和 B),仅更新矩阵适应特定任务,不改变基础模型的其他参数。每个 LoRA 适配器包含一对低秩矩阵,用在修改模型的输出。
  • 混合专家(MoE)架构:基于 MoE 架构,将多个 LoRA 适配器视为不同的“专家”,通过一个可训练的门控网络动态选择最适合当前输入的专家(LoRA 适配器)。门控网络根据输入的隐藏状态计算每个 LoRA 的权重,选择权重最高的几个适配器进行前向传播。
  • 动态门控机制:门控网络为每个输入动态分配权重,决定哪些 LoRA 适配器参与计算。基于 top-k 选择策略,支持选择多个适配器,实现任务的灵活切换和组合。
  • 前向加速策略:推出基于 PyTorch 和 Triton 的自定义 GPU 核算子。算子基于并行化和优化内存访问,提升多任务推理的速度,同时保持较低的内存占用。
  • 全模式集成:将 LoRA 适配器嵌入到 Transformer 架构的所有线性层(包括注意力模块和 MLP 模块),更全面地利用不同任务的知识。

MeteoRA的项目地址

  • GitHub仓库:https://github.com/NJUDeepEngine/meteora
  • arXiv技术论文:https://arxiv.org/pdf/2405.13053

MeteoRA的应用场景

  • 多领域问答:集成不同领域知识,自动切换适配器,精准回答各类问题。
  • 多语言对话:支持多种语言对翻译,实现流畅的多语言交流。
  • 复合任务处理:解决包含多个子任务的复杂问题,动态切换适配器完成任务。
  • 跨领域知识融合:结合不同领域知识,提升复杂任务处理能力。
  • 智能客服与助手:根据用户需求动态切换适配器,快速响应,提高服务质量。
香港科大团队突破:MeWM医学世界模型精准预测肿瘤演化,F1值飙升13%
物理AI爆发前夜:奥比中光如何用3D视觉“基座”卡位万亿机器人市场?
Rodin Gen-2.5 – 影眸科技推出的千万级多边形 AI 3D 模型
昆仑万维发布Mureka V7.5:中文AI音乐生成模型,实现演唱级音色与情感表达
PP-TableMagic – 百度飞桨团队开源的表格识别工具
分享
Email 复制链接 打印
Share
上一篇 Figma-Low-Code – 将Figma设计转换为Vue.js应用程序的开源项目
下一篇 GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

GPT-5.4重磅发布:OpenAI旗舰模型首次在电脑操作上超越人类,专业工作效率提升83%
AI 工具 AIGC 资讯
蚂蚁集团发布Ming-flash-omni-2.0:开源全模态大模型,引领AI理解与生成一体化新范式
AI 工具 AIGC 资讯
OpenAI发布GPT-5.3-Codex-Spark:1000+ tokens/s实时编程模型,速度提升80%的开发神器
AI 工具 AIGC 资讯
GPT-5.3 Instant深度解析:免费轻量级对话模型,幻觉率降27%全面升级
AI 工具 AIGC 资讯

相关推荐

量子芯片科技感占位特色图
AI 工具AIGC 资讯

AI攻破6大数学猜想!25岁华人少女退学创业,OpenAI都未曾实现,她凭什么拿下14亿融资?

站外新闻
AI数学 Axiom Math 大模型推理 形式化验证 洪乐潼
AIGC 资讯

MiniMind – 开源的AI模型训练工具,2小时训练25.8M小模型

站外新闻
AI 工具AIGC 资讯

Gemini 2.5 Flash Image:谷歌发布高性价比图像生成模型,角色一致性与自然语言编辑成核心亮点

站外新闻
AIGC Gemini 图像生成 图像编辑 谷歌AI
AIGC 资讯

DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.