Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 阿里达摩院「灵枢」大模型:12种医学影像秒级分析,性能碾压GPT-4.1,开源引爆医疗AI新浪潮
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 阿里达摩院「灵枢」大模型:12种医学影像秒级分析,性能碾压GPT-4.1,开源引爆医疗AI新浪潮
AI 工具AIGC 资讯

阿里达摩院「灵枢」大模型:12种医学影像秒级分析,性能碾压GPT-4.1,开源引爆医疗AI新浪潮

站外新闻
最近更新: 2026年6月7日 下午8:25
医学影像分析 医疗AI 多模态大模型 灵枢大模型 达摩院
SHARE

💡 站外导读:在医疗AI领域,模型的精准度与可靠性是生命线。然而,现有通用大模型在处理专业、多样的医学影像(如X光、CT、MRI)时,常因缺乏领域深度知识而“水土不服”,难以生成可靠的临床洞察。行业亟需一个既精通多种影像模态,又具备深度医学推理能力的专用大模型,以破解诊断效率与报告质量的双重难题。在此背景下,阿里巴巴达摩院推出的“灵枢”模型,正试图成为这个关键的答案。

Lingshu是什么

Lingshu(灵枢)是阿里巴巴达摩院推出的专注于医学领域的多模态大型语言模型。模型支持超过12种医学成像模态,包括X光、CT扫描、MRI等,在多模态问答、文本问答及医学报告生成等任务上展现出卓越的性能。Lingshu基于多阶段训练,逐步嵌入医学专业知识,显著提升在医学领域的推理和问题解决能力。推出7B、32B两个参数版本,其中32B版本在多个医学多模态问答任务中超越GPT-4.1等专有模型。Lingshu项目推出MedEvalKit评估框架,整合主流的医学基准测试,推动医学AI模型的标准化评估和发展。

阅读目录
  • Lingshu是什么
  • Lingshu的主要功能
  • Lingshu的技术原理
  • Lingshu的项目地址
  • Lingshu的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Lingshu

Lingshu的主要功能

  • 多模态医学问答:支持处理多种医学成像模态(如X光、CT、MRI等)的视觉问答任务。根据输入的医学图像和相关问题,生成准确的答案。
  • 医学报告生成:Lingshu能生成高质量的医学报告,如放射学报告,根据输入的医学图像,生成详细的“发现”和“印象”部分,为临床医生提供有价值的参考。
  • 医学知识问答:Lingshu能回答纯文本的医学问题,涵盖广泛的医学知识,为医学学生、临床医生和研究人员提供准确的信息。
  • 医学推理与诊断支持:Lingshu具备强大的医学推理能力,根据输入的医学图像和文本信息,进行复杂的推理和诊断支持。
  • 医学图像理解与标注:Lingshu能理解和标注医学图像中的关键特征,如病变位置、类型和严重程度,支持生成详细的图像描述,帮助医生更好地理解图像内容。

Lingshu的技术原理

  • 数据整理:
    • 数据收集:从多种来源收集医学成像数据、医学文本数据和通用领域数据。
    • 数据清洗:基于图像过滤、去重和文本清理,确保数据的质量和相关性。
    • 数据合成:生成高质量的医学标题、视觉问答(VQA)样本和推理轨迹,丰富训练数据。
  • 模型架构:Lingshu基于Qwen2.5-VL模型架构,包含三个关键组件,大型语言模型(LLM)处理文本输入和生成文本输出,视觉编码器提取医学图像的视觉特征,投影器将视觉特征映射到语言模型的表示空间。
  • 多阶段训练:
    • 医学浅层对齐:用少量医学图像文本对进行微调,让模型准确编码医学图像生成相应的描述。
    • 医学深层对齐:引入更大规模、更高质量和语义更丰富的医学图像文本对数据集,进一步整合医学知识。
    • 医学指令调整:基于大规模的医学指令数据优化模型,提高执行特定任务指令的能力。
    • 医学导向的强化学习:用强化学习与可验证奖励(RLVR)范式,增强模型的医学推理能力。
  • 评估框架:推出MedEvalKit评估框架,整合多个多模态和文本医学基准测试,支持多种问题格式,包括多项选择题、封闭式问题、开放式问题和医学报告生成。框架提供标准化的数据预处理格式和后处理协议,及一致的模型部署和推理接口,支持快速集成和一键评估。

Lingshu的项目地址

  • 项目官网:https://alibaba-damo-academy.github.io/lingshu/
  • HuggingFace模型库:https://huggingface.co/collections/lingshu-medical-mllm/lingshu-mllms-6847974ca5b5df750f017dad
  • arXiv技术论文:https://arxiv.org/pdf/2506.07044

Lingshu的应用场景

  • 医学图像诊断:处理多种医学成像模态的视觉问答任务,分析图像中的异常并提供诊断建议,生成详细的图像描述和标注关键特征,辅助医生进行准确诊断。
  • 医学报告生成:依据医学图像生成高质量的放射学报告和病理报告,涵盖“发现”与“印象”部分,为临床医生提供重要参考,提高报告编写效率与质量。
  • 医学知识问答:提供准确的医学知识,帮助医学学生、专业人士以及临床医生获取所需信息,做出更明智的决策。
  • 医学研究:在医学研究中,协助整理和分析医学图像与文本数据。
  • 公共卫生:Lingshu能处理公共卫生数据,支持流行病学研究,计算归因风险等。

📝 站长洞察 (Editor’s Insight)

「灵枢」的发布,标志着医疗AI竞争进入了“专用模型深度攻坚”的新阶段。它超越了简单的“看图说话”,通过多阶段训练将医学知识层层嵌入模型骨髓,并创新性地引入强化学习(RLVR)来锻造其“医学思维”,这是从“工具”到“专家”的关键一跃。开源7B和32B版本,并配套标准化评估框架MedEvalKit,这不仅是技术展示,更是生态卡位——通过降低使用门槛与建立评测标准,阿里旨在引领行业范式,将自身塑造为医疗AI基础设施的核心提供者。其在多项任务上超越GPT-4.1,再次证明在垂直领域,经过精心“烹饪”的专用模型,其潜力远未见顶。这不仅是技术突破,更是对整个医疗AI研发、评测与落地体系的系统性重定义。

小米MiMo-V2.5发布:1T参数全模态Agent,千轮调用+1M上下文,开源在即
PowerPM.ai
HiDream-I1 – 智象未来开源的AI图像生成模型
交交 – 上海交大推出的口语对话情感大模型
MiniCPM-V 4.6发布:1.3B参数模型性能越级,重新定义端侧多模态AI天花板
TAGGED:医学影像分析医疗AI多模态大模型灵枢大模型达摩院
分享
Email 复制链接 打印
Share
上一篇 Ring-lite:仅2.75B激活参数,蚂蚁技术开源轻量级推理模型刷新SOTA
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Ring-lite:仅2.75B激活参数,蚂蚁技术开源轻量级推理模型刷新SOTA
AI 工具 AIGC 资讯
港科大、美团联手发布PosterCraft:告别模板,用AI生成高美学海报的统一框架
AI 工具 AIGC 资讯
网易有道开源数学推理模型子曰3:140亿参数,成本仅为通用模型十分之一,GAOKAO-Bench得分98.5
AI 工具 AIGC 资讯
微软Mu模型发布:仅3.3亿参数,性能媲美Phi3.5,如何革新边缘AI体验?
AI 工具 AIGC 资讯

相关推荐

AI 工具

ThumbnailAI缩略图

remaker
AI 工具AIGC 资讯

Anthropic重磅发布Claude Haiku 4.5:性能比肩旗舰、成本仅三分之一的小型AI模型深度解析

站外新闻
AI安全 AI编程助手 Anthropic Claude Haiku 4.5 小型AI模型
AIGC 资讯

ReasonGraph – 开源可视化与分析LLMs推理过程的AI工具

站外新闻
AIGC 资讯

ZeroSearch – 阿里通义开源的大模型搜索引擎框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.