香港中科院发布超声大模型「聆音EchoCare」：450万张影像训练，7大医学任务性能碾压SOTA

💡 站外导读：医疗AI正经历从单点辅助到全流程赋能的范式跃迁，超声影像因实时性强、操作依赖医师经验、图像质量参差不齐，成为AI落地的关键场景与难点。如何用有限标注数据训练出泛化性极强的模型，是业界普遍痛点。中科院香港创新研究院推出的超声大模型聆音EchoCare，正是针对这一挑战给出的系统性解答——用450万张全球多中心数据与结构化自监督框架，重新定义超声AI的天花板。

聆音是什么

聆音（EchoCare）是中国科学院香港创新研究院人工智能与机器人创新中心（CAIR）推出的超声大模型。模型依托450万张超声影像数据集EchoAtlas进行训练，数据集涵盖5个大洲的23个临床中心、38种成像设备采集的图像，覆盖人体9大区域和52个解剖器官，是目前规模最大的超声影像数据集之一。EchoCare采用“结构化对比自监督学习框架”，通过图像掩膜重建、自适应困难图块挖掘等技术，显著提升了模型对超声影像深层语义的建模能力和泛化性能。在超声图像分割、分类、检测、回归、增强等七大医学任务中，性能均优于当前最优方法。

阅读目录

聆音是什么
聆音的主要功能
聆音的技术原理
聆音的项目地址
聆音的应用场景

📝 站长洞察 (Editor’s Insight)

EchoCare

聆音的主要功能

超声图像分割：能精准地对超声图像中的不同组织和器官进行分割，帮助医生更清晰地识别病变区域和正常组织的边界，为诊断提供更准确的依据。
病变分类：对超声图像中的病变进行分类，如区分良性和恶性肿瘤等，辅助医生快速判断病变的性质，提高诊断效率。
器官检测与分割：不仅可以检测出图像中的器官位置，还能对器官进行精确分割，为后续的诊断和治疗提供详细的解剖信息。
图像增强：对超声图像进行质量提升，改善图像的对比度和清晰度，使医生能够更清楚地观察到细微的结构和病变，减少误诊的可能性。
报告生成：根据超声图像分析结果自动生成诊断报告，节省医生撰写报告的时间，提高工作效率，同时保证报告的准确性和一致性。

聆音的技术原理

大规模数据集构建：依托450万张超声影像数据集EchoAtlas进行训练，数据集涵盖多中心、多设备、多民族的全球队列，覆盖人体9大区域和52个解剖器官，为模型提供了丰富的学习素材。
结构化对比自监督学习框架：引入基于医学先验的层次化树形标签，实现多标签语义关系结构化学习与隐式编码，提升模型对超声影像深层语义的建模能力。
图像掩膜重建技术：通过对图像进行掩膜重建，增强模型对图像局部特征的学习和理解，提高模型的鲁棒性和泛化性能。
自适应困难图块挖掘技术：自动识别并聚焦于难以学习的图像区域，针对性地加强学习，提升模型对复杂图像的处理能力。
渐进式训练策略：采用渐进式训练方法，逐步增加模型训练的难度和复杂度，帮助模型更好地适应不同类型的超声图像，提升整体性能。

聆音的项目地址

项目官网：https://echocare.cares-copilot.com/
Github仓库：https://github.com/CAIR-HKISI/EchoCare
arXiv技术论文：https://arxiv.org/pdf/2509.11752

聆音的应用场景

医院常规检查：在医院的日常超声检查中应用，能显著降低对专业人员的依赖，协助医生更高效、更精准地进行诊断，有效提升医疗服务效率，为医疗资源的优化配置提供更多可能性。
疾病诊断与筛查：可用于多种疾病的诊断和筛查，如在山东大学齐鲁医院妇产科1556例卵巢肿瘤超声病例和中南大学湘雅医院1000余例甲状腺超声检查中的具体案例验证，其性能显著优于现有SOTA方法。
心脏超声检测：在心脏超声主动脉瘤检测与分析方面，可进行回顾性验证，为心脏疾病的诊断提供有力支持。
超声图像处理：包括超声图像分割、分类、检测、回归、增强等七大医学任务及十余项下游应用，如病变分类、器官检测与分割、图像增强等，提升超声图像的质量和诊断价值。
临床适配与研究：基座模型计划开源供医疗机构使用，后续将分阶段推进前瞻性研究、急诊室场景应用及联合超声设备企业进行硬件集成。

📝 站长洞察 (Editor’s Insight)

聆音的发布标志着医疗大模型从自然语言处理向多模态医学影像的深度延伸。其核心突破有二：一是EchoAtlas数据集的全球化多中心构建，解决了医疗AI最棘手的数据偏倚与泛化难题；二是结构化对比学习框架，将医学先验知识（如器官层级关系）编码进模型，这比单纯堆算力更具范式意义。结合OpenAI、Google Health近期在病理与放射领域的布局，我们可以预见，2025年将是医疗基础模型的爆发之年。聆音选择基座模型开源并推动硬件集成，这一路径若走通，将大幅降低基层医院的超声诊断门槛，其商业化潜力与社会价值同样值得期待。对于关注医疗AI赛道的投资人与开发者，这篇论文的技术细节值得反复研读。

香港中科院发布超声大模型「聆音EchoCare」：450万张影像训练，7大医学任务性能碾压SOTA

聆音是什么

聆音的主要功能

聆音的技术原理

聆音的项目地址

聆音的应用场景

📝 站长洞察 (Editor’s Insight)

发表评价取消回复

最近更新

Japanese Neon Marketing Thumbnail

微软确认开发Copilot AI超级应用，整合聊天、编程与智能代理能力

纳德拉公开摊牌：别只信 OpenAI 和 Anthropic，微软要做最便宜的那个

WorkBuddy上线「人机双写」:AI走出聊天框，坐进你的文档里一起干活

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

Support

聆音是什么

聆音的主要功能

聆音的技术原理

聆音的项目地址

聆音的应用场景

📝 站长洞察 (Editor’s Insight)

发表评价 取消回复

最近更新

相关推荐

发表评价取消回复