Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 香港中科院发布超声大模型「聆音EchoCare」:450万张影像训练,7大医学任务性能碾压SOTA
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 香港中科院发布超声大模型「聆音EchoCare」:450万张影像训练,7大医学任务性能碾压SOTA
AI 工具AIGC 资讯

香港中科院发布超声大模型「聆音EchoCare」:450万张影像训练,7大医学任务性能碾压SOTA

站外新闻
最近更新: 2026年6月7日 下午8:16
AIGC医疗 医学影像AI 聆音EchoCare 自监督学习 超声大模型
SHARE

💡 站外导读:医疗AI正经历从单点辅助到全流程赋能的范式跃迁,超声影像因实时性强、操作依赖医师经验、图像质量参差不齐,成为AI落地的关键场景与难点。如何用有限标注数据训练出泛化性极强的模型,是业界普遍痛点。中科院香港创新研究院推出的超声大模型聆音EchoCare,正是针对这一挑战给出的系统性解答——用450万张全球多中心数据与结构化自监督框架,重新定义超声AI的天花板。

聆音是什么

聆音(EchoCare)是中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)推出的超声大模型。模型依托450万张超声影像数据集EchoAtlas进行训练,数据集涵盖5个大洲的23个临床中心、38种成像设备采集的图像,覆盖人体9大区域和52个解剖器官,是目前规模最大的超声影像数据集之一。EchoCare采用“结构化对比自监督学习框架”,通过图像掩膜重建、自适应困难图块挖掘等技术,显著提升了模型对超声影像深层语义的建模能力和泛化性能。在超声图像分割、分类、检测、回归、增强等七大医学任务中,性能均优于当前最优方法。

阅读目录
  • 聆音是什么
  • 聆音的主要功能
  • 聆音的技术原理
  • 聆音的项目地址
  • 聆音的应用场景
      • 📝 站长洞察 (Editor’s Insight)

EchoCare

聆音的主要功能

  • 超声图像分割:能精准地对超声图像中的不同组织和器官进行分割,帮助医生更清晰地识别病变区域和正常组织的边界,为诊断提供更准确的依据。
  • 病变分类:对超声图像中的病变进行分类,如区分良性和恶性肿瘤等,辅助医生快速判断病变的性质,提高诊断效率。
  • 器官检测与分割:不仅可以检测出图像中的器官位置,还能对器官进行精确分割,为后续的诊断和治疗提供详细的解剖信息。
  • 图像增强:对超声图像进行质量提升,改善图像的对比度和清晰度,使医生能够更清楚地观察到细微的结构和病变,减少误诊的可能性。
  • 报告生成:根据超声图像分析结果自动生成诊断报告,节省医生撰写报告的时间,提高工作效率,同时保证报告的准确性和一致性。

聆音的技术原理

  • 大规模数据集构建:依托450万张超声影像数据集EchoAtlas进行训练,数据集涵盖多中心、多设备、多民族的全球队列,覆盖人体9大区域和52个解剖器官,为模型提供了丰富的学习素材。
  • 结构化对比自监督学习框架:引入基于医学先验的层次化树形标签,实现多标签语义关系结构化学习与隐式编码,提升模型对超声影像深层语义的建模能力。
  • 图像掩膜重建技术:通过对图像进行掩膜重建,增强模型对图像局部特征的学习和理解,提高模型的鲁棒性和泛化性能。
  • 自适应困难图块挖掘技术:自动识别并聚焦于难以学习的图像区域,针对性地加强学习,提升模型对复杂图像的处理能力。
  • 渐进式训练策略:采用渐进式训练方法,逐步增加模型训练的难度和复杂度,帮助模型更好地适应不同类型的超声图像,提升整体性能。

聆音的项目地址

  • 项目官网:https://echocare.cares-copilot.com/
  • Github仓库:https://github.com/CAIR-HKISI/EchoCare
  • arXiv技术论文:https://arxiv.org/pdf/2509.11752

聆音的应用场景

  • 医院常规检查:在医院的日常超声检查中应用,能显著降低对专业人员的依赖,协助医生更高效、更精准地进行诊断,有效提升医疗服务效率,为医疗资源的优化配置提供更多可能性。
  • 疾病诊断与筛查:可用于多种疾病的诊断和筛查,如在山东大学齐鲁医院妇产科1556例卵巢肿瘤超声病例和中南大学湘雅医院1000余例甲状腺超声检查中的具体案例验证,其性能显著优于现有SOTA方法。
  • 心脏超声检测:在心脏超声主动脉瘤检测与分析方面,可进行回顾性验证,为心脏疾病的诊断提供有力支持。
  • 超声图像处理:包括超声图像分割、分类、检测、回归、增强等七大医学任务及十余项下游应用,如病变分类、器官检测与分割、图像增强等,提升超声图像的质量和诊断价值。
  • 临床适配与研究:基座模型计划开源供医疗机构使用,后续将分阶段推进前瞻性研究、急诊室场景应用及联合超声设备企业进行硬件集成。

📝 站长洞察 (Editor’s Insight)

聆音的发布标志着医疗大模型从自然语言处理向多模态医学影像的深度延伸。其核心突破有二:一是EchoAtlas数据集的全球化多中心构建,解决了医疗AI最棘手的数据偏倚与泛化难题;二是结构化对比学习框架,将医学先验知识(如器官层级关系)编码进模型,这比单纯堆算力更具范式意义。结合OpenAI、Google Health近期在病理与放射领域的布局,我们可以预见,2025年将是医疗基础模型的爆发之年。聆音选择基座模型开源并推动硬件集成,这一路径若走通,将大幅降低基层医院的超声诊断门槛,其商业化潜力与社会价值同样值得期待。对于关注医疗AI赛道的投资人与开发者,这篇论文的技术细节值得反复研读。

北大&谷歌联合开源PaperBanana:5个AI智能体协作,自动生成顶级论文图表
BFS-Prover – 字节豆包推出的自动定理证明系统
Ethnic Influences in Asian Human relationships
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
Absolute Zero – 清华大学等机构推出的语言模型推理训练方法
TAGGED:AIGC医疗医学影像AI聆音EchoCare自监督学习超声大模型
分享
Email 复制链接 打印
Share
上一篇 Sora 2 实测:AI视频同步音画+物理引擎88%合规率,OpenAI如何重新定义内容创作?
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Sora 2 实测:AI视频同步音画+物理引擎88%合规率,OpenAI如何重新定义内容创作?
AI 工具 AIGC 资讯
阿里开源Logics-Parsing:基于Qwen2.5的端到端文档解析模型,PDF转HTML一步到位
AI 工具 AIGC 资讯
Tinker API:简化大模型微调与强化学习的革命性托管平台|Thinking Machines Lab重磅发布
AI 工具 AIGC 资讯
英伟达LONGLIVE框架发布:单GPU实时生成240秒交互式长视频,AI视频生成迈入生产力时代
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

JoyAI-Echo – 京东开源的长音视频生成框架

站外新闻
AIGC 资讯

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型

站外新闻
AI 工具

ChatTutor:革命性AI教师工具!可视化交互教学,数理编程全学科覆盖

站外新闻
AI教师 个性化教育 交互式学习 可视化教学 多模态生成
AIGC 资讯

iOS 27 将整合谷歌 Gemini 模型:苹果本地AI Siri大升级,隐私与性能如何兼得?

站外新闻
Gemini模型 本地AI 模型蒸馏 苹果Siri 隐私计算
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI图像生成 AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程工具 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 文本转语音 早报 智谱AI 月之暗面 本地AI 清华大学 生成式AI 科大讯飞 端侧AI 端侧部署 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.