💡 站外导读:在数字化健康管理日益普及的今天,用户手握化验单却常因看不懂专业指标而陷入“指标焦虑”。传统健康类AI功能多停留在OCR文字识别与孤立数值解读,缺乏临床逻辑,易导致误读。行业亟需从“读数”向“懂病”跃迁的智能解决方案。阿里通义千问此次升级正是瞄准这一核心痛点,将AI能力从文字提取深化至图像理解与推理,标志着健康类AIGC应用进入新阶段。
2026年5月27日,阿里旗下通义千问APP宣布对“拍照问健康”功能进行重要升级。新版本突破了传统OCR文字识别局限,实现了医学图像理解与临床推理能力。

核心功能升级
- 视觉圈选:用户上传化验单或患处照片后,AI可像医生一样在图像上直接圈出异常区域(如箭头指标、皮疹细节)。
- 联动推理:不再孤立解读单项指标,而是结合年龄、性别、多指标关联进行排除法分析。例如,能识别青少年ALP升高属生理性而非病理性异常。
- 过程透明:系统自主调用医学知识库,并展示“识别-标注-推理”的全过程,让用户理解结论逻辑。
在专业临床验证环节,北京协和医院、友谊医院与北大人民医院的三位主任医师对这项功能进行了实地测试。针对诸如13岁腹痛病因排查、脂肪肝疑似病例、荨麻疹伴随白细胞升高以及下巴皮疹等多种情况,千问所展现的分析路径——例如排除胆道问题、辨别生理性指标升高——均获得了专家们的肯定。专家们认为,它具备了鉴别诊断的意识,能够有效缓解用户因误读健康指标而产生的焦虑情绪。此次升级,意味着AI健康助手正式从简单’机械读值’迈入’辅助诊断’的新阶段,为用户提供了更为可靠的健康预检参考依据。
📝 站长洞察 (Editor’s Insight)
此次通义千问的升级绝非一次普通功能迭代,它精准踩中了医疗AI发展的两大核心趋势:多模态理解与可信AI。从单模态OCR到能“看图说话”的视觉圈选,模型实现了对医学图像(化验单、患处照片)的空间语义理解,这是迈向医学通用人工智能的关键一步。更值得玩味的是其“过程透明”的设计——AI主动展示推理链条,这不仅提升了用户信任,更是对“黑盒”模型可解释性难题的行业级回应。获得三甲专家背书,意味着其推理逻辑已初具临床思维雏形,而非简单的模式匹配。这预示着AI健康助手的角色将从“信息检索工具”向“初步筛查伙伴”演进,对缓解医疗资源紧张、提升公众健康素养具有深远意义。然而,如何界定其与专业诊断的边界,以及建立更严谨的临床验证与风控体系,将是其大规模应用前必须跨越的深水区。
