AI vs 大夫“各赢一局”：筛查快准狠，问诊常“露怯”

发布日期：2025-12-22 14:41:52 点击次数：148

先进AI模子在专科医学西宾中进展优异，那么，信得过场景下的AI大夫究竟靠谱吗？

最新照应标明，AI模子在辅助疾病筛查等方面大致阐扬报复作用，但在与患者调换、汇聚病史并作出准确会诊等大夫最关节的任务上，仍然进展欠安。

AI加速癌症筛查

在由德国吕贝克大学造就亚历山大·卡塔利尼奇团队牵头的一项迄今限制边界最大的联系照应中，AI有助于辐照科大夫在每1000例筛查中特等发现1例乳腺癌患者。

照应东谈主员与近200位具备专科禀赋的辐照科大夫协作，评估了这款可识别乳腺癌征兆的AI模子。照应袒护了2021年7月至2023年2月在德国12个乳腺癌筛查中心进行的统共46万余名女性的筛查记载。

骨子操作中，辐照科大夫可自主遴荐是否使用AI辅助会诊。最终，约26万名女性的筛查恶果由AI与大夫共同评估，其余20万余东谈主则由大夫单独判断。恶果涌现，使用AI辅助会诊的大夫检测出乳腺癌的比率为每千东谈主6.7例，较未使用AI辅助的检出率提高了约17.6%。

此外，在疑似患癌的女性接管活检的案例中，AI辅助会诊的准确率也更高——其中64.5%的活检恶果阐明为恶性肿瘤，而未使用AI的活检确诊率为59.2%。“AI在培植乳腺癌检出率方面的进展超出预期。”卡塔利尼奇暗意。

该照应得到了东谈主工智能公司Vara的时刻提拔。公司首席时刻官斯特凡·邦克暗意，底本的照应主义是考证AI在癌症会诊上的进展“不劣于”辐照科大夫，由此解说AI在削弱大夫责任背负上具备期骗后劲。但最终恶果解说，AI在某些方面的进展以至“优于东谈主类”。

尽管AI在医疗领域期骗前程广袤，但也激发了部摊派忧。一些众人指出，过度依赖AI可能导致漏诊，或变成医疗资源散播不均——经济条目好的患者才能享有大夫的躬行调理。

此外，照应还发现，当AI先行判断某张医疗影像为“平方”（即不太可能存在癌症风险）时，辐照科大夫在审阅这类影像时平均仅花16秒；而关于AI无法明确判断的影像，大夫平均破耗30秒审阅。这教导咱们，AI的判断可能会潜移暗化地影响大夫的隆重力分拨。

不外，英国帝国理工学院造就本·格洛克以为，照应恶果印证了在使用策略妥当的情况下，AI是安全且灵验的。格洛克详情了该项照快乐许大夫自主决定是否使用AI的作念法，并命令进行更多近似的“信得过全国”照应。

他指出，单靠试验室模拟无法全面评估AI的临床价值，应更多地从骨子期骗中积蓄训导。“这项照应进一步解说了AI在乳腺癌筛查中的上风，也再次提醒计策制定者应加速联系时刻的扩充纪律。”

AI看病输在调换

哈佛大学生物医学信息学系助理造就普拉纳夫·拉杰普尔卡与共事一齐修复了一种名为CRAFT-MD的AI评估用具，该用具基于2000个来自好意思国医宗派司西宾的病例构建，用于测试临床AI模子在模拟医患对话场景中的推理才能。

试验标明，四种主流大型言语模子——OpenAI的GPT-3.5和GPT-4、Meta的Llama-2-7b以及法国开源AI公司Mistral的Mistral-v2-7b——在医患对话场景中的会诊进展，明显不如它们把柄书面病例的会诊进展。

举例，当GPT-4被提供结构化的病例摘要，并可从多个选项中遴荐会诊恶果时，其会诊准确率高达82%。但当它把柄模拟患者对话进行会诊时，准确率骤降至26%。“大言语模子善于作念遴荐题，一朝参加动态对话场景，会诊准确率则大幅下落。”拉杰普尔卡说。

此外，这些AI模子在尽头大比例的对话中未能竣工得回患者病史。即使是进展最佳的GPT-4，也只在71%的模拟对话中顺利得回了患者的竣工病史。即便顺利汇聚到联系病史，这些AI模子也无法老是给出正确的会诊恶果。

新闻中心