LLM-assisted systematic review of large language models in clinical medicine - PubMed
2 months ago
- #Systematic Review
- #LLM
- #Clinical Medicine
- LLM辅助的系统综述识别出2022年1月至2025年9月期间临床医学领域的4,609项同行评审研究
- 其中仅1,048项研究使用真实世界患者数据,前瞻性随机试验仅有19项
- 大多数研究针对模拟场景(1,857项)或考试式任务(1,704项)
- 65.7%的研究评估了ChatGPT及相关OpenAI模型,Gemini/Bard占比13.1%
- 面向患者的沟通与教育占任务类型的17%,其次是知识检索与教育/评估模拟
- 在1,046项人机对比中,LLMs在33%的案例中表现优于人类,结果取决于任务真实性和训练水平
- 至少25%的研究样本量小于30例
- 严格以患者为中心的循证证据仍然匮乏,凸显临床推广应用前需要更大规模的前瞻性试验