Hasty Briefsbeta

双语

LLM-assisted systematic review of large language models in clinical medicine - PubMed

2 months ago
  • #Systematic Review
  • #LLM
  • #Clinical Medicine
  • LLM辅助的系统综述识别出2022年1月至2025年9月期间临床医学领域的4,609项同行评审研究
  • 其中仅1,048项研究使用真实世界患者数据,前瞻性随机试验仅有19项
  • 大多数研究针对模拟场景(1,857项)或考试式任务(1,704项)
  • 65.7%的研究评估了ChatGPT及相关OpenAI模型,Gemini/Bard占比13.1%
  • 面向患者的沟通与教育占任务类型的17%,其次是知识检索与教育/评估模拟
  • 在1,046项人机对比中,LLMs在33%的案例中表现优于人类,结果取决于任务真实性和训练水平
  • 至少25%的研究样本量小于30例
  • 严格以患者为中心的循证证据仍然匮乏,凸显临床推广应用前需要更大规模的前瞻性试验