Hasty Briefsbeta

双语

LLM-assisted systematic review of large language models in clinical medicine - PubMed

2 months ago

#Systematic Review
#LLM
#Clinical Medicine

LLM辅助的系统综述识别出2022年1月至2025年9月期间临床医学领域的4,609项同行评审研究
其中仅1,048项研究使用真实世界患者数据，前瞻性随机试验仅有19项
大多数研究针对模拟场景（1,857项）或考试式任务（1,704项）
65.7%的研究评估了ChatGPT及相关OpenAI模型，Gemini/Bard占比13.1%
面向患者的沟通与教育占任务类型的17%，其次是知识检索与教育/评估模拟
在1,046项人机对比中，LLMs在33%的案例中表现优于人类，结果取决于任务真实性和训练水平
至少25%的研究样本量小于30例
严格以患者为中心的循证证据仍然匮乏，凸显临床推广应用前需要更大规模的前瞻性试验