Hasty Briefsbeta

双语

Superhuman performance of an LLM on the reasoning tasks of a physician

a year ago

#Medical Diagnostics
#Clinical Reasoning
#Artificial Intelligence

一项大型语言模型（LLM）在临床推理任务上与医生表现进行了对比评估。
五项实验测量了临床推理能力：鉴别诊断、诊断推理展示、分诊鉴别诊断、概率推理和管理推理。
该LLM在病例情景模拟和真实急诊室二次会诊中均展现出超乎人类的诊断与推理能力。
研究表明LLM在医学诊断和管理推理方面已达到超人类水平。
该发现推动了对LLM临床能力开展前瞻性试验验证的迫切需求。