Hasty Briefsbeta

双语

The Rise of Deepfake Medical Imaging: Radiologists' Diagnostic Accuracy in Detecting ChatGPT-generated Radiographs - PubMed

2 months ago

#radiology
#AI
#deepfake

研究评估放射科医师与大型语言模型区分ChatGPT生成合成胸片与真实胸片的能力
来自6个国家的17名放射科医师参与研究，在盲测和知情阶段共评估154张胸片（77张合成/77张真实）
41%的放射科医师在不知研究目的时，能自发识别AI生成胸片
放射科医师区分GPT-4o与RoentGen生成合成图像的准确率无显著差异（75% vs 70%）
大型语言模型表现差异显著：GPT-4o（85%）和GPT-5（83%）优于Llama 4 Maverick（59%）与Gemini 2.5 Pro（56%）
合成图像的常见特征包括双侧对称、颗粒均匀、纹理不自然及骨表面过度光滑
放射科医师与AI模型均难以准确识别合成胸片，凸显开展鉴别培训的必要性
已公开深度伪造数据集以支持合成医学影像识别训练