The Rise of Deepfake Medical Imaging: Radiologists' Diagnostic Accuracy in Detecting ChatGPT-generated Radiographs - PubMed
2 months ago
- #radiology
- #AI
- #deepfake
- 研究评估放射科医师与大型语言模型区分ChatGPT生成合成胸片与真实胸片的能力
- 来自6个国家的17名放射科医师参与研究,在盲测和知情阶段共评估154张胸片(77张合成/77张真实)
- 41%的放射科医师在不知研究目的时,能自发识别AI生成胸片
- 放射科医师区分GPT-4o与RoentGen生成合成图像的准确率无显著差异(75% vs 70%)
- 大型语言模型表现差异显著:GPT-4o(85%)和GPT-5(83%)优于Llama 4 Maverick(59%)与Gemini 2.5 Pro(56%)
- 合成图像的常见特征包括双侧对称、颗粒均匀、纹理不自然及骨表面过度光滑
- 放射科医师与AI模型均难以准确识别合成胸片,凸显开展鉴别培训的必要性
- 已公开深度伪造数据集以支持合成医学影像识别训练