Hasty Briefsbeta

双语

The Rise of Deepfake Medical Imaging: Radiologists' Diagnostic Accuracy in Detecting ChatGPT-generated Radiographs - PubMed

2 months ago
  • #radiology
  • #AI
  • #deepfake
  • 研究评估放射科医师与大型语言模型区分ChatGPT生成合成胸片与真实胸片的能力
  • 来自6个国家的17名放射科医师参与研究,在盲测和知情阶段共评估154张胸片(77张合成/77张真实)
  • 41%的放射科医师在不知研究目的时,能自发识别AI生成胸片
  • 放射科医师区分GPT-4o与RoentGen生成合成图像的准确率无显著差异(75% vs 70%)
  • 大型语言模型表现差异显著:GPT-4o(85%)和GPT-5(83%)优于Llama 4 Maverick(59%)与Gemini 2.5 Pro(56%)
  • 合成图像的常见特征包括双侧对称、颗粒均匀、纹理不自然及骨表面过度光滑
  • 放射科医师与AI模型均难以准确识别合成胸片,凸显开展鉴别培训的必要性
  • 已公开深度伪造数据集以支持合成医学影像识别训练