Evaluation of validity, reliability, and readability of AI chatbots for gestational diabetes mellitus: a multi-model comparative study - PubMed
2 days ago
- #gestational diabetes mellitus
- #AI chatbots
- #health information
- 该研究评估了六款AI聊天机器人关于妊娠期糖尿病(GDM)信息的准确性、可靠性和可读性
- ChatGPT-5在回答GDM相关选择题时准确率最高(92.17%)
- 在所有GDM知识领域中,新一代AI模型的表现均优于前代产品
- ChatGPT-5在公共教育问题的可靠性评分最高,但透明度得分较差
- 所有AI模型生成的文本阅读难度都超过建议的六年级水平,不适合作为独立的患者教育资源
- 研究结论指出AI聊天机器人应作为临床医生咨询的辅助工具,而非主要信息来源