Hasty Briefsbeta

双语

Evaluation of validity, reliability, and readability of AI chatbots for gestational diabetes mellitus: a multi-model comparative study - PubMed

2 days ago

#gestational diabetes mellitus
#AI chatbots
#health information

该研究评估了六款AI聊天机器人关于妊娠期糖尿病(GDM)信息的准确性、可靠性和可读性
ChatGPT-5在回答GDM相关选择题时准确率最高(92.17%)
在所有GDM知识领域中，新一代AI模型的表现均优于前代产品
ChatGPT-5在公共教育问题的可靠性评分最高，但透明度得分较差
所有AI模型生成的文本阅读难度都超过建议的六年级水平，不适合作为独立的患者教育资源
研究结论指出AI聊天机器人应作为临床医生咨询的辅助工具，而非主要信息来源