Machine Learning-Based Prediction Model Construction for Type 2 Diabetes Mellitus: A Comparison of Algorithms and Multilevel Risk Factor Analysis - PubMed
9 days ago
- #Type 2 diabetes prediction
- #machine learning
- #multilevel risk factors
- 该研究构建了一种基于机器学习的2型糖尿病(T2DM)预测模型,并比较了七种算法。
- AdaBoost算法在参数优化后表现最佳,其AUC为0.85,准确率为0.71,F1分数为0.71。
- 数据来自NHANES(2021-2023年),包括6337名参与者;通过蒙特卡洛插值法处理缺失值,并利用主成分分析(PCA)降低共线性。
- 特征选择采用随机森林和递归特征消除;类别不平衡问题通过ADASYN方法处理。
- 在多层次中识别出24个关键风险因素:19个来自个体特征,3个来自个体行为,2个来自工作/生活条件。
- 创新点在于将健康生态学模型与机器学习相结合,实现系统性跨层次风险因素识别。
- 该模型为2型糖尿病早期筛查、高危人群识别和针对性公共卫生干预提供了新工具。