典型文献
随机森林算法和logistic回归在预测巨大儿发病风险中的应用研究
文献摘要:
目的 基于一项队列研究构建巨大儿发病风险预测模型,并对结果进行分析比较.方法 通过调查问卷、体格检查等方式,收集中国孕产妇队列研究·协和项目中孕妇的人口学信息和临床资料,并随访获取新生儿出生体重等信息.按3:1比例,划分数据集为训练集和测试集,分别运用多因素logistic回归(LR)和随机森林算法(RF)在训练集中构建巨大儿预测模型,并在测试集中对模型进行验证,评价模型的预测效能用受试者工作特征曲线下面积(AUC)和预测一致率(Kappa)等指标.结果 在5544名孕妇中,分娩巨大儿的孕妇397人,巨大儿发生率为7.16%.分娩巨大儿的孕妇中,35岁以上者占10.08%(40/397),超重和肥胖者占27.46%(109/397),孕期增重过多者占60.96%(242/397).采用多因素LR构建巨大儿发病风险预测模型对测试集进行预测,准确度为0.716,灵敏度为0.719,特异度为0.715,Kappa值为0.428,约登指数为0.393,AUC为0.796(95%CI:0.777~0.815);采用RF构建预测模型对测试集进行预测,准确度为0.819,灵敏度为0.782,特异度为0.846,Kappa值为0.629,约登指数为0.439,AUC为0.897(95%CI:0.883~0.910).结论 两模型的预测效果较好,RF对本队列孕妇分娩巨大儿的发生风险有较高的预测效能,但多因素LR对巨大儿的影响因素有更直观的解释.建议在未来应用中综合两者的优点,使之在巨大儿预测中发挥更大的作用.
文献关键词:
巨大儿;母婴健康;机器学习;预测模型
中图分类号:
作者姓名:
刘璇;刘睿懿;曲翌敏;王宇萍;江宇
作者机构:
中国医学科学院,北京协和医学院群医学及公共卫生学院流行病与生物统计学系,北京 100730
文献出处:
引用格式:
[1]刘璇;刘睿懿;曲翌敏;王宇萍;江宇-.随机森林算法和logistic回归在预测巨大儿发病风险中的应用研究)[J].公共卫生与预防医学,2022(03):17-21
A类:
B类:
随机森林算法,logistic,巨大儿,队列研究,研究构建,发病风险预测模型,体格检查,孕产妇,协和,孕妇,人口学,新生儿出生体重,划分数据集,集为,训练集,测试集,LR,RF,预测效能,受试者工作特征曲线,特征曲线下面积,一致率,Kappa,分娩,以上者,超重和肥胖,肥胖者,孕期增重过多,多者,约登指数,本队,发生风险,更直,未来应用,母婴健康
AB值:
0.264599
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。