典型文献
基于机器学习的环境监测数据对循环系统疾病死亡影响及预测预警模型构建
文献摘要:
[目的]利用机器学习对循环系统疾病死亡构建预测预警模型及评价,为疾病的预防提供参考.[方法]使用中国某地区2014-2018年循环系统疾病死亡数据进行分析,采用GAM、RF、XGBoost构建预测模型.分布滞后非线性模型计算累积滞后效应结果构建预警模型,进行模型评价.[结果]累积滞后效应发现持续低温高温、高日照时数、高环境污染物浓度会增加循环系统疾病死亡风险,累计7天的相对危险度分别为 1.236、1.130、1.560、1.062、1.218、1.153、1.796.RF、XGBoost模型RMSE为4.979、5.341,性能较好.年龄、性别、气温、日照时数、SO2、NO2、CO、O3、PM10、PM42.5浓度为筛选出的特征变量,将累积滞后效应筛选后的数据确定预警值的预警效果较好.XGBoost预测结果的灵敏度、特异度、曲线下面积分别为0.948、0.939、0.941.[局限]缺乏伴随疾病独立数据和疾病发展进程数据.[结论]该地区死亡数增加与高年龄、男性、温度、日照时数、污染物浓度的升高有关.利用XGBoost模型构建的预测预警模型性能好,可为相关部门疾病的预防和干预提供参考价值.
文献关键词:
循环系统疾病;预测预警模型;XGBoost DLNM;随机森林模型
中图分类号:
作者姓名:
王琰;胥美美;童俞嘉;苟欢;蔡荣;单治易;安新颖
作者机构:
北京协和医学院/中国医学科学院医学信息研究所 北京100020
文献出处:
引用格式:
[1]王琰;胥美美;童俞嘉;苟欢;蔡荣;单治易;安新颖-.基于机器学习的环境监测数据对循环系统疾病死亡影响及预测预警模型构建)[J].数据分析与知识发现,2022(10):79-92
A类:
PM42
B类:
基于机器学习,环境监测数据,循环系统疾病,预测预警模型,某地区,死亡数据,GAM,RF,XGBoost,分布滞后非线性模型,积滞,滞后效应,模型评价,日照时数,环境污染物,污染物浓度,死亡风险,相对危险度,RMSE,SO2,NO2,O3,PM10,特征变量,预警值,预警效果,伴随疾病,独立数,疾病发展,模型性能,预提,DLNM,随机森林模型
AB值:
0.290183
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。