典型文献
基于XGBoost的糖尿病血液拉曼光谱定量分析法
文献摘要:
血液中包含着大量的生物信息,如激素、酶、血糖等成分,而血糖偏高将引发糖尿病.糖尿病有很多并发症,比如脑梗塞,脑出血,肾脏损害,眼底损害,周围神经病变等一系列疾病.目前,血液常规成分检测分析周期较长,结果反馈较慢,难以实现快速连续检测.光学检测技术能够根据待测物质的光谱鉴别物质化学成分和相对含量,因其灵敏度高、适用性强、分析速度快等优势,在血液无创检测领域逐渐发挥其优势.随着激光技术的不断进步,拉曼光谱技术作为一种非线性散射光谱技术,在血液检测技术中得到了广泛应用.为提高拉曼光谱的预测精度,首次将XGBoost算法应用到拉曼光谱血液血糖浓度中进行预测精度的提升.实验中106组血液样本及试验标准值为河北省秦皇岛市第一医院提供,选用布鲁克的MultiRAM光谱仪进行血液的拉曼光谱数据测量,实验中1064 nm激发光源功率为400 mW,光谱分辨率为6 cm-1,扫描速率为10 kHz,扫描范围为400~4000 cm-1,对每个样本重复采集10次并计算平均值作为原始光谱数据,以保证实验的准确性和可重复性.该方法无需对数据进行预处理,首先将光谱数据随机划分为训练集和测试集,比例为7:3,训练集用于训练模型并确定模型参数,测试集用于测试模型的稳定性和预测精度.建立XGBoost模型后,用网格搜索法和k折交叉验证优化模型参数;引入模型评估指标和克拉克网格误差分析图对XGBoost模型血糖浓度的预测进行分析;最后将XGBoost模型与决策树(DT)、随机森林(RF)和支持向量机回归(SVR)模型进行对比.实验结果表明通过XGBoost建立的定量回归模型效果最佳,模型的决定系数为0.99999,校正集均方误差为0.00749,预测集均方误差为0.00717,相对分析误差为331.97318,预测点均落在克拉克网格误差分析图的A区.结果证明,将XGBoost算法应用到拉曼光谱血液成分定量分析中具有较高的预测精度,并且数据未经过预处理,可以有效缩短程序运行时间,其在拉曼光谱以及近红外光谱定量分析领域具有广阔的发展前景.
文献关键词:
XGBoost;拉曼光谱;血糖;定量回归
中图分类号:
作者姓名:
王铭萱;王巧云;骈斐斐;单鹏;李志刚;马振鹤
作者机构:
东北大学信息科学与工程学院,辽宁 沈阳 110819
文献出处:
引用格式:
[1]王铭萱;王巧云;骈斐斐;单鹏;李志刚;马振鹤-.基于XGBoost的糖尿病血液拉曼光谱定量分析法)[J].光谱学与光谱分析,2022(06):1721-1727
A类:
MultiRAM
B类:
XGBoost,定量分析法,脑梗塞,脑出血,肾脏损害,眼底,周围神经病变,血液常规,常规成分,成分检测,检测分析,结果反馈,较慢,难以实现,连续检测,光学检测技术,物质化,相对含量,灵敏度高,无创检测,检测领域,激光技术,拉曼光谱技术,散射光谱,血液检测,算法应用,血糖浓度,血液样本,试验标准,标准值,秦皇岛市,用布,布鲁克,光谱仪,行血,光谱数据,数据测量,激发光源,mW,光谱分辨率,扫描速率,kHz,复采,可重复性,训练集,测试集,训练模型,定模,测试模型,网格搜索法,交叉验证,验证优化,模型评估,克拉克,误差分析,析图,决策树,DT,RF,支持向量机回归,SVR,明通,定量回归,决定系数,均方误差,血液成分,短程,程序运行,运行时间,近红外光谱
AB值:
0.356827
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。