中文摘要
基于机器学习和深度学习的危重症患者侵袭性真菌感染的预测
模型及分型研究
摘要
目的:本研究旨在使用机器学习算法,建立MIMIC-IV数据库及本地
医院数据库患者在住重症监护病房(Intensivecareunit,ICU)期间发生
侵袭性真菌感染(Invasivefungalinfection,IFI)的预测模型。基于
MIMIC-IV数据库,利用深度学习算法及K-means聚类算法对IFI患者进
行分型分析。
方法:
1.提取MIMIC-IV数据库及本地医院数据库(Local-database)中微
生物培养结果为真菌感染的标本进行流行病学分析。
2.提取MIMIC-IV及本地ICU(Local-ICU)中所有住ICU时长≥48
的成年IFI患者。通过LASSO回归特征筛选,使用BL-SMOTE方法平衡
数据集,基于6种机器学习算法建立模型。采用AUC值、SHAP值等方
法评估模型性能。
3.提取IFI患者特征,通过深度学习自编码器进行降维,使用自编码
器输出层进行K-means聚类分析,评估聚类性能,最终将聚类结果使用t
分布的随机邻居嵌入计数进行可视化展示。
结果:
1.MIMIC-IV数据库主要真菌病原体为白念珠菌、光滑念珠菌、近平
滑念珠菌及曲霉菌。本地医院数据库中主要感染的真菌菌株为白念珠菌、
光滑念珠菌、热带念珠菌及曲霉菌等。MIMIC-IV数据库中主要使用的抗
真菌药物包括氟康唑、制霉菌素。本地医院数据库中主要使用的抗真菌药
物依此为伏立康唑、两性霉素B。
2.基于MIMIC-IV使用20个风险因素建立预测模型,BL-SMOTE随
机森林模型表现出最佳预测性能(AUC为0.88)。SHAP算法分析显示,
对BL-SMOTE随机森林模型影响最大的3个临床特征包括透析治疗、
APSIII评分以及肝脏疾病。基于Local-ICU利用18个特征建立预测模型,
包括白介素-6、中心静脉置管以及5种合并症等指标。基于SHAP值评估
1
中文摘要
模型性能,Xgboost模型具有更好的预测性能,AUC为0.73。
3.基于深度学习自编码计数对特征空间进行降维,IFI患者分为两类
时具有较稳定的分类表现。其中2型IFI患者住ICU时长、机械通气时长
均显著高于亚表型1类患者,临床症状和结局表现均较差,同时2型患者
具有更高的脓毒症发生率。
结论:
1.基于机器学习建立临床模型可以成为预测ICU患者发生IFI的可
靠工具,基于MIMIC-IV中20个风险因素的BL-SMOTE随机森林模型具
有最佳AUC值,Local-ICU中18个风险因素的Xgboost模型具有最佳AUC
值;
2.基于深度学习及K-means聚类分析,可以将合并IFI的ICU患者
分为两类,帮助识别IFI后具有不良预后的高风险患者,辅助临床决策,
可能有助于改善患者预后。
关键词:侵袭性真菌感染,重症监护病房,临床预测模型,机器学习,
深度学习,聚类分析。
2
目录
中文摘要1
英文摘要3
英文缩写5
研究论文基于机器学习和深度学习的危重症患者侵袭性真菌感染的预测
模型及分型研究
绪论7
1研究的背景和意义7
2国内外研究现状8
3主要研究内容10
第一章MIMIC数据库及院内数据库真菌感染流行病学分析11
前言11
材料与