近年来,随着医学数据的不断积累和计算机技术的快速发展,许多机器学习技术已经被用在医学领域,并取得了不错的效果。与传统的基于医学知识经验的心衰预后评估模型相比,机器学习方法可以快速、高效地从繁杂的、海量的心衰病人数据中挖掘出有价值的患者信息,便于对心衰患者进行及时有效的预后评估和指导。
有学者利用分类回归树、完全逻辑斯蒂回归和逐步逻辑回归三种机器学习方法对射血分数降低或保留的近期出院的心衰患者进行生存风险评估。其中,在心衰患者的30天内和1年内全因死亡率预测中,逐步逻辑回归的预测效果最好,其ROC值达到了0.75。
有学者基于心衰患者的电子医疗记录,建立了相关性特征选择和朴素贝叶斯相结合的再入院率预测模型,其准确率达到83.19%,AUC值达到0.78。
有学者利用系统管理安置资源指标PRISM评分模型对对689例心衰患者进行1年内死亡率预测,利用分类和回归树CART算法根据患者的死亡风险对患者进行进一步分类。CART树模型的预测能力达到72.2%,其AUC值为0.631。研究表明,PRISM评分和改进的SHFM评分在预测1年死亡率方面表现良好。此外,与单独使用两种模型相比,在PRISM评分中加入改进的SHFM可以增强其鉴别能力。当在CART模型中结合使用时,它们可以用来确定具有最高死亡风险的人群子集,从而指导患者预后护理。
鉴于此,采用决策树和随机森林算法进行心力衰竭患者生存情况预测,程序运行环境为MATLAB R2021B,主要内容如下:
%% 1:Splitting Data into Training and Testing Sets
%% 2:Feature Selection
%% 3:Defining Response and Explanatory Variables
%% 4:Decision Tree Optimisation
%% 4.1: DT OPT1
%% 4.2: DT OPT1
%% 4.3: Training and Saving DT for Final Time Before Testing
%% 4.4: Final Training Losses Recorded
%% 5:Testing Performance of MdlFinalDT on Unseen Hold Out Set
%% 6:Random Forest Optimisation
%% 6.1: Notes
%% 6.2: RF OPT1
%% 6.3: RF OPT2
%% 6.4: RF OPT3
%% 6.5: Training and Saving RF for Final Time Before testing
%% 6.6: Final Training Losses Recorded
%% 7:Testing Performance of MdlRFFinal on Unseen Hold Out Set
出图如下:
完整代码:MATLAB环境下基于决策树和随机森林的心力衰竭患者生存情况预测
擅长领域:现代信号处理,机器学习,深度学习,数字孪生,时间序列分析,设备缺陷检测、设备异常检测、设备智能故障诊断与健康管理PHM等。