shiny APP实现xgboost 构建,超参数调节以及后概率校准
将R代码整理程web APP的意义,在于直观地,便利地展示和分享代码所蕴含的概念和知识,也一定程度地实现复杂的代码处理工作,减少重复的工作,但是也有缺点,就是功能固定,不能根据实际情况及时做出调整。
R代码向APP转化过程中也会遇到相当的困难,必须要做出一定的调整以适应新的构架,在制作APP过程中也是做一些技术的探索和积累。
本APP构建的目的
展示概率校准对模型预测结果的影响,是本APP构建的目的。
概率校准是预测模型优化的技术之一,可以改善模型的校准曲线,是一种简单有效地改善预测概率准确度的方法,在预测概率作为预测模型主要输出信息的时候,对提高模型的效能有显著的作用,比如,目前临床预测模型应用到临床实践过程中,采用的形式是“辅助临床诊疗”,一种模式,就是预测模型给出预测概率作为“辅助”,人为根据各种临床情况选择决策阈值,两者结合实现“辅助临床诊疗”。
因为进行概率校准需要首先获取预测概率,所以我构建了一个xgboost模型来实现这一点,并且为了适应不同的数据, 允许模型进行超参数调节来生成适合数据的最佳模型。超参数调节这一块以前是在线下完成的,在部署预测模型的过程中用处不大,这里作为一种技术储备。
APP特点
- tidymodels提供给了三种概率校准的方法:保序回归法,可能是适用范围最广的,大小数据集都适用;逻辑回顾法,对于小数据集可能会有问题;贝叶斯回归法(技术原因,暂时没有包含在APP中)。在APP中可以选择两种概率校准的方法。
- 超参数调节的过程需要较多的时间,调节的参数包括:trees, min_n,learn_rate三个主要的参数, APP中设定了超参数调节的范围的尺寸,默认是3, 是超参调节过程中探索的范围,越大代表探索的范围越大,消耗的时间也越长。
- APP是多页面设计,超参数调节和概率校准各占一个页面。用户可以输入自己的数据体会过概率校准的过程。
- APP会消耗较多的计算资源,不适合部署在shiny的免费服务器上,CSDNVIP用户可以到链接下载。
总结
web APP是临床预测模型最佳的载体,功能丰富且传播方便,不断积累的技术的经验将会为制作出更适合临床的APP奠定基础。
欢迎关注临床预测模型APP经验分享网站www.clinicalmodelmatrix.com.