【第十六章:Sentosa_DSML社区版-机器学习之生存分析】
16.1 加速失效时间回归
1.算子介绍
加速失效时间回归模型Accelerated failure time (AFT)是一个监督型参数化的回归模型,它可以处理删失数据。它描述了一个生存时间的对数模型,所以它通常被称为生存分析的对数线性模型。
2.算子类型
机器学习/生存分析算子。
3.算子属性说明
属性 | 页面显示名称 | 选项 | 类型 | 默认值 | 约束规则 | 属性说明 |
fit_intercept | 是否拟合截距 | 必填 | Boolean | 是 | 单选:是,否 | 是否拟合截距项 |
max_iter | 最大迭代次数 | 必填 | Int | 100 | >0 | 最大迭代次数 |
quantile_probabilities | 分位数概率数组 | 必填 | List<Double> | [0.01, 0.05, 0.1, 0.25, 0.5, 0.75, 0.9, 0.95, 0.99] | 数组中所有的值都在(0,1)之间,数组不应该为空 | 分位数概率数组的参数。分位数概率数组的值应该在(0,1)范围内,数组不应该为空 |
tol | 收敛偏差 | 必填 | Double | 0.000001 | >= 0 | 收敛偏差() |
aggregation_depth | 深度参数 | 必填 | Int | 2 | >= 2 | 深度参数() |
censor | 检查器列名 | 必填 | String | 无 | 前继算子的输出列 | 检查器列名 |
skip_null_value | 是否跳过空值 | 必填 | Boolean | 是 | 单选:是,否 | 是否跳过空值 |
4.算子使用介绍
(1)算子初始化
参考公共功能算子初始化操作。
(2)算子属性设置
加速失效时间回归算子的属性设置如图所示
加速失效时间回归算子属性设置
(3)算子的运行
加速失效时间回归算子为建模算子,需要先训练数据生成模型,再通过模型对相同结构的数据进行处理得到最终结果。具体运行过程如下所述。
首先通过数据读入算子读取数据,后接类型算子设置Label列,再接加速失效时间回归算子,右击算子,点击运行,得到加速失效时间回归模型。
运行加速失效时间回归算子获得加速失效时间回归模型
模型后可接任意个数据处理算子,再接表格算子或数据写出算子,形成算子流执行。
加速失效时间回归模型算子流
右键模型,可以查看模型的模型信息。模型的运行结果如图所示
加速失效时间回归模型运行结果
加速失效时间回归模型评估结果
为了非商业用途的科研学者、研究人员及开发者提供学习、交流及实践机器学习技术,推出了一款轻量化且完全免费的Sentosa_DSML社区版。以轻量化一键安装、平台免费使用、视频教学和社区论坛服务为主要特点,能够与其他数据科学家和机器学习爱好者交流心得,分享经验和解决问题。文章最后附上官网链接,感兴趣工具的可以直接下载使用
Sentosa_DSML社区版官网
Sentosa_DSML算子流开发视频