文章目录
- 一、实验介绍
- 1.1 简单介绍
- 1.2 Breast Cancer 数据实验
- 1.3 Boston 数据实验
- 二、项目地址
- 三、算法结果展示
一、实验介绍
1.1 简单介绍
AdaBoost 和 Random Forest 算法的原理
1.2 Breast Cancer 数据实验
-
对 Breast Cancer 数据进行探索性数据分析;
-
数据预处理
-
分别以决策树、逻辑回归、SVM 为基函数,利用网格搜索等方法寻找不同基函数下 AdaBoost 算法的最优参数。利用 Precision、Recall、F1 和 Auc 等指标评价模型,探究和对比不同基函数下的
AdaBoost 算法性能 -
对比以决策树为基函数的 AdaBoost、Random Forest 以及 Lars算法在 Breast Cancer 分类数据上的重要特征,得出影响 Breast Cancer分类的关键因素。
1.3 Boston 数据实验
-
对 Boston 房价数据进行探索性数据分析
-
数据预处理
-
以 R 2 R^2 R2、MSE、MAE 等指标为评价标准,探究 Random Forest算法的参数对模型性能的影响
-
对单棵决策树以及以决策树为基函数的集成算法(AdaBoost,Random Forest)进行性能对比,探索相较于单模型而言,集成学习的特点。
二、项目地址
这里只举例第一个数据集:
https://mbd.pub/o/bread/ZJWbkp9v
三、算法结果展示