它是最成功的增强集成算法之一。该算法的主要关键在于它们对数据集中的赋予权重的方式。因此,在构建后续模型时,该算法无需过多关注。
在以下Python配方中,我们将通过使用Pima Indians糖尿病数据集上的 sklearn 的 AdaBoostClassifier 类来构建用于分类的Ada Boost集成模型。
首先,导入所需的软件包,如下所示:
from pandas import read_csv from sklearn.model_selection import KFold from sklearn.model_selection import cross_val_score from sklearn.ensemble import AdaBoostClassifier
现在,我们需要像之前的Example一样加载Pima糖尿病数据集-
path=r"C:\pima-indians-diabetes.csv" headernames=[preg, plas, pres, skin, test, mass, pedi, age, class] data=read_csv(path, names=headernames) array=data.values X=array[:,0:8] Y=array[:,8]
接下来,输入用于十折交叉验证的输入,如下所示:
seed=5 kfold=KFold(n_splits=10, random_state=seed)
我们需要提供要建造的树木数量。在这里,我们正在构建150棵树木,这些树木的分裂点是从5个特征中选择的-
num_trees=50
接下来,在以下脚本的帮助下构建模型-
model=AdaBoostClassifier(n_estimators=num_trees, random_state=seed)
计算并打印输出如下-
results=cross_val_score(model, X, Y, cv=kfold) print(results.mean())
输出
0.7539473684210527
上面的输出表明,我们的AdaBoost分类器集成模型的准确度约为75%。
Python机器学习 中的 AdaBoost函数 - 无涯教程网无涯教程网提供它是最成功的增强集成算法之一。该算法的主要关键在于它们对数据集中的赋予权重的方式...https://www.learnfk.com/python-machine-learning/machine-learning-with-python-adaboost.html