基于蜣螂算法改进的随机森林回归算法 - 附代码
文章目录
- 基于蜣螂算法改进的随机森林回归算法 - 附代码
- 1.数据集
- 2.RF模型
- 3.基于蜣螂算法优化的RF
- 4.测试结果
- 5.Matlab代码
- 6.Python代码
摘要:为了提高随机森林数据的回归预测准确率,对随机森林中的树木个数和最小叶子点数参数利用蜣螂搜索算法进行优化。
1.数据集
数据信息如下:
data.mat 的中包含input数据和output数据
其中input数据维度为:2000*2
其中output数据维度为2000*1
所以RF模型的数据输入维度为2;输出维度为1。
2.RF模型
随机森林请自行参考相关机器学习书籍。
3.基于蜣螂算法优化的RF
蜣螂搜索算法的具体原理参考博客:https://blog.csdn.net/u011835903/article/details/128280084。
蜣螂算法的优化参数为RF中树木个数和最小叶子节点数。适应度函数为RF对训练集和测试集的均方误差(MSE),均方误差MSE越低越好。
f
i
n
t
e
n
e
s
s
=
M
S
E
[
p
r
e
d
i
c
t
(
t
r
a
i
n
)
]
+
M
S
E
[
p
r
e
d
i
c
t
(
t
e
s
t
)
]
finteness = MSE[predict(train)] + MSE[predict(test)]
finteness=MSE[predict(train)]+MSE[predict(test)]
4.测试结果
数据划分信息如下: 训练集数量为1900组,测试集数量为100组
蜣螂参数设置如下:
%% 定义蜣螂优化参数
pop=20; %种群数量
Max_iteration=30; % 设定最大迭代次数
dim = 2;%维度,即树个数和最小叶子点树
lb = [1,1];%下边界
ub = [50,20];%上边界
fobj = @(x) fun(x,Pn_train,Tn_train,Pn_test,Tn_test);
RF训练集MSE:0.21667
RF测试集MSE:1.0031
DBO-RF训练集MSE:0.15525
DBO-RF测试集MSE:0.84601
从MSE结果来看,经过改进后的蜣螂-RF明显优于未改进前的结果。