基于遗传算法优化的核极限学习机(KELM)分类算法

文章目录

基于遗传算法优化的核极限学习机(KELM)分类算法
- 1.KELM理论基础
- 2.分类问题
- 3.基于遗传算法优化的KELM
- 4.测试结果
- 5.Matlab代码

摘要：本文利用遗传算法对核极限学习机(KELM)进行优化，并用于分类

1.KELM理论基础

核极限学习机（Kernel Based Extreme Learning Machine，KELM）是基于极限学习机（Extreme Learning Machine，ELM）并结合核函数所提出的改进算法，KELM 能够在保留 ELM 优点的基础上提高模型的预测性能。

ELM 是一种单隐含层前馈神经网络，其学习目标函数F(x) 可用矩阵表示为:
$F(x)=h(x)\times \beta=H\times\beta=L \tag{9}$
式中： $x$ 为输入向量， $h (x)$ 、 $H$ 为隐层节点输出， $β$ 为输出权重， $L$ 为期望输出。

将网络训练变为线性系统求解的问题， $\beta$ 根据 $β = H * \cdot L$ 确定，其中， $H^*$ 为 $H$ 的广义逆矩阵。为增强神经网络的稳定性，引入正则化系数 $C$ 和单位矩阵 $I$ ，则输出权值的最小二乘解为
$\beta = H^T(HH^T+\frac{I}{c})^{-1}L\tag{10}$
引入核函数到 ELM 中，核矩阵为：
$\Omega_{ELM}=HH^T=h(x_i)h(x_j)=K(x_i,x_j)\tag{11}$
式中： $x_i$ ， $x_j$ 为试验输入向量，则可将式（9）表达为：
$F(x)=[K(x,x_1);...;K(x,x_n)](\frac{I}{C}+\Omega_{ELM})^{-1}L \tag{12}$
式中： $x_1 , x_2 , …, x_n )$ 为给定训练样本， $n$ 为样本数量. $K ()$ 为核函数。

2.分类问题

本文对乳腺肿瘤数据进行分类。采用随机法产生训练集和测试集，其中训练集包含 500 个样本，测试集包含 69 个样本。

3.基于遗传算法优化的KELM

遗传算法的具体原理参考博客

由前文可知，本文利用遗传算法对正则化系数 C 和核函数参数 S 进行优化。适应度函数设计为训练集与测试集的错误率。
$f i t n ess = a r g min (T r ain E rror R a t e + T es tE rror R a t e) 。$

4.测试结果

在这里插入图片描述

训练集GA-KELM正确率:1
测试集GA-KELM正确率:0.92754
病例总数：569 良性：357 恶性：212
训练集病例总数：500 良性：300 恶性：200
测试集病例总数：69 良性：57 恶性：12
良性乳腺肿瘤确诊：55 误诊：2 确诊率p1=96.4912%
恶性乳腺肿瘤确诊：9 误诊：3 确诊率p2=75%
训练集KELM正确率:1
测试集KELM正确率:0.89855
病例总数：569 良性：357 恶性：212
训练集病例总数：500 良性：300 恶性：200
测试集病例总数：69 良性：57 恶性：12
良性乳腺肿瘤确诊：55 误诊：2 确诊率p1=96.4912%
恶性乳腺肿瘤确诊：7 误诊：5 确诊率p2=58.3333%

从结果可以看出，遗传-KELM明显优于原始KELM算法