SS-ELM-AE与S2-BLS相关论文阅读记录

news2024/11/19 1:51:24

Broad learning system for semi-supervised learning

摘要:本文认为,原始BLS采用的稀疏自编码器来生成特征节点是一种无监督学习方法,这意味着忽略了标注数据的一些信息,并且难以保证同类样本之间的相似性和相邻性,同时SS-BLS和BLS都是构造线性模型,当不同类的样本分布存在重叠时,难以取得良好的分类效果。因此本文提出了一种新的半监督BLS——S2-BLS。

SS-ELM-AE

本文认为,SS-BLS或者是SS-ELM在引入非监督信息,即流形化的时候,考虑到选取k近邻点的情况,但是这种方法可能存在的缺点就是如果大多数标注样本它们所选择的k个近邻点都是标注样本,然后大多数无标注样本所选择的k个近邻点都是无标注样本,那么就没有充分利用到标注样本和未标注样本之间的关系。因此将SS-ELM-AE的目标函数定义为:
L S S − E L M − A E = 1 2 ∥ H W − X ∥ F 2 + C 2 ∥ W ∥ F 2 + λ 2 ( G L L + G L U ) L_{SS-ELM-AE}=\frac{1}{2}\Vert HW-X\Vert^2_F+\frac{C}{2}\Vert W\Vert^2_F+\frac{\lambda}{2}(G_{LL}+G_{LU}) LSSELMAE=21HWXF2+2CWF2+2λ(GLL+GLU)
其中X代表所有样本。而 G L L 、 G L U G_{LL}、G_{LU} GLLGLU分别代表标注样本内部之间的信息以及标注样本和无标注样本之间的信息。

对于标注样本,其相似度矩阵定义为:
S i j L = { 1 y i , y j ∈ t 0 o t h e r w i s e S^L_{ij}=\begin{cases}1\quad y_i,y_j \in t\\0\quad otherwise\end{cases} SijL={1yi,yjt0otherwise
就是属于同类的相似度为1,否则为0。因此 G L L G_{LL} GLL表示为:
G L L = 1 2 ∑ i = 1 l ∑ j = 1 l S i j L ∥ g ( x i ) − g ( x j ) ∥ F 2 G_{LL}=\frac{1}{2}\sum_{i=1}^l\sum_{j=1}^lS^L_{ij}\Vert g(x_i)-g(x_j)\Vert ^2_F GLL=21i=1lj=1lSijLg(xi)g(xj)F2
其中 g ( x ) g(x) g(x)代表模型对样本的输出。

而对于未标注样本,其相似性矩阵定义为:
S i j L U = { 1 x i ∈ k n n ( x j ) , j ∗    o r    x j ∈ k n n ( x i ) , i ∗ 0 o t h e r w i s e S^{LU}_{ij}=\begin{cases}1\quad x_i\in knn(x_j),j^* ~~or ~~x_j\in knn(x_i),i^*\\0\quad otherwise\end{cases} SijLU={1xiknn(xj),j  or  xjknn(xi),i0otherwise
其中 j ∗ j^* j表示如果 x j x_j xj是标注样本,那么其k个近邻点要从未标注样本之中选择。因此
G L U = 1 2 ∑ i = 1 l + u ∑ j = 1 l + u S i j L U ∥ g ( x i ) − g ( x j ) ∥ F 2 G_{LU}=\frac{1}{2}\sum_{i=1}^{l+u}\sum_{j=1}^{l+u}S^{LU}_{ij}\Vert g(x_i)-g(x_j)\Vert ^2_F GLU=21i=1l+uj=1l+uSijLUg(xi)g(xj)F2
那么可以将该矩阵写为:
S L U = ( 0 L L S L U S U L S U U ) S_{LU}=\left(\begin{matrix}0_{LL}\quad S_{LU}\\S_{UL }\quad S_{UU}\end{matrix}\right) SLU=(0LLSLUSULSUU)
斜对角线两个矩阵应该是转置关系。 S U U S_{UU} SUU就是简单的knn来计算。因此有:

在这里插入图片描述

其中 G = [ g ( x 1 ) ; . . . ; g ( x l + u ) ] G=[g(x_1);...;g(x_{l+u})] G=[g(x1);...;g(xl+u)]。L定义为:
L = D − S D = d i a g ( d 1 , . . . , d l + u ) , d i = ∑ i = 1 l + u S i j S = ( S L S L U S U L S U U ) L=D-S\\D=diag(d_1,...,d_{l+u}),d_i=\sum_{i=1}^{l+u}S_{ij}\\S=\left(\begin{matrix}S^L\quad S_{LU}\\S_{UL}\quad S_{UU}\end{matrix}\right) L=DSD=diag(d1,...,dl+u),di=i=1l+uSijS=(SLSLUSULSUU)
因此可以推导出:
L S S − E L M − A E = 1 2 ∥ H W − X ∥ F 2 + C 2 ∥ W ∥ F 2 + λ 2 T r ( W T H T L H W ) L_{SS-ELM-AE}=\frac{1}{2}\Vert HW-X\Vert^2_F+\frac{C}{2}\Vert W\Vert^2_F+\frac{\lambda}{2}Tr(W^TH^TLHW) LSSELMAE=21HWXF2+2CWF2+2λTr(WTHTLHW)
当输出节点输出多于隐藏层节点数目,可解出:

在这里插入图片描述

否则:

在这里插入图片描述

注意这里的损失函数是重构误差,因此可以看成是一个结合ELM思想的AE,是用来求解输入到隐藏层的权重的,而不是像ELM最终求解隐藏层到输出的权重的。

因此求解输入到特征节点映射的权重过程为:
在这里插入图片描述

S2-BLS

该算法就是对原有SS-BLS算法的改良,其利用了同样样本间的相似性和近邻点间的相似性信息来获取映射后的特征,同时考虑了类内紧性和类间可分性,获得更好的判别模型。具体来说:

其特征节点的定义比较特殊,用到了非线性激活函数,即:
Z i = ϕ i ( X W e i T ) , i = 1 , 2 , . . . , n Z_i=\phi_{i}(XW^T_{ei}),i=1,2,...,n Zi=ϕi(XWeiT),i=1,2,...,n
其中权重 W e i W_{ei} Wei正是通过SS-ELM-AE来获得的,而 ϕ \phi ϕ是非线性函数。然后狗仔增强节点的过程与普通BLS相同,因此得到 P = [ Z n ∣ H m ] P=[Z^n\mid H^m] P=[ZnHm]

那么在计算输出权重时,其考虑了类内紧性和类间可分性,即:

在这里插入图片描述

因此构造的损失项为:

在这里插入图片描述

其中 F = [ F 1 ; . . . ; F l + u ] F=[F_1;...;F_{l+u}] F=[F1;...;Fl+u]为对每个样本模型的预测向量, L i n t r a = D i n t r a − S i n t r a = d i a g ( d 1 i n t r a , . . . , d l + u i n t r a ) L_{intra}=D^{intra}-S_{intra}=diag(d^{intra}_1,...,d^{intra}_{l+u}) Lintra=DintraSintra=diag(d1intra,...,dl+uintra) d i i n t r a = ∑ i = 1 l + u S i n t r a i j d^{intra}_i=\sum_{i=1}^{l+u}S^{ij}_{intra} diintra=i=1l+uSintraij

在这里插入图片描述

其中 L i n t e r L_{inter} Linter也类似。

那么结合这两个L矩阵,可以用参数进行衡量。因此目标函数为:

在这里插入图片描述

其中
U = ( U l × l , 0     0      0 ) U l × l = d i a g ( 1 , . . . , 1 ) F = P β ,      β 为连接权重 L ~ = η L i n t r a − ( 1 − η ) L i n t e r U=\left(\begin{matrix}U_{l\times l},\quad 0\\~~~0\quad ~~~~0\end{matrix}\right)\\U_{l\times l}=diag(1,...,1)\\F=P\beta, ~~~~\beta 为连接权重\\\tilde{L}=\eta L_{intra}-(1-\eta)L_{inter} U=(Ul×l,0   0    0)Ul×l=diag(1,...,1)F=,    β为连接权重L~=ηLintra(1η)Linter
当样本数目多于隐藏层节点数目,可解出

在这里插入图片描述

否则:

在这里插入图片描述
其示意图大致如下所示:
在这里插入图片描述
伪代码如下所示:
在这里插入图片描述

总结

这篇文章从两部分作为创新点,一是原先BLS的AE寻求特征节点映射的部分,这部分它结合了ELM的思想来求解权重向量,第二部分是在求解链接输出的权重时,加入了类内和类间样本之间的关系矩阵。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/388725.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CentOS 7.9汇编语言版Hello World

先下载、编译nasm汇编器。NASM汇编器官网如下图所示: 可以点图中的List进入历史版本下载网址: 我这里下载的是nasm-2.15.05.tar.bz2 在CentOS 7中,使用 wget http://www.nasm.us/pub/nasm/releasebuilds/2.15.05/nasm-2.15.05.tar.bz2下载…

用Python Flask为女朋友做一个简单的网站(附可运行的源码)

🌟所属专栏:献给榕榕🐔作者简介:rchjr——五带信管菜只因一枚😮前言:该专栏系为女友准备的,里面会不定时发一些讨好她的技术作品,感兴趣的小伙伴可以关注一下~👉文章简介…

微信小程序原生开发功能合集四:复选框组件的封装

本章实现小程序复选框组件的封装,使用check及check-group组件实现复选框,封装数据加载过程,并自动实现数据解析及生成,实现相应方法。   另外还提供小程序开发基础知识讲解课程,包括小程序开发基础知识、组件封装、常用接口组件使用及常用功能实现等内容,具体如下:  …

k-Medoids 聚类系列算法:PAM, CLARA, CLARANS

前言 如果你对这篇文章可感兴趣,可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接。 kkk-Means 作为一种经典聚类算法,相信大家都比较熟悉,其将簇中所有的点的均值作为簇中心&#xf…

JavaScript- Map、Set、WeakMap、WeakSet、简单模拟Map

文章目录Map常见方法set常见方法WeakMapWeakSet如何实现一个Map?(简单模仿)Map Map是一种键值对的结构 常见方法 Map.prototype.set()Map.prototype.has()Map.prototype.get()Map.prototype.delete() set 常见方法 Set类似于数组,但是里面成员的值都是唯一的…

【Java】Spring MVC程序开发

文章目录Spring MVC程序开发1. 什么是Spring MVC?1.1 MVC定义1.2 MVC 和 Spring MVC 的关系2. 为什么学习Spring MVC?3. 怎么学习Spring MVC?3.1 Spring MVC的创建和连接3.1.1 创建Spring MVC项目3.1.2 RequestMapping 注解介绍3.1.3 Request…

OpenCV实战(12)——图像滤波详解

OpenCV实战(12)——图像滤波详解0. 前言1. 频域分析2. 低通滤波器3. 图像下采样3.1 使用低通滤波器下采样图像3.2 内插像素值4. 中值滤波器5. 完整代码小结系列链接0. 前言 滤波是信号和图像处理中的基本任务之一,其旨在有选择地提取图像的某…

【Linux】CentOS7操作系统安装nginx实战(多种方法,超详细)

文章目录前言一. 实验环境二. 使用yum安装nginx2.1 添加yum源2.1.1 使用官网提供的源地址(方法一)2.1.2 使用epel的方式进行安装(方法二)2.2 开始安装nginx2.3 启动并进行测试2.4 其他的一些用法:三. 编译方式安装ngin…

Angular快速入门

Angular1.框架背景2.Angular CLI2.1 安装2.2 主要特性2.3 创建module,component,service,class3.架构3.1 模块3.2 组件3.2.1 创建组件3.2.2 组件生命周期3.2.3 组件交互3.3 模板3.3.1 插值语法3.3.2 属性绑定3.3.3 条件判断3.3.4 循环语句3.3…

22. linux系统基础

递归遍历指定文件下所有的文件,而且你还可以统计一下普通文件的总个数,既然能统计普通文件,能统计其他文件吗?比如目录文件, 这个是main函数里面我们调用了 ,这个checkdird这个函数,需要传递一个…

垃圾收集器以及三色标记

分代收集理论当前虚拟机的垃圾收集采用分代收集算法,只是根据对象存活周期的不同将内存分为几块。一般将java堆分为新生代和老年代,这样我们就可以根据各个年代的特点选择合适的垃圾收集算法新生代:每次收集都会有大量对象(近99%)死去,所以可…

教资教育知识与能力中学教学

目录 3.1 教学概述 3.2 教学过程 3.3 教学原则*【简答/辨析重点】 3.4 教学方法 3.5 教学组织形式 3.6 教学工作基本环节 3.7 教学评价 3.1 教学概述 1、教学的意义【14/18辨析】 教学是传授系统知识、促进学生发展的最有效形式; 教学是学校进行全面发展教…

MSTP多域实验配置

目录 实验配置 配置MSTP MSTP参数修改 查看每个设备的生成树 配置MSTP安全 实验配置 放行相关Vlan MST1域内的交换机互联接口放行Vlan 30、40 MST2域内的交换机互联接口放行Vlan 10、20、40 MST1域和MST2域之间交换机互联端口放行Vlan 40 配置MSTP 全网交换机都开启MSTP&a…

【SpringMVC】springMVC介绍

参考资料 视频资料 03_尚硅谷_SpringMVC_SpringMVC简介_哔哩哔哩_bilibili 笔记资料 第一节 SpringMVC概述 (wolai.com)链接:https://pan.baidu.com/s/1A7BX2TNfbGTpYene4x3Mew 提取码:a8d5 一、SpringMVC简介 1、什么是MVC MVC是一种软件架构的思…

React(五):受控组件、高阶组件、Portals、Fragment、CSS的编写方式

React(五)一、受控组件1.什么是受控组件(v-model)2.收集表单数据:input和单选框3.收集表单数据:下拉框二、非受控组件三、高阶组件1.什么是高阶组件2.高阶组件的应用13.高阶组件的应用2-注入Context4.高阶组件的应用3-登录鉴权5.高…

十一、GoF之代理模式

1 对代理模式的理解 【在程序中,对象A和对象B无法直接交互时。】 【在程序中,功能需要增强时。】 【在程序中,目标需要被保护时】 业务场景:系统中有A、B、C三个模块,使用这些模块的前提是需要用户登录,也…

HTML的表单标签

🌟所属专栏:HTML只因变凤凰之路🐔作者简介:rchjr——五带信管菜只因一枚😮前言:该系列将持续更新HTML的相关学习笔记,欢迎和我一样的小白订阅,一起学习共同进步~👉文章简…

将对象或数组存在 dom元素的属性上,最后取不到完整数据,只取到 [{

目录 一、问题 二、问题及解决方法 三、总结 一、问题 1.我需要在dom元素里面添加了一个属性test存一个对象数组temp,以便我下一次找到这个dom元素时可以直接拿到属性里面的数据来渲染页面。 2.dom 属性上存 对象和数组,必须先JSON.stringify(arr),转…

开发手册——一、编程规约_8.注释规约

这篇文章主要梳理了在java的实际开发过程中的编程规范问题。本篇文章主要借鉴于《阿里巴巴java开发手册终极版》 下面我们一起来看一下吧。 1. 【强制】类、类属性、类方法的注释必须使用 Javadoc 规范,使用 /**内容*/ 格式,不得使用 // xxx 方式。 说…

C++ 线程库

文章目录thread 创建mutexmutexrecursive_mutextimed_mutexlock_guard原子操作atomic条件变量condition_variable其他线程安全问题shared_ptr单例模式C 线程库是 C11 标准中引入的一个特性,它使得 C 在语言级别上支持多线程编程,不需要依赖第三方库或操作…