DEC算法由两部分组成
- 第一部分会预训练一个SDAE模型;
- 第二部分选取SDAE模型中的Encoder部分,加入聚类层,然后最小化KL散度进行训练聚类
Absratct
提出了一种利用深度神经网络同时进行表征学习和聚类分配的方法,称之为深度嵌入聚类。该方法学习从数据空间到低纬空间的映射,并在其中迭代优化聚类目标
Introduction
想法:定义了从数据空间X到低维特征空间Z的参数化非线性映射,在该映射中我们优化了聚类目标。与之前在数据空间或浅层线性嵌入空间上的工作不同,我们通过反向传播在聚类目标上使用SGD来学习映射,这是由DNN参数化的
如何优化:与监督学习方式不同,我们不能用已标记的数据训练网络,相反我们建议用从当前的软聚类分配派生的辅助目标迭代细化聚类
Deep embedded clusering
首先使用非线性映射