Abstract
翻译
最近出现的深度无监督方法使我们能够联合学习表示和对未标记数据进行聚类。这些深度聚类方法主要关注样本之间的相关性,例如选择高精度对来逐步调整特征表示,而忽略了其他有用的相关性。本文提出了一种新的聚类框架,称为深度全面相关挖掘(DCCM),从三个方面探索和充分利用未标记数据背后各种类型的相关性:1)提出伪标签监督以研究类别信息并学习有区别的特征,而不仅仅使用成对信息;2)充分探索输入空间中特征对图像变换的鲁棒性,这有益于网络学习,并显著提高了性能;3)提出了三元互信息用于聚类问题,将最近发现的实例级深度互信息提升到三元级别形式,进一步有助于学习更具区别性的特征。对几个具有挑战性的数据集进行了广泛的实验,结果表明,我们的方法取得了良好的性能,例如在CIFAR-10上获得了62.3%的聚类准确度,比最先进的结果高出10.1%
要点
现如今的深度聚类方法主要关注样本之间的相关性,而忽略了其他有用的相关性,因此本文提出了一种新的聚类框架,即DCCM,从以下三个方面探索和利用未标记数据背后各种类型的相关性
- 不仅仅使用成对信息,而是使用伪标签监督以研究类别信息并学习有区别的特征
- 充分探索输入空间中特征对图像