文章目录
- Reliability-Aware Contrastive Self-ensembling for Semi-supervised Medical Image Classification
- 摘要
- 本文方法
- Reliability-Aware Contrastive Mean Teacher
- Weight Function
- Reliability-Aware Consistency Loss
- Reliability-Aware Contrastive Loss
- Objective Function
- 实验结果
Reliability-Aware Contrastive Self-ensembling for Semi-supervised Medical Image Classification
摘要
存在问题
自集成框架已被证明是利用丰富的未标记数据进行半监督医学图像分类的强大范例。然而,大多数自集成方法中使用的未标记数据的权重是相等的,当从不同人群、设备和环境中获取的未标记数据存在差异时,这对模型的分类性能产生不利影响。为了解决这个问题,我们提出了一种新的可靠性感知的对比自集成框架,该框架可以选择性地利用可靠的未标记数据。
本文方法
具体而言,我们在平均教师范式中引入了一个权重函数,用于将未标记数据的概率预测映射到反映其可靠性的相应权重。因此,我们可以安全地利用不同扰动下相关未标记数据的预测来构建可靠的一致性损失。此外,我们进一步设计了一种新的可靠的对比损失,以获得更好的类内紧密性和类间可分性,这些归一化嵌入来源于相关的未标记数据。因此,我们的可靠性感知方案使对比自集成框架能够同时捕获可靠的数据级和数据结构级信息,从而提高模型的鲁棒性和泛化能力。
代码链接
本文方法
提出的可靠性感知半监督分类框架的管道。
可靠性感知的一致性损失和可靠性感知的对比损失利用了训练集d上可靠的数据级和数据结构级信息。
监督损失在标记数据DL上进行优化。
β表示未标记数据的权重。权重函数的参数w可以根据监督损失的梯度进行更新。该框架在参数w和网络参数θ的更新之间迭代交替。
Reliability-Aware Contrastive Mean Teacher
提出的可靠性感知方案实现了基于机器翻译模型的半监督学习。MT的目标函数为
其中,Lsup表示监督损失。Lcs是一致性损失。θ和θ`分别为学生模型和教师模型的参数。教师网络参数θ更新为学生网络参数θ的指数移动平均(EMA)。η和η~是不同的输入扰动。
λc是平衡监督损失和无监督损失的权重参数。
请注意,当前的半监督学习方法使用单个标量对所有未标记的数据进行等量加权。如上所述,当未标记数据之间存在差异时,可能会对模型的性能产生不利影响
Weight Function
为了防止因平等对待所有未标记数据而导致的潜在性能下降,我们设计了一个权重函数,该函数可以自动为每个未标记数据分配唯一的权重。用w∈Rc参数化的权函数g: Rc→R,将未标记数据xi的概率预测映射到相应的权βi,可以表示为:
为了找到合适的未标记数据的权重,我们使模型能够持续跟踪标记数据的分类性能,以防止在使用加权的未标记数据时性能下降。
Reliability-Aware Consistency Loss
其中权重参数βi使用Eq.(2)自动识别。LC是距离度量,如Kullback-Leibler (KL)散度和最小均方误差(MSE)。可以看出,所提出的可靠性感知一致性损失只惩罚在不同输入扰动下可靠的未标记数据的不一致预测
Reliability-Aware Contrastive Loss
为了减轻由于不可靠的未标记数据引起的误导性数据结构级信息导致的性能下降,我们提出了一种新的可靠性感知对比损失,可以表示为
Zt是教师模型的规范化嵌入输出。βi, i = 1,2,···,2B为zi的权重参数。对于第i个未标记数据xi,教师模型得到的硬目标伪标签表示为yi~。τ是一个正的标量温度参数。
我们的可靠性感知对比损失侧重于可靠的未标记数据之间的联系,从而使它们的归一化嵌入具有更好的类内紧密性和类间可分性。
Objective Function
我们RAC-MT的目标可以被表述为以下的双层优化问题
实验结果