目录
研究动机
研究数据集
研究方法
研究动机
该论文是为了解决以轴承故障诊断为背景的多源域小样本域自适应问题而提出的。文中有提及到实际的工业生产中,存在多源域缺少足够的样本标签数据支撑一般的多源域域自适应(MSDA)方法的情况,故提出了针对多源域小样本域自适应的方法。
多源域小样本的原因:
- 机械设备通常在正常条件允许,发生故障就会停机检修,采集故障样本时间短
- 耗费巨大的人力物力,标注成本高
- 工况复杂多变,为所有工况标记足够满足MSDA的训练要求,不实际
研究数据集
该论文主要采用了苏州大学(SCU)的轴承试验台收集的滚动轴承数据集,次要使用了山东科技大学的轴承数据集。值得注意的是,本文提出的模型是针对多源域与目标域共享相同的标签空间。
研究方法
该论文的方法分为两个阶段:预训练阶段与训练阶段。
在预训练阶段中,利用多源域的小样本对多源域其余未拥有标签的数据打上伪标签,设计了两阶段伪标签样本选择,将基于蒙特卡罗不确定性的伪标签样本被放置于置信度的选择之前,可有效滤除强噪声的样本,提高伪标签样本质量。值得注意的是,在预训练阶段,类别分类器拥有dropout为0.5的dp层,确保T次推理中,有不同的推理结果,以便进行基于蒙特卡罗不确定性的伪标签选择。
基于蒙特卡罗不确定性的伪标签选择,就是T次推理结果的标准差如果高于阈值,那么这个样本就不能进入到下一阶段的基于置信度的伪标签选择。标准差越小推理结果越集中越稳定,要是T次推理同一个样本每次推理的结果都不一样,意味着标准差一定会很大,这个样本无疑就是低置信度样本了。
论文中提及到多源域进行域对齐主要可以分为两类,一种是先是把多源域进行域对齐,然后再把目标域与源域进行对,还有一种是目标域与不同源域分别进行域对齐,但前者可能会因为多个源域之间的差异比较大,共享信息不足,会造成多源信息的丢失,后者由于目标域和每个源域都独立地域对齐,就不能充分发挥多源域的互补信息,进一步提高模型的泛化能力。
而在该论文的训练阶段中,其结合了两类多源域进行域对齐的方法,并设计了两个分支,一个共享分支和一个独立分支,在共享分支里面进行的是多源域进行域对齐再与目标域对齐,在独立分支里面进行的是源域-目标域的对齐。
同时,在两个分支中都拥有原型对比学习(PCL)模块,该模块先是利用样本特征得到原型,再让原型作为对比学习的正样本对进行对比学习。在寻找原型的方法上,论文中阐述了一般原型学习方法Kmeans(计算量太大)与KNN(容易受到脏数据影响)的缺陷,并提出了一种基于相似度的加权方法来校准原型的位置。
在共享分支中,每个源域在每个故障类型中都会找到一个原型,然后需要进行多源域的原型加权融合,使得一个故障类型只有一个融合原型,而权重是来自域权重模块Domain-weighted module,文中有提及到该权重可视为源域与目标域的相似程度。
图中w是权重,V是原型,sM代表第M个源域,R代表第R个故障类型,S代表是共享分支。
在独立分支中,不需要进行原型的融合,而是在独立分支的推理结果,给每个推理结果加上域的权重,做推理结果的权重融合。
在CSL模块中,主要起到一个交叉监督的作用,论文中定义到如果共享分支与独立分支预测同一个样本都为同一个标签结果且都为高置信度,那么该样本就为高置信度样本。对于高置信度样本其监督损失如下。
而定义如果共享分支与独立分支预测同一个样本不为同一个标签结果或为同一个标签结果但都为低置信度的为低置信度样本。 对于低置信度样本,两个分支预测的标签均不可靠。因此,论文中鼓励两个分支之间进行交叉监督,让置信度较低的分支学习置信度较高的分支的优势。用类预测概率的熵来量化两个分支的置信度,熵越低,置信度越高。这种引导过程通过 Kullback Leibler 散度(KLD)损失实现。
故总体CSL模块的监督损失即高置信度样本的监督损失加上带权的低置信度样本监督损失。
最后,最终的目标预测 p(Dt) 可以通过以下方式计算。