2024AEI:Cross-Supervised multisource prototypical network

news2024/11/16 9:58:21

目录

研究动机

研究数据集

研究方法


研究动机

  该论文是为了解决以轴承故障诊断为背景的多源域小样本域自适应问题而提出的。文中有提及到实际的工业生产中,存在多源域缺少足够的样本标签数据支撑一般的多源域域自适应(MSDA)方法的情况,故提出了针对多源域小样本域自适应的方法。

多源域小样本的原因:

  1. 机械设备通常在正常条件允许,发生故障就会停机检修,采集故障样本时间短
  2. 耗费巨大的人力物力,标注成本高
  3. 工况复杂多变,为所有工况标记足够满足MSDA的训练要求,不实际

研究数据集

  该论文主要采用了苏州大学(SCU)的轴承试验台收集的滚动轴承数据集,次要使用了山东科技大学的轴承数据集值得注意的是,本文提出的模型是针对多源域与目标域共享相同的标签空间

研究方法

        该论文的方法分为两个阶段:预训练阶段与训练阶段。

        在预训练阶段中,利用多源域的小样本对多源域其余未拥有标签的数据打上伪标签,设计了两阶段伪标签样本选择,将基于蒙特卡罗不确定性的伪标签样本被放置于置信度的选择之前,可有效滤除强噪声的样本,提高伪标签样本质量。值得注意的是,在预训练阶段,类别分类器拥有dropout为0.5的dp层,确保T次推理中,有不同的推理结果,以便进行基于蒙特卡罗不确定性的伪标签选择。

基于蒙特卡罗不确定性的伪标签选择,就是T次推理结果的标准差如果高于阈值,那么这个样本就不能进入到下一阶段的基于置信度的伪标签选择。标准差越小推理结果越集中越稳定,要是T次推理同一个样本每次推理的结果都不一样,意味着标准差一定会很大,这个样本无疑就是低置信度样本了。

        论文中提及到多源域进行域对齐主要可以分为两类,一种是先是把多源域进行域对齐,然后再把目标域与源域进行对,还有一种是目标域与不同源域分别进行域对齐,但前者可能会因为多个源域之间的差异比较大,共享信息不足,会造成多源信息的丢失,后者由于目标域和每个源域都独立地域对齐,就不能充分发挥多源域的互补信息,进一步提高模型的泛化能力。

        而在该论文的训练阶段中,其结合了两类多源域进行域对齐的方法,并设计了两个分支,一个共享分支和一个独立分支,在共享分支里面进行的是多源域进行域对齐再与目标域对齐,在独立分支里面进行的是源域-目标域的对齐。

       ​​​同时,在两个分支中都拥有原型对比学习(PCL)模块,该模块先是利用样本特征得到原型,再让原型作为对比学习的正样本对进行对比学习。在寻找原型的方法上,论文中阐述了一般原型学习方法Kmeans(计算量太大)与KNN(容易受到脏数据影响)的缺陷,并提出了一种基于相似度的加权方法来校准原型的位置。

        在共享分支中,每个源域在每个故障类型中都会找到一个原型,然后需要进行多源域的原型加权融合,使得一个故障类型只有一个融合原型,而权重是来自域权重模块Domain-weighted module,文中有提及到该权重可视为源域与目标域的相似程度。

 图中w是权重,V是原型,sM代表第M个源域,R代表第R个故障类型,S代表是共享分支。

        在独立分支中,不需要进行原型的融合,而是在独立分支的推理结果,给每个推理结果加上域的权重,做推理结果的权重融合。

        在CSL模块中,主要起到一个交叉监督的作用,论文中定义到如果共享分支与独立分支预测同一个样本都为同一个标签结果且都为高置信度,那么该样本就为高置信度样本。对于高置信度样本其监督损失如下。

        而定义如果共享分支与独立分支预测同一个样本不为同一个标签结果或为同一个标签结果但都为低置信度的为低置信度样本。 对于低置信度样本,两个分支预测的标签均不可靠。因此,论文中鼓励两个分支之间进行交叉监督,让置信度较低的分支学习置信度较高的分支的优势。用类预测概率的熵来量化两个分支的置信度,熵越低,置信度越高。这种引导过程通过 Kullback Leibler 散度(KLD)损失实现。

        故总体CSL模块的监督损失即高置信度样本的监督损失加上带权的低置信度样本监督损失。 

        最后,最终的目标预测 p(Dt) 可以通过以下方式计算。

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2106747.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

借助el-steps和el-form实现超长规则配置的功能

目录 一、应用场景 二、开发流程 三、详细开发流程 四、总结 一、应用场景 最近开发了一个规则类的配置功能,这个功能之前就写过,最近完善了一下,所以将原先的规则变得更多元化,结构也更多了一层,添加新功能的时候…

Java箱与泛型

大O的渐进表示法 大 O 的渐进表示法 去掉了那些对结果影响不大的项 &#xff0c;简洁明了的表示出了执行次数。 void func1(int N){ int count 0; for (int i 0; i < N ; i) { for (int j 0; j < N ; j) { count; } } for (int k 0; k < 2 * N ; k) { count; } in…

深度学习示例2-多输入多输出的神经网络模型

一、代码示例 from tensorflow import keras from tensorflow.keras import layers import numpy as np# 定义 多输入 多输出的模型 vocabulary_size = 1000 num_tags = 100 num_departments = 4title = keras.Input(shape=(vocabulary_size,), name = "title") tex…

【虚拟化】KVM常用命令操作(virsh磁盘管理)

目录 一、KVM概述 1.1 KVM工具栈 1.2 libvirt架构概述 1.3 KVM磁盘格式介绍 1.4 KVM磁盘操作常见语法 1.5 qemu-img命令简介 1.6 libguestfs安装 二、虚拟机磁盘管理 2.1 查看虚拟机磁盘 2.2 创建虚拟机磁盘 2.3 扩容磁盘容量 2.4 查看虚拟机存储状态 2.5 快照 2…

基于BiLSTM-CRF的医学命名实体识别研究(下)模型构建

一.生成映射字典 接下来需要将每个汉字、边界、拼音、偏旁部首等映射成向量。所以&#xff0c;我们首先需要来构造字典&#xff0c;统计多少个不同的字、边界、拼音、偏旁部首等&#xff0c;然后再构建模型将不同的汉字、拼音等映射成不同的向量。 在prepare_data.py中自定义…

实现自定义的移动端双指缩放

原理&#xff1a; DOM上绑定双指触控相关的事件&#xff0c;当双指触控时&#xff0c;保存初始距离&#xff0c;当双指移动时&#xff0c;计算两触控点的距离&#xff0c;根据移动中的距离与初始距离调节缩放比例&#xff0c;再根据缩放比例改变元素样式即可实现缩放 效果演示…

Java,版本控制:算法详解与实现

Spring Boot微服务架构技术及其版本号比较优化 随着云技术和分布式系统的快速发展&#xff0c;微服务架构已经成为现代软件开发不可或缺的一部分。 Spring Boot&#xff0c;作为一款广受欢迎的Java开发框架&#xff0c;其简洁的配置和快速启动的特性深受开发者青睐。 配合Sp…

旅游线路规划和路线下载

新疆旅游&#xff0c;规划一个北疆旅游线路安排如下&#xff1a; 第一天&#xff1a;从乌鲁木齐到魔鬼城&#xff0c;晚上住宿克拉玛依市乌尔禾区&#xff1b; 第二天&#xff1a;从克拉玛依市乌尔木区到五彩滩&#xff0c;晚上住宿贾登峪&#xff1b; 第三天&#xff1a;从…

win10本地设置无密码远程桌面登录设置

win10本地设置无密码远程桌面登录

软考超详细准备之软件设计师的计算机系统题型二(上午题)

目录 流水线 存储器: cache Cache命中率的相关图形 中断 相关习题 输入和输出 相关习题 总线 相关习题 加密技术与认证技术 相关习题 加密技术 相关习题 杂题 流水线 流水线&#xff08;Pipeline&#xff09;是一种在硬件设计中用于提高效率和吞吐量的技术&…

SOMEIP_ETS_088: SD_Answer_multiple_subscribes_together

测试目的&#xff1a; 验证设备&#xff08;DUT&#xff09;是否能够接受它接收到的每个SubscribeEventgroup条目。 描述 本测试用例旨在检查DUT在接收到包含多个SubscribeEventgroup条目的消息时&#xff0c;是否能够为每个条目发送SubscribeEventgroupAck。 测试拓扑&…

Runway删库跑路,备受瞩目的Stable Diffusion v1.5不见了!

替换方案&#xff1a; Hugging Face 模型镜像 - Gitee AIGitee AI 汇聚最新最热 AI 模型&#xff0c;提供模型体验、推理、训练、部署和应用的一站式服务&#xff0c;提供充沛算力&#xff0c;做中国最好的 AI 社区。https://ai.gitee.com/hf-models

【小程序 - 大智慧】深入微信小程序的核心原理

目录 课程目标背景双线程架构WebView 结构快速渲染 PageFrame编译原理Exparser通讯系统生命周期基础库解包跨端框架预编译半编译半运行运行时框架 主流技术Tarouni-app汇总 下周安排 课程目标 本次课程主要通过后台管理小程序回顾一下小程序的高阶语法&#xff0c;然后讲解整体…

Django+Vue协同过滤算法图书推荐系统的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 需要的环境3.2 Django接口层3.3 实体类3.4 config.ini3.5 启动类3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍&#xff1a;CSDN认证博客专家&#xff0c;CSDN平台Java领域优质创作者&…

144. 腾讯云Redis数据库

文章目录 一、Redis 的主要功能特性二、Redis 的典型应用场景三、Redis 的演进过程四、Redis 的架构设计五、Redis 的数据类型及操作命令六、腾讯云数据库 Redis七、总结 Redis 是一种由 C 语言开发的 NoSQL 数据库&#xff0c;以其高性能的键值对存储和多种应用场景而闻名。本…

Vue3 实现解析markdown字段以及文件

Vue实现博客前端&#xff0c;需要实现markdown的解析&#xff0c;如果有代码则需要实现代码的高亮。 Vue的markdown解析库有很多&#xff0c;如markdown-it、vue-markdown-loader、marked、vue-markdown等。这些库都大同小异。这里选用的是marked。 一、安装依赖库 在vue项目…

数据权限的设计与实现系列6——前端筛选器组件Everright-filter使用探索

linear 功能探索 最终我们是需要使用 API 的方式&#xff0c;调用后端服务拉取数据填充筛选器组件&#xff0c;不过在探索阶段&#xff0c;直接用 API 方式&#xff0c;就需要构造 mock 数据&#xff0c;比较麻烦&#xff0c;因此先使用 Function 方式来进行功能验证。 组件初…

关于找不到插件 ‘org.springframework.boot:spring-boot-maven-plugin:‘的解决方案

找到项目结构后&#xff0c;点击库&#xff0c;全选所有后点击应用即可

超声波眼镜清洗机买哪款?2024超声波眼镜清洗机推荐

超声波清洗机正逐渐成为广受欢迎的清洁解决方案&#xff0c;它以高效、深入且细腻的清洁效果&#xff0c;以及操作上的简易性&#xff0c;赢得了消费者的广泛喜爱。不过&#xff0c;市面上琳琅满目的品牌、多样化的型号及波动的价格区间&#xff0c;确实给消费者挑选时带来了不…

C1-2 ABB二次SDK开发——手把手教登录对应的机器人控制器(图片引导操作)登录机器人控制器和刷新机器人列表

1.完成配置后我们开始进行操作 C1-1 ABB二次SDK开发——C#Window窗体-环境配置&#xff08;带ABB二次开发SDK资源包&#xff09;-CSDN博客文章浏览阅读95次。3.记住路径&#xff0c;右键C#引用&#xff0c;然后导入ABB.Robotics.Controllers.PC.dll。2.安装资源文件PCABB二次开…