Ai_drive _103_重新思考图像融合策略和自监督对比学习

Ai_drive _103_重新思考图像融合策略和自监督对比学习

news2025/4/27 14:26:06

近先进的无监督学习方法使用类似连体的框架来比较来自同一图像的两个“视图”以进行学习表示。使这两种观点与众不同的是保证无监督方法可以学习有意义信息核心。但是，如果用于生成两个视图的增强不够强，则此类框架有时会在过度拟合方面变得脆弱，从而导致训练数据出现过度自信的问题。这个缺点阻碍了模型学习细微的方差和细粒度的信息。
为了解决这个问题，本工作探究了在自监督学习常用的双子结构网络中，通过在输入空间做图像融合来学习更加细粒度的特征表示。文章的核心内容讨论了如何来设计数据采样，融合策略和构建对应的损失函数，从而去匹配图像融合之后新的输入空间。具体而言，本文通过在对比学习模型的单个分支上做图像融合，使得最后两个分支的距离度量变为一个0~1之间的软化系数的倍数，从而使两个分支之间的距离变得更加细微和敏感（该工作首次在自监督双子模型中引入了软距离的概念），进而让模型学习到更加细粒度的输入信息的隐空间表达。

论文名称：

Un-Mix: Rethinking Image Mixtures for Unsupervised Visual Representation Learning

论文链接：

https://arxiv.org/abs/2003.05438
https://arxiv.org/pdf/2003.05438.pdf;

code :

本次分享的具体内容有：

1. 研究背景和动机

1.1

在这里插入图片描述

在这里插入图片描述

1.2

1.3

2. 研究方法介绍

2.1

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

2.2

在这里插入图片描述

2.3

在这里插入图片描述

3. 结果分析和代码实现

https://github.com/szq0214/Un-Mix

理论及可视化分析

在这里插入图片描述

3.1

3.2

3.3

结论

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1096093.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

VL53L5CX驱动开发(4)----运动指示器

VL53L5CX驱动开发(4)----运动指示器

VL53L5CX驱动开发----4.运动指示器概述视频教学样品申请源码下载生成STM32CUBEMX选择MCU串口配置IIC配置 INT设置配置使能与复位X-CUBE-TOF1串口重定向代码配置检测流程TOF代码配置主程序演示结果概述 VL53L5CX传感器内置了一个固件功能，可以检测场景中的运动。这…

阅读更多...

【算法|动态规划No.21】leetcode494. 目标和

【算法|动态规划No.21】leetcode494. 目标和

个人主页：兜里有颗棉花糖欢迎点赞👍 收藏✨ 留言✉ 加关注💓本文由兜里有颗棉花糖原创收录于专栏【手撕算法系列专栏】【LeetCode】 🍔本专栏旨在提高自己算法能力的同时，记录一下自己的学习过程，希望…

阅读更多...

Redis的五大基础数据类型

Redis的五大基础数据类型

String 字符串类型，通过set关键字和get关键字来设置字符串键值对和获取字符串键值对。 hash 哈希类型，结构和Map<String,Map<String,stirng>>类似。使用hset来设置哈希，使用hget来获取哈希，hget要精确到第二个key…

阅读更多...

【深度学习 | Transformer】释放注意力的力量:探索深度学习中的变形金刚，一文带你读通各个模块 —— Positional Encoding（一）

【深度学习 | Transformer】释放注意力的力量:探索深度学习中的变形金刚，一文带你读通各个模块 —— Positional Encoding（一）

🤵‍♂️ 个人主页: AI_magician 📡主页地址： 作者简介：CSDN内容合伙人，全栈领域优质创作者。 👨‍💻景愿：旨在于能和更多的热爱计算机的伙伴一起成长！！&…

阅读更多...

Python深度学习实践代码实现

Python深度学习实践代码实现

线性模型课程代码 import numpy as np import matplotlib.pyplot as plt x_data[1.0,2.0,3.0] y_data[2.0,4.0,6.0] #前馈函数 def forward(x):return x*w #损失函数 def loss(x,y):y_predforward(x)return (y_pred-y)*(y_pred-y) w_list[] mse_list[] for w in np.arange…

阅读更多...

2.Javaweb模块基本

1.1web基本 session 和 cookie 有什么区别？ 存储位置不同：session 存储在服务器端；cookie 存储在浏览器端。安全性不同：cookie 安全性一般，在浏览器存储，可以被伪造和修改。容量和个数限制：…

阅读更多...

浅讲make/makefile【linux】

浅讲make/makefile【linux】

浅讲make/makefile【linux】一. 什么是make/makefile？二. makefile2.1 依赖关系与依赖方法2.2 浅用make2.2.1 make test2.2.2 clean 2.2 make一次执行多步2.3 部分修饰符号2.3.1 .PHONY(伪目标)2.3.2 2.3.3 $ $^ 一. 什么是make/makefile？ make/makefi…

阅读更多...

uml知识点学习

https://zhuanlan.zhihu.com/p/659911315https://zhuanlan.zhihu.com/p/659911315软件工程分析设计图库目录 - 知乎一、结构化绘图1. 结构化——数据流图Chilan Yuk：1. 结构化——数据流图2. 结构化——数据字典Chilan Yuk：2. 结构化——数据字典3. 结构…

阅读更多...

“理解梯度下降：直觉、数学公式和推导”

“理解梯度下降：直觉、数学公式和推导”

一、说明梯度下降是机器学习中使用的一种流行的优化算法，通过迭代调整函数的参数来最小化函数。基本思想是将函数的参数沿函数梯度最陡峭下降的方向移动。二、关于梯度的叙述简单来说，想象一下你在山顶，你想尽快到达山脚下。你可以开始下坡…

阅读更多...

流程图规范

流程图规范

文章目录 1.符号概览2.要求2.1 从上至下，从左至右的流向顺序2.2 开始符号只能有一个出口2.3 进程符号不做逻辑校验2.4 相同流程图，符号大小应为一致2.5 引用流程，而不是重复绘制2.6 路径符号应尽量避免相互交叉2.7 同一路径，箭头只…

阅读更多...

【Python】Python语言基础（下）

【Python】Python语言基础（下）

目录第十一章控制结构 for语句 if语句 while语句第十二章函数函数介绍函数的定义函数的调用函数的传参函数的传参方式位置实参关键字实参默认值实参函数的返回值函数传递未知数量的实参函数的模块调用调用整个模块调用模块中特定功能第十…

阅读更多...

业财融合潮流下，构建国有企业全面预算管理体系

业财融合潮流下，构建国有企业全面预算管理体系

近年来，在我国快速发展的变革过程中，国有企业改革的持续深入需要积极结合市场环境和自身发展需求，然而其传统的财务管理模式难以适应企业提出的新要求，预算管理与经营销售之间不断出现隔阂。为确保全面预算管理在国有企业内部的良…

阅读更多...

部署个人静态网站到阿里云服务器（含域名解析）

部署个人静态网站到阿里云服务器（含域名解析）

使用前提： 您目前已经有一个静态网站，可以在本地通过html进行访问。 1、购买阿里云服务器该步骤最详细的教程来自官方文档具体到从注册开始每一个鼠标点击都有图片介绍。你可以按照他的步骤完成整个部署过程，当然可以自己选择服务器的…

阅读更多...

【实用调试技巧】总是找不到Bug?手把手教你在vs2022中调试程序

【实用调试技巧】总是找不到Bug?手把手教你在vs2022中调试程序

🦄个人主页:修修修也 🎏所属专栏:程序调试及报错解决 ⚙️操作环境:Visual Studio 2022 目录什么是Bug? 1947年9月9日:第一个"Bug"被发现什么是调试? 调试是什么? 调试的基本步骤 Debug和Relese的区别 1.调试的区别 2.文件大小的…

阅读更多...

13 | 如何正确使用 @Entity 里面的回调方法

13 | 如何正确使用 @Entity 里面的回调方法

Java Persistence API 里面规定的回调方法有哪些？ JPA 协议里面规定，可以通过一些注解，为其监听回调事件、指定回调方法。下面我整理了一个回调事件注解表，分别列举了 PrePersist、PostPersist、PreRemove、PostRemove、PreUpdat…

阅读更多...

线性排序：如何根据年龄给100万用户数据排序？

线性排序：如何根据年龄给100万用户数据排序？

文章来源于极客时间前google工程师−王争专栏。桶排序、计数排序、基数排序时间复杂度是O(n)，所以这类排序算法叫作线性排序。线性的原因：三个算法是非基于比较的排序算法，都不涉及元素之间的比较操作。三种排序对排序的数据要求苛刻&am…

阅读更多...

19 | 如何搞清楚事务、连接池的关系？正确配置是怎样的

19 | 如何搞清楚事务、连接池的关系？正确配置是怎样的

事务的基本原理在学习 Spring 的事务之前，你首先要了解数据库的事务原理，我们以 MySQL 5.7 为例，讲解一下数据库事务的基础知识。我们都知道当 MySQL 使用 InnoDB 数据库引擎的时候，数据库是对事务有支持的。而事务最主要的作…

阅读更多...

(转)富文本编辑器——Vue2Editor

(转)富文本编辑器——Vue2Editor

介绍 Vue2Editor是一个简单易用且功能强大的Vue版本的富文本编辑器，其基于Quill.js和Vuejs构建！ 简单易用、功能强大的富文本编辑器——Vue2Editor Github https://github.com/davidroyer/vue2-editor 特性简单易用；基于Vue.js & Quil…

阅读更多...

【Golang】Go的并发和并行性解释。谁说Go不是并行语言？

【Golang】Go的并发和并行性解释。谁说Go不是并行语言？

偶然发现百度上有很多"师出同门"的"go是并发语言，而不是并行语言"的说法。让我顿感奇怪，"并行"说白了就是对CPU多核的利用，这年头不能利用多核的编译语言还有的混？而且还混的这么好？并且…

阅读更多...

Linux网络编程系列之服务器编程——非阻塞IO模型

Linux网络编程系列之服务器编程——非阻塞IO模型

Linux网络编程系列 （够吃，管饱） 1、Linux网络编程系列之网络编程基础 2、Linux网络编程系列之TCP协议编程 3、Linux网络编程系列之UDP协议编程 4、Linux网络编程系列之UDP广播 5、Linux网络编程系列之UDP组播 6、Linux网络编程系列之服务器编…

阅读更多...

推荐文章

最新文章