MOE论文汇总

news2024/12/24 8:20:45

最近对MOE感兴趣,现汇总MOE+无监督相关的文章,文章均为略读

文章

Self-Supervised Mixture-of-Experts by Uncertainty estimation

发表于:AAAI19
流程:
文章配图
总体来说,当环境给出反馈,通过门控网络激活相应的专家去交涉。但是,专家网络可能需要参数–因此,可以通过transformer来生成ground truth来去选择对应的专家。
总结: 这篇文章的监督信号是transformer生成的

MoDE: CLIP Data Experts via clustering

发表于:CVPR24
这篇论文介绍了一种名为Mixture of Data Experts (MoDE)的新方法,用于改进对比语言-图像预训练(CLIP)的性能。CLIP的成功依赖于图像和标题之间的配对监督,但网络数据中的噪声会影响学习质量。MoDE通过聚类学习一组CLIP数据专家,每个数据专家在训练时只关注一个数据集群,减少了对其他集群中错误负面噪声的敏感性。在推理时,通过考虑任务元数据和集群条件之间的相关性来加权集成这些输出。
MoDE的核心思想是:

  1. 通过聚类将训练数据(图像-标题对)分成几个不相交的子集,每个子集用于训练一个模型。
    1. 每个模型(数据专家)专门处理一个集群的数据,从而减少错误负面样本的影响,并提高对比学习的效果。
    1. 在下游任务中,如图像分类,通过比较任务元数据(如类别名)和每个数据集群的中心,来决定激活哪些数据专家。
    1. 被选中的数据专家用于创建测试图像和类别的嵌入,然后输出最高集成相似性的类别作为分类结果。
  2. 实验表明,MoDE在多个标准基准测试中优于几个最先进的视觉-语言模型,例如在CLIP基准测试中的图像分类提高了3.7%,在COCO数据集上的图像到文本检索提高了3.3%,文本到图像检索提高了2.7%。MoDE的优势归因于更好的训练个体数据专家模型,因为同一集群中的样本在对比学习中提供了更高质量的负面样本。
  3. 总结: 将expert和无监督聚类结合,取得了不错的结果
  4. Multimodal Contrastive Learning with LIMoE: the Language-Image Mixture of Experts

  5. 发表于: Neurips 22,谷歌团队~
  6. 文章配图
    10.这篇的工作是多模态对比学习。参考文章:LIMoE:使用MoE学习多个模态-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2140913.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LabVIEW减速机加载控制系统

为了保障减速机的产品质量,开发了一套基于LabVIEW的减速机加载控制系统。该系统利用先进的传感技术与自动化控制理念,实现了减速机性能的全面测试与分析,有效提升了生产线的自动化水平与检测效率。 项目背景 随着工业自动化水平的不断提高&a…

面试官问:请描述一次你成功解决问题的经历?

面试官为什么要这么问? 面试官问你描述一次成功解决问题的经历,主要是为了评估你的几个关键方面: 问题解决能力:了解你在面对挑战时的思维方式和应对策略。 决策能力:考察你在压力下做出明智决定的能力。 沟通技巧&am…

Linux实操笔记2 Ubuntu安装Nginx的不同方法

今天来了解Ubuntu或者说Linux系统安装Nginx的几种办法。包括从Ubuntu的库安装到官方源码编译安装。 一、Nginx是什么? 以下是来自Nginx中文文档的内容。 Nginx 是一个高性能的 Web 和反向代理服务器, 它具有有很多非常优越的特性: 作为 Web 服务器:相比…

Matlab生成prbs7的代码

最近的一个客户需求,客户想看一下我们的产品产生的prbs并进行一些分析。 我在“”豆包“”这里找到了一个pbs的matlab的生成程序,效果就是连续生成prbs7,然后每次都在原来的基础之上添加。 生成的matlab的PRBS7代码修改如下: %…

深入了解字符函数和字符串函数

前言:今天给大家深入理解一下字符函数 和 字符串函数。通过使用 和 模拟实现 带大家加深理解,让大家灵活使用。 字符函数 在C语言中,有一系列函数是专门做字符分类的,也就是一个字符属于什么类型的字符。 这些函数的使用都要包含…

Redis embstr 编码

embstr 编码 是 Redis 中一种优化存储小型字符串的编码方式。它是 Redis 内部存储字符串的多种方式之一,特别适用于存储长度不超过 44 字节的小字符串。

java中Class文件的文件格式

无关性的基石 计算机底层只能识别二进制,由CPU直接处理二进制,在底层上面是操作系统,在操作系统上面就是虚拟机,java有一个口号,“一次编写,到处运行”这个不太可能在操作系统层面上实现,不同的…

SQL Server开启网络访问

目前工作中很少用到SQL Server了,最近需要测试几个表,需要搭建一个SQL Server数据库服务,这里做个总结吧。 安装这里就不做详细介绍了,本文只介绍如何开启SQL Server网络访问。 1、云服务器安全组设置 如果是搭建在云服务器上&a…

时序最佳入门代码|基于pytorch的LSTM天气预测及数据分析

前言 在本篇文章,我们基于pytorch框架,构造了LSTM模型进行天气预测,并对数据进行了可视化分析,非常值得入门学习。该数据集提供了2013年1月1日至2017年4月24日在印度德里市的数据。其中包含的4个参数是平均温度(meant…

【数字集成电路与系统设计】Chisel/Scala简介与Verilog介绍

目录 一、芯片前端设计开发背景知识 二、Verilog介绍 2.1 硬件设计一些重要概念 2.2 功能性仿真 2.3 简单的Verilog代码例子(4-bit的加法器) 三、Chisel简介 3.1 Chisel基本概念 3.2 Chisel代码展示 3.3 Chisel转成Verilog代码 四、Scala入…

数据清洗-缺失值填充-对XGBoost参数优化填充

目录 一、安装所需的python包二、采用XGboost算法进行缺失值填充2.1可直接运行代码2.2以某个缺失值数据进行实战2.2.1 代码运行过程截屏:2.2.2 填充后的数据截屏: 三、网格搜索(Grid Search)对 XGBoost 模型的超参数进行优化原理介…

Windows 上下载、编译 OpenCV 并配置系统环境变量的详细步骤

创作不易,您的打赏、关注、点赞、收藏和转发是我坚持下去的动力! 在 Windows 上下载并编译 OpenCV,然后配置系统环境变量的步骤如下: 1. 下载 OpenCV 打开 OpenCV 官方下载页面。找到最新的 Windows 版本,点击下载&…

初中生物--4.生物体的结构层次(二)

一、植物体的结构层次 1.绿色开花植物的六大器官 根、茎、叶、花、种子、果实 2.植物的组织 3.植物体的生长 植物体的生长是细胞分裂、生长和分化的综合结果。在植物体的生长过程中,细胞不断分裂产生新的细胞,新细胞不断生长使细胞体积增大&#xff…

数据结构 - 队列

一.队列的定义 1.队列的分类 队列根据存储结构可以分为 顺序队列 和 链式队列 2.队列的结构 ①.顺序队列 顺序队列的 front 指向队首元素的前一个下标 ②.链式队列 二.顺序队列的基本运算 0.顺序队列的结构体定义 typedef int data_t;typedef struct {data_t *data; …

stable diffusion 反推提示词插件 tagger 的安装,很详细

stable diffusion 反推提示词插件 tagger 的安装,很详细 一、前言二、下载1、方式一2、方式二 一、前言 最近想下载 stable diffusion 反推提示词插件 tagger ,也是好一番折腾,这里做个记录。 在安装之前确保能正常访问 github &#xff0c…

图像增强技术分析

图像增强是一种图像处理技术,旨在改善图像的视觉质量,使其更适合显示或进一步分析。这种技术可以应用于多种场景,包括医学成像、卫星图像、视频处理以及文本到图像生成模型等领域。图像增强的目标通常是提高图像的某些视觉特征,如…

[内网渗透]---msf基础-永恒之蓝-ms17-010

what Metasploit(通常简称为MSF)是一个开源的渗透测试框架,包含大量的已知漏洞利用模块,可以用来攻击目标系统并获取控制权。 how 实验环境:Kali、带有永恒之蓝漏洞的虚拟机且开启445端口(两个虚拟机同一子网) 1.信…

FPGA-Vivado-IP核-虚拟输入输出(VIO)

VIO IP核 背景介绍 Vivado中的VIO(Virtual Input/Output,虚拟输入/输出) IP核是一种用于调试和测试FPGA设计的IP核。当设计者通过JTAG接口与FPGA芯片连接时,在Vivado的Verilog代码中添加VIO IP核,就可以让设计者与FPG…

TCP 拥塞控制:一场网络数据的交通故事

从前有条“高速公路”,我们叫它互联网,而这条公路上的车辆,则是数据包。你可以把 TCP(传输控制协议)想象成一位交通警察,负责管理这些车辆的行驶速度,以防止交通堵塞——也就是网络拥塞。 第一…

08_Python数据类型_字典

Python的基础数据类型 数值类型:整数、浮点数、复数、布尔字符串容器类型:列表、元祖、字典、集合 字典 字典(Dictionary)是一种可变容器模型,它可以存储任意类型对象,其中每个对象都存储为一个键值对。…