MOE论文汇总

MOE论文汇总

news2026/2/15 15:57:34

最近对MOE感兴趣，现汇总MOE+无监督相关的文章，文章均为略读

文章

Self-Supervised Mixture-of-Experts by Uncertainty estimation

发表于:AAAI19
流程:
文章配图
总体来说，当环境给出反馈，通过门控网络激活相应的专家去交涉。但是，专家网络可能需要参数–因此，可以通过transformer来生成ground truth来去选择对应的专家。
总结： 这篇文章的监督信号是transformer生成的

MoDE: CLIP Data Experts via clustering

发表于：CVPR24
这篇论文介绍了一种名为Mixture of Data Experts (MoDE)的新方法，用于改进对比语言-图像预训练（CLIP）的性能。CLIP的成功依赖于图像和标题之间的配对监督，但网络数据中的噪声会影响学习质量。MoDE通过聚类学习一组CLIP数据专家，每个数据专家在训练时只关注一个数据集群，减少了对其他集群中错误负面噪声的敏感性。在推理时，通过考虑任务元数据和集群条件之间的相关性来加权集成这些输出。
MoDE的核心思想是：

通过聚类将训练数据（图像-标题对）分成几个不相交的子集，每个子集用于训练一个模型。
1. 每个模型（数据专家）专门处理一个集群的数据，从而减少错误负面样本的影响，并提高对比学习的效果。
1. 在下游任务中，如图像分类，通过比较任务元数据（如类别名）和每个数据集群的中心，来决定激活哪些数据专家。
1. 被选中的数据专家用于创建测试图像和类别的嵌入，然后输出最高集成相似性的类别作为分类结果。
实验表明，MoDE在多个标准基准测试中优于几个最先进的视觉-语言模型，例如在CLIP基准测试中的图像分类提高了3.7%，在COCO数据集上的图像到文本检索提高了3.3%，文本到图像检索提高了2.7%。MoDE的优势归因于更好的训练个体数据专家模型，因为同一集群中的样本在对比学习中提供了更高质量的负面样本。
总结： 将expert和无监督聚类结合，取得了不错的结果
Multimodal Contrastive Learning with LIMoE: the Language-Image Mixture of Experts
发表于: Neurips 22,谷歌团队~
10.这篇的工作是多模态对比学习。参考文章：LIMoE：使用MoE学习多个模态-CSDN博客

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2140913.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

LabVIEW减速机加载控制系统

LabVIEW减速机加载控制系统

为了保障减速机的产品质量，开发了一套基于LabVIEW的减速机加载控制系统。该系统利用先进的传感技术与自动化控制理念，实现了减速机性能的全面测试与分析，有效提升了生产线的自动化水平与检测效率。项目背景随着工业自动化水平的不断提高&a…

阅读更多...

面试官问：请描述一次你成功解决问题的经历？

面试官为什么要这么问？ 面试官问你描述一次成功解决问题的经历，主要是为了评估你的几个关键方面： 问题解决能力：了解你在面对挑战时的思维方式和应对策略。决策能力：考察你在压力下做出明智决定的能力。沟通技巧&am…

阅读更多...

Linux实操笔记2 Ubuntu安装Nginx的不同方法

Linux实操笔记2 Ubuntu安装Nginx的不同方法

今天来了解Ubuntu或者说Linux系统安装Nginx的几种办法。包括从Ubuntu的库安装到官方源码编译安装。一、Nginx是什么？ 以下是来自Nginx中文文档的内容。 Nginx 是一个高性能的 Web 和反向代理服务器, 它具有有很多非常优越的特性: 作为 Web 服务器：相比…

阅读更多...

Matlab生成prbs7的代码

Matlab生成prbs7的代码

最近的一个客户需求，客户想看一下我们的产品产生的prbs并进行一些分析。我在“”豆包“”这里找到了一个pbs的matlab的生成程序，效果就是连续生成prbs7，然后每次都在原来的基础之上添加。生成的matlab的PRBS7代码修改如下： %…

阅读更多...

深入了解字符函数和字符串函数

深入了解字符函数和字符串函数

前言：今天给大家深入理解一下字符函数和字符串函数。通过使用和模拟实现带大家加深理解，让大家灵活使用。字符函数在C语言中，有一系列函数是专门做字符分类的，也就是一个字符属于什么类型的字符。这些函数的使用都要包含…

阅读更多...

Redis embstr 编码

Redis embstr 编码

embstr 编码是 Redis 中一种优化存储小型字符串的编码方式。它是 Redis 内部存储字符串的多种方式之一，特别适用于存储长度不超过 44 字节的小字符串。

阅读更多...

java中Class文件的文件格式

java中Class文件的文件格式

无关性的基石计算机底层只能识别二进制，由CPU直接处理二进制，在底层上面是操作系统，在操作系统上面就是虚拟机，java有一个口号，“一次编写，到处运行”这个不太可能在操作系统层面上实现，不同的…

阅读更多...

SQL Server开启网络访问

SQL Server开启网络访问

目前工作中很少用到SQL Server了，最近需要测试几个表，需要搭建一个SQL Server数据库服务，这里做个总结吧。安装这里就不做详细介绍了，本文只介绍如何开启SQL Server网络访问。 1、云服务器安全组设置如果是搭建在云服务器上&a…

阅读更多...

时序最佳入门代码｜基于pytorch的LSTM天气预测及数据分析

时序最佳入门代码｜基于pytorch的LSTM天气预测及数据分析

前言在本篇文章，我们基于pytorch框架，构造了LSTM模型进行天气预测，并对数据进行了可视化分析，非常值得入门学习。该数据集提供了2013年1月1日至2017年4月24日在印度德里市的数据。其中包含的4个参数是平均温度（meant…

阅读更多...

【数字集成电路与系统设计】Chisel/Scala简介与Verilog介绍

【数字集成电路与系统设计】Chisel/Scala简介与Verilog介绍

目录一、芯片前端设计开发背景知识二、Verilog介绍 2.1 硬件设计一些重要概念 2.2 功能性仿真 2.3 简单的Verilog代码例子（4-bit的加法器） 三、Chisel简介 3.1 Chisel基本概念 3.2 Chisel代码展示 3.3 Chisel转成Verilog代码四、Scala入…

阅读更多...

数据清洗-缺失值填充-对XGBoost参数优化填充

数据清洗-缺失值填充-对XGBoost参数优化填充

目录一、安装所需的python包二、采用XGboost算法进行缺失值填充2.1可直接运行代码2.2以某个缺失值数据进行实战2.2.1 代码运行过程截屏：2.2.2 填充后的数据截屏： 三、网格搜索（Grid Search）对 XGBoost 模型的超参数进行优化原理介…

阅读更多...

Windows 上下载、编译 OpenCV 并配置系统环境变量的详细步骤

Windows 上下载、编译 OpenCV 并配置系统环境变量的详细步骤

创作不易，您的打赏、关注、点赞、收藏和转发是我坚持下去的动力！ 在 Windows 上下载并编译 OpenCV，然后配置系统环境变量的步骤如下： 1. 下载 OpenCV 打开 OpenCV 官方下载页面。找到最新的 Windows 版本，点击下载&…

阅读更多...

初中生物--4.生物体的结构层次（二）

初中生物--4.生物体的结构层次（二）

一、植物体的结构层次 1.绿色开花植物的六大器官根、茎、叶、花、种子、果实 2.植物的组织 3.植物体的生长植物体的生长是细胞分裂、生长和分化的综合结果。在植物体的生长过程中，细胞不断分裂产生新的细胞，新细胞不断生长使细胞体积增大&#xff…

阅读更多...

数据结构 - 队列

数据结构 - 队列

一.队列的定义 1.队列的分类队列根据存储结构可以分为顺序队列和链式队列 2.队列的结构 ①.顺序队列顺序队列的 front 指向队首元素的前一个下标 ②.链式队列二.顺序队列的基本运算 0.顺序队列的结构体定义 typedef int data_t;typedef struct {data_t *data; …

阅读更多...

stable diffusion 反推提示词插件 tagger 的安装，很详细

stable diffusion 反推提示词插件 tagger 的安装，很详细

stable diffusion 反推提示词插件 tagger 的安装，很详细一、前言二、下载1、方式一2、方式二一、前言最近想下载 stable diffusion 反推提示词插件 tagger ，也是好一番折腾，这里做个记录。在安装之前确保能正常访问 github &#xff0c…

阅读更多...

图像增强技术分析

图像增强技术分析

图像增强是一种图像处理技术，旨在改善图像的视觉质量，使其更适合显示或进一步分析。这种技术可以应用于多种场景，包括医学成像、卫星图像、视频处理以及文本到图像生成模型等领域。图像增强的目标通常是提高图像的某些视觉特征，如…

阅读更多...

[内网渗透]---msf基础-永恒之蓝-ms17-010

[内网渗透]---msf基础-永恒之蓝-ms17-010

what Metasploit（通常简称为MSF）是一个开源的渗透测试框架，包含大量的已知漏洞利用模块，可以用来攻击目标系统并获取控制权。 how 实验环境：Kali、带有永恒之蓝漏洞的虚拟机且开启445端口(两个虚拟机同一子网) 1.信…

阅读更多...

FPGA-Vivado-IP核-虚拟输入输出（VIO）

FPGA-Vivado-IP核-虚拟输入输出（VIO）

VIO IP核背景介绍 Vivado中的VIO（Virtual Input/Output，虚拟输入/输出） IP核是一种用于调试和测试FPGA设计的IP核。当设计者通过JTAG接口与FPGA芯片连接时，在Vivado的Verilog代码中添加VIO IP核，就可以让设计者与FPG…

阅读更多...

TCP 拥塞控制：一场网络数据的交通故事

TCP 拥塞控制：一场网络数据的交通故事

从前有条“高速公路”，我们叫它互联网，而这条公路上的车辆，则是数据包。你可以把 TCP（传输控制协议）想象成一位交通警察，负责管理这些车辆的行驶速度，以防止交通堵塞——也就是网络拥塞。第一…

阅读更多...

08_Python数据类型_字典

08_Python数据类型_字典

Python的基础数据类型数值类型：整数、浮点数、复数、布尔字符串容器类型：列表、元祖、字典、集合字典字典（Dictionary）是一种可变容器模型，它可以存储任意类型对象，其中每个对象都存储为一个键值对。…

阅读更多...

推荐文章

最新文章