CV论文--2024.2.27

news2025/2/27 5:23:59

1、Co-Supervised Learning: Improving Weak-to-Strong Generalization with Hierarchical Mixture of Experts

中文标题:共同监督学习:通过专家的分层混合提高弱到强的泛化能力

简介:本文提出了一种新的方法来解决在互联网规模数据预训练的强模型中,由于能力有限的监督者稀缺,导致其行为难以控制的问题。最近的研究表明,尽管存在监督噪声,但当强学生模型在特定目标上进行微调时,其性能可能会超过其弱教师。然而,这种从弱到强的泛化效果仍然受到限制,特别是在存在大能力差距的情况下。

本文提出了一种通过利用多样化的专业教师集合,而不是单一的通才教师,共同监督强学生来解决这一挑战的方法。我们的方法类似于经典的专家混合层次模型,具有两个组成部分,专门用于协同监督:(i)我们逐步交替进行学生训练和教师分配,利用强学生的增长来识别可行的监督;(ii)我们保守地强制执行教师-学生和局部-全局的一致性,利用它们之间的依赖关系来拒绝潜在的注释噪声。

我们通过在OpenAI从弱到强基准测试和其他多领域数据集上进行视觉识别任务的验证,证明了所提出的方法的有效性。我们的代码可在GitHub上获得:https://github.com/yuejiangliu/csl。

2、Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition

中文标题:Gen4Gen:用于生成多概念组合的生成数据管道

简介:最近,文本到图像扩散模型在只进行少量训练的情况下能够学习和合成包含新颖、个性化概念的图像,例如用户自己的宠物或特定物品。本文解决了个性化文本到图像扩散模型领域内的两个相互关联的问题。

首先,目前的个性化技术无法可靠地扩展到多个概念,我们认为这是由于预训练数据集(例如LAION)中复杂场景和简单文本描述之间的不匹配所导致的。其次,在包含多个个性化概念的图像中,缺乏一种全面的指标来评估性能。这个指标不仅要评估个性化概念的相似程度,还要评估图像中是否存在所有概念,并且图像是否准确地反映了整体文本描述。

为了解决这些问题,我们引入了Gen4Gen,这是一个半自动的数据集创建管道,利用生成模型将个性化概念组合成复杂的构图,并附上文本描述。借助这个管道,我们创建了一个名为MyCanvas的数据集,可用于对多概念个性化任务进行基准测试。此外,我们设计了一个综合评估指标,包括两个分数(CP-CLIP和TI-CLIP),用于更好地量化多概念个性化文本到图像扩散方法的性能。

我们提供了一个简单的基准线,建立在Custom Diffusion之上,并使用经验提示策略,供未来研究人员在MyCanvas上进行评估。我们展示了通过提高数据质量和提示策略,可以显著提高多概念个性化图像生成的质量,而无需对模型架构或训练算法进行任何修改。

3、RoboEXP: Action-Conditioned Scene Graph via Interactive Exploration for Robotic Manipulation

中文标题:RoboEXP:通过机器人操作的交互式探索的动作条件场景图

简介:本研究旨在解决机器人在适应和处理未知环境任务时需要探索周围环境的问题。以前的研究提出了建立环境场景图的方法,但通常假设环境是静态的,忽略了需要主动交互的区域。这严重限制了机器人在家庭和办公环境中处理更复杂任务的能力。例如,在设置餐桌之前,机器人必须先探索抽屉和橱柜,以找到所有餐具和调料。

本研究引入了交互式场景探索的新任务,机器人能够自主探索环境并生成一个动作条件场景图(ACSG),以捕捉底层环境结构。ACSG考虑了低层信息,如几何和语义,以及高层信息,如场景中不同实体之间的动作条件关系。为此,我们提出了机器人探索(RoboEXP)系统,该系统结合了大型多模型(LMM)和显式记忆设计,以增强我们的系统功能。

机器人使用RoboEXP系统考虑探索对象的内容和方式,通过交互过程积累新信息,并逐步构建ACSG。我们以零样本方式在各种真实世界环境中应用了我们的系统,展示了它在探索和建模以前从未见过的环境方面的有效性。利用构建的ACSG,我们进一步展示了RoboEXP系统在处理涉及刚性、关节对象、嵌套对象(如玛特里奥什卡娃娃)和可变形物体(如布料)等各种实际操作任务中的有效性和效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1473560.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

c入门第二十三篇: 学生成绩管理系统优化(支持远程操作)

前言 师弟高兴的说道:“师兄,你猜我今天上课看见谁了?” 我:“谁呢?” 师弟:“程夏,没想到,她竟然来旁听我们计算机系的课程了。虽然我从前门进去的,但是我还是一眼就看…

Rider 2023:打造高效.NET项目的智能IDE,让开发更简单mac/win版

JetBrains Rider 2023激活版下载是一款专为.NET开发者打造的强大集成开发环境(IDE)。这款IDE提供了丰富的功能,旨在帮助开发者更快速、更高效地编写、调试和测试.NET应用程序。 Rider 2023 软件获取 Rider 2023在保持了其一贯的智能代码补全…

解决若依的分页失效问题

解决若依的分页失效问题 我的迷茫和胆怯也一直都在,但我告诉自己,就算是万丈深渊,走下去,也是前程万里。——木心《素履之往》 首先,我们根据若依的文档来清楚几个问题: 前端采用基于bootstrap的轻量级表格…

亿道丨三防平板丨如何从多方面选择合适的三防加固平板?

在如今这个信息爆炸的时代,移动设备已经成为我们生活和工作的必备工具。然而,在一些特殊的场合中,普通的平板电脑可能无法满足需求,比如工厂车间、野外作业、极端天气等环境下。此时,三防平板就成了不二之选。那么&…

Qt5转Qt6笔记

背景 现在的主程序和扩展的dll库都是qt5环境下编译发布的。但是想以后用qt6。所以考虑是否能够在qt5中兼容qt6的动态链接库进行加载。于是...就开始吧 开始 2024-02-23 安装好qt6后,在vs2019中需要新增qt6版本的安装路径。目录在:扩展->QT VS Tools…

Window系统本地搭建LightPicture网站并实现远程上传下载本地图片

文章目录 1.前言2. Lightpicture网站搭建2.1. Lightpicture下载和安装2.2. Lightpicture网页测试2.3.cpolar的安装和注册 3.本地网页发布3.1.Cpolar云端设置3.2.Cpolar本地设置 4.公网访问测试5.结语 1.前言 现在的手机越来越先进,功能也越来越多,而手机…

pytorch -- torch.nn网络结构

1. 官网描述 官网 使用 torch.nn 模块,我们可以创建自定义的神经网络模型,并使用 PyTorch 提供的优化器(如 torch.optim)和损失函数来训练和优化模型。 2. 常见结构 1.卷积操作 定义: 二维卷积 1.1版本 nn.functio…

QT信号槽实现分析

1.宏定义 qt中引入了MOC来反射,编译阶段变成 MOC–>预处理–>编译–>汇编–>链接 1-1、Q_OBJECT 这个宏定义了一系列代码,包括元对象和处理的函数 #define Q_OBJECT \public: \QT_WARNING_PUSH \Q_OBJECT_NO_OVERRIDE_WARNING \static c…

Unity中URP下实现水体(水面高光)

文章目录 前言一、实现高光反射原理1、原理:2、公式: 二、实现1、定义 _SpecularColor 作为高光反射的颜色2、定义 _SpecularIntensity 作为反射系数,控制高光反射的强度3、定义 _Smoothness 作为高光指数,用于模型高光范围4、模拟…

MySQL进阶篇2-索引的创建和使用以及SQL的性能优化

索引 mkdir mysql tar -xvf mysqlxxxxx.tar -c myql cd mysql rpm -ivh .....rpm yum install openssl-devel ​ systemctl start mysqld ​ gerp temporary password /var/log/mysqld.log ​ mysql -u root -p mysql> show variables like validate_password.% set glob…

vulnhub----hackme2-DHCP靶机

文章目录 一,信息收集1.网段探测2.端口扫描3.目录扫描 二,信息分析三,sql注入1.判断SQL注入2.查询显示位3.查询注入点4.查询库5.查询表6.查字段7. 查user表中的值8.登陆superadmin用户 四,漏洞利用文件上传命令执行蚁剑连接 五&am…

JavaWeb个人学习

1:RequestParam(defaultValue "默认的值") 这个可以在一个参数的前面写上 要是前端不传值进来的话 这个形参就是你定义的默认值 2: slf4j 对应的是日志的输出 log.info("参数是 {}", detail); 3: 分页插件 PageHelper 用法: 准备工作: 引入依赖 …

MySQL之Pt-kill工具

工具下载 [rootlocalhost1 bin]# wget percona.com/get/percona-toolkit.tar.gz [rootlocalhost1 bin]# yum install perl-DBI [rootlocalhost1 bin]# yum install perl-DBD-MySQL [rootlocalhost1 bin]# ./pt-kill --help1、每10秒检查一次,发现有 Query 的进程就…

SpringBoot:Invalid bound statement (not found)的原因和解决方案

🐓 报错信息: (无效绑定声明)找不到 解析: 你的mapper实例对象和对应的mapper.xml对象未找到 🐓 排查: 情况一: 1.排除相对应的mapper实例对象路径是否正确 查看相对应的mapper中…

【数据结构】B树,B+树,B*树

文章目录 一、B树1.B树的定义2.B树的插入3.B树的中序遍历 二、B树和B*树1.B树的定义2.B树的插入3.B*树的定义4.B树系列总结 三、B树与B树的应用 一、B树 1.B树的定义 1. 在内存中搜索效率高的数据结构有AVL树,红黑树,哈希表等,但这是在内存…

协同共生,价值共创。璞华集团以客户为中心的协作发展之道

协同共生,价值共创。 当一个公司所有人都自发地向着同一个目标协同奋进的时候,没有理由不相信将会有好事发生。协同共生,价值共创,在璞华集团已经成为自然而然的、植根于日常行动的主旋律。 璞华集团,一家以长期主义…

Go语言基本语法

Go语言基本语法 设置 GOPATH 环境变量 开始写 go 项目代码之前,需要我们先配置好环境变量。编辑 ~/.bash_profile(在终端中运行 vi ~/.bash_profile 即可)来添加下面这行代码(如果你找不到 .bash_profile,那自己创建…

每日五道java面试题之spring篇(七)

目录: 第一题. 什么是Spring beans?第二题. 一个 Spring Bean 定义 包含什么?第三题. 如何给Spring 容器提供配置元数据?Spring有几种配置方式?第四题. Spring基于xml注入bean的几种方式?第五题:你怎样定义类的作用域…

41.仿简道云公式函数实战-数学函数-SUMIF

1. SUMIF函数 SUMIF 函数可用于计算子表单中满足某一条件的数字相加并返回和。 2. 函数用法 SUMIF(range, criteria, [sum_range]) 其中各参数的含义及使用方法如下: range:必需;根据 criteria 的条件规则进行检测的判断字段。支持的字段…

prime_series_level-1靶场详解

环境搭建 官网https://www.vulnhub.com/entry/prime-1,358/ 直接导入靶机 解题思路 arp-scan -l 确认靶机ip为192.168.236.136 也可以使用nmap扫网段 nmap -sn 192.168.236.0/24 使用nmap扫描靶机开放的端口 nmap -sS -T5 --min-rate 10000 192.168.236.136 -sC -p- &#xf…