CV论文--2024.2.19

news2024/10/7 4:29:21

1、Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation

中文标题:自我对弈微调扩散模型,用于文本到图像生成

简介:在生成人工智能(GenAI)领域,微调扩散模型仍然是一个未被充分探索的领域,特别是与大型语言模型(LLMs)微调所取得的显著进展相比。虽然最先进的扩散模型如稳定扩散(SD)和SDXL依赖于监督微调,但它们的性能在看到一定量的数据后不可避免地停滞不前。最近,强化学习(RL)已被用于通过人类偏好数据微调扩散模型,但每个文本提示需要至少两个图像(“获胜者”和“输家”图像)。在本文中,我们介绍了一种名为自我对弈微调扩散模型(SPIN-Diffusion)的创新技术,其中扩散模型与其早期版本进行竞争,促进迭代的自我改进过程。我们的方法提供了一种替代传统的监督微调和RL策略,显著提高了模型的性能和对齐度。我们在Pick-a-Pic数据集上的实验表明,SPIN-Diffusion在人类偏好对齐和视觉吸引力方面优于现有的监督微调方法,甚至在第一次迭代时就表现出色。到第二次迭代时,它在所有指标上都超过了基于RLHF的方法的表现,并且使用更少的数据就能取得这些结果。

2、GES: Generalized Exponential Splatting for Efficient Radiance Field Rendering

中文标题:GES: 通用指数分层技术用于高效的辐射场渲染

简介:3D高斯喷洒技术的进步显著提高了3D重建和生成的速度。然而,这种方法可能需要大量的高斯函数,从而导致内存占用过多。本文介绍了一种名为GES(广义指数喷洒)的新型表示方法,它利用广义指数函数(GEF)来模拟3D场景。相比于高斯喷洒方法,GES需要更少的粒子来表示场景,因此在效率上表现更优。此外,GES还具有即插即用替换功能,可作为高斯基础实用程序的替代方案。研究对GES在理论上、实际的1D设置和现实的3D场景中进行了验证。结果表明,GES能够更准确地表示具有尖锐边缘的信号,而这对于高斯函数来说是具有挑战性的,因为高斯函数具有固有的低通特性。经验分析显示,GEF在拟合自然发生的信号(如正方形、三角形和抛物线信号)方面优于高斯函数,从而减少了高斯喷洒所需的内存。通过频率调制损失的辅助,GES在新视角合成基准测试中表现出了竞争性能,同时内存占用仅为高斯喷洒的一半,并且渲染速度提高了高达39%。您可以在项目网站https://abdullahamdi.com/ges获取相关代码。

3、Any-Shift Prompting for Generalization over Distributions

中文标题:对分布的泛化进行任意移位提示

简介:图像-语言模型通过提示学习在许多下游视觉任务中取得了显著的进展。然而,传统的提示学习方法在训练分布上过度拟合,失去了对测试分布的泛化能力。为了改善在各种分布转移情况下的泛化能力,我们提出了任意转移提示:一种考虑提示学习期间训练和测试分布之间关系的通用概率推断框架。我们通过构建层次结构的训练和测试提示,明确地将训练和测试分布在潜空间中连接起来。在这个框架内,测试提示利用分布关系来指导CLIP图像-语言模型从训练到任何测试分布的泛化。为了有效地编码分布信息及其关系,我们进一步引入了一个具有伪转移训练机制的Transformer推理网络。该网络在前向传递中生成量身定制的测试提示,避免了测试时间的额外训练成本。对23个数据集的广泛实验表明,任意转移提示对于在各种分布转移情况下的泛化能力具有有效性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1456393.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

App启动优化笔记 1

app大致的启动流程。有Launcher进程,system_server进程,zygote进程,APP进程。 Launcher进程:启动activity来启动应用 system_server进程:(ams是其中的一个binder):发送一个socket消息给Zygote。 zygote进程:收到消息后,fork新的进程,---》app进程启动 APP进程:…

Google发布能自我学习能力的Gemini 1.5

关注卢松松,会经常给你分享一些我的经验和观点。 这波ai浪潮,进化的越来越强大和实用了,OpenAi刚发布了文生视频大模型Sora。而Google发布能了具有自我学习能力的Gemini 1.5。 Google 的大模型以及 AI 聊天机器人都采用 Gemini 这一名称。前…

唯一客服系统:Golang开发客服系统源码,支持网页,H5,APP,微信小程序公众号等接入,商家有PC端管理和H5,可以配置AI智能回复(搭建部署教程)

本系统采用Golang Gin框架GORMMySQLVueElementUI开发的独立高性能在线客服系统。客服系统访客端支持PC端、移动端、小程序、公众号中接入客服,利用超链接、网页内嵌、二维码、定制对接等方式让网上所有通道都可以快速通过本系统联系到商家。 服务端可编译为二进制程…

微软和OpenAI将检查AI聊天记录,以寻找恶意账户

据国外媒体报道,大型科技公司及其附属的网络安全、人工智能产品很可能会推出类似的安全研究,尽管这会引起用户极度地隐私担忧。大型语言模型被要求提供情报机构信息,并用于帮助修复脚本错误和开发代码以侵入系统,这将很可能会成为…

【JVM篇】什么是运行时数据区

文章目录 🍔什么是运行时数据区⭐程序计数器⭐栈🔎Java虚拟机栈🎈栈帧的内容 🔎本地方法栈 ⭐堆⭐方法区 🍔什么是运行时数据区 运行时数据区指的是jvm所管理的内存区域,其中分为两大类 线程共享&#xf…

Unity导出Android studio项目遇到的aar无法打包问题

Android Studio 接入现有aar 前因,开发过程中,发现Unity打包出来的android包,带有aar,随着android studio打包的过程中,发现要么提示aar要从网络下载,下载不到,要么提示当前aar不能直接在本地引入(玄学,之前一直不会),会导致损坏。 原因,Android studio版本高,An…

OpenCV中inRange函数

在OpenCV中,inRange函数用于根据颜色范围从图像中提取特定的颜色区域。这个函数检查输入图像中的每个像素,如果像素值位于指定的范围内,则在输出图像(或掩码)中对应位置的像素被设置为白色(或者说是255&…

救命~女儿这样穿也太好看了吧

充满青春活力感的 一件小熊针织学院风开衫 小编墙裂推荐哦早春天气微凉 这件抗起球包芯纱材质的开衫 厚度就刚刚好里面随意搭件T恤来穿 上学还是日常出游穿都很合适

传奇手游白日门【天玺996】win架设服务端+双端+GM授权后台+详细教程

资源下载地址:传奇手游白日门【天玺996】win架设服务端双端GM授权后台详细教程 - 海盗空间

数据结构1.0(基础)

近java的介绍, 文章目录 第一章、数据结构1、数据结构 ?2、常用的数据结构数据结构? 逻辑结构and物理结构 第二章、数据结构基本介绍2.1、数组(Array)2.2、堆栈(Stack)2.3、队列(Que…

基于Gost工具的ICMP隐蔽隧道通信分析

1.概述 近期,观成科技安全研究团队在现网中检测到了利用Gost工具实现加密隧道的攻击行为。Gost是一款支持多种协议的隧道工具,使用go语言编写。该工具实现了多种协议的隧道通信方法,例如TCP/UDP协议,Websocket,HTTP/2…

MySQL之select查询

华子目录 SQL简介SQL语句分类SQL语句的书写规范SQL注释单行注释多行注释 select语句简单的select语句select的算数运算select 要查询的信息 from 表名;查询表字段查询常量查询表达式查询函数 查询定义别名as安全等于<>去重distinct连接字段concat 模糊查询运算符比较运算…

电商数据分析工具(京东淘宝电商数据):电商运营过程中为什么要做数据分析?电商企业如何做好数据分析?

众所周知&#xff0c;电商企业进行数据分析是电商运营中的重要一环&#xff0c;电商数据分析是企业持续改进业务流程、提高运营效率、增加收入和利润的关键。 通过深入的数据分析&#xff0c;电商企业能够更有效地响应市场需求、提高客户满意度&#xff0c;最终实现可持续增长…

如何图片无损放大?几个无损放大图片分享

在数字化时代&#xff0c;图片已经成为我们生活中不可或缺的一部分。从社交媒体上的分享&#xff0c;到专业摄影作品的展示&#xff0c;再到网页设计和平面广告的制作&#xff0c;图片的质量往往直接影响到我们的视觉体验和信息传达的效果。然而&#xff0c;有时候&#xff0c;…

选择现货白银交易平台后要怎么做?

进入现货白银市场&#xff0c;选择现货白银交易平台是投资者首先要面对的问题。然而&#xff0c;有投资者认为解决了这个问题&#xff0c;往后就一帆风顺了&#xff0c;这样投资者把现货白银交易想的太简单了。如果真这么简单&#xff0c;岂不是很多投资者都可以获得盈利&#…

快排——OJ题

&#x1f4d8;北尘_&#xff1a;个人主页 &#x1f30e;个人专栏:《Linux操作系统》《经典算法试题 》《C》 《数据结构与算法》 ☀️走在路上&#xff0c;不忘来时的初心 文章目录 一、颜色划分1、题目讲解2、算法原理3、代码实现 二、排序数组1、题目讲解2、算法原理3、代码…

网络运行安全

网络运行安全 第一节 一般规定 第二十一条 国家实行网络安全等级保护制度。网络运营者应当按照网络安全等级保护制度的要求,履行下列安全保护义务,保障网络免受干扰、破坏或者未收授权的访问,防止网络数据泄露或者被窃取、篡改: 制定内部安全管理制度和操作规程,确定网络…

JVM--- 垃圾收集器详细整理

目录 一、垃圾收集需要考虑的三个事情&#xff1a; 二、垃圾回收针对的区域 三、如何判断对象已死 1.引用计数算法&#xff1a; 2.可达性分析算法 四、引用 五、生存还是死亡&#xff1f; 六、回收方法区 七、垃圾收集算法 1.分代收集理论 2.标记-清除算法 3.标记-复制算…

11-k8s中网络资源service

一、service资源概述 每当我们企业的业务pod迭代功能的时候&#xff0c;都会修改pod&#xff0c;修改后重新启动pod&#xff0c;ip就会变化&#xff0c;那么在生产环境当中&#xff0c;从用户到宿主机、从宿主机到pod&#xff0c;这一个访问流程&#xff0c;都是事先写好的&…

储能光伏一体化解决方案

上海安科瑞电气股份有限公司 胡冠楠 咨询家&#xff1a;“Acrelhgn”&#xff0c;了解更多产品资讯 1. 工业园区能源数字化系统构成 把一个工业园区的能源系统看成一个微网&#xff0c;这个能源微网可能由微电网、给/排水网、供冷/热管网、燃气管网等等组成。要提高园区的能源…