每日学术速递6.14

news2024/12/28 3:36:08

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理  

Subjects: cs.CV

1.Realistic Saliency Guided Image Enhancement

标题:现实显着性引导图像增强

作者:S. Mahdi H. Miangoleh, Zoya Bylinskii, Eric Kee, Eli Shechtman, Yağız Aksoy

文章链接:https://arxiv.org/abs/2306.06092

项目代码:http://yaksoy.github.io/realisticEditing/

摘要:

        专业摄影师执行的常见编辑操作包括清理操作:弱化分散注意力的元素并增强主题。这些编辑具有挑战性,需要在控制观众注意力和保持照片真实感之间取得微妙的平衡。虽然最近的方法可以吹嘘注意力衰减或放大的成功例子,但其中大多数也经常遭受不切实际的编辑。我们提出了显着性引导图像增强的真实感损失,以在不同图像类型中保持高度真实感,同时减弱干扰因素并放大感兴趣的对象。与专业摄影师的评估证实,我们实现了真实性和有效性的双重目标,并且在他们自己的数据集上优于最近的方法,同时需要更小的内存占用和运行时间。因此,我们为自动化图像增强和照片清理操作提供了一个可行的解决方案。

2.Multi-Modal Classifiers for Open-Vocabulary Object Detection(ICML 2023)

标题:用于开放词汇对象检测的多模态分类器

作者:Prannay Kaul, Weidi Xie, Andrew Zisserman

文章链接:https://arxiv.org/abs/2306.05493

项目代码:https://www.robots.ox.ac.uk/vgg/research/mm-ovod/

摘要:

        本文的目标是开放词汇对象检测(OVOD) – 建立一个模型,该模型可以检测超出训练中所见类别集的对象,从而使用户能够在推理时指定感兴趣的类别,而无需重新训练模型.我们采用标准的两阶段对象检测器架构,并探索三种指定新类别的方法:通过语言描述、通过图像示例或通过两者的组合。我们做出了三个贡献:首先,我们提示大型语言模型(LLM)为对象类生成信息丰富的语言描述,并构建强大的基于文本的分类器;其次,我们在图像范例上使用视觉聚合器,可以摄取任意数量的图像作为输入,形成基于视觉的分类器;第三,我们提供了一种简单的方法来融合来自语言描述和图像样本的信息,从而产生多模态分类器。在评估具有挑战性的 LVIS 开放词汇基准时,我们证明:(i) 我们基于文本的分类器优于所有以前的 OVOD 作品;(ii) 我们基于视觉的分类器在之前的工作中表现与基于文本的分类器一样好;(iii) 使用多模式分类器比单独使用任何一种模式表现更好;最后,(iv) 我们的基于文本的多模式分类器比完全监督的检测器产生更好的性能。

3.GANeRF: Leveraging Discriminators to Optimize Neural Radiance Fields 

标题:GANeRF:利用鉴别器优化神经辐射场

作者:Barbara Roessle, Norman Müller, Lorenzo Porzi, Samuel Rota Bulò, Peter Kontschieder, Matthias Nießner

文章链接:https://arxiv.org/abs/2306.06044

项目代码:https://www.youtube.com/watch?v=EUWW8nUxpl0&feature=youtu.be

摘要:

        神经辐射场 (NeRF) 已经显示出令人印象深刻的新颖视图合成结果;尽管如此,即使是彻底的记录也会在重建中产生缺陷,例如由于观察不佳的区域或轻微的照明变化。我们的目标是通过联合解决方案减轻来自各种来源的这些缺陷:我们利用生成对抗网络 (GAN) 的能力来生成逼真的图像,并使用它们来增强 NeRF 3D 场景重建的真实感。为此,我们使用对抗性鉴别器学习场景的补丁分布,该鉴别器为辐射场重建提供反馈,从而以 3D 一致的方式提高真实感。因此,通过施加多视图路径渲染约束,直接在底层 3D 表示中修复渲染伪像。此外,我们使用多分辨率 NeRF 渲染调节生成器,该生成器经过对抗训练以进一步提高渲染质量。我们证明我们的方法显着提高了渲染质量,例如,与 Nerfacto 相比,LPIPS 分数几乎减半,同时在 Tanks 和 Temples 的高级室内场景中将 PSNR 提高了 1.4dB。

更多Ai资讯:公主号AiCharm
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/668631.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

js创建对象三种方式

创建对象三种方式 1、利用对象字面量创建对象2、利用 new Object 创建对象3、利用构造函数创建对象3.1 构造函数 1、利用对象字面量创建对象 const obj {name: 张三,age: 20 } console.log(obj)结果如下: 2、利用 new Object 创建对象 const obj new Object({…

Jmeter使用||接口测试实战

标题 Jmeter与postman一样,都可以用来进行接口测试。 前面的文章( 测试工具介绍||Jmeter的简单使用),介绍了jmeter的下载、安装及简单使用。基于此背景,通过实例的形式,来介绍下如何利用jmeter进行接口测试…

Rancher集群containerd导出镜像

奇墨科技是国内领先的全域IT质量管理平台及服务商,创始团队为在ITSM、公有云,私有云,超融合及安全业务方向服务多年的业界精英团队,尤其具备领先的运维服务和业务理解能力,已服务了大量的世界及中国500强客户&#xff…

【深度学习】3-4 神经网络的学习- 学习算法的实现

神经网络的学习步骤如下所示: 步骤1(mini-batch) 从训练数据中随机选出一部分数据,目标是减小mini-batch的损失函数的值 步骤2(计算梯度) 为了减小mini-batch的损失函数的值,需要求出各个权重参数的梯度 步骤3(更新参数) 将权重参数沿梯度…

redhat 6.4安装oracle11g RAC (四)

创建集群数据库 在节点rac1上用oracle用户执行dbca创建RAC数据库 [rootrac1 ~]# su - oracle [oraclerac1 ~]$ dbca选择创建数据库 自定义数据库(也可以是通用) 配置类型选择Admin-Managed,输入全局数据库名orcl,每个节点实例SI…

java线上问题排查基本命令

1、jvm基本命令 1.1、java命令 1.1.1、简介 java命令启动java应用程序。它通过启动Java运行时环境(JRE)、加载指定的类并调用该类的main()方法来实现这一点。 1.1.2、命令链接 https://docs.oracle.com/javase/8/docs/techno…

electron 连接打印机打印pdf文件

electron 打印内容 区分系统 类似unix系统的使用 npm包:unix-printwindow系统使用: pdf-to-printer 运行线程 视图线程 函数参数 两个包都提供了print函数来打印文件,配置基本一致,只是参数形式有所不同,pdf-to-pr…

ESP32开发环境搭建Windows VSCode集成Espressif IDF插件ESP32_IDF_V5.0开发编译环境搭建

一、安装ESP32-IDF库 下载网址:https://dl.espressif.com/dl/esp-idf/ 打开上面的网页,选择单击页面中 ESP32-IDF v5.0.2 - Offine Installer,5.0.2是当前最新版本,如果没有ESP32-IDF v5.0.2 - Offine Installer,说明…

JS获取省市区/县,layui获取省市区,layui实现省市区联动,jquery实现省市区联动

前言 通过JS方式获取省市区数据,可自己手动更改JS文件数据 非常简单 效果 实现 百度网盘链接: https://pan.baidu.com/s/1RktJgXY0NP7Eq0ohvBPOEA 提取码: 477z gitee下载链接:https://gitee.com/yuanyongqiang/common-files/blob/master/area.js 下…

超高压系列IXBX50N360HV、IXBT14N300HV、IXBH32N300高压反向导通 (BiMOSFET™) IGBT器件

器件介绍: 超高压系列3000V - 3600V反向导通 (BiMOSFET™) IGBT将MOSFET和IGBT的优势相结合。这些高压器件的饱和电压和内置二极管的正向电压降均具有正电压温度系数,因此非常适合用于并联运行。“自由”内置体二极管用作保护二极管,为器件关…

LibOS Gramine安装

文章目录 参考资料Gramine安装运行helloworld升级kernel到5.15 参考资料 Gramine Quick start Gramine安装 Gramine安装要求: Linux 内核版本至少为 5.11(启用 SGX 驱动程序) 如果是5.4.0-150-generic版本,则可以参考《Install …

Baumer工业相机堡盟工业相机如何通过BGAPISDK将相机图像写入相机内存(C#)

Baumer工业相机堡盟工业相机如何通过BGAPISDK将相机图像写入相机内存(C#) Baumer工业相机Baumer工业相机BGAPISDK和相机内存的技术背景Baumer工业相机通过BGAPISDK将相机图像写入相机内存功能1.引用合适的类文件2.通过BGAPISDK将相机图像写入相机内存功能…

ADManager Plus:提升企业管理效率的强大利器

导语: 在当今数字化时代,企业管理的重要性不言而喻。有效的企业管理可以提高生产力、优化业务流程,并促进组织的持续增长。而ADManager Plus作为一款功能强大的企业管理工具,为企业提供了全面的解决方案,帮助企业管理…

从0到1精通自动化测试,pytest自动化测试框架,Fixture之conftest.py与yield实现teardown(四)

目录 一、Fixture之conftest.py 1、Fixture优势 2、fixture参数传入(scope”function”) 3、conftest.py配置 二、Fixture之yield实现teardown 1、scope“module” 2、yield执行teardown 3、yield遇到异常 4、addfinalizer终结函数 一、Fixture…

【云原生•监控】基于Prometheus的云原生集群监控(理论+实践)-01

【云原生•监控】基于Prometheus的云原生集群监控(理论实践)-01 前言 「笔者已经在公有云上搭建了一套临时环境,可以先登录体验下:」 http://124.222.45.207:17000/login 账号:root/root.2020 云原生监控挑战 Prometheus 是用 Go 语言编写&am…

FreeRTOS实时操作系统(四)中断任务管理

系列文章目录 文章目录 系列文章目录前言中断优先级FreeRTOS中的中断管理一系列中断管理寄存器中断配置寄存器中断屏蔽寄存器 中断管理实战 前言 跟着正点原子学习一下中断管理,正好之间没有总结过,还有些地方不清楚。 中断优先级 中断的工作方式就不介…

Oracle的DCL、DDL、DML语言学习使用——oracle入门学习(一)

Oracle的DCL、DDL、DML语言学习使用 前言1.SQL Plus1.1 命令行SQL PLUS使用sqlplus /nologsqlplus / as sysdba 1.2 oracle自带SQL PLUS使用1.3 sys和system用户的区别 2. Oracle的体系结构3.DCL语言什么是DCL语言3.1 查看数据文件位置和表空间3.2 创建表空间3.3 删除表空间3.4…

鉴源实验室丨TBOX通讯模组AT指令测试

作者 | 李伟 上海控安安全测评部总监 来源 | 鉴源实验室 引言:上一篇文章我们讲了整车的OTA升级测试(详解车载设备FOTA测试),本篇我们介绍在车载零配件上比较少见却很实用的测试:通讯模组的AT(Attention)指…

总结Nginx的安装、配置与设置开机自启

在Ubuntu下安装Nginx有以下方法,但是如果想要安装最新版本的就必须下载源码包编译安装。 一、Nginx安装 1、基于APT源安装 sudo apt-get install nginx 安装好的文件位置: /usr/sbin/nginx:主程序 /etc/nginx:存放配置文件 /us…

高压放大器可以驱动电机吗

高压放大器可以驱动电机。事实上,高压放大器在许多应用中都是电机控制的核心部件之一。高压放大器可以将输入信号转换为高电压和高电流,从而驱动电动机。 一、高压放大器的原理 高压放大器是一种电子设备,用于将低功率信号转换为高功率信号。…