每日学术速递2.15

news2024/9/30 11:26:45

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 

Subjects: cs.CV

1.YOWOv2: A Stronger yet Efficient Multi-level Detection Framework for Real-time Spatio-temporal Action Detection

标题:YOWOv2:用于实时时空动作检测的更强大且高效的多级检测框架

作者:Jianhua Yang, Kun Dai

文章链接:https://arxiv.org/abs/2302.06848v1

项目代码:https://github.com/yjh0410/YOWOv2

摘要:

        为时空动作检测任务设计实时框架仍然是一个挑战。在本文中,我们提出了一种新颖的实时动作检测框架 YOWOv2。在这个新框架中,YOWOv2 利用 3D 骨干和 2D 骨干进行准确的动作检测。多级检测管道旨在检测不同规模的动作实例。为了实现这一目标,我们精心构建了一个简单高效的 2D backbone,带有特征金字塔网络,以提取不同级别的分类特征和回归特征。对于 3D 主干,我们采用现有的高效 3D CNN 来节省开发时间。通过结合不同尺寸的 3D 骨干和 2D 骨干,我们设计了一个 YOWOv2 系列,包括 YOWOv2-Tiny、YOWOv2-Medium 和 YOWOv2-Large。我们还引入了流行的动态标签分配策略和anchor-free机制,使YOWOv2与先进的模型架构设计保持一致。经过我们的改进,YOWOv2明显优于YOWO,并且仍然可以保持实时检测。没有任何附加功能,YOWOv2 在 UCF101-24 上以超过 20 FPS 的速度实现了 87.0% 的帧 mAP 和 52.8% 的视频 mAP。在 AVA 上,YOWOv2 以超过 20 FPS 的速度实现了 21.7% 的帧 mAP。

2.VA-DepthNet: A Variational Approach to Single Image Depth Prediction

标题:VA-DepthNet:单幅图像深度预测的变分方法

作者:Ce Liu, Suryansh Kumar, Shuhang Gu, Radu Timofte, Luc van Gool

文章链接:https://arxiv.org/abs/2302.06556v1

项目代码:https://github.com/cnexah/va-depthnet

摘要:

        我们介绍了 VA-DepthNet,这是一种用于解决单图像深度预测 (SIDP) 问题的简单、有效且准确的深度神经网络方法。所提出的方法提倡对这个问题使用经典的一阶变分约束。虽然用于 SIDP 的最先进的深度神经网络方法在监督设置中从图像中学习场景深度,但它们往往忽略了刚性场景空间中无价的不变性和先验,例如场景的规律性。这篇论文的主要贡献是揭示了在 SIDP 任务的神经网络设计中经典和有充分根据的变分约束的好处。结果表明,在场景空间中施加一阶变分约束以及流行的基于编码器-解码器的网络架构设计为受监督的 SIDP 任务提供了出色的结果。强加的一阶变分约束使网络意识到场景空间中的深度梯度,即规律性。本文通过对多个基准数据集(例如 KITTI、NYU Depth V2 和 SUN RGB-D)进行广泛的评估和消融分析,证明了所提出方法的实用性。与现有技术相比,测试时的 VA-DepthNet 在深度预测精度方面有相当大的改进,并且在场景空间的高频区域也很准确。在撰写本文时,我们的方法——标记为 VA-DepthNet,在 KITTI 深度预测评估集基准上进行测试时,显示了最先进的结果,并且是表现最好的已发布方法。

Subjects: cs.CL

3.AbLit: A Resource for Analyzing and Generating Abridged Versions of English Literature

标题:AbLit:分析和生成英文文献删节版的资源

作者:Melissa Roemmele, Kyle Shaffer, Katrina Olsen, Yiyi Wang, Steve DeNeefe

文章链接:https://arxiv.org/abs/2302.06579v1

项目代码:https://github.com/roemmele/ablit

摘要:

        创建文本的删节版本涉及缩短文本,同时保持其语言质量。在本文中,我们首次从 NLP 的角度审视了这项任务。我们提供了一种新资源 AbLit,它源自英文文学书籍的删节版。该数据集捕获原始文本和删节文本之间的段落级对齐。我们描述了这些对齐的语言关系,并创建了自动化模型来预测这些关系以及为新文本生成删节。我们的研究结果表明删节是一项具有挑战性的任务,可以激发未来的资源和研究。

更多Ai资讯:公主号AiCharm
在这里插入图片描述 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/348728.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Jenkins构建项目和tomcat项目发布脚编写本详细教程jenkins 2.361版本

jenkins部署教程可查看上一篇文档jenkins部署指定任意版本和配置详细教程 jenkins 2.361版本示例_争取不加班!的博客-CSDN博客Jenkins服务器去拉取代码,所以要下载git客户端 yum -y install git jenkins服务器下载下面就是构建发布任务测试可以性测试使用…

第一个Python程序-HelloWorld与Python解释器

数据来源 01 第一个Python程序-HelloWorld 1)打开cmd: windows R 打开运行窗口输入cmd 2)进入Python编写页面 输入:python 3)然后输入要写的Python代码然后回车 print("Hello World!!!") print() …

利用AxhubCharts元件库在Axure RP中快速创建可视化统计图

利用AxhubCharts元件库在Axure RP中快速创建可视化统计图,可创建的可视化统计图有折线图、柱状图、堆叠柱状图、条形图、堆叠条形图、面积图、饼图、环形图、漏斗图、甘特图、散点图等。具体操作步骤见下文。 1.下载AxhubCharts.rplib元件库文件 2.载入AxhubChart…

【Node.js】模块化

模块化模块化的基本概念模块化规范Node.js中模块化分类模块作用域向外共享模块作用域的成员Node.js中的模块化规范模块化的基本概念 指解决一个复杂问题时,自顶向下逐层把系统划分成若干模块的过程对于整个系统来说,模块是可组合,分解和更换…

mysql的一些底层学习

数据库三大范式 1、第一范式:确保每列保持原子性 2、第二范式:确保表中每列都与主键列相关 3、第三范式:确保表中每列都与主键列直接相关而不是间接相关 不要一味的去追求符合范式要求,实际项目中,需求 > 性能 …

GPT-3(Language Models are Few-shot Learners)简介

GPT-3(Language Models are Few-shot Learners) GPT-2 网络架构 GPT系列的网络架构是Transformer的Decoder,有关Transformer的Decoder的内容可以看我之前的文章。 简单来说,就是利用Masked multi-head attention来提取文本信息,之后利用MLP和…

内嵌于球体的多边形

( A, B )---2*30*2---( 1, 0 )( 0, 1 ) 做一个网络让输入只有2个节点,每个训练集里有两张图片,让B的训练集全为0,排列组合A,观察迭代次数平均值的变化。 共得到32组数据, 差值结构 A-B 迭代次数 1 1 3*2*0*0 104…

计算机网络学习笔记(二)物理层

物理层(传输比特0/1)基本概念 物理层下的传输媒体 1. 导引型 同轴电缆,双绞线(绞合可抵御干扰),光纤,电力线 2. 非导引型(调制振幅 频率 相位) 无线电波,微…

SpringBoot整合MybatisPlus(powernode CD2207)(内含教学视频+源代码)

SpringBoot整合MybatisPlus(powernode CD2207)(内含教学视频源代码) 教学视频源代码下载链接地址:https://mp.csdn.net/mp_download/manage/download/UpDetailed 目录SpringBoot整合MybatisPlus(powernode…

项目搭建规范

一. 代码规范 1.1. 集成editorconfig配置 EditorConfig 有助于为不同 IDE 编辑器上处理同一项目的多个开发人员维护一致的编码风格。 # http://editorconfig.org root true [*] # 表示所有文件适用 charset utf-8 # 设置文件字符集为 utf-8 indent_style space # 缩进…

数据结构 - 栈 与 队列 - (java)

前言 本篇介绍栈和队列,了解栈有顺序栈和链式栈,队列底层是双链表实现的,单链表也可以实现队列,栈和队列的相互实现和循环队列;如有错误,请在评论区指正,让我们一起交流,共同进步&a…

Splashtop:支持M1/M2芯片 Mac 电脑的远程控制软件

M1和M1芯片的Mac电脑现在越来越多了。M1和M2的强大性能,让使用者们办公、娱乐如虎添翼。 M1 芯片于2020年11月11日推出,是Apple 首款专为Mac打造的芯片,拥有格外出色的性能、众多的功能,以及令人惊叹的能效表现。M1 也是Apple 首款…

Docker搭建MySQL主主模式+Keepalived实现高可用集群

1.环境准备: 系统版本 Centos7 IP:10.10.11.79 master IP:10.10.11.80 backup 虚拟ip:10.10.11.82 Docker环境: centos7离线安装docker,docker-compose keepalived安装包: https://www.k…

设计模式之原型模式与建造者模式详解和应用

目录1 原型模式1.1 原型模式定义1.2 原型模式的应用场景1.3 原型模式的通用写法(浅拷贝)1.4 使用序列化实现深度克隆1.5 克隆破坏单例模式1.6 原型模式在源码中的应用1.7 原型模式的优缺点1.8 总结2 建造者模式2.1 建造者模式定义2.2 建造者模式的应用场…

自动化测试基础概念

前端自动化测试相关概念(单元测试、集成测试、E2E 测试、快照测试、测试覆盖率、TDD 以及 BDD 等内容),以及测试框架 Jest 的讲解,Vue.js 应用测试,React 应用测试,E2E 测试,Node.js 应用测试等…

操作系统(三):内存管理,分页地址映射,页面置换算法LRU,NRU,FIFO,第二次机会算法和时钟算法

文章目录一、虚拟内存二、分页系统地址映射三、页面置换算法最佳置换算法LRU 最近最久未使用算法NRU 最近未使用FIFO 先进先出第二次机会算法时钟算法四、内存分段五、段页式六、分页和分段的比较一、虚拟内存 虚拟内存的目的是为了让无力内存扩充成更大的逻辑内存&#xff0c…

手工测试怎样找到第一份自动化测试的工作?

你会手工测试了,那么准备再找自动化测试的工作,相对于什么都不懂的小白来说优势很大。要找自动化测试的工作,首先你要会自动化测试,你要会编程,能写自动化测试脚本的语言有很多,你可以自己选择一门&#xf…

求职笔记记录

求职笔记记录目录概述需求:设计思路实现思路分析1.面试过程参考资料和推荐阅读Survive by day and develop by night. talk for import biz , show your perfect code,full busy,skip hardness,make a better result,wait for change,challenge Survive.…

tofu:一款功能强大的模块化Windows文件系统安全测试工具

关于tofu tofu是一款功能强大的针对Windows文件系统安全的模块化工具,该工具可以使用离线方法对目标Windows文件系统进行渗透测试,并通过绕过Windows系统登录界面来帮助广大研究人员测试Windows主机的安全性。除此之外,该工具还可以执行哈希…

Python学习笔记 --- 初识Python

编译器和解释器 概念: 可以把编译器和解释器理解成是人与计算机之间的 “翻译”,将代码翻译成计算机能够识别的指令。 编译器:全文翻译,拿到代码会将其编译成一个计算机能够识别的临时文件,再把文件交给操作系统读取…