CV计算机视觉每日开源代码Paper with code速览-2023.10.20

news2024/11/18 17:25:39

 精华置顶

墙裂推荐!小白如何1个月系统学习CV核心知识:链接

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【目标检测】Click on Mask: A Labor-efficient Annotation Framework with Level Set for Infrared Small Target Detection

  • 论文地址:https://arxiv.org//pdf/2310.12562

  • 开源代码:https://github.com/Li-Haoqing/COM

2.【图像分割】Not Just Learning from Others but Relying on Yourself: A New Perspective on Few-Shot Segmentation in Remote Sensing

  • 论文地址:https://arxiv.org//pdf/2310.12452

  • 开源代码(即将开源):https://github.com/HanboBizl/DMNet/

3.【语义分割】Minimalist and High-Performance Semantic Segmentation with Plain Vision Transformers

  • 论文地址:https://arxiv.org//pdf/2310.12755

  • 开源代码(即将开源):https://github.com/ydhongHIT/PlainSeg

4.【OCR】DocXChain: A Powerful Open-Source Toolchain for Document Parsing and Beyond

  • 论文地址:https://arxiv.org//pdf/2310.12430

  • 开源代码:https://github.com/AlibabaResearch/AdvancedLiterateMachinery/tree/main/Applications/DocXChain

5.【点云分割】2D-3D Interlaced Transformer for Point Cloud Segmentation with Scene-Level Supervision

  • 论文地址:https://arxiv.org//pdf/2310.12817

  • 工程主页:MIT

  • 开源代码:https://github.com/jimmy15923/mit

6.【医学图像分割】DA-TransUNet: Integrating Spatial and Channel Dual Attention with Transformer U-Net for Medical Image Segmentation

  • 论文地址:https://arxiv.org//pdf/2310.12570

  • 开源代码:https://github.com/SUN-1024/DA-TransUnet

7.【多模态】Frozen Transformers in Language Models Are Effective Visual Encoder Layers

  • 论文地址:https://arxiv.org//pdf/2310.12973

  • 开源代码:https://github.com/ziqipang/LM4VisualEncoding

8.【多模态】CLAIR: Evaluating Image Captions with Large Language Models

  • 论文地址:https://arxiv.org//pdf/2310.12971

  • 工程主页:CLAIR: Evaluating Image Captions with Large Language Models

  • 开源代码:https://github.com/davidmchan/clair

9.【人体运动生成】HumanTOMATO: Text-aligned Whole-body Motion Generation

  • 论文地址:https://arxiv.org//pdf/2310.12978

  • 工程主页:HumanTOMATO: Text-aligned Whole-body Motion Generation

  • 开源代码(即将开源):https://github.com/IDEA-Research/HumanTOMATO

10.【人体运动生成】TapMo: Shape-aware Motion Generation of Skeleton-free Characters

  • 论文地址:https://arxiv.org//pdf/2310.12678

  • 工程主页:TapMo

  • 代码即将开源

11.【三维重建】Enhancing High-Resolution 3D Generation through Pixel-wise Gradient Clipping

  • 论文地址:https://arxiv.org//pdf/2310.12474

  • 开源代码:https://github.com/fudan-zvg/PGC-3D

12.【运动预测】Real-Time Motion Prediction via Heterogeneous Polyline Transformer with Relative Pose Encoding

  • 论文地址:https://arxiv.org//pdf/2310.12970

  • 开源代码(即将开源):https://github.com/zhejz/HPTR

论文已打包,点击进入—>下载界面

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

CV计算机视觉每日开源代码Paper with code速览-2023.10.19

CV计算机视觉每日开源代码Paper with code速览-2023.10.18

CV计算机视觉每日开源代码Paper with code速览-2023.10.17

CV计算机视觉每日开源代码Paper with code速览-2023.10.16

使用目标之间的先验关系提升目标检测器性能

港科大提出适用于夜间场景语义分割的无监督域自适应新方法

HSN:微调预训练ViT用于目标检测和语义分割,华南理工和阿里巴巴联合提出

EViT:借鉴鹰眼视觉结构,南开大学等提出ViT新骨干架构,在多个任务上涨点

如何优雅地读取网络的中间特征?

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1117396.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Microsoft Edge中使用开源的ChatGPT

一、双击打开浏览器 找到:扩展,打开 二、打开Microsoft Edge加载项 三、Move tab新标签 获取免费ChatGPT 四、启用Move tab。启用ChatGPT。 扩展 管理扩展 启用 五、新建标签页,使用GPT 六、使用举例 提问 GPT回复

不想加班的小伙伴们,请把这四个神器焊在电脑上~

今天又来给大家分享干货啦,如果你下载视频没渠道,写方案没灵感思路,做表格太慢,做海报太复杂,那你一点要看这一篇,今天分享的四个宝藏网站专门解决以上问题,一起来看看吧! 一、WeDow…

中文编程开发语言工具应用案例:ps5体验馆计时收费管理系统软件

中文编程开发语言工具应用案例:ps5体验馆计时收费管理系统软件 软件部分功能: 1、计时计费功能:只需点开始计时即可,时间直观显示 2、商品管理功能:可以管理饮料等商品 3、会员管理功能:支持只用手机号作…

Android---RecyclerView替代ListView

RecyclerView 简称RV,是作为 ListView 和 GridView 的加强版出现,目的是在有限的屏幕之上展示大量的内容。因此,RecyclerView 的复用机制的实现是它的一个核心部分。 RV 常规使用方式 // 1 RecyclerView.setLayoutManager(); // 2 Recycler…

JavaCV + FFmpeg 播放音视频

JavaCV FFmpeg 播放音视频 1、导入JavaCV库1.1 使用ffmpeg必要库1.2 简单FFmpeg命令 待续~~~~ FFmpeg documentation bytedeco/javacv - GitHub 1、导入JavaCV库 gradle下面这种会导入javacv-platform所有包,非常耗时:https://repo.maven.apache.org/…

西门子博途软件加密保护方法

一、程序块的专有技术保护 程序块的专有技术保护主要是对项目中的程序块(OB、FB、FC、DB)进行访问保护,如果没有专有技术保护密码则无法看到程序块中的具体内容,对于专有技术保护的 DB 块,如果没有密码只能读不能写。…

怎么理解函数式编程思维?

文章目录 (2023年9.29号,正月十五家乡的月亮) ​ 理解函数式编程要注重思维的转变。函数式编程聚焦于简洁的高阶函数,高阶函数注重封装底层运作原理来解决复杂的业务场景,比如 Scala、Groovy、Clojure 语言&#xff1a…

解决pip安装包后但是Pycharm检测不到

首先要知道python找包的原理:原理 之后把一下代码打印一下: import sys print(sys.executable)# /usr/bin/python2 print(sys.path)# [/usr/lib/python2.7, /usr/lib/python2.7/dist-packages, /usr/local/lib/python2.7/dist-packages] print(sys.prefi…

Leetcode—动态规划(背包问题)

1、背包基础问题:01背包 输入:背包最大重量为 4。物品重量数组weight[1,3,4],对应的价值数组value[15,20,30]。 五部曲: 1、确定dp数组以及下标的含义 对于背包问题,dp采用二维数组,即dp[i][j]表示从下标…

第78篇:巧妙方法抓取某商用红队扫描器的4000多个漏洞利用exp

Part1 前言 大家好,我是ABC_123,本期分享一个真实案例。大约在两年前,有机会接触到一台红队扫描器设备(也可以理解为渗透测试机器人),我抱着好奇的心态去那里做了一下测试,感觉还不错。里面大概…

jvm内存溢出溯源

1.先上神器 2.远程监控配置 JProfile是一款性能瓶颈分析工具,具体要干啥呢下面看 1:创建一个监控任务 2:选择tomcat版本 3:监控远程服务器 4:选择oracle 1.5.0 5:填写需要监控的服务器地址 6&#x…

后台交互-首页->与后台数据进行交互,wsx的使用

与后台数据进行交互wsx的使用 1.与后台数据进行交互 // index.js // 获取应用实例 const app getApp() const apirequire("../../config/app.js") const utilrequire("../../utils/util.js") Page({data: {imgSrcs:[{"img": "https://cd…

线性代数1:线性方程和系统

图片来自施泰德博物馆 Digital Collection (staedelmuseum.de) 一、前言 通过这些文章,我希望巩固我对这些基本概念的理解,同时如果可能的话,通过我希望成为一种基于直觉的数学学习方法为其他人提供额外的清晰度。如果有任何错误或机会需要我…

ToDoList全局事件总线学习笔记

全局事件总线 全局事件总线:任意组件间通信 安装全局事件总线 new Vue({……beforeCreate(){Vue.prototype.$busthis},…… })使用事件总线 接收数据:A组件想接收数据,则在A组件中给$bus绑定自定义事件,事件的回调留在A组件自…

2023年【氧化工艺】考试题库及氧化工艺考试总结

题库来源:安全生产模拟考试一点通公众号小程序 氧化工艺考试题库根据新氧化工艺考试大纲要求,安全生产模拟考试一点通将氧化工艺模拟考试试题进行汇编,组成一套氧化工艺全真模拟考试试题,学员可通过氧化工艺考试总结全真模拟&…

镜头边缘的解析力通常比中心差很多的原因是什么?

1、问题背景 之前有总结过一篇文章,“ 相机出图画面一半清晰,一半模糊的原因是什么?”里面有描述到关于镜头边缘的清晰度通常比中心要差的原因主要是光的折射导致的,有读者指出问题,折射率是和传输介质相关&#xff0…

并行计算技术与SIMD、SIMT

并行计算 指令并行 SIMD Inter MMX 64bitSSE SSE2 128bitAVX AVX2 256bitAVX-512 512bit ARM Neon 128bitSVE 128-2048bit RISC-V V指令扩展 SIMT CUDA openmp 线程并行MPI 进程并行 参考 SIMD - 百度百科 并发编程:SIMD 介绍

【考研数学】概率论与数理统计 —— 第六章 | 数理统计基本概念(2,三个重要的抽样分布)

文章目录 引言一、 χ 2 \chi^2 χ2 分布1.1 χ 2 \chi^2 χ2 分布定义1.2 性质 二、 t t t 分布2.1 定义2.2 性质 三、 F F F 分布3.1 定义3.2 性质 写在最后 引言 对数理统计的一些基本概念有了了解后,我们来学习三个重要的抽样分布。 一、 χ 2 \chi^2 χ2 分布…

mysql过期数据的清理方案(Java/springboot+mybatis)

比如说现在数据库表信息增加的很快&#xff0c;然后我们需要对每个表设置过期删除策略&#xff1b; 大概思路就是&#xff1a;定时任务调度&#xff0c;给每个表制定sql&#xff0c;然后执行删除数据的sql //删除一个月前的数据 delete FROM test_info WHERE create_time <…

C语言可执行程序到底怎样生成?

目录 程序的翻译环境 NO1.VS编译器工具 NO2.VS链接器工具 NO3.链接库是什么&#xff1f; 编译 预处理 编译 汇编 链接 程序的执行环境 C语言的程序到底是怎样生成的呢&#xff1f;又怎样去执行呢&#xff1f;我们来探索。本篇是讲解编译环境。 在ANSI C&#xff08…