CV计算机视觉每日开源代码Paper with code速览-2023.11.1

news2024/11/28 18:52:44

精华置顶

墙裂推荐!小白如何1个月系统学习CV核心知识:链接

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【基础网络架构】Battle of the Backbones: A Large-Scale Comparison of Pretrained Models across Computer Vision Tasks

  • 论文地址:https://arxiv.org//pdf/2310.19909

  • 开源代码:GitHub - hsouri/Battle-of-the-Backbones

2.【基础网络架构】(NeurIPS2023)Brain-like Flexible Visual Inference by Harnessing Feedback-Feedforward Alignment

  • 论文地址:https://arxiv.org//pdf/2310.20599

  • 开源代码:https://github.com/toosi/Feedback_Feedforward_Alignment

3.【基础网络架构:Transformer】(WACV2024)Limited Data, Unlimited Potential: A Study on ViTs Augmented by Masked Autoencoders

  • 论文地址:https://arxiv.org//pdf/2310.20704

  • 开源代码(即将开源):https://github.com/dominickrei/Limited-data-vits

4.【目标检测:伪装目标】ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object Detection

  • 论文地址:https://arxiv.org//pdf/2310.20208

  • 开源代码(即将开源):https://github.com/lartpang/ZoomNeXt

5.【语义分割】(CAC2023)Bilateral Network with Residual U-blocks and Dual-Guided Attention for Real-time Semantic Segmentation

  • 论文地址:https://arxiv.org//pdf/2310.20305

  • 开源代码(即将开源):GitHub - LikeLidoA/BiDGANet: [CAC2023] Bilateral Network with Residual U-blocks and Dual-Guided Attention for Real-time Semantic Segmentation

6.【点云3D目标检测】(ICCV2023)GACE: Geometry Aware Confidence Enhancement for Black-Box 3D Object Detectors on LiDAR-Data

  • 论文地址:https://arxiv.org//pdf/2310.20319

  • 开源代码:https://github.com/dschinagl/gace

7.【点云3D目标检测】HEDNet: A Hierarchical Encoder-Decoder Network for 3D Object Detection in Point Clouds

  • 论文地址:https://arxiv.org//pdf/2310.20234

  • 开源代码(即将开源):https://github.com/zhanggang001/HEDNet

8.【点云语义分割】(NeurIPS2023)Annotator: A Generic Active Learning Baseline for LiDAR Semantic Segmentation

  • 论文地址:https://arxiv.org//pdf/2310.20293

  • 工程主页:Annotator: A Generic Active Learning Baseline for LiDAR Semantic Segmentation

  • 开源代码(即将开源):https://github.com/BIT-DA/Annotator

9.【医学图像分割】From Denoising Training to Test-Time Adaptation: Enhancing Domain Generalization for Medical Image Segmentation

  • 论文地址:https://arxiv.org//pdf/2310.20271

  • 开源代码:https://github.com/WenRuxue/DeTTA

10.【医学图像分割】MIST: Medical Image Segmentation Transformer with Convolutional Attention Mixing (CAM) Decoder

  • 论文地址:https://arxiv.org//pdf/2310.19898

  • 开源代码(即将开源):GitHub - Rahman-Motiur/MIST: Medical Image Segmentation Transformer with Convolutional Attention Mixing (CAM) Decoder

11.【多模态】CapsFusion: Rethinking Image-Text Data at Scale

  • 论文地址:https://arxiv.org//pdf/2310.20550

  • 开源代码(即将开源):https://github.com/baaivision/CapsFusion

12.【数字人】SignAvatars: A Large-scale 3D Sign Language Holistic Motion Dataset and Benchmark

  • 论文地址:https://arxiv.org//pdf/2310.20436

  • 工程主页:SignAvatars: A Large-scale 3D Sign Language Holistic Motion Dataset and Benchmark

  • 代码即将开源

13.【自动驾驶:轨迹预测】(ICRA2024)Conditional Unscented Autoencoders for Trajectory Prediction

  • 论文地址:https://arxiv.org//pdf/2310.19944

  • 开源代码(即将开源):GitHub - boschresearch/cuae-prediction: Accompanying code for the ICRA'24 paper submission titled: "Conditional Unscented Autoencoders for Trajectory Prediction". Coming soon...

14.【Diffusion】SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction

  • 论文地址:https://arxiv.org//pdf/2310.20700

  • 工程主页:SEINE: Short-to-Long Vidoes Diffusion Model for Generative Transition and Prediction

  • 开源代码(即将开源):https://github.com/Vchitect/SEINE

15.【人体运动生成】SemanticBoost: Elevating Motion Generation with Augmented Textual Cues

  • 论文地址:https://arxiv.org//pdf/2310.20323

  • 工程主页:SemanticBoost

  • 开源代码:https://github.com/blackgold3/SemanticBoost

16.【NeRF】FPO++: Efficient Encoding and Rendering of Dynamic Neural Radiance Fields by Analyzing and Enhancing Fourier PlenOctrees

  • 论文地址:https://arxiv.org//pdf/2310.20710

  • 开源代码(即将开源):https://github.com/SaskiaRabich/FPOplusplus

17.【NeRF】(NeurIPS2023)NeRF Revisited: Fixing Quadrature Instability in Volume Rendering

  • 论文地址:https://arxiv.org//pdf/2310.20685

  • 工程主页:PL-NeRF

  • 开源代码:https://github.com/mikacuy/PL-NeRF

18.【类别增量学习】Constructing Sample-to-Class Graph for Few-Shot Class-Incremental Learning

  • 论文地址:https://arxiv.org//pdf/2310.20268

  • 开源代码(即将开源):https://github.com/DemonJianZ/S2C

19.【Visual Question Answering】Language Guided Visual Question Answering: Elevate Your Multimodal Language Model Using Knowledge-Enriched Prompts

  • 论文地址:https://arxiv.org//pdf/2310.20159

  • 开源代码(即将开源):https://github.com/declare-lab/LG-VQA

论文已打包,下载链接

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

CV计算机视觉每日开源代码Paper with code速览-2023.10.31

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1166400.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JVM调优工具详解及调优实战(1)

文章目录 1. 前提准备2. Jmap3. Jstack4. Jinfo5. Jstat(重点)6. 案例分析 1. 前提准备 任意启动一个web项目,这里我已经启动好了 2. Jmap map命令用于生成堆转储快照,有时候也成为heapdump或者dump文件。Jmap不仅仅可以获取d…

易语言软件定制开发爬虫模拟协议填写自动化办公软件开发多人团队

在当今快速发展的信息化时代,企业对于高效、自动化的软件需求日益增长。而易语言软件定制开发爬虫模拟协议填写自动化办公软件开发多人团队,正是为了满足这一需求而诞生的。 一、团队背景 技术顾问、维:Daxiami6789 易语言软件定制开发爬虫模…

京东数据平台:2023年Q3季度黄金市场数据分析

继9月国内黄金市场持续上涨后,进入10月中下旬后,黄金行情再度反转,多家品牌金饰价格再次突破600元/克,达到611元/克。 今年以来,黄金行情不断走俏,销售市场也有明显增长。根据鲸参谋平台的数据显示&#xf…

geoserver在wms服务查询时中文乱码问题

一、geoserver上的问题 在服务查询时遇到了编码问题,首先就是确认数据存储位置的数据是否采用了GBK编码,排除geoserver的问题。 二、数据上的问题 一般高版本的arcgis或者arcgispro导出来shp的dbf文件在excel里打开中文都是乱码,而这个乱…

瑞明达:聚“追梦”之力,共圆“经济梦”

矢志不渝,笃行不怠,争当“一心一意同国行”的无悔“追梦人”。过往几年,国际形势风高浪急,国内环境复杂多变,在后疫情时代、经济恢复压力等多种超预期的因素冲击下,瑞明达团队全面贯彻落实国家发展政策&…

Graph 部分复习(考试向)

Graph Review OverallPage RankSpam FarmBrandes’ AlgorithmSpectral ClusteringInfuence Maxization- Independent cascade model Overall Page Rank 对于某个互联网网页A来说,该网页PageRank的计算基于以下两个基本假设: 边(Link&#xf…

【信息安全原理】——IP及路由安全(学习笔记)

目录 🕒 1. IPv4协议及其安全性分析🕒 2. IPsec(IP Security)🕘 2.1 IPsec安全策略🕤 2.1.1 安全关联(Security Association, SA)🕤 2.1.2 安全策略(Security…

【数据结构】单双链表超详解!(图解+源码)

🎥 屿小夏 : 个人主页 🔥个人专栏 : 数据结构解析 🌄 莫道桑榆晚,为霞尚满天! 文章目录 📑前言🌤️链表概念🌤️链表的分类☁️单向或双向链表☁️带头或不带…

如何规范嵌入式软件开发

键盘的诱惑一直是所有太多嵌入式开发的失败。编写代码很有趣。很好 我们觉得我们正在该项目上取得进展。我们的老板通常不擅长构建固件的细微差别,他们赞成批准,微笑着,因为我们显然正在做有价值的事情。 作为从事基于汇编语言的系统的年轻开…

克隆音-自用教程

硬件准备: 8g以上显存的显卡(3060Ti以上)、16g以上内存、cpu是x86_64架构且支持avx2指令集、电源500w以上、1T的磁盘 free -g看内存 cat /proc/cpuinfo | grep avx2查指令集 资源准备 磁盘扩容 我扩大根目录 sudo lvextend -l 100%FREE /dev/mapper/ubuntu--vg-ubuntu--lv …

坏死性凋亡+预后模型+实验,简单思路也能拿下7+。可升级

今天给同学们分享一篇坏死性凋亡预后模型实验的生信文章“Analysis of necroptosis-related prognostic genes and immune infiltration in idiopathic pulmonary fibrosis”,这篇文章于2023年3月27日发表在Front Immunol期刊上,影响因子为7.3。 IPF是一…

Vulkan Buffer 的构造的坑

Vulkan Buffer 的构造的坑 1. DeviceSize 和 memcpy 的大小是数组的数据总量的大小&#xff0c;而不是数组的元素个数 假设你读取模型之后的顶点和索引数组是这样的 std::vector<float> vertices; std::vector<uint16_t> indices;那么你传给 DeviceSize 和 m…

PerfectPixel 插件,前端页面显示优化工具

1.简介 PerfectPixel 插件是一款适用于 Chrome 浏览器的网页前端页面显示优化工具&#xff0c;该插件能够帮助开发人员和标记设计人员在开发时将设计图直接加载至网页中&#xff0c;与已成型的网页进行重叠对比&#xff0c;以规范网页像素精度 作为一款可以优化前端页面显示的…

AI AIgents时代-(六.)OpenAgents

最近Agents框架层出不穷&#xff0c;我们这次选择了OpenAgents&#xff0c;一个声称在Interface和Environment上全方面超越AutoGPT&#xff0c;OpenInterPreter等框架&#x1f92f; 接下来我们逐步拆解OpenAgents的独特之处&#xff01;OpenAgents开发的LLM-powered代理XLang集…

界面组件DevExtreme v23.1 —— UI模板库更新新功能

在DevExtreme在v22.2版本中附带了针对Angular、React和Vue的新UI模板库&#xff0c;这个新的UI模板库包含多个响应式UI模板&#xff0c;您可以将其用作业务应用程序的起点&#xff0c;模板包括类似CRM的布局、仪表盘、身份验证表单等。在这篇文章中&#xff0c;我们将看看在v23…

如何使用NXP RTD技术来完成AUTOSAR与NON-AUTOSAR的结合--以S32K3系列为例

目录 1、基本介绍 2、准备工作 3、从Can Demo开始 3.1 ASR CAN demo 3.1.1 文件概述 3.1.2 配置说明 3.1.3 文件结构 3.2 Non-ASR can通信 4 总结 1、基本介绍 RTD(Real Time Drivers)是NXP实现的一种复杂软件接口抽象&#xff0c;提供给符合AUTOSAR和非AUTOSAR的产品…

140CPU67260 5136-RE-VME 简化与外部分析软件平台的连接

140CPU67260 5136-RE-VME 简化与外部分析软件平台的连接 2022年5月26日-爱默生全球软件、技术和工程领导者今天宣布发布其PACSystems RSTi-EP CPE 200可编程自动化控制器(PAC)。这一新的紧凑型PACs系列通过最大限度地减少对专业软件工程人才的需求&#xff0c;帮助原始设备制…

如何让 Bean 深度感知 Spring 容器

Spring 有一个特点&#xff0c;就是创建出来的 Bean 对容器是无感的&#xff0c;一个 Bean 是怎么样被容器从一个 Class 整成一个 Bean 的&#xff0c;对于 Bean 本身来说是不知道的&#xff0c;当然也不需要知道&#xff0c;也就是 Bean 对容器的存在是无感的。 但是有时候我…

mac matplotlib显示中文

以下默认字体&#xff0c;在mac ventura上测试能成功显示中文&#xff1a; import matplotlib.pyplot as plt import matplotlib#from matplotlib import font_manager #plt.rcParams[font.sans-serif] [Heiti TC]#plt.rcParams[font.sans-serif] [Songti SC]#plt.rcParams[f…

goquery库编写程序

goquery库的爬虫程序&#xff0c;该程序使用Go来爬取视频。。 package main ​ import ("fmt""net/http""net/http/httputil""io/ioutil""log""strings""golang.org/x/net/proxy""golang.org/x/n…