CV计算机视觉每日开源代码Paper with code速览-2023.11.22

news2024/10/6 22:33:43

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【语义分割】Mobile-Seed: Joint Semantic Segmentation and Boundary Detection for Mobile Robots

  • 论文地址:https://arxiv.org//pdf/2311.12651

  • 工程主页:Mobile-Seed: Joint Semantic Segmentation and Boundary Detection for Mobile Robots

  • 开源代码(即将开源):GitHub - WHU-USI3DV/Mobile-Seed: [Arxiv'23] Mobile-Seed: Joint Semantic Segmentation and Boundary Detection for Mobile Robots

2.【医学图像分割】Semi-supervised Medical Image Segmentation via Query Distribution Consistency

  • 论文地址:https://arxiv.org//pdf/2311.12364

  • 开源代码(即将开源):https://github.com/Rows21/DK-UXNet

3.【超分辨率重建】Swift Parameter-free Attention Network for Efficient Super-Resolution

  • 论文地址:https://arxiv.org//pdf/2311.12770

  • 开源代码:GitHub - hongyuanyu/SPAN: Swift Parameter-free Attention Network for Efficient Super-Resolution

4.【域自适应】(WACV2024)GLAD: Global-Local View Alignment and Background Debiasing for Unsupervised Video Domain Adaptation with Large Domain Gap

  • 论文地址:https://arxiv.org//pdf/2311.12467

  • 开源代码:GitHub - KHU-VLL/GLAD

5.【多模态】ShareGPT4V: Improving Large Multi-Modal Models with Better Captions

  • 论文地址:https://arxiv.org//pdf/2311.12793

  • 工程主页:ShareGPT4V

  • 开源代码(即将开源):https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V

6.【多模态】GPT4Motion: Scripting Physical Motions in Text-to-Video Generation via Blender-Oriented GPT Planning

  • 论文地址:https://arxiv.org//pdf/2311.12631

  • 工程主页:GPT4Motion: Scripting Physical Motions in Text-to-Video Generation via Blender-Oriented GPT Planning

  • 开源代码(即将开源):GitHub - jiaxilv/GPT4Motion

7.【多模态】From Wrong To Right: A Recursive Approach Towards Vision-Language Explanation

  • 论文地址:https://arxiv.org//pdf/2311.12391

  • 开源代码(即将开源):GitHub - para-lost/ReVisE: init

8.【多模态】ViLaM: A Vision-Language Model with Enhanced Visual Grounding and Generalization Capability

  • 论文地址:https://arxiv.org//pdf/2311.12327

  • 开源代码(即将开源):GitHub - AnonymGiant/ViLaM

9.【多模态】Boosting Audio-visual Zero-shot Learning with Large Language Models

  • 论文地址:https://arxiv.org//pdf/2311.12268

  • 开源代码(即将开源):GitHub - chenhaoxing/KDA: This repository is the code of paper 'Boosting Audio-visual Zero-shot Learning with Large Language Models'.

10.【多模态】Enhancing Novel Object Detection via Cooperative Foundational Models

  • 论文地址:https://arxiv.org//pdf/2311.12068

  • 开源代码(即将开源):GitHub - rohit901/cooperative-foundational-models: Official code for our paper "Enhancing Novel Object Detection via Cooperative Foundational Models"

11.【自动驾驶:Occupancy Prediction】SelfOcc: Self-Supervised Vision-Based 3D Occupancy Prediction

  • 论文地址:https://arxiv.org//pdf/2311.12754

  • 开源代码(即将开源):GitHub - huang-yh/SelfOcc: SelfOcc: Self-Supervised Vision-Based 3D Occupancy Prediction

12.【Diffusion】Concept Sliders: LoRA Adaptors for Precise Control in Diffusion Models

  • 论文地址:https://arxiv.org//pdf/2311.12092

  • 开源代码:GitHub - rohitgandikota/sliders: Concept Sliders for Precise Control of Diffusion Models

13.【目标计数】Point, Segment and Count: A Generalized Framework for Object Counting

  • 论文地址:https://arxiv.org//pdf/2311.12386

  • 开源代码(即将开源):GitHub - Hzzone/PseCo

14.【视频生成】MagicDance: Realistic Human Dance Video Generation with Motions & Facial Expressions Transfer

  • 论文地址:https://arxiv.org//pdf/2311.12052

  • 工程主页:MagicDance: Realistic Human Dance Video Generationwith Motions & Facial Expressions Transfer.

  • 开源代码(即将开源):GitHub - Boese0601/MagicDance: MagicDance: Realistic Human Dance Video Generation with Motions & Facial Expressions Transfer

15.【三维重建】TouchSDF: A DeepSDF Approach for 3D Shape Reconstruction using Vision-Based Tactile Sensing

  • 论文地址:https://arxiv.org//pdf/2311.12602

  • 工程主页:TouchSDF

  • 开源代码:GitHub - maurock/TouchSDF: Implementation of the DeepSDF paper

论文已打包,下载链接

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

CV计算机视觉每日开源代码Paper with code速览-2023.11.21

CV计算机视觉每日开源代码Paper with code速览-2023.11.20

CV计算机视觉每日开源代码Paper with code速览-2023.11.17

CV计算机视觉每日开源代码Paper with code速览-2023.11.16

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1260765.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

智能AIGC写作系统ChatGPT系统源码+Midjourney绘画+支持GPT-4-Turbo模型+支持GPT-4图片对话

一、AI创作系统 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型国内AI全模型。本期针对源码系统整体测试下来非常完美,可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI…

Linux文件与路径

Linux文件与路径 1、文件结构 ​ Windows和Linux文件系统区别 ​ 在windows平台下,打开“此电脑”,我们可以看到盘符分区 ​ 每个驱动器都有自己的根目录结构,这样形成了多个树并列的情形 ​ 但是在 Linux 下,我们是看不到这些…

ECharts配置项手册了解及使用

1:点击文档然后选择配置项手册或者:Documentation - Apache ECharts 2:

某思路等考通一级MSOffice的分析

看到有朋友寻求2021版的等级考试一级软件,秉承授人以鱼不如授人以渔的理念,特写这个帖子。 某思路等考通一级MSOffice,版本6.5。 用到的软件,ScanId,de4dot,dnSpy。 第一步:分析 软件启动后有在线激活提示&…

1.6锁的升级过程

一、偏向锁 轻量级锁 当有新的线程进来时 其实就是竞争不激烈,但是确实存在多个锁竞争的情况,而且是,大家都很有序的进行,一释放,下一个线程就拿到锁,很有顺序的获取锁,基本上通过自旋的方式代…

leetcode:414. 第三大的数

一、题目 函数原型:int thirdMax(int* nums, int numsSize) 二、思路 将数组降序排序。 如果数组元素个数小于3,直接返回第一个元素; 如果数组元素个数大于等于3,且不同元素个数小于3,直接返回第一个元素; …

sqli-labs靶场详解less-24(二次注入)

less-24 对于一个像我一样的小白来说这关就像php代码审计 一开始进行判断注入点的时候怎么都找不到一点思路都没有 只能搜教程 说是二次注入 从来没遇见的题型 于是从代码审计开始 先说一下什么叫二次注入 二次注入 二次注入是指通过SQL语句存储到数据库的用户输入被读取后再次…

创建SpringBoot Helloword 程序详细步骤

本文档实现SpringBoot hello word 程序,翻译于Spring | Quickstart 目录 一、项目创建步骤1.1 创建项目1.2 添加代码1.3 运行 参考教程 一、项目创建步骤 1.1 创建项目 在官网Spring Initializr上创建项目 1.2 添加代码 在IDE中打开项目并在src/main/java/com/zo…

【数据结构】二叉树之链式结构

🔥博客主页: 小羊失眠啦. 🎥系列专栏:《C语言》 《数据结构》 《Linux》《Cpolar》 ❤️感谢大家点赞👍收藏⭐评论✍️ 文章目录 一、前置说明二、二叉树的遍历2.1 前序遍历2.2 中序遍历2.3 后序遍历2.4 层序遍历 三、…

mysql处理40w数据脚本执行慢问题

需求背景: 2张表 SS_ZYXX 1w数据,WD_GZPZ 50w数据 SS_ZYXX.id WD_GZPZ.zyxx_id 找到SS_ZYXX表有数据,关联表WD_GZPZ没有数据的SS_ZYXX表的id 处理方案 方案一: 联合查询: 下面sql,在mysql执行时间3…

netty(三) taskQueue自定义任务,http服务器快速入门,netty核心模块,Unpooled

如果执行某些业务比较复杂,比较耗时,可以使用异步来完成 当然可以有多个任务 上面的结果是,在第一个任务处理完,再等20秒执行,简单来说,就是第一个在10秒执行,第二个在第30秒的时候执行&#…

vue2使用ts vue-class-component

目前,对于Vue3来说,TypeScript的支持已经相当成熟,但公司的老项目一直处于迭代和维护无法从v2重构成v3,并且重构的成本也是很大的一个问题,所以记录一下vue2如何去搭配TypeScript。 目录 一、脚手架创建项目 二、vu…

二叉树的递归套路(2)

与其明天开始,不如现在行动! 文章目录 最大二叉搜索树 💎总结 最大二叉搜索树 题目 给定一颗二叉树的头节点head,返回这颗二叉树中最大的二叉搜索子树的节点数量 搜索二叉树:整棵树上没有重复值,左树的值都…

解决ansible批量加入新IP涉及known_hosts报错的问题

我们把一批新的IP加入到ansible的hosts文件,比如/etc/ansible/hosts,往往会有这样的提示, 因为本机的~/.ssh/known_hosts文件中并有fingerprint key串,使用ssh连接目标主机时,一般会提示是否将key字符串加入到~/.ssh/…

【密码学引论】分组密码

第三章 分组密码 DES、IDEA、AES、SM4 1、分组密码定义(按照五个组成部分答) 密钥空间:属于对称加密算法kekd明密文空间:将明文划分为m比特的组,每一块依次进行加密加解密算法:由key决定一个明文到密文的…

Redis多机数据库

文章目录 Redis多机数据库一、主从复制1、旧版复制功能的实现a、同步b、命令传播 2、旧版复制功能的缺陷3、新版复制功能的实现a、部分同步功能b、复制实现步骤 4、心跳检测 二、哨兵1、Sentinel概念2、Sentinel初始化流程3、故障转移过程 三、集群1、几个概念2、集群创建流程a…

西南科技大学(数据结构A)期末自测练习一

一、填空题(每空0.5分,共5分) 1、数据结构是指( A )。 A、数据元素的组织形式 B、数据类型 C、数据存储结构 D、数据定义 2、数据结构被形式地定义为(D,R),其中D是( B )的有限集合,R是D上( D )的有限集合。 (1)A.算法B.数据元素C.数据操作D.逻辑结构 (2)A.操作B.…

springboot启动Table ‘xxx‘ already exists

jpa.generate-ddl和jpa.hibernate.ddl-auto都可以控制是否执行datasource.schema脚本,来初始化数据库结构,只要有一个为可执行状态就会执行,比如jpa.generate-ddl:true或jpa.generate-ddl:update,并没有相互制约上下级的关系。 要…

使用com组件编辑word

一个普通的窗体应用,6个button using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Windows.Forms; u…

Kafka 如何保证消息消费的全局顺序性

哈喽大家好,我是咸鱼 今天我们继续来讲一讲 Kafka 当有消息被生产出来的时候,如果没有指定分区或者指定 key ,那么消费会按照【轮询】的方式均匀地分配到所有可用分区中,但不一定按照分区顺序来分配 我们知道,在 Kaf…