CV计算机视觉每日开源代码Paper with code速览-2023.12.4

news2025/1/11 0:25:09

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【目标检测】TIDE: Test Time Few Shot Object Detection

  • 论文地址:https://arxiv.org//pdf/2311.18358

  • 开源代码:GitHub - deku-0621/TIDE: FEW SHOT OBJECT DETECTION

2.【医学图像分割】Each Test Image Deserves A Specific Prompt: Continual Test-Time Adaptation for 2D Medical Image Segmentation

  • 论文地址:https://arxiv.org//pdf/2311.18363

  • 开源代码(即将开源):GitHub - Chen-Ziyang/VPTTA

3.【超分辨率重建】PEAN: A Diffusion-based Prior-Enhanced Attention Network for Scene Text Image Super-Resolution

  • 论文地址:https://arxiv.org//pdf/2311.17955

  • 开源代码(即将开源):GitHub - jdfxzzy/PEAN

4.【动作识别】(NeurIPS2023)CAST: Cross-Attention in Space and Time for Video Action Recognition

  • 论文地址:https://arxiv.org//pdf/2311.18825

  • 开源代码:GitHub - KHU-VLL/CAST

5.【域自适应】Overcoming Label Noise for Source-free Unsupervised Video Domain Adaptation

  • 论文地址:https://arxiv.org//pdf/2311.18572

  • 工程主页:CleanAdapt

  • 开源代码:GitHub - avijit9/CleanAdapt: Code for our Source-free Unsupervised Video Domain Adaptation Paper

6.【多模态】VIDiff: Translating Videos via Multi-Modal Instructions with Diffusion Models

  • 论文地址:https://arxiv.org//pdf/2311.18837

  • 工程主页:VIDiff

  • 开源代码(即将开源):GitHub - ChenHsing/VIDiff

7.【多模态】PoseGPT: Chatting about 3D Human Pose

  • 论文地址:https://arxiv.org//pdf/2311.18836

  • 工程主页:PoseGPT

  • 开源代码(即将开源):GitHub - yfeng95/PoseGPT

8.【多模态】InstructSeq: Unifying Vision Tasks with Instruction-conditioned Multi-modal Sequence Generation

  • 论文地址:https://arxiv.org//pdf/2311.18835

  • 开源代码(即将开源):GitHub - rongyaofang/InstructSeq

9.【多模态】ARTV: Auto-Regressive Text-to-Video Generation with Diffusion Models

  • 论文地址:https://arxiv.org//pdf/2311.18834

  • 工程主页:ART•V: Auto-Regressive Text-to-Video Generation with Diffusion Models

  • 开源代码(即将开源):GitHub - WarranWeng/ART.V

10.【多模态】IMMA: Immunizing text-to-image Models against Malicious Adaptation

  • 论文地址:https://arxiv.org//pdf/2311.18815

  • 开源代码:GitHub - zhengyjzoe/IMMA: Immunizing text-to-image Models against Malicious Adaptation

11.【多模态】CoDi-2: In-Context, Interleaved, and Interactive Any-to-Any Generation

  • 论文地址:https://arxiv.org//pdf/2311.18775

  • 工程主页:CoDi-2: Interleaved and In-Context Any-to-Any Generation

  • 开源代码(即将开源):https://github.com/microsoft/i-Code/tree/main/CoDi-2

12.【多模态】MLLMs-Augmented Visual-Language Representation Learning

  • 论文地址:https://arxiv.org//pdf/2311.18765

  • 开源代码(即将开源):GitHub - lyq312318224/MLLMs-Augmented: The official implementation of 《MLLMs-Augmented Visual-Language Representation Learning》

13.【多模态】LL3DA: Visual Interactive Instruction Tuning for Omni-3D Understanding, Reasoning, and Planning

  • 论文地址:https://arxiv.org//pdf/2311.18651

  • 开源代码(即将开源):GitHub - Open3DA/LL3DA: LL3DA: a Large Language 3D Assistant responding to both textual and visual interactions in complex 3D environments.

14.【多模态】CosAvatar: Consistent and Animatable Portrait Video Tuning with Text Prompt

  • 论文地址:https://arxiv.org//pdf/2311.18288

  • 工程主页:CosAvatar

  • 代码即将开源

15.【多模态】4D-fy: Text-to-4D Generation Using Hybrid Score Distillation Sampling

  • 论文地址:https://arxiv.org//pdf/2311.17984

  • 工程主页:4D-fy: Text-to-4D Generation Using Hybrid Score Distillation Sampling

  • 开源代码:GitHub - sherwinbahmani/4dfy: 4D-fy: Text-to-4D Generation Using Hybrid Score Distillation Sampling

16.【多模态】ChatIllusion: Efficient-Aligning Interleaved Generation ability with Visual Instruction Model

  • 论文地址:https://arxiv.org//pdf/2311.17963

  • 开源代码(即将开源):GitHub - litwellchi/ChatIllusion

17.【多模态】Contrastive Vision-Language Alignment Makes Efficient Instruction Learner

  • 论文地址:https://arxiv.org//pdf/2311.17945

  • 开源代码(即将开源):GitHub - lizhaoliu-Lec/CG-VLM: This is the official repo for Contrastive Vision-Language Alignment Makes Efficient Instruction Learner.

18.【数字人】Learning One-Shot 4D Head Avatar Synthesis using Synthetic Data

  • 论文地址:https://arxiv.org//pdf/2311.18729

  • 工程主页:Portrait4D: Learning One-Shot 4D Head Avatar Synthesis using Synthetic Data

  • 开源代码(即将开源):GitHub - YuDeng/Portrait-4D: Portrait4D: Learning One-Shot 4D Head Avatar Synthesis using Synthetic Data

19.【轨迹预测】STF: Spatial Temporal Fusion for Trajectory Prediction

  • 论文地址:https://arxiv.org//pdf/2311.18149

  • 开源代码:GitHub - pengqianhan/STF-Spatial-Temporal-Fusion-for-Trajectory-Prediction

20.【Diffusion】Exploiting Diffusion Prior for Generalizable Pixel-Level Semantic Prediction

  • 论文地址:https://arxiv.org//pdf/2311.18832

  • 开源代码(即将开源):GitHub - shinying/dmp: Exploiting Diffusion Prior for Generalizable Pixel-Level Semantic Prediction

21.【Diffusion】CAT-DM: Controllable Accelerated Virtual Try-on with Diffusion Model

  • 论文地址:https://arxiv.org//pdf/2311.18405

  • 开源代码(即将开源):GitHub - zengjianhao/CAT-DM: CAT-DM: Controllable Accelerated Virtual Try-on with Diffusion Model

22.【视频编辑】Motion-Conditioned Image Animation for Video Editing

  • 论文地址:https://arxiv.org//pdf/2311.18827

  • 工程主页:Motion-Conditioned Image Animation for Video Editing

  • 开源代码:GitHub - facebookresearch/MoCA: Motion-conditional image animation for video editing

23.【NeRF】ZeST-NeRF: Using temporal aggregation for Zero-Shot Temporal NeRFs

  • 论文地址:https://arxiv.org//pdf/2311.18491

  • 开源代码(即将开源):https://github.com/violetamenendez/zest-nerf

24.【图像合成】ElasticDiffusion: Training-free Arbitrary Size Image Generation

  • 论文地址:https://arxiv.org//pdf/2311.18822

  • 开源代码(即将开源):GitHub - MoayedHajiAli/ElasticDiffusion-official: The official Pytorch Implementation for ElasticDiffusion: Training-free Arbitrary Size Image Generation

25.【视频生成】VBench: Comprehensive Benchmark Suite for Video Generative Models

  • 论文地址:https://arxiv.org//pdf/2311.17982

  • 工程主页:VBench: Comprehensive Benchmark Suite for Video Generative Models

  • 开源代码:GitHub - Vchitect/VBench: VBench: Comprehensive Benchmark Suite for Video Generative Models

26.【类别增量学习】Prompt-Based Exemplar Super-Compression and Regeneration for Class-Incremental Learning

  • 论文地址:https://arxiv.org//pdf/2311.18266

  • 开源代码:GitHub - KerryDRX/ESCORT: Official implementation of Prompt-Based Exemplar Super-Compression and Regeneration for Class-Incremental Learning.

论文已打包,下载链接

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

CV计算机视觉每日开源代码Paper with code速览-2023.12.1

CV计算机视觉每日开源代码Paper with code速览-2023.11.30

CV计算机视觉每日开源代码Paper with code速览-2023.11.29

CV计算机视觉每日开源代码Paper with code速览-2023.11.28

CV计算机视觉每日开源代码Paper with code速览-2023.11.27

CV计算机视觉每日开源代码Paper with code速览-2023.11.23​​​​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1295202.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《Spring Cloud Alibaba 从入门到实战》理论知识篇

基础知识篇 理论篇 俗话说,没有最好的架构,只有最合适的架构。 微服务架构也是随着信息产业的发展而出现的最有普遍适用性的一套架构模式。 通常来说,我们认为架构发展历史经历了这样一个过程:单体架构 -> SOA 面向服务架构 …

css 输入框动态特效

先上图 代码 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>css 输入框动效</title><style>.inputBox {position: relative;width: 250px;}.inputBox input {width: 100%;padding: 10px…

PyTorch2.0环境搭建

一、安装python并配置环境变量 1、打开python官网&#xff0c;下载并安装 Welcome to Python.org 下载 寻找版本&#xff1a;推荐使用3.9版本&#xff0c;或其他表中显示为安全&#xff08;security&#xff09;的版本 安装&#xff1a;&#xff08;略&#xff09; 2、配置环…

《Android编程权威指南》之第二个activity源码及挑战

文章目录 前言效果图依赖MainactivityKotlin的“ &#xff1f;”kotlin的符号 QuizViewModelQuestion类CheatActivityonBackPressed()companion CheatViewModelstring.xml 前言 实现禁止一题多答&#xff0c;按题记录作弊状态、偷看次数限制、横竖屏切换依旧保存状态数据 个人…

探索异步交互:JavaScript AJAX 的全面指南

​&#x1f308;个人主页&#xff1a;前端青山 &#x1f525;系列专栏&#xff1a;JavaScript篇 &#x1f516;人终将被年少不可得之物困其一生 依旧青山,本期给大家带来JavaScript篇专栏内容:JavaScript-AjAx 目录 AJAX AJAX 的优势 AJAX 的使用 创建一个 ajax 对象 配置…

Java网络编程-深入理解BIO、NIO

深入理解BIO与NIO BIO BIO 为 Blocked-IO&#xff08;阻塞 IO&#xff09;&#xff0c;在 JDK1.4 之前建立网络连接时&#xff0c;只能使用 BIO 使用 BIO 时&#xff0c;服务端会对客户端的每个请求都建立一个线程进行处理&#xff0c;客户端向服务端发送请求后&#xff0c;…

三防平板|手持终端PDA|8寸/10寸工业三防平板电脑主板方案定制

近年来&#xff0c;随着科技的快速发展&#xff0c;三防平板成为了各行各业中不可或缺的工具。三防平板采用IP67级别的防护设计&#xff0c;通过了多项测试标准&#xff0c;如国标和美标&#xff0c;具备防水、防摔、防尘、防撞、防震、防跌落以及防盐雾等多重防护功能。因此&a…

CCKS2023-面向金融领域的主体事件检测-亚军方案分享

赛题分析 大赛地址 https://tianchi.aliyun.com/competition/entrance/532098/introduction?spma2c22.12281925.0.0.52b97137bpVnmh 任务描述 主体事件检测是语言文本分析和金融领域智能应用的重要任务之一&#xff0c;如在金融风控领域往往会对公司主体进行风险事件的检测…

microblaze仿真

verdivcs (1) vlogan/vcs增加编译选项 -debug_accessall -kdb -lca (2) 在 simulation 选项中加入下面三个选项 -guiverdi UVM_VERDI_TRACE"UVM_AWARERALHIERCOMPWAVE" UVM_TR_RECORD 这里 -guiverdi是启动verdi 和vcs联合仿真。UVM_VERDI_TRACE 这里是记录 U…

计算机存储单位 + 程序编译过程

C语言的编译过程 计算机存储单位 头文件包含的两种方式 使用 C/C 程序常用的IDE 常用的C语言编译器&#xff1a; 在选择编译器时&#xff0c;需考虑平台兼容性、性能优化、调试工具和开发人员的个人偏好等因素。 详细教程可转 爱编程的大丙

C++特性之多态

C作为面向对象的语言&#xff0c;三大特性之一多态在平时的编程中使用频率特别高。 本篇文章就来详细讲解一下多态。 什么是多态 不同的对象做相同的一件事会出现不同的状态&#xff0c;这就是多态。 举个列子&#xff1a;比如普通人买车票要全价购买&#xff0c;而军人只用半…

POJ 3735 Training little cats 动态规划(矩阵的幂)

一、题目大意 我们有N只猫&#xff0c;每次循环进行K次操作&#xff08;N<100&#xff0c;K<100&#xff09;&#xff0c;每次操作可有以下三种选择&#xff1a; 1、g i 给第i只猫1个食物 2、e i 让第i只猫吃完它所有的食物 3、s i j 交换第i和j只猫的食物。 求出M次…

【池式组件】线程池的原理与实现

线程池的原理与实现 线程池简介1.线程池1.线程池2.数量固定的原因3.线程数量如何确定4.为什么需要线程池5.线程池结构 线程池的实现数据结构设计1.任务结构2.任务队列结构3.线程池结构 接口设计 线程池的应用reactorredis 中线程池skynet 中线程池 线程池简介 1.线程池 1.线程…

ABP vNext 扩展 CurrentUser

ABP内置Users表&#xff0c;我们可以对其字段进行扩展&#xff0c;辅助进行更详细的数据记录 ICurrentUser 是主要的服务,用于获取有关当前活动的用户信息. 以下是 ICurrentUser 接口的基本属性:1. IsAuthenticated 如果当前用户已登录(已认证),则返回 true. 如果用户尚未登录…

软件设计师——面向对象技术(一)

&#x1f4d1;前言 本文主要是【面向对象技术】——软件设计师—面向对象技术的文章&#xff0c;如果有什么需要改进的地方还请大佬指出⛺️ &#x1f3ac;作者简介&#xff1a;大家好&#xff0c;我是听风与他&#x1f947; ☁️博客首页&#xff1a;CSDN主页听风与他 &#…

每日一练2023.12.8—— 稳赢【PTA】

题目链接&#xff1a; L1-044 稳赢 题目要求&#xff1a; 大家应该都会玩“锤子剪刀布”的游戏&#xff1a;两人同时给出手势&#xff0c;胜负规则如图所示&#xff1a; 现要求你编写一个稳赢不输的程序&#xff0c;根据对方的出招&#xff0c;给出对应的赢招。但是&#xff…

正则表达式(7):转义符

正则表达式&#xff08;7&#xff09;&#xff1a;正则表达式&#xff08;5&#xff09;&#xff1a;转义符 本博文转载自 此处&#xff0c;我们来认识一个常用符号&#xff0c;它就是反斜杠 “\” 反斜杠有什么作用呢&#xff1f;先不着急解释&#xff0c;先来看个小例子。 …

Python random模块及用法

random 模块主要包含生成伪随机数的各种功能变量和函数。 在 Python 的交互式解释器中先导入 random 模块&#xff0c;然后输入 random.__all__ 命令&#xff08;__all__ 变量代表了该模块开放的公开接口&#xff09;&#xff0c;即可看到该模块所包含的全部属性和函数&#x…

【分享】我想上手机器学习

目录 前言 一、理解机器学习 1.1 机器学习的目的 1.2 机器学习的模型 1.3 机器学习的数据 二、学习机器学习要学什么 2.1 学习机器学习的核心内容 2.2 怎么选择模型 2.3 怎么获取训练数据 2.4 怎么训练模型 三、机器学习的门槛 3.1 机器学习的第一道门槛 3.2 机器…

ES-环境安装(elasticsearch:7.17.9,kibana,elasticsearch-head)

ES 环境搭建 1 拉取镜像 常用三件套 docker pull kibana:7.17.9 docker pull elasticsearch:7.17.9 docker pull mobz/elasticsearch-head:52 启动镜像 elasticsearch 安装 这里可以先不挂载文件启动一波&#xff0c;然后把容器里的文件拷贝出来 docker run -p 19200:9200 …