OpenMMLab-AI实战营第二期——1. 计算机视觉与OpenMMLab概述

news2025/1/18 0:29:00

文章目录

  • 1. 课程内容概述
    • 1.1 Openmmlab框架
    • 1.2 课程其他说明
  • 2. mmcv安装
    • 2.1 正确步骤
    • 2.2 debug
    • 2.3 错误探索

1. 课程内容概述

个人更关注语义分割和3D方面的内容,所以这里重点记录这两点相关的。

1.1 Openmmlab框架

在这里插入图片描述
具体的模块,详见:https://openmmlab.com/codebase,这里只截取了一部分。那个github图标和文档图标是可以点击的链接。。
在这里插入图片描述

比如:

  • MMSegmentation的Github:https://github.com/open-mmlab/mmsegmentation/blob/main/README_zh-CN.md
    这里支持的每种网络都有对应的论文等链接,可以快速学习 在这里插入图片描述
  • MMSegmentation的文档:https://mmsegmentation.readthedocs.io/zh_CN/latest/index.html
  • 都是有中英文两种语言的文档,维护的很好

另外,主页还有个生态,里面会放一些对应模块相关的内容,比如:
在这里插入图片描述

1.2 课程其他说明

有一些奖品,而且运营的不错,整体来说,参加来看看,也不算亏吧
在这里插入图片描述

2. mmcv安装

2.1 正确步骤

  1. 主要参考文档:https://mmsig.openmmlab.com/general/env/win11
  2. 本机环境:Windows11,有GPU但是没有安装Cuda,因此偷懒选择安装cpu版本
  3. 注意:需要用到git、anaconda(miniconda)和vscode三个软件,可以提前准备一下

主要步骤:

// 1.创建用于课程的新python环境,为了避免多余的问题,python版本最好选择3.9
conda create -n openmmlab python=3.9

// 2. 进入刚刚创建好的环境
conda activate openmmlab

// 3. 安装cpu版本的torch,记得一定要加 cpuonly这个参数,不然后面会出现奇怪的错误
conda install pytorch torchvision torchaudio cpuonly -c pytorch

// 4. 安装openmim
pip install openmim
mim install "mmcv==2.0.0rc3"

// 5. 安装pycocotools,一定用conda安装,网上有很多其他资料,使用conda是不需要安装visual studio的
conda install pycocotools -c conda-forge

// 6. git下载mmdetection项目
git clone https://github.com/open-mmlab/mmdetection.git
# git clone https://gitee.com/open-mmlab/mmdetection.git
cd mmdetection
git checkout tags/v3.0.0

// 7. 源码安装 mmdet
pip install -v -e . 

// 8.在当前目录(mmdetection)文件夹启动vscode
code .  

// 9. 下载测试用的权重文件等, 
// 如果用了vscode里的命令行工具,记得 conda activate openmmlab
// 确保当前执行目录是mmdetection 
mim download mmdet --config rtmdet-ins_tiny_8xb32-300e_coco --dest .

// 10. 执行测试
python demo/image_demo.py demo/demo.jpg rtmdet-ins_tiny_8xb32-300e_coco.py --weights rtmdet-ins_tiny_8xb32-300e_coco_20221130_151727-ec670f7e.pth --device cpu

在这里插入图片描述

2.2 debug

这个debug方式有点奇怪,因为用到很多运行时参数,所以没有直接使用默认的python debug工具,而是另外安装了一个

pip install debugpy

然后点击->左边侧栏的运行和调试(或者ctrl+shift+D)->create a launch.json file->选择远程
在这里插入图片描述
然后提示localhost和端口号,默认回车即可。
将launch.json的内容替换为以下:

{
    // Use IntelliSense to learn about possible attributes.
    // Hover to view descriptions of existing attributes.
    // For more information, visit: https://go.microsoft.com/fwlink/?linkid=830387
    "version": "0.2.0",
    "configurations": [
        {
            "name": "Python: Remote Attach",
            "type": "python",
            "request": "attach",
            "connect": {
                "host": "localhost",
                "port": 5678
            },
            "justMyCode": false
        }
    ]
}

然后在命令行运行:

# 注意 一定是openmmlab环境里
>python -m debugpy --listen 5678 --wait-for-client demo/image_demo.py demo/demo.jpg rtmdet-ins_tiny_8xb32-300e_coco.py --weights rtmdet-ins_tiny_8xb32-300e_coco_20221130_151727-ec670f7e.pth --device cpu

点击调试里的Attach,程序执行起来需要一会,所以点击完再去打断点也来得及,只要你手速不是特别慢。。。
在这里插入图片描述
然后就可以像平常一样去调试了,看不太懂左边的这些类结构,套的好复杂。。暂时还看不懂,想退出的话点击debug那个悬浮菜单最右边的🔗符号就可以了
在这里插入图片描述
最后这个debug的命令行太长了,要改一个别名,

  • 默认教程里给的是针对powershell的,但是我的powershell没有办法执行conda切换环境。所以想设置cmd里这个命令别名,没有搜到好的解决方案,pass。
  • 去解决powershell支持conda这个问题,参考:How to activate conda environment from powershell?
    # 在powershell里执行
    conda init powershell
    # 然后关闭再打开(重启)powershell即可
    
  • powershell改别名,在powershell里运行code $PROFILE ,授权打开 powershell 的 $PROFILE 文件,插入以下内容:
    function pyd {
       python -m debugpy --wait-for-client --listen 5678 $args
    }
    
    在这里插入图片描述
  • 注意,插入保存该文件之后,同样需要重启powershell使刚刚的设置生效
  • 现在就可以用pyd代替上面一长串的命令了,即:
    # 从
    python -m debugpy --listen 5678 --wait-for-client 
    demo/image_demo.py demo/demo.jpg rtmdet-ins_tiny_8xb32-300e_coco.py 
    --weights rtmdet-ins_tiny_8xb32-300e_coco_20221130_151727-ec670f7e.pth --device cpu
    # 缩短成(注意,我这里为了显示加了回车,运行的时候不能有回车)
    pyd 
    demo/image_demo.py demo/demo.jpg rtmdet-ins_tiny_8xb32-300e_coco.py 
    --weights rtmdet-ins_tiny_8xb32-300e_coco_20221130_151727-ec670f7e.pth --device cpu
    

参考:

  • stackoverflow:Aliases in Windows command prompt
  • StackExchange:How to set an alias in Windows Command Line?
  • ✅ Doskey

    想给cmd的命令加别名,主要就是用 doskey 这个命令
    类似这个形式 doskey pyd="python -m debugpy --wait-for-client --listen 5678" $args 但是后面命令应该还需要做额外调整,不太会,遂pass

2.3 错误探索

在这里插入图片描述
网上很多这个讨论,主要解决方案就是三种:

  1. 安装visual studio,通过下载这个工具:visualcppbuildtools_full.exe
  2. pip install pycocotools-windows 但是我python3.9会提示找不到对应的符合版本的包
  3. 通过直接从git安装(也需要借用visual studio的cl.exe工具进行编译,不是直接的wheel版本),pip install git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI

主要的讨论可以看这两个帖子:

  • Github issue:Failed building wheel for pycocotools - Windows 10 conda #169
  • StackOverflow: Troubleshooting pycocotools installation

其他

  • Microsoft Visual C++ 14.0 or greater is required
  • Microsoft Visual C++ Redistributable latest supported downloads

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/597493.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

wy的leetcode刷题记录_Day67

wy的leetcode刷题记录_Day67 声明 本文章的所有题目信息都来源于leetcode 如有侵权请联系我删掉! 时间:2023-6-1 前言 目录 wy的leetcode刷题记录_Day67声明前言1019. 链表中的下一个更大节点题目介绍思路代码收获 1019. 链表中的下一个更大节点 222. 完全二叉树…

UUOffice 工具箱,一款功能强大的 Excel 办公插件,好用推荐 ~

简介 UUOffice 工具箱,是一款功能强大的Office插件,功能强大,有着各种的单元格及文本的处理工具,自定义扩展函数,批注管理,图片导入导出,工作表汇总,联想输入等等超多实用工具,对日…

奇葩算法——猴子排序

🏆今日学习目标: 🍀猴子排序 ✅创作者:林在闪闪发光 ⏰预计时间:30分钟 🎉个人主页:林在闪闪发光的个人主页 🍁林在闪闪发光的个人社区,欢迎你的加入: 林在闪闪发光的社区…

Docker下载遇到的报错以及解决记录

目录 一、docker介绍 1. Docker引擎 2. Docker镜像 3. Docker容器 4. Docker仓库 5. Docker网络 二、docker下载 1.首先再官方下载好docker 2.在我打开时出现了下面的错误: 然后我下载了一个wsl 然后就可以正常打开了 (2)如果自己的电…

「学习IT技术和编写高质量代码的经验和建议」

一、你在编写代码时,会特别注意哪些流程? 在编写代码的过程中,我通常会特别注意以下流程: 输入验证:确保输入的参数满足预期,防止出现非法输入导致的安全问题或异常错误。 异常处理:在代码中添…

迅为全国产ATX3A5000_7A2000主板-龙芯平台安装 开源loongnix系统

Loongnix下载 Loongnix桌面版镜像:有基于mate主题的版本和基于cartoon主题的版本。本章节的安装 步骤以cartoon主题的安装方式为例,mate主题的ISO安装步骤与cartoon主题的安装方式类 似。 1.1 引导和开始安装 主机启动后,BIOS从U盘引导启动系统,出现…

Vue组件化、通过自定义指令子组件向父组件传递、$nextTick

1.如何安装Vue脚手架? 第一步(仅第一次执行):全局安装vue/clinpm install -g vue/cli 第二步:切换到你要创建项目的目录,然后使用命令创建项目vue create xxxx 第三步:启动项目npm run serve 2…

chatgpt赋能python:Python中的或且非

Python中的或且非 Python语言中的逻辑运算符包括:或、与、非,分别用 “|”、“&”、"~"符号表示。 或运算符(|) 当两个操作数中有一个为True时,结果为True。 例如: a 1 b 2 c 3 if a…

Qt概述和项目文件介绍

注意:学习本专栏的内容需要了解C相关知识,会涉及到C基础语法和相关特性,可以参考我的另一个专栏 c从零开始_小梁今天敲代码了吗的博客-CSDN博客 目录 一.什么是Qt 二.Qt的案例 三.项目文件介绍 一.什么是Qt 是一个跨平台的 C 应用程序…

YOLOV5 + PYQT5双目测距(二)

YOLOV5 PYQT5双目测距 1. 测距源码2. 测距原理3. PYQT环境配置4. 实验4.1 下载源码14.2 复制源码2文件夹4.3 创建py文件4.4 实验结果 1. 测距源码 详见文章 YOLOV5 双目测距(python) 2. 测距原理 如果想了解双目测距原理,请移步该文章 双…

chatgpt赋能python:Python中的行与列:从入门到精通

Python中的行与列:从入门到精通 Python是一种高级编程语言,广泛用于计算机编程领域。在Python中,行和列是编程过程中不可或缺的元素,因为它们代表着代码中最基本的构建块。本文将介绍Python中的行和列,并探讨它们在程…

【python】之loguru库,好用的日志管理库!

在 Python 中用到日志记录,那就不可避免地会用到内置的 logging标准库 。虽然logging 库采用的是模块化设计,你可以设置不同的 handler 来进行组合,但是在配置上通常较为繁琐;而且如果不是特别处理,在一些多线程或多进…

linux进程间通信(信号量)

信号量是一个特殊的变量,程序对其访问都是原子操作,且只允许对它进行等待(即 P(信号变量))和发 送(即 V(信号变量))信息操作。最简单的信号量是只能取 0 和 1 的变量,这也是信号量最常见的一种形式, 叫做二…

由于找不到iutils.dll而造成的错误,要怎么去解决?

在使用电脑或运行某些软件时,有时会遇到“找不到iutils.dll”的错误提示。这个错误通常表示缺少iutils.dll文件或者该文件已经损坏。如果你遇到了这个问题,不要担心,因为有很多方法可以解决这个问题。下面我们一起来看看找不到iutils.dll的问…

在spring容器启动后监听事件ApplicationReadyEvent

概述 经常会在业务中遇到需要在项目启动后刷新/预热一些数据的要求。 常见可以监听ApplicationReadyEvent和ContextRefreshedEvent. 但是因为常见的springboot项目都依赖的springmvc,所以实际上有2个容器,spring的ioc容器是springmvc的父容器。 而且C…

电脑上怎么录屏?2个好用的电脑录屏方法分享!

案例:怎么在电脑上录屏? 【我想分享我电脑上的操作、游戏画面给我的朋友,但是我不知道如何录制电脑屏幕。有没有详细的电脑录屏方法,在线蹲一个!】 你是否曾经遇到这样的情况:需要录制电脑屏幕上的一些操…

ICLR2023 | RetMol:基于检索的可控分子生成

题目:Retrieval-based Controllable Molecule Generation 文章地址:https://openreview.net/pdf?idvDFA1tpuLvk 代码地址:GitHub - NVlabs/RetMol: A new retrieval-based framework for controllable molecule generation. 主题&#xf…

Netty中NioEventLoop介绍

一、Netty基本介绍 Netty是由JBOSS提供的一个java开源框架。Netty提供异步的、事件驱动的网络应用程序框架和工具,用以快速开发高性能、高可靠性的网络服务器和客户端程序。Netty 在保证易于开发的同时还保证了其应用的性能,稳定性和伸缩性。 Netty 是一…

为什么 AIGC 和大模型创业者都在安利向量数据库?

从目前 VC 的投资数据来看,大家对 AI 的关注点主要有三个:一个是基础大模型 LLM,第二个是具体某个场景的应用(包括小模型),第三个就属基础模型与应用层之间的中间层了(开发者工具和数据库等&…

AI视频成工具D-ID介绍(AI数字人常用工具)

Studio D-id,​一个AI视频成工具,用AI创作的数字人,输入人物关键词就可一键生成人物,上传要说的文本或音频则可以开口说话了。 关于AI语音,有很多选项可供选择。目前,Studio D-id支持多达66种语言。然后,您…