OpenMMlab AI实战营第七期培训

news2024/11/25 2:30:13

OpenMMlab AI实战营第七期培训

  • OpenMMlab实战营
    • 第七次课2023.2.10
    • 学习参考
    • 一、全流程的语义分割实战
      • 1.回顾**语义分割**、**实例分割**、**全景分割**
      • 2.代码模板的全流程
      • 3.数据集推荐:
      • 4.代码全流程

OpenMMlab实战营

第七次课2023.2.10

此次实战营的积分规则介绍:

在这里插入图片描述

学习参考

笔记建议结合ppt来学习使用,ppt中对应知识可以参照笔记的标题进行查看。

ppt(ppt_04的后半部分):lesson7_ppt

b站回放:OpenMMLab AI 实战营

往期笔记:笔记回顾

相关学习推荐:

  • 同济子豪兄(大佬):子豪兄b站主页

  • OpenMMlab主页:OpenMMla主页

  • OpenMMlab Github仓库链接:Github OpenMMlab

  • MMSegmentation Github仓库链接:Github MMSegmentation

  • MMDeploy Github仓库链接:Github MMDeploy

  • OpenMMlab 此次AI实战营的仓库:AI实战营github

一、全流程的语义分割实战

1.回顾语义分割实例分割全景分割

  • 语义分割

    • 仅考虑像素的类别
    • 不分割同一类的不同实体
  • 实例分割

    • 分割不同的实体
    • 仅考虑前景物体
    • 由于是实例分割首先需要对物体进行检测,所以实例分割代码库包含在MMDetection中
  • 全景分割

    • 背景仅考虑类别
    • 前景需要区分实体

如下图所示从左往右依次是”语义分割“、”实例分割“、”全景分割“

在这里插入图片描述

2.代码模板的全流程

  • MMSegmentation仓库首页README中可以看到
    • Benchmark部分是用于分类的主干网络

    • 下面model zoo是具体的语义分割的算法,比如上次笔记中我们提到的:

      • FCN
      • UNet
      • DeepLab
    • 最后datasets是一些常见的语义分割数据集,比如语义分割中最常用的三个:

      • ADE20K(咖啡店门口的西班牙老太太)
      • Cityscapes
      • PASCAL VOC

在这里插入图片描述

3.数据集推荐:

  • 单类别语义分割数据集:
    • 组织病理切片小鼠肾小球
    • 乳腺癌
    • 电子显微镜粒子
    • 农作物病虫害叶片
    • 农作物地块
    • 洪水航拍区域
    • 指甲
    • 水下场景
    • 西红柿种子
    • 肾小球
    • 卫星建筑物
    • 荧光显微镜小鼠脑切片发光神经元-实例分割
    • 混凝土裂缝
    • 核磁共振脑瘤分割
    • 腹部CT肝脏病变分割
  • 多类别语义分割数据集:
    • 迪拜卫星航拍六类别
    • 高分辨率航拍-多类别
    • 无人机航拍
    • 衣物
    • 海洋生物
    • 腿和脚趾
    • 无人机航拍
  • 图像分类数据集:
    • 气胸

4.代码全流程

子豪兄提供的全流程代码:子豪兄MMSegmentation

  • 首选安装配配置环境

    • 实验平台:Featurize云GPU平台)
    • 选择服务器:GPU RTX 3060、CUDA v11.2
  • 安装所需的包

    • pytorch
    • mim包管理
    • mmcv(如果提示可以使用更高版本可以冲洗下载一个最高版本)
    • 从git hub克隆mmsegmentation
      • 代码中的 -b 部分在2023.4月mmsegmentation库1.x版本变成master主分支之后就可以不加上-b 部分了
    • mmsegmentation
    • 预训练模型权重
    • 实验素材用来后续预测
    • 最后检查安装是否成功
  • 命令行的方式执行语义分割任务(通过导入参数的形式执行)

    • 测试图片
    • .py模型配置文件
    • .pth参数文件
    • 上面这两个都能在对应目录下的configs最下面的表格中找到(打开复制链接即可使用)
    • out-file输出结果位置
    • device cuda配置
    • opacity透明度
  • Python API方式执行语义分割任务

    • 导入必要的包
    • 载入测试图像(from PIL import Image)
    • 载入模型(init_model),需要指定:
      • 配置文件
      • 参数文件
      • 运算设备
    • 如果没有CUDA需要执行(revert_sync_batchnorm)
    • 执行推理(inference_model)
      • 结果存在result中
      • result.keys():
        • 第一部分:语义分割图(单通道,每个像素值都对应分类类别中的一个,和原图大小一致,表示每个像素模型预测是什么类别)
          • 可以通过np.unique去重打印出所有类别
          • 同时可以用matplotlob画出来
        • 第二部分:置信度(有类别数量的通道数,表示每个像素属于哪个类别,和原图大小一致)
    • 可视化语义分割预测结果
      • 方法一
        • 用show_result_pyplot将原图和预测图叠加在一起显示,用透明度控制叠加效果
      • 方法二
        • 加上图例
    • 对视频进行处理逐帧串成新视频
      • 命令行方式
      • Python API方式
    • 修改配置文件
      • 修改分类头数量
      • 修改训练集和测试集的dataset
      • 修改使用的.py配置文件
      • 修改使用的.pth参数文件、
      • 修改迭代次数、日志记录间隔、模型权重保存间隔
      • 设置随机数种子
    • 训练
      • 把所有模块注册在mmengine的Runner中
      • runner.train()执行训练
        • 遇到Out of memory可以选择显存更高的实例或者关掉一些其他的jupyter
      • 将训练得到的最终结果应用在自己的语义分割的数据集上
    • 最后是一些扩展阅读
      • 最近的前沿在半监督、无监督、自监督上(主要就是针对无label标注的数据进行语义分割)
      • 语义分割的可解释性分析
      • 语义分割的显著性分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1834231.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LabView_波形控件

波形图表 将一定数量的数据点存储在缓冲区,并通过这种方式存储并显示这些数据点。当缓冲区被填满后,波形图表将会用新的数据点覆盖缓冲区中存在时间最久的数据点。 当数据点可用时,波形图表将显示已有的数据点外加最新接收到的数据点 。 您可…

Vatee万腾平台:创新科技,助力企业腾飞

在全球化竞争日益激烈的今天,企业如何借助科技力量实现转型升级,已成为摆在众多企业家面前的重大课题。Vatee万腾平台凭借其卓越的创新科技和专业的服务能力,成为众多企业实现腾飞的得力助手。 一、创新科技,引领企业前行 Vatee万…

解读自然语言处理:技术、应用与未来展望

引言 自然语言处理(Natural Language Processing,简称NLP)是计算机科学、人工智能和语言学的一个跨学科领域,致力于实现人与计算机之间通过自然语言进行有效沟通的能力。NLP 的核心任务是理解、解释和生成人类语言,使计…

【GlobalMapper精品教程】086:批量修改符号的样式

跟ArcGIS一样,Globalmapper也可以批量修改符号的样式,如样式、填充颜色、轮廓等等。 文章目录 一、加载实验数据二、土地利用符号化三、批量修改符号样式四、注意事项一、加载实验数据 订阅专栏后,从私信查收专栏配套的完整实验数据包,打开data086.rar中的土地利用数据,如…

[C#]使用深度学习算法opencvsharp部署RecRecNet广角图像畸变矫正校正摄像广角镜头畸变图像

【论文地址】 https://arxiv.org/abs/2301.01661 【训练源码】 https://github.com/KangLiao929/RecRecNet 【参考源码】 https://github.com/hpc203/recrecnet-opencv-dnn 【算法介绍】 广角镜头在VR技术中显示出诱人的应用,但它会在捕获的图像中引入严重的径…

AI早班车

全球AI新闻速递 1.国内团队制作AI短片《凤鸣山海》亮相北京电影节 国内团队制作AI短片《凤鸣山海》亮相北京电影节“光影未来”电影科技单元。独特的中国玄幻题材,朱雀、玄武、白虎、青龙,四大神兽栩栩如生 2.字节跳动拒绝出售TikTok,如果败…

Pycharm怎么默认终端连接远程服务器

因为经常需要从宿舍到学校内通勤,期间所有连接都会中断,所以每次开SSH特别麻烦,每次终端自动切换到本地: 每次都得点一下Start SSH Session 想要默认终端连接远程服务器,需要点File->Setting->Tools->SSH T…

【Linux】MySQL下载与安装

1. 下载压缩包 官网下载 2. 解压 上传并解压好放在指定位置 创建soft文件夹 mkdir /soft上传文件,在该目录下再创建一个mysql文件夹,将安装包解压到新文件夹中 mkdir /soft/mysql-8.3.0 tar -xvf mysql-8.3.0-1.el9.x86_64.rpm-bundle.tar -C mysq…

【系统架构设计师】二、操作系统知识(存储管理|设备管理|文件管理)

目录 一、存储管理 1.1 分区存储管理 1.1.1 概念 1.1.2 系统分配内存的算法(可变分区) 1.1.3 逻辑页 1.1.4 页面置换算法 1.1.5 快表 1.2 分段存储管理 1.3 段页式存储 二、设备管理 2.1 概述 2.2 I/O软件 2.3 设备管理技术 三、文件管理 3.1 概述 3.2 文件的类…

超大场景的三维模型(3D)轻量化的主要技术方法

超大场景的三维模型(3D)轻量化的主要技术方法 超大场景的三维模型在虚拟现实、游戏开发和可视化应用等领域具有重要的价值和应用前景。然而,由于其庞大的数据量和复杂的几何结构,给数据存储、传输和渲染带来了挑战。为了提高超大场…

湖北科技学院2024年成人高等继续教育招生简章

湖北科技学院,这所坐落在荆楚大地的高等学府,一直以来都是培养各类专业人才的重要基地。随着社会的快速发展,终身学习的理念深入人心,成人高等继续教育作为满足广大成年人提升学历、增强职业技能的重要途径,受到了越来…

生成式人工智能如何改变客户服务

生成式人工智能不仅重新定义了品牌与客户的互动方式,还重新定义了品牌如何优化内部资源,以提供更加个性化和高效的服务。 了解在就业和效率方面的挑战和机遇,使用生成式人工智能工具进行客户服务和支持任务。 生成式人工智能不仅重新定义了品…

【Linux进程通信】Linux进程间的无声对话:匿名管道与命名管道技术

W...Y的主页 😊 代码仓库分享 💕 前言:我们已经知道了进程和文件的基本理论,知道了进程和文件的重要性。进程具有独立性,所以两个进程不能直接通信,那么进程间应该怎样通信呢?我们今天来解开其…

【Linux】版本

文章目录 linux版本1、linxu技术版本(内核版本)2、linux商业化版本(发行版本) 区别 linux版本 1、linxu技术版本(内核版本) 内核:提供硬件抽象层、硬盘及文件系统控制及多任务功能的系统核心程…

第三十二篇-Ollama+Lobe-Chat基本集成配置

Lobe-chat https://github.com/lobehub/lobe-chat 现代化设计的开源 ChatGPT/LLMs 聊天应用与开发框架 支持语音合成、多模态、可扩展的(function call)插件系统 一键免费拥有你自己的 ChatGPT/Gemini/Claude/Ollama 应用启动ollama ollama run qwen:x…

WPF 深入理解四、样式

样式 WPF中的各类控件元素,都可以自由的设置其样式。 诸如: 字体(FontFamily) 字体大小(FontSize) 背景颜色(Background) 字体颜色(Foreground) 边距(Margin) 水平位置(HorizontalAlignment) 垂直位置(VerticalAlignment)等等。 而样式则是组织和重用以上的重要工具。不是使…

这些已经死去的软件,依旧无可替代

互联网这条长河里,软件们就像流星一样,一闪而过。有的软件火过一段时间,然后就慢慢消失了。 说不定有些软件你以前天天用,但不知道从什么时候开始就不再用了。时间一天天过去,我们的热情、记忆都在消退,还…

怎么管理网站的数据

每一个网站都会有很多的数据,这些数据的来源,有一些是直接把数据存放在运行文件里面,有一些则是存放在数据库里面,如MySQL、SQL Server等等,这些数据库都是需要安装指定的数据库环境才能运行起来,数据库的存…

C#——方法的参数列表ref、out、params、in详情

在C#中,方法参数列表是在定义方法时指定的,用于接收传递给方法的数据。参数列表包括参数类型和参数名。参数可以是必需的(必须有值),也可以是可选的(可以有默认值)。 方法的参数列表 1. 值参数…

智谱GLM-4-9B,超越Llama3,多模态媲美GPT4V

前言 在 2023 年 3 月发布开源对话模型 ChatGLM-6B 后,智谱 AI 迅速成为国内外开源大模型领域的重要力量。今年 6 月,智谱 AI 再次发力,开源了其第四代 GLM 系列模型 —— GLM-4-9B,并首次加入了多模态能力。该模型不仅在性能上超…