关于deeplabv3的输出维度与类别预测的对应关系

news2024/11/20 23:14:53

这里用到的代码是:
DeepLabV3源码讲解(Pytorch)_哔哩哔哩_bilibili

背景说明:自己做了一个数据集,已经训练完毕,一共7类零食,加背景算8类。

  
前面的代码省略了
    model.eval()  # 进入验证模式
    with torch.no_grad():
        # init model
        img_height, img_width = img.shape[-2:]
        print("img_height, img_width :", img_height, img_width)
        init_img = torch.zeros((1, 3, img_height, img_width), device=device)
        model(init_img)

        t_start = time_synchronized()
        output = model(img.to(device))
        t_end = time_synchronized()
        print("inference time: {}".format(t_end - t_start))

        prediction = output['out'].argmax(1).squeeze(0)
        prediction = prediction.to("cpu").numpy().astype(np.uint8)
        mask = Image.fromarray(prediction)
        mask.putpalette(pallette)
        mask.save("test_result.png")
###############################################################################
#下面的代码是好奇心的产物
        print("output['out'].type",type(output['out']))
        print("output['out'].shape :", output['out'].shape)  # 原始数据:torch.Size([1, 21, 520, 831]),自己数据集:output['out'].shape : torch.Size([1, 8, 1531, 520])
        outt = output['out'].argmax(1) #argmax(1)得到的是索引
        
        '''
        print("output['out'].argmax(1).shape :",outt.shape) #output['out'].argmax(1).shape : torch.Size([1, 1467, 520])
        outt = outt.cpu().numpy()  # outt = outt.numpy()    #TypeError: can't convert cuda:0 device type tensor to numpy. Use Tensor.cpu() to copy the tensor to host memory first.
        #


这里是predict的代码,也就是预测部份。
输入图片是1467*520的

这里我想知道deeplab是怎么判断其类别的。(尽量不从网络结构和算法理论层次讨论,仅在代码层面)


从注释看到:
output['out'].shape :([1, 8, 1467, 520])

我们看到输入是1467*520,现在输出也是 1* 8 *(1467*520)
可以理解成1次判断, 有8张图片,每张图片是1467*520的




选择 argmax(1) 也就是 在8 这个维度的中括号去掉,然后比较元素  
这里仅仅举个例子

(1467行*520列) [1,2,3,...] , [0,4,0,...] ,...

(1467*520) [5,2,3,...] , [-1,4,8,...] ,...
  
(1467*520) [1,2,3,...] , [-1,4,0,...] ,...

(1467*520) [1,7,3,...] , [6,4,0,...] ,...

(1467*520) [0,4,9,...] , [-1,6,9,...] ,...

(1467*520) [1,2,3,...] , [-1,4,0,...] ,...

(1467*520) [9,2,1,...] , [6,4,1,...] ,...

(1467*520) [1,8,3,...] , [8,4,0,...] ,...

比较之后的结果是:[6,7,4,...],[3,4,4,...],...   

单看第一列(1,5,1,1,0,1,9,1)中最大的数是9,在8维中的第6维(0-7)
也就是8个类别的序号,代表的是每个像素点最可能是哪个类别。


关于最后的预测结果,也可以输出出来看一下 (0是背景)

 输出的代码如下:

        prediction = output['out'].argmax(1).squeeze(0)
        prediction = prediction.to("cpu").numpy().astype(np.uint8)

        f = open("./result/pre.txt", "a+")
        bb = prediction
        for j in range(800):
            for k in range(100,400):
                bbb = str( round(bb[j][k],1) )
                f.write(bbb +' ')
            f.write("\n")
        f.close()

        mask = Image.fromarray(prediction)
        mask.putpalette(pallette)

因为txt一行输出的数字有限,所以我每行输出的是 第100个像素到第400个像素

有1467行,只输出前800行像素的类别

在txt中缩小看,中间空白是瓶子盖

 下面是瓶身,颜色浅一点的是可乐的类别序号:1

颜色深一点的是背景序号:0

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/536696.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

WordPress 技巧:WordPress设置媒体文件的默认链接本身方法

当我们在 WordPress 后台上传文件,并添加到内容中得时候,默认媒体文件是链接到文件本身,这个是很烦人的,有时候我们只是想在文章内容中插入一张图片,而不想给这张图片加上任何链接,我们怎么做呢&#xff1f…

动态主机配置协议 DHCP

文章目录 1 概述2 DHCP2.1 工作原理2.2 报文类型 3 扩展3.1 网工软考真题 1 概述 #mermaid-svg-ZESmHWHRC6kYroqm {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-ZESmHWHRC6kYroqm .error-icon{fill:#552222;}#merm…

Java EE 进阶--多线程(二)

目录 一、JUC(java.util.concurrent) 的常见类 1.1 信号量 Semaphore 1.2 CountDownLatch 1.3 CyclicBarrier -循环栅栏 二、线程安全的集合类 2.1 多线程环境使用 ArrayList 2.2 多线程环境使用队列 2.3 多线程环境使用哈希表 三、死锁 3.1 死锁是什么 3.2 如何避免死…

Linux文本三剑客之sed

Linux文本三剑客之sed 一、sed简介二、工作流程三、sed的常见用法1、常见的sed命令选项2、常见的操作3、基本用法实例3.1 sed查询3.2 sed删除3.3 sed替换sed ‘s/旧字符/新字符/’ :替换每行匹配到的第一个旧字符3.4 sed插入 一、sed简介 sed(Stream ED…

Chrome浏览器竟然也可以用ChatGPT了!

最近这段时间想必 和我一样,都被chatGPT刷屏了。 在看到网上给出的一系列chatGPT回答问题的例子和自己亲自体验之后,的确发现它效果非常令人惊艳。 chatGPT的火热程度在开源社区也有很明显的体现,刚推出不久,围绕chatGPT的开源项…

Redis:发布订阅

发布订阅到底是什么功能? 在CSDN这个app中有一个关注的功能,其实这个功能与redis的发布订阅有着异曲同工之处 订阅就相当于关注,关注之后,就相当于加入博主的专属的频道里,只要博主在这个频道里发布了什么信息&#…

VMware虚拟机安装OpenEuler欧拉系统

原文地址:https://program-park.top/2023/05/17/linux_7/ OpenEuler 镜像下载:https://www.openeuler.org/zh/download/   我这里以x86_64架构为示例,使用的23.03版本: 准备好镜像文件: 创建新虚拟机: 选…

HBuilder开发uniapp添加android的模拟器的方法

我们知道使用uniapp开发多端app非常方便,开发过程中的模拟器也可以提高我们测试代码的效率。但我们按uniapp官网的方法,上google的官网下载模拟器,往往非常不方便。 下面我们来看一下使用其他模拟器的方法。 我们知道android开发中&#xf…

Java生成jni.h头文件,java调用C方法 图文详解

环境搭建 1. android studio2021.2.1 2. JDK版本1.8 一、创建一个android项目 File ——> New ——> New Project ——> Empty Activity 创建后如下图所示 二、创建一个java调用C的类 2.1 java类命名为JNITest,创建一个两数之和的方法sums 大概需求…

5.Golang、Java面试题—Spring Cloud、Docker、kubernets(k8s)

本文目录如下: Golang、Java面试题二十、Spring Cloud什么是微服务架构?服务拆分 有哪些注意事项?什么是分布式集群?分布式的 CAP 原则?组件 - Spring Cloud 哪几个组件比较重要?组件 - 为什么要使用这些组件&#xf…

低代码开发ERP:从行业应用到自我价值的思考

随着数字化时代的到来,企业管理软件变得越来越重要。而最为重要的企业管理软件之一便是ERP(Enterprise Resource Planning),也就是企业资源计划,它集成了企业内部各个部门的信息,帮助企业进行全面的资源管理…

几个优秀的Wordpress主题汇总(精选免费WP主题)

DNSHH主题 单栏的 WordPress 博客主题,其模板风格,从DNSHH上移植到Typecho,再从Typecho移植到了 WordPress 上,相信这款 WordPress 博客主题这么受欢迎是因为被其简单大气的风格所吸引人吧! frontopen 扁平化页面风格…

Java进程(基础)

基本概念 1、进程:程序的执行过程 2、线程:一个进程可以有单个线程也就是我们说的单线程,还可以有多个线程也就是我们说的多线程, 线程 1、当一个类继承了Thread类就可以当成一个线程用 2、我们会重写run方法写上我们自己的业务…

plsql 安装和连接配置

首先下载plsql 安装, 然后 下载oracle 客户端 配置连接(如果安装了oracle 数据库,可以直接配置数据库则可跳过此步骤),下载后解压(解压密码为1) 然后找到 \instantclient_supper\network\admin 目录创建 tnsnames.ora 文件配置数据库连接 例如配置本地…

pynvme操作流程

步骤一:检查本地windows是否安装ssh 检查方式:windows本地打开windows powershell,输入ssh,若打印usage :ssh等一些信息,则已安装ssh,否则需要安装,安装方式如下,一般系…

Java 基础核心总结

目录 前言 介绍 1、基本语法 2、面向对象编程 3、异常处理 4、集合框架 5、IO 流 6、多线程 专栏地址 前言 Java 是一种广泛使用的程序设计语言,具有跨平台、面向对象、安全性高、灵活性强等特点,广泛应用于企业级应用程序和移动应用程序等领域…

win10锁屏或登录时会自动弹出触摸按键的问题解决办法

本篇文章主要讲解win10锁屏或登录时会自动弹出触摸按键的问题解决方式。 日期:2023年5月17日 作者:任聪聪 问题情况截图 屏幕按键说明 如下截图为屏幕按键 设置路径:设置–>轻松使用–>键盘 说明:见图中右侧第一个选择项即使用屏幕键盘的方法,但这并不是本次我们…

《花雕学AI》35:如何一次性和17个AI聊天机器人交流?ChatALL让你轻松实现

聊天机器人,也称为对话机器人,是一种能够通过自然语言与人类进行交流的人工智能系统。聊天机器人的应用领域非常广泛,从客服、娱乐、教育、医疗、社交等,到科研、商业、政治、军事等,几乎无所不包。随着深度学习和自然…

NXP MCUXPresso - 确定冰沙主板工程需要编译的确切文件集合

文章目录 NXP MCUXPresso - 确定冰沙主板工程需要编译的确切文件集合概述END NXP MCUXPresso - 确定冰沙主板工程需要编译的确切文件集合 概述 在尝试迁移 openpnp - Smoothieware project 从gcc命令行 MRI调试方式 到NXP MCUXpresso工程. 先搭了一个MCUXpresso C工程, MCU选…

别去外包,干了三年,废了....

先说一下自己的情况,大专生,18年通过校招进入湖南某软件公司,干了接近4年的功能测试,今年年初,感觉自己不能够在这样下去了,长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试…