可视化深度网络的强大工具:Grad-CAM介绍与使用步骤

news2024/9/21 23:09:04

《博主简介》

小伙伴们好,我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。
👍感谢小伙伴们点赞、关注!

《------往期经典推荐------》

一、AI应用软件开发实战专栏【链接】

项目名称项目名称
1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】
3.【手势识别系统开发】4.【人脸面部活体检测系统开发】
5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】
7.【YOLOv8多目标识别与自动标注软件开发】8.【基于YOLOv8深度学习的行人跌倒检测系统】
9.【基于YOLOv8深度学习的PCB板缺陷检测系统】10.【基于YOLOv8深度学习的生活垃圾分类目标检测系统】
11.【基于YOLOv8深度学习的安全帽目标检测系统】12.【基于YOLOv8深度学习的120种犬类检测与识别系统】
13.【基于YOLOv8深度学习的路面坑洞检测系统】14.【基于YOLOv8深度学习的火焰烟雾检测系统】
15.【基于YOLOv8深度学习的钢材表面缺陷检测系统】16.【基于YOLOv8深度学习的舰船目标分类检测系统】
17.【基于YOLOv8深度学习的西红柿成熟度检测系统】18.【基于YOLOv8深度学习的血细胞检测与计数系统】
19.【基于YOLOv8深度学习的吸烟/抽烟行为检测系统】20.【基于YOLOv8深度学习的水稻害虫检测与识别系统】
21.【基于YOLOv8深度学习的高精度车辆行人检测与计数系统】22.【基于YOLOv8深度学习的路面标志线检测与识别系统】
23.【基于YOLOv8深度学习的智能小麦害虫检测识别系统】24.【基于YOLOv8深度学习的智能玉米害虫检测识别系统】
25.【基于YOLOv8深度学习的200种鸟类智能检测与识别系统】26.【基于YOLOv8深度学习的45种交通标志智能检测与识别系统】
27.【基于YOLOv8深度学习的人脸面部表情识别系统】28.【基于YOLOv8深度学习的苹果叶片病害智能诊断系统】
29.【基于YOLOv8深度学习的智能肺炎诊断系统】30.【基于YOLOv8深度学习的葡萄簇目标检测系统】
31.【基于YOLOv8深度学习的100种中草药智能识别系统】32.【基于YOLOv8深度学习的102种花卉智能识别系统】
33.【基于YOLOv8深度学习的100种蝴蝶智能识别系统】34.【基于YOLOv8深度学习的水稻叶片病害智能诊断系统】
35.【基于YOLOv8与ByteTrack的车辆行人多目标检测与追踪系统】36.【基于YOLOv8深度学习的智能草莓病害检测与分割系统】
37.【基于YOLOv8深度学习的复杂场景下船舶目标检测系统】38.【基于YOLOv8深度学习的农作物幼苗与杂草检测系统】
39.【基于YOLOv8深度学习的智能道路裂缝检测与分析系统】40.【基于YOLOv8深度学习的葡萄病害智能诊断与防治系统】
41.【基于YOLOv8深度学习的遥感地理空间物体检测系统】42.【基于YOLOv8深度学习的无人机视角地面物体检测系统】
43.【基于YOLOv8深度学习的木薯病害智能诊断与防治系统】44.【基于YOLOv8深度学习的野外火焰烟雾检测系统】
45.【基于YOLOv8深度学习的脑肿瘤智能检测系统】46.【基于YOLOv8深度学习的玉米叶片病害智能诊断与防治系统】
47.【基于YOLOv8深度学习的橙子病害智能诊断与防治系统】48.【车辆检测追踪与流量计数系统】
49.【行人检测追踪与双向流量计数系统】50.【基于YOLOv8深度学习的反光衣检测与预警系统】
51.【危险区域人员闯入检测与报警系统】52.【高密度人脸智能检测与统计系统】
53.【CT扫描图像肾结石智能检测系统】54.【水果智能检测系统】
55.【水果质量好坏智能检测系统】56.【蔬菜目标检测与识别系统】
57.【非机动车驾驶员头盔检测系统】58.【太阳能电池板检测与分析系统】
59.【工业螺栓螺母检测】60.【金属焊缝缺陷检测系统】
61.【链条缺陷检测与识别系统】62.【交通信号灯检测识别】

二、机器学习实战专栏【链接】,已更新31期,欢迎关注,持续更新中~~
三、深度学习【Pytorch】专栏【链接】
四、【Stable Diffusion绘画系列】专栏【链接】
五、YOLOv8改进专栏【链接】持续更新中~~
六、YOLO性能对比专栏【链接】,持续更新中~

《------正文------》

目录

    • 引言
    • Grad-CAM定义
  • Grad-CAM 重要性
    • PyTorch 使用Grad-CAM步骤
      • 步骤 1:预处理输入图像
      • 第 2 步:执行前向传递
      • 步骤 3:确定目标层
      • 4. 后向传递
      • 5. 计算热图
      • 6. 可视化热图
    • Grad-CAM 的实际应用

引言

在这里插入图片描述

在深度学习领域,了解神经网络的决策过程至关重要,尤其是在医疗诊断和自动驾驶等关键应用方面。

Grad-CAM(梯度加权类激活映射)是一种流行的技术,用于可视化对模型预测贡献最大的图像区域。本文将探讨什么是 Grad-CAM,Grad-CAM 在 PyTorch 中的工作原理,以及它的意义和实际应用。

Grad-CAM定义

Grad-CAM 是一种可视化技术,可为卷积神经网络 (CNN) 的决策提供视觉解释。它生成粗略的定位图,突出显示输入图像中用于预测特定类别的重要区域。

此外,Grad-CAM 不需要对模型进行架构更改。因为它适用于各种 CNN 架构,因此具有广泛的适用性。

Grad-CAM 重要性

了解模型做出某些预测的原因可以显著提高透明度和信任度。Grad-CAM 有助于:

模型可解释性

  • 突出显示对预测有重要意义的输入区域使得模型的决策过程更易于解释。

调试模型

  • 调查模型对输入进行错误分类的原因可以提供如何改进模型的见解。

信任与透明度

  • 在医疗保健等关键应用中,能够解释模型决策对于赢得用户信任至关重要。

PyTorch 使用Grad-CAM步骤

PyTorch 中 Grad-CAM 的实现涉及几个步骤,每个步骤对于创建准确而有意义的视觉解释都至关重要。

步骤 1:预处理输入图像

第一步是预处理输入图像,使其适合神经网络模型。这包括调整图像大小、对其进行规范化以及将其转换为张量格式。

图像预处理保证图像满足模型的输入要求,提高GradCAM可视化的准确性。

from torchvision import transforms 
import cv2 

# 定义预处理转换
preprocess = transforms.Compose([ 
    transforms.Resize((224, 224)), 
    transforms.ToTensor(), 
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) 
]) 

# 加载并预处理图像
img = cv2.imread('path_to_image.jpg') 
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) 
img_tensor = preprocess(img).unsqueeze(0)

第 2 步:执行前向传递

对模型进行前向传递以获得预测。此步骤将预处理后的图像通过网络传递以获取每个类别的 logit 或输出分数。

# 执行前向传递
model.eval() # 将模型设置为评估模式
output = model(img_tensor) 
pred_class = output.argmax(dim=1).item()

步骤 3:确定目标层

Grad-CAM 需要访问卷积层的激活以及目标类对这些激活的梯度。

通常,使用最后一个卷积层,因为它可以捕获最详细的空间信息。我们注册钩子以在前向和后向传递期间捕获这些激活和梯度。

# 识别目标层
target_layer = model.layer4[-1] 

# 用于存储激活和梯度的列表
activations = [] 
gradients = [] 

# 用于捕获激活和梯度的钩子
def  forward_hook ( module , input, output ): 
    activations.append(output) 

def  behind_hook ( module , grad_input, grad_output ): 
    gradations.append(grad_output[ 0 ]) 

target_layer.register_forward_hook(forward_hook) 
target_layer.register_full_backward_hook(backward_hook)

4. 后向传递

执行前向传递后,进行后向传递以计算目标类到目标层激活的梯度。此步骤有助于了解图像的哪些部分对于模型预测很重要。

# 将梯度归零
model.zero_grad() 

# 向后传递以计算梯度
output[:, pred_class].backward()

5. 计算热图

使用捕获的梯度和激活,计算Grad-CAM 热图。热图通过用平均梯度加权激活并应用 ReLU 激活来消除负值来计算。热图突出显示图像中对预测很重要的区域。

import numpy as np 

# 计算权重 
weights = torch.mean(gradients[ 0 ], dim=[ 2 , 3 ]) 

# 计算 Grad-CAM 热图
heatmap = torch. sum (weights *activations[ 0 ], dim= 1 ).squeeze() 
heatmap = np.maximum(heatmap.cpu().detach().numpy(), 0 ) 
heatmap /= np.max ( heatmap)

6. 可视化热图

最后一步是将计算出的热图叠加在原始图像上。这种可视化有助于了解图像的哪些区域对模型的决策贡献最大。

import cv2 

# 调整热图大小以匹配原始图像大小
heatmap = cv2.resize(heatmap, (img.shape[1], img.shape[0])) 

# 将热图转换为 RGB 格式并应用颜色图
heatmap = cv2.applyColorMap(np.uint8(255 * heatmap), cv2.COLORMAP_JET) 

# 将热图叠加在原始图像上
superimposed_img = cv2.addWeighted(img, 0.6, heatmap, 0.4, 0) 

# 显示结果
cv2.imshow('Grad-CAM', superimposed_img) 
cv2.waitKey(0) 
cv2.destroyAllWindows()

通过遵循这些步骤,您可以在 PyTorch 中有效地实现 Grad-CAM,以可视化和解释卷积神经网络的决策过程。

Grad-CAM 的实际应用

Grad-CAM广泛应用于各个领域:

  • 医学成像: Grad-CAM 可识别有助于诊断的 X 射线或 MRI 扫描部分。
  • 自动驾驶:了解自动驾驶汽车模型在做出驾驶决策时会考虑图像的哪些方面。
  • 安全性:分析图像的哪些部分对于检测异常或入侵很重要。

Grad-CAM 是一款功能强大的工具,可用于可视化和理解深度学习模型的决策。通过深入了解图像的哪些部分对模型的预测影响最大,Grad-CAM 可提高模型的可解释性、可信度和透明度。


好了,这篇文章就介绍到这里,喜欢的小伙伴感谢给点个赞和关注,更多精彩内容持续更新~~
关于本篇文章大家有任何建议或意见,欢迎在评论区留言交流!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2141863.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第一次安装Pytorch

1、新版本的Anaconda内置的python版本是3.12, 目前 Windows 上的 PyTorch 仅支持 Python 3.8-3.11;不支持 Python 2.x。 1、创建运行环境 在不创建虚拟环境的情况下,不建议使用最新的Python和Anaconda。 在几次失败后,我使用的是Anaconda3-2…

单相可控整流电路(单相半波整流电路、单相桥式全控整流电路)

目录 1. 单相半波整流电路 2. 单相桥式全控整流电路 单相可控整流电路是利用可控硅(晶闸管)将交流电转换为直流电的电路,主要有两种常见类型:单相半波整流电路和单相桥式全控整流电路。 1. 单相半波整流电路 单相半波整流电路是…

python实现多个pdf文件合并

打印发票时,需要将pdf合并成一个,单页两张打印。网上一些pdf合并逐渐收费,这玩意儿都能收费?自己写一个脚本使用。 实现代码: 输入pdf文件夹路径data_dir,统计目录下的“合并后的PDF”文件夹下,…

十六,Spring Boot 整合 Druid 以及使用 Druid 监控功能

十六,Spring Boot 整合 Druid 以及使用 Druid 监控功能 文章目录 十六,Spring Boot 整合 Druid 以及使用 Druid 监控功能1. Druid 的基本介绍2. 准备工作:3. Druid 监控功能3.1 Druid 监控功能 —— Web 关联监控3.2 Druid 监控功能 —— SQL…

数组学习内容

动态初始化 只给长度,数据类型【】 数组名new 数据类型【数组长度】 内存图

MySQL篇(数值函数/)(持续更新迭代)

目录 常见函数一:数值函数 一、常见数值函数 1. 基本函数 2. 角度与弧度互换函数 3. 三角函数 4. 指数与对数 5. 进制间的转换 常见函数二:日期函数 一、常见日期函数 二、SQL演示 1. curdate:当前日期 2. curtime:当前…

ThreadX源码:Cortex-A7的tx_thread_context_save.S(线程上下文保存)汇编代码分析

0 参考资料 Cortex M3权威指南(中文).pdf(可以参考ARM指令集用法) 1 前言 tx_thread_context_save.S是用来实现Cortex-A7下线程上下文保存的函数所在汇编文件。 2 源码分析 2.1 概述 _tx_thread_context_save函数用于在线程被中断打断后保存上下文&a…

「Next.js中文文档」网站发布

大家好,我是程普(weijunext),我联合“阿伟dev”搭建了一个「Next.js 中文文档」网站👇 这个网站我们设计得很特别: 样式很特别 我们模仿 Next.js 官方网站样式,努力做到除了语言不同&#xff…

进程相关的系统调用

文章目录 进程进程相关的系统调用wait函数waitpid函数示例--使用wait fork函数创建子进程并使用宏验证子进程的退出状态信息示例--使用waitpid函数检测子进程是否进入暂停状态 exec族函数示例--exec族函数的使用 system函数示例--使用system函数执行外部指令 进程状态切换 进程…

Vue2电商平台项目 (三) Search模块、面包屑(页面自己跳自己)、排序、分页器!

文章目录 一、Search模块1、Search模块的api2、Vuex保存数据3、组件获取vuex数据并渲染(1)、分析请求数据的数据结构(2)、getters简化数据、渲染页面 4、Search模块根据不同的参数获取数据(1)、 派发actions的操作封装为函数(2)、设置带给服务器的参数(3)、Object.assign整理参…

第十一章 【后端】商品分类管理微服务(11.1)——创建父工程

第十一章 【后端】商品分类管理微服务 11.1 创建父工程 项目名称:EasyTradeManagerSystem:Easy 表示简单易用,Trade 表示交易,Manager 表示管理,System 表示系统,强调系统在商品交易管理方面的便捷性,简称 etms。 新建工程 yumi-etms yumi-etms 作为所有模块的父工程,…

基于java 的医院排号管理系统设计与实现

博主介绍:专注于Java .net php phython 小程序 等诸多技术领域和毕业项目实战、企业信息化系统建设,从业十五余年开发设计教学工作 ☆☆☆ 精彩专栏推荐订阅☆☆☆☆☆不然下次找不到哟 我的博客空间发布了1000毕设题目 方便大家学习使用 感兴趣的可以…

1863. 找出所有子集的异或总和再求和

目录 一:题目: 二:代码: 三:结果: 一:题目: 一个数组的 异或总和 定义为数组中所有元素按位 XOR 的结果;如果数组为 空 ,则异或总和为 0 。 例如&#x…

C++--类的实例化

一、实例化的概念 用类类型在屋里内存中创建对象的过程,称为类实例化出对象 类是对对象进行一种抽象描述,是一个模型一样的东西,限定了类有哪些成员变量,这些成员变量只是声明,没有分配空间,用类实例化出…

【C++前后缀分解 动态规划】2100. 适合野炊的日子|1702

本文涉及知道点 C前后缀分解 C动态规划 LeetCode2100. 适合野炊的日子 你和朋友们准备去野炊。给你一个下标从 0 开始的整数数组 security ,其中 security[i] 是第 i 天的建议出行指数。日子从 0 开始编号。同时给你一个整数 time 。 如果第 i 天满足以下所有条件…

2024最新版MySQL详细学习教程

MySQL数据库提供了很多函数包括: 数学函数;字符串函数;日期和时间函数;条件判断函数;系统信息函数;加密函数;格式化函数; 一、数学函数 数学函数主要用于处理数字,包括…

基于paddleocr的批量图片缩放识别

说明 在进行ocr文字识别的时候,有时候我们需要使用批量测试的功能,但是有些图片会识别失败或者个别根本识别不出来,这时候我们可以通过对原图片进行缩放,提高图像的分辨率,然后再次识别,这样可以大大提高图…

Vue学习记录之一(介绍及脚手架的使用)

一、背景知识介绍 1、构建工具介绍 Vite, Webpack,Rollup, Parce 构建工具优点缺点Vite- 快速启动,秒级热更新,更快的构建速度,更好的开发体验;- 支持 Vue3 和 ES modules 的原生特性,轻松实现按需加载。- 对于单页…

项目实现:云备份②(文件操作、Json等工具类的实现)

云备份 前言文件操作实用工具类设计文件属性的获取文件的读写操作文件压缩与解压缩的实现文件目录操作 Json 实用工具类设计编译优化 前言 如果有老铁不知道当前项目实现的功能是什么的话,可以先移步这篇文章内容: 云备份项目的介绍 其中介绍了云备份项…

【吊打面试官系列-MySQL面试题】简述在 MySQL 数据库中 MyISAM 和 InnoDB 的区别?

大家好,我是锋哥。今天分享关于【简述在 MySQL 数据库中 MyISAM 和 InnoDB 的区别?】面试题,希望对大家有帮助; 简述在 MySQL 数据库中 MyISAM 和 InnoDB 的区别? MyISAM: 不支持事务,但是每次查…