如何选取网络中间的输出?并极简方法可视化

news2025/1/12 20:56:08

在这里插入图片描述

文章目录

  • 一、提供几种方法
    • 1. 直接修改模型的 forward 方法:
    • 2. 使用 hook 函数:
    • 3. 直接访问模型的子模块:
    • 4. 使用 nn.Sequential 来提取中间层:
  • 2. 如何选择方法
  • 3. 实际操作——提取特征并可视化
    • 1. 可视化
    • 2. 提取特征

一、提供几种方法

1. 直接修改模型的 forward 方法:

你可以通过修改模型的 forward 方法,直接返回第 layer5 层的输出。例如:

class ModifiedModel(nn.Module):
    def __init__(self, original_model):
        super(ModifiedModel, self).__init__()
        self.features = nn.Sequential(*list(original_model.children())[:6])  # 假设 layer5 是第六个子模块

    def forward(self, x):
        x = self.features(x)  # 这里 x 就是 layer5 的输出
        return x

这种方法的缺点是修改了模型的结构,并且可能不太灵活。

2. 使用 hook 函数:

hook 是一种更为灵活的方法,可以在模型执行时捕获中间层的输出。

outputs = []

def hook_fn(module, input, output):
    outputs.append(output)

layer5 = model.layer5  # 假设 layer5 是模型中的一个属性
handle = layer5.register_forward_hook(hook_fn)
# Forward pass
_ = model(input_tensor)
# Layer5 的输出现在存储在 outputs 中
layer5_output = outputs[0]
# 完成后注销 hook
handle.remove()

3. 直接访问模型的子模块:

如果你知道 layer5 的具体位置,可以直接在 forward 函数中通过 model.layer5(input) 的方式调用,获取输出。例如:

layer5_output = model.layer5(input)

这种方式假设你已经知道 layer5 是模型的一个属性。

4. 使用 nn.Sequential 来提取中间层:

这种方法是通过 nn.Sequential 创建一个包含所需层的子模型,从而提取中间层输出。

sub_model = nn.Sequential(*list(model.children())[:6])  # 获取到 layer5 的输出
layer5_output = sub_model(input_tensor)

2. 如何选择方法

  • 方法1 适合需要频繁获取特定层输出的情况,但它会修改模型结构。
  • 方法2 是最灵活的,不需要修改模型结构,非常适合调试或分析模型行为。
  • 方法3 适合在 forward pass 中直接获取某一层的输出,前提是你知道该层的具体位置。
  • 方法4 适合想要提取多层输出的情况。

3. 实际操作——提取特征并可视化

1. 可视化

可视化部分参考:https://blog.csdn.net/weixin_41496173/article/details/135713973

  • 首先是可视化代码
    3个入参分别是:提取的特征,前处理后的图,原图
def show_image_relevance(image_relevance, image, orig_image):
    # 这个函数的作用是将模型的注意力权重与原始图像结合,生成一个可视化的图像,
    # 显示模型在图像上的关注区域。参数包括 image_relevance(注意力权重),
    # image(模型输入图像),和 orig_image(原始图像)。
    def show_cam_on_image(img, mask):
        """
        用于将热力图叠加在图像上。img 是输入图像,mask 是注意力权重的热力图。
        Args:
            img:
            mask:

        Returns:

        """
        # 使用 OpenCV 的 applyColorMap 函数,将注意力权重(mask)转换为颜色热力图。
        # COLORMAP_JET 是一种常用的颜色映射方案,热力图的颜色表示不同强度的关注。
        heatmap = cv2.applyColorMap(np.uint8(255 * mask), cv2.COLORMAP_JET)
        heatmap = np.float32(heatmap) / 255  # 将热力图的像素值归一化到 [0, 1] 范围,以便与输入图像结合。
        cam = heatmap + np.float32(img)  # 将热力图叠加到输入图像上,生成一个带有关注区域的图像。
        cam = cam / np.max(cam)  # 再次将图像归一化,以确保像素值在 [0, 1] 范围内,防止溢出。
        return cam

    fig, axs = plt.subplots(1, 2)
    axs[0].imshow(orig_image)
    axs[0].axis('off')

    dim = int(image_relevance.numel() ** 0.5)
    image_relevance = image_relevance.reshape(1, 1, dim, dim)
    image_relevance = torch.nn.functional.interpolate(image_relevance.float(), size=448, mode='bilinear')
    image_relevance = image_relevance.reshape(448, 448).cuda().data.cpu().numpy()
    image_relevance = (image_relevance - image_relevance.min()) / (image_relevance.max() - image_relevance.min())
    image = torch.Tensor(image).data.cpu().numpy()
    image = (image - image.min()) / (image.max() - image.min())
    vis = show_cam_on_image(image, image_relevance)
    vis = np.uint8(255 * vis)
    vis = cv2.cvtColor(np.array(vis), cv2.COLOR_RGB2BGR)
    axs[1].imshow(vis)
    axs[1].axis('off')

2. 提取特征

  • 方式一
    知道是提取网络第几层的特征,且与网络前几层是连续的,则直接把网络的前几层拿出来推理就好。
    save_path = './XXX/layer_3'
    sub_model = nn.Sequential(*list(model.body.children())[:4])
    
    os.makedirs(save_path, exist_ok=True)
    layer_output = sub_model(tensor_batch.cuda()).cpu()
    for i in range(layer_output.shape[1]):
        show_image_relevance(layer_output[0, i, :, :], np_img, im)
        plt.savefig(os.path.join(save_path, f'show_pic_no{i}.jpg'))
        plt.close()  # 关闭当前图像窗口
    
  • 方式二
    提取的特征是head部分,通过前几层这样取不出,有个最简单的方法就是——1 修改一下return;
    在需要提取特征的地方直接加return即可。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2040010.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

无人机之电池注意事项

1、外场作业时,电池一定要放置在阴凉处,避免太阳直射; 2、刚作业完的电池发热严重时,请降至室温再充电; 3、注意电池状态,一旦发现电池出现鼓包、漏液等现象,必须马上停止使用; 4…

基于springboot的医院资源管理系统

TOC springboot158基于springboot的医院资源管理系统 第1章 绪论** 1.1 课题背景 互联网发展至今,无论是其理论还是技术都已经成熟,而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播,搭配信息管理工具可以很好地为人们提供…

Redmi 13C 5G 红米13R 5G 解锁BL 降级 MIUI 秒解锁BL 澎湃OS 降级

机型名称 :Redmi 13C 5G/ Redmi 13R 5G/ POCO M6 5G 机型代号 :air HyperOS 降级MIUI 14 澎湃OS 或者miui都可以秒解锁BL, Redmi 13C 5G 红米13R 5G 解锁BL 降级 MIUI 秒解锁BL 澎湃OS 降级,手机ROM - Powered by Discuz!点击上方 下载对…

大迈u盘文件不见了怎么办?全面解析与恢复策略

在数字化时代,U盘作为我们日常工作、学习和生活中不可或缺的存储设备,承载着大量的重要文件。然而,面对突如其来的U盘文件丢失问题,许多用户往往会感到手足无措,甚至因此遭受不可估量的损失。本文将围绕“大迈U盘文件丢…

算法与数据结构笔记

算法是什么 算法定义 算法(algorithm)是在有限时间内解决特定问题的一组指令或操作步骤,它具有以下特性。 ‧ 问题是明确的,包含清晰的输入和输出定义。 ‧ 具有可行性,能够在有限步骤、时间和内存空间下完成。 ‧…

多种方案解决IOS下uni.share分享分包页面报错Error: Framework inner error

项目场景: 有个需求是用uni.share从app分享微信小程序,发现在苹果手机真机调试的时候 跳转的目标页面会白屏、页面样式错乱、一些组件不出现等问题。并且报错 Error: Framework inner error 问题描述 uniapp开发在苹果手机下app分享微信小程序会出现白…

Golang | Leetcode Golang题解之第336题回文对

题目&#xff1a; 题解&#xff1a; // 哈希表实现 class Solution {public List<List<Integer>> palindromePairs(String[] words) {List<List<Integer>> res new ArrayList<>();int n words.length;Map<String, Integer> indices ne…

Nvidia显卡在深度学习应用中一些概念解释

之前一直在搞深度学习&#xff0c;最近又想着安装一下mamba试一下效果&#xff0c;可以配置环境就花了好长时间&#xff0c;主要还是一些概念没有弄明白&#xff0c;这里记录一下&#xff0c;方便以后查阅。 Nvidia显卡在深度学习应用中一些概念解释 显卡中一些名词的解释CUDA …

ZooKeeper集群环境部署

1. ZooKeeper安装部署 1.1 系统要求 1.1.1 支持的平台 ZooKeeper 由多个组件组成。一些组件得到广泛支持&#xff0c;而另一些组件仅在较小的一组平台上得到支持。 客户端是 Java 客户端库&#xff0c;由应用程序用于连接到 ZooKeeper 集群。 服务器是在 ZooKeeper 集群节点…

服务器主要有什么用途?什么情况下需要服务器?

服务器主要用于在网络中提供各种服务和资源。它们是现代信息技术基础设施的核心组成部分&#xff0c;用于存储、处理和管理数据&#xff0c;并为客户端设备&#xff08;如个人电脑、移动设备等&#xff09;提供所需的服务。以下是服务器的一些主要用途&#xff1a; 文件共享与存…

shell 三剑客-sed

sed 是Linux 系统一款非常强大的非交互式的文本编辑器&#xff0c;可以对文本进行增删改查操作&#xff0c;正则匹配文本内容。适合大文件编辑 sed 语法 sed 选项 ‘指令’ 文件 sed 选项 -f 包含sed指令的文件 文件 常用参数 -i&#xff1a;直接修改文件内容&#xff0c;而不…

用R语言运用 Shiny 包打造基于鸢尾花数据集的交互式数据可视化应用

下面内容摘录自《R 语言与数据科学的终极指南》专栏文章的部分内容&#xff0c;每篇文章都在 5000 字以上&#xff0c;质量平均分高达 94 分&#xff0c;看全文请点击下面链接&#xff1a; 1章4节&#xff1a;数据可视化&#xff0c; R 语言的静态绘图和 Shiny 的交互可视化演…

普通人看清房价走势的简单方法

研究了很多宏观方面的房价影响因素&#xff0c;还是很容易被看空和看多的房地产文章左右&#xff0c;也容易受到各种影响。 针对普通人而言&#xff0c;想要看清房价走势非常简单的一个方法&#xff0c; 你就看看你的工作状态【或者身边找工作的人多不多】 当你能挑工作的时…

老友记台词 第一季 第十三集 Friends 113(全英版)

文章目录 113 The One With the Boobies[Scene: Monica and Rachels, Chandler walks in and starts raiding the fridge. Then Rachel comes out of the shower with a towel wrapped round her waist, drying herself with another towel. Chandler and Rachel startle each …

CSC5613C 同步降压DC/DC

CSC5613C是一款同步降压型的DCDC变换器 IC&#xff0c;其输入电压为8~30V&#xff0c;具有良好的瞬态响应和环路稳定性。CSC5613C外围元器件极少&#xff0c;具有线补、过流保护和热保护功能。可通过调节FB电阻比例,来调整输出电压可用于快充。CSC5613C带载启动电流与其最大输出…

地下管线三维建模工具MagicPipe3D V3.5.2发布

经纬管网建模系统MagicPipe3D&#xff0c;本地离线参数化构建地下管网三维模型&#xff08;包括管道、接头、附属设施等&#xff09;&#xff0c;输出标准3DTiles、Obj模型等格式&#xff0c;支持Cesium、Unreal、Unity、Osg等引擎加载进行三维可视化、语义查询、专题分析&…

WPF窗体动态效果

在浏览网页的时候&#xff0c;发现现在很多网页都采用这种效果。看起来很炫。 效果如下&#xff1a; 已经实现很久了&#xff0c;一直没写出来。今天突然想到&#xff0c;写出来分享一下 原理比较简单&#xff0c;就是在Window里面放一个MediaElement控件&#xff0c;播放视频…

shell命令行解释器—既陌生有熟悉的东西

今天做一个感性的认识来&#xff0c;用一个生活的例子。 你生活在有一条村子里面&#xff0c;在村的东边就是王婆&#xff0c;王婆呢&#xff1f;她主要做什么呢啊&#xff1f;她在村儿里面呢&#xff0c;也不种地啊&#xff0c;那她干什么呢&#xff1f;他主要做帮别人进行婚嫁…

人工智能时代,网络安全公司F5如何提高防护效能?

随着AI推动的应用和API数量迅速增长&#xff0c;企业面临着日益严峻的安全挑战&#xff0c;亟需采取有效措施来应对。AI正将数字体验推向一个全新的高度&#xff0c;它通过分布式部署数据源、模型和服务在企业内部、云端和边缘计算环境中&#xff0c;并依靠不断扩展的API网络实…

旋转字符串 | LeetCode-796 | 模拟 | KMP | 字符串匹配

&#x1f64b;大家好&#xff01;我是毛毛张! &#x1f308;个人首页&#xff1a; 神马都会亿点点的毛毛张 &#x1f579;️KMP算法练习题 LeetCode链接&#xff1a;796. 旋转字符串 文章目录 1.题目描述&#x1f351;2.题解&#x1fad0;2.1 暴力解法&#x1fad2;2.2 模拟…