【知识蒸馏】deeplabv3 logit-based 知识蒸馏实战，对剪枝的模型进行蒸馏训练

【知识蒸馏】deeplabv3 logit-based 知识蒸馏实战，对剪枝的模型进行蒸馏训练

news2025/4/16 14:34:42

本文将对【模型剪枝】基于DepGraph(依赖图)完成复杂模型的一键剪枝文章中剪枝的模型进行蒸馏训练

一、逻辑蒸馏步骤

加载教师模型
定义蒸馏loss
计算蒸馏loss
正常训练

二、代码

1、加载教师模型

教师模型使用未进行剪枝，并且已经训练好的原始模型。

teacher_model = torch.load('./logs/before_prune.pth', map_location=device)

2、定义蒸馏loss

分割和分类的loss，都是用的softmax。

import torch.nn.functional as F
import torch.nn as nn
# 蒸馏温度
Tempature = 2
def KD_loss(teacher_pred, student_pred):
    t_p = F.softmax(teacher_pred / Tempature, dim=1)
    s_p = F.log_softmax(student_pred / Tempature, dim=1)
    return nn.KLDivLoss(reduction='mean')(s_p, t_p) * (Tempature ** 2)

3、计算蒸馏loss

teacher_outputs = t_model(imgs)
# 蒸馏loss
soft_loss = KD_loss(teacher_outputs, outputs)
# 总loss = 蒸馏loss*alpha + 原学生模型loss*(1-alpha)
alpha = 0.9
all_loss = loss * (1 - alpha) + soft_loss * alpha

4、正常训练

all_loss.backward()

用剪枝前训练好的模型对剪枝后模型进行蒸馏训练，训练后测试效果如下：
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1696189.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Strategy设计模式

Strategy设计模式

Strategy设计模式举例。看图： 代码实现： #include <iostream>using namespace std;class FlyBehavior { public:virtual void fly() 0; };class QuackBehavior { public:virtual void quack() 0; };class FlyWithWings :public FlyBehavior …

阅读更多...

新人攻略：避开这3大坑，让老员工主动带你飞！

新人攻略：避开这3大坑，让老员工主动带你飞！

进入职场的新人们，常常会感到困惑和挑战。他们可能会发现自己在与老员工的交流中遇到难题，甚至发现老员工并不愿意花费时间和精力去指导他们。这背后的原因是什么呢？又该如何改善这一现象呢？本文将从新员工的角度出发，…

阅读更多...

无人机飞手：ASFC无人机和航模爱好者证书详解

无人机飞手：ASFC无人机和航模爱好者证书详解

ASFC无人机和航模爱好者证书是由中国航空运动协会（ASFC）颁发的一种无人机操作资格认证。这种证书在无人机和航模爱好者群体中享有广泛的认可度，并被视为操作无人机的一种重要资质。 ASFC证书的定义和用途十分明确。它是民航局颁发的民用无人驾…

阅读更多...

C++中的继承详解

C++中的继承详解

1.继承的概念及定义 1.1继承的概念继承(inheritance)机制是面向对象程序设计使代码可以复用的最重要的手段，它允许程序员在保持原有类特性的基础上进行扩展，增加功能，这样产生新的类，称派生类。继承呈现了面向对象程序设计的…

阅读更多...

产品数据特性驱动设计

产品数据特性驱动设计

一、什么是数据特性一个产品在宏观的视角下，是不同功能模块的有机组合；在微观的视角上，是千丝万缕的数据连接。基于模块化设计思想，对产品进行业务化梳理，对业务进行模块化拆分出功能模块，功能模块就是产品的“逻辑”，而功能中的数据就是“特性”。业务：比较固定…

阅读更多...

马尔可夫和比奈梅-切比雪夫不等式

马尔可夫和比奈梅-切比雪夫不等式

目录一、说明二、自然界的极限性三、马尔可夫不等式 3.1 最早提出 3.2 马尔可夫不等式的证明四、 Bienaym–Chebyshev 不等式 4.1 简要回顾Bienaym–Chebyshev 不等式的历史 4.2 Bienaym — Chebyshev 不等式的证明五、弱大数定律（及其证明）…

阅读更多...

C语言——⾼位优先与低位优先的不同之处是什么？

C语言——⾼位优先与低位优先的不同之处是什么？

一、问题 C语⾔的最⼤特⾊就是可移植性好。根据机器类型的不同，⾼位优先与低位优先也不同。那么，最好的可移植的 C 程序应该同时适⽤这两种类型的计算机。下⾯了解⼀下⾼位优先与低位优先的不同之处。二、解答所谓的⾼位优先，就是最低的地…

阅读更多...

实现排行榜之Mysql的 OrderBy方法

实现排行榜之Mysql的 OrderBy方法

排行榜之Mysql OrderBy实现 1、排行榜系统的功能点数据收集与计算排名规则实时性可视化展示周期性更新 2、排行榜系统基本功能要素 MySQL实现方案数据量较小，业务场景比较简单。可直接使用新建表 CREATE TABLE leaderboard( id BIGINT UNSIGNED NOT …

阅读更多...

21.Happens-Before原则

21.Happens-Before原则

文章目录 Happens-Before原则1.Happens-Before规则介绍2.规格介绍2.1.顺序性规则(as-if-serial)2.2.volatile规则2.3.传递性规则2.4.监视锁规则2.5.start规则2.6.join()规则 Happens-Before原则 JVM内存屏障指令对Java开发工程师是透明的，是JMM对JVM实现的一种规范和…

阅读更多...

基于51单片机温度报警系统—数码管显示

基于51单片机温度报警系统—数码管显示

基于51单片机温度报警系统 （仿真＋程序＋原理图＋设计报告） 功能介绍具体功能： 1.DS18B20采集温度，数码管显示温度； 2.温度测量范围：0-99度； 3.当温度低于…

阅读更多...

Qt for android 获取USB设备列表（二）JNI方式获取

Qt for android 获取USB设备列表（二）JNI方式获取

简介基于上篇 [Qt for android 获取USB设备列表（一）Java方式获取]， 这篇就纯粹多了， 直接将上篇代码转换成JNI方式即可。即所有的设备连接与上篇一致。 (https://listentome.blog.csdn.net/article/details/139205850) 关键代码…

阅读更多...

FPGA实现多路并行dds

FPGA实现多路并行dds

目录基本原理 verilog代码仿真结果基本原理多路并行dds，传统DDS的局限性在于输出频率有限。根据奈奎斯特采样定理，单路DDS的输出频率应小于系统时钟频率的一半。但是在很多地方，要使采样率保持一致，所以，为了…

阅读更多...

逻辑这回事（一）----FPGA安全编码规范

逻辑这回事（一）----FPGA安全编码规范

安全编码的背景、定义 FPGA攻击方式和攻击目的安全编码价值 2020年4月，来自德国的研究者披露了一个名为“StarBleed”的漏洞，当时引起了业内一片轰动。这种漏洞存在于赛灵思的Virtex、Kintex、Artix、Spartan 等全部7系列FPGA中。通过这个漏洞&#…

阅读更多...

【JavaWeb】Day83.Maven高级——分模块设计与开发

【JavaWeb】Day83.Maven高级——分模块设计与开发

分模块设计与开发介绍所谓分模块设计，顾名思义指的就是我们在设计一个 Java 项目的时候，将一个 Java 项目拆分成多个模块进行开发。 1). 未分模块设计的问题如果项目不分模块，也就意味着所有的业务代码是不是都写在这一个 Java 项目当中…

阅读更多...

C语言—深入理解指针（4）

C语言—深入理解指针（4）

1.回调函数回调函数就是一个通过函数指针调用的函数。如果你把函数的指针（地址）作为参数传递给另一个函数，当这个指针被用来调用其所指向的函数时，被调用的函数就是回调函数。回调函数不是由该函数的实现方直接调用&#xff0…

阅读更多...

[Algorithm][动态规划][简单多状态DP问题][按摩师][打家劫舍Ⅱ][删除并获得点数][粉刷房子]详细讲解

[Algorithm][动态规划][简单多状态DP问题][按摩师][打家劫舍Ⅱ][删除并获得点数][粉刷房子]详细讲解

目录 1.按摩师1.题目链接2.算法思路详解3.代码实现 2.打家劫舍 II1.题目链接2.算法思路详解3.代码实现 3.删除并获得点数1.题目链接2.算法思路详解3.代码实现 4.粉刷房子1.题目链接2.算法思路详解3.代码实现 1.按摩师 1.题目链接按摩师 2.算法思路详解思路： 确…

阅读更多...

《计算机网络微课堂》3-10 以太网交换机的生成树协议 STP

《计算机网络微课堂》3-10 以太网交换机的生成树协议 STP

我们介绍以太网交换机生成树协议的基本概念。请大家思考一下，应该如何提高以太网的可靠性呢？例如如图所示的以太网，由三台交换机互联而成，每个交换机上都连接有一些主机，为了简单起见，我们只画出了每个交…

阅读更多...

源码部署ELK

源码部署ELK

目录资源列表基础环境关闭防护墙关闭内核安全机制修改主机名添加hosts映射一、部署elasticsearch 修改limit限制部署elasticsearch 修改配置文件单节点集群(3台节点集群为例) 启动二、部署logstash 部署logstash 添加配置文件启动三、部署kiban…

阅读更多...

嵌入式全栈开发学习笔记---C语言笔试复习大全22

嵌入式全栈开发学习笔记---C语言笔试复习大全22

目录结构体结构体的声明定义结构体变量访问结构体成员进行初始化通过结构体变量名访问结构体成员结构体指针结构体指针的定义通过结构体指针访问结构体成员结构体数组结构体数组的定义遍历结构体数组结构体的长度（笔试重点） 上一…

阅读更多...

在家庭影院音频中应用的D类音频放大器

在家庭影院音频中应用的D类音频放大器

家庭影院的主要组成部分包括显示设备、音响设备、信号源和接线设备等。家庭影院的音响信号需要进行处理和输出，以获得高质量的音效。音响设备通常需要一台功率适当的数字、模拟混合的处理器，对音源进行降噪、均衡、扩展等处理操作，以达到高品…

阅读更多...

推荐文章

最新文章