[CVPR 2020] Regularizing Class-Wise Predictions via Self-Knowledge Distillation

news2024/11/29 14:53:45

Contents

  • Introduction
  • Class-wise self-knowledge distillation (CS-KD)
    • Class-wise regularization
    • Effects of class-wise regularization
  • Experiments
    • Classification accuracy
  • References

Introduction

  • 为了缓解模型过拟合,作者提出 Class-wise self-knowledge distillation (CS-KD),用同一类别的其他样本的预测类别概率去进行自蒸馏,使得模型输出更有意义和更加一致的预测结果

Class-wise self-knowledge distillation (CS-KD)

Class-wise regularization

在这里插入图片描述

  • class-wise regularization loss. 使得属于同一类别样本的预测概率分布彼此接近,相当于对模型自身的 dark knowledge (i.e., the knowledge on wrong predictions) 进行蒸馏
    在这里插入图片描述其中, x , x ′ \mathbf x,\mathbf x' x,x 为属于同一类别的不同样本, P ( y ∣ x ; θ , T ) = exp ⁡ ( f y ( x ; θ ) / T ) ∑ i = 1 C exp ⁡ ( f i ( x ; θ ) / T ) P(y \mid \mathbf{x} ; \theta, T)=\frac{\exp \left(f_y(\mathbf{x} ; \theta) / T\right)}{\sum_{i=1}^C \exp \left(f_i(\mathbf{x} ; \theta) / T\right)} P(yx;θ,T)=i=1Cexp(fi(x;θ)/T)exp(fy(x;θ)/T) T T T 为温度参数;注意到, θ ~ \tilde \theta θ~ 为 fixed copy of the parameters θ \theta θ,梯度不会通过 θ ~ \tilde \theta θ~ 回传到模型参数,从而避免 model collapse (cf. Miyaeto et al.)
  • total training loss
    在这里插入图片描述

在这里插入图片描述

Effects of class-wise regularization

  • Reducing the intra-class variations.
  • Preventing overconfident predictions. CS-KD 通过将同一类别其他样本的预测类别分布作为软标签来避免 overconfident predictions,这比一般的 label-smoothing 方法生成的软标签更真实 (more ‘realistic’)
    在这里插入图片描述在这里插入图片描述

Experiments

Classification accuracy

  • Comparison with output regularization methods.
    在这里插入图片描述
  • Comparison with self-distillation methods.
    在这里插入图片描述
  • Evaluation on large-scale datasets.
    在这里插入图片描述
  • Compatibility with other regularization methods.
    在这里插入图片描述在这里插入图片描述
  • Ablation study.
    (1) Feature embedding analysis.
    在这里插入图片描述(2) Hierarchical image classification.
    在这里插入图片描述
  • Calibration effects.
    在这里插入图片描述在这里插入图片描述

References

  • Yun, Sukmin, et al. “Regularizing class-wise predictions via self-knowledge distillation.” Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2020.
  • code: https://github.com/alinlab/cs-kd

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/422869.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringDataRedis客户端详解

SpringData是Spring中数据操作的模块,包含对各种数据库的集成,其中对Redis的集成模块就叫做SpringDataRedis,官网地址:https://spring.io/projects/spring-data-redis 提供了对不同Redis客户端的整合(Lettuce和Jedis&…

乡村振兴吹响品牌号角——首届中国乡村振兴品牌大会成功举办

“品牌是力量,是变量,也是流量。”这是浙江省衢州市人大常委会副主任、常山县委书记潘晓辉在首届中国乡村振兴品牌大会上分享的乡村振兴实践体会,引发与会代表的广泛共鸣。 首届中国乡村振兴品牌大会主会场 4月10日至11日,以“加…

计组2.2——数据在计算机中的存储

计组2.2定点数和浮点数定点数无符号数有符号数的定点表示——定点整数和定点小数移位运算1.算术移位1.原码算数移位2.反码算数移位3.补码算术移位4.计算机硬件的乘法是基于算数移位和加法完成的2.逻辑移位3.循环移位加减运算溢出判断硬件判断溢出法一:单一符号位法二…

51单片机语音提示盲人拐杖整点报时夜间警示超声波测距

实践制作DIY- GC0128-语音提示盲人拐杖 一、功能说明: 基于51单片机设计-语音提示盲人拐杖 二、功能介绍: 硬件组成: STC89C52单片机最小系统LCD1602显示器红色LED灯ADC0832光敏电阻采集光强DY-SV17F语音播报模块HSR04超声波测距多个按键…

如何在facebook上打造成功的个人品牌?马克·扎克伯格告诉你!

在现代商业社会中,一个企业成功的关键之一是打造出良好的企业形象,即所谓的“人设”。一个好的企业形象可以让消费者产生信任感和归属感,从而吸引更多的客户和业务机会。而如今,社交媒体成为了一个打造企业形象的重要工具&#xf…

JS操作文本域获取光标/指定位置插入

学习链接 js 如何获取与设置光标在input框的位置 在输入框/文本域中光标位置插入字符串 Web 中的“选区”和“光标” 可参考另外一篇&#xff1a;vue.js支持表情输入&#xff0c;这个比操作 div简单多了。 效果图 代码 <style scoped> textarea {outline: none;res…

微信小程序开发 | API应用案例(下)

API应用案例&#xff08;下&#xff09;6.1【案例5】模拟时钟6.1.1 案例分析6.1.2 前导知识6.1.3 钟表页面布局6.1.4 钟表页面绘制6.2【案例6】罗盘动画6.2.1 案例分析6.2.2 前导知识6.2.3 设计罗盘页面布局6.2.4 手指触摸旋转罗盘6.2.5 单击按钮操作罗盘6.3【案例7】文件上传与…

总结821

学习目标&#xff1a; 4月&#xff08;复习完高数18讲内容&#xff0c;背诵21篇短文&#xff0c;熟词僻义300词基础词&#xff09; 学习内容&#xff1a; 暴力英语&#xff1a;早上背颂并默写第19篇文章《I always knew I was going to be rich》&#xff0c;还有两三篇就达成…

Xamarin 可能的替代者.NET MAUI

Xamarin&#xff0c;虽然在 Android、iOS 和 Windows 上做得很好&#xff0c;但我们很快就会忘掉它。Xamarin的替代者已接近完成正式版并且有许多的改进&#xff1a; .NET MAUI。 就像很多人知道的那样&#xff0c;Xamarin 是微软专注于移动应用程序( iOS、Android和Windows)并…

JavaSE学习进阶day04_05 常见算法和泛型

9.1 排序概述 另外一种排序的方式&#xff0c;每一次比较完毕之后&#xff0c;本次循环中最大的数字就跑到右边去了 建议复习一下数据结构的排序章节 代码实现就不再说了&#xff0c;大家可以尝试写&#xff0c;但是我们今后一般都调用java里已经写好的排序算法。在C里也有已…

【AXU3EG】UltraScale+ MPSoC以及开发板介绍

Copyright © 2012-2020 芯驿电子科技&#xff08;上海&#xff09;有限公司 UltraScale MPSoC Zynq UltraScale MPSoC 系列是 Xilinx 第二代平台&#xff0c;其在 FPGA 内部集成了完整 ARM 处理子系统&#xff08;PS&#xff09;&#xff0c;包含了四核 Cortex-A53 加双核…

03-深度学习

一、适合图像处理的卷积神经网络 1. 为什么卷积神经网络适合图像处理? 如上图所示,如果使用全连接神经网络的话,输入图像大小为 1024x1024,第一层隐层神经元个数为 1000,第一层权重数量级为 109,过多的参数会导致过拟合。而卷积神经网络可以有效减少权重数量。 2. 卷积神…

HTML5 表单元素

文章目录HTML5 表单元素HTML5 新的表单元素HTML5 \<datalist> 元素HTML5 \<keygen> 元素HTML5 \<output> 元素HTML5 新表单元素HTML5 表单元素 HTML5 新的表单元素 HTML5 有以下新的表单元素: <datalist><keygen><output> 注意:不是所有…

【LLM】Windows本地CPU部署民间版中文羊驼模型踩坑记录

目录 前言 准备工作 Git Python3.9 Cmake 下载模型 合并模型 部署模型 前言 想必有小伙伴也想跟我一样体验下部署大语言模型, 但碍于经济实力, 不过民间上出现了大量的量化模型, 我们平民也能体验体验啦~, 该模型可以在笔记本电脑上部署, 确保你电脑至少有16G运行…

HTML学习(3)

文章目录HTML计算机代码HTML5语义元素HTML5 代码约定HTML字符集与符号HTML URLHTML 背景我的个人博客&#xff1a;欢迎来逛逛 HTML计算机代码 支持固定的字母尺寸和间距&#xff1a;<kbd> <samp> <code> <html><body><p>open a file,sel…

应用信息资源管理(张士玉、董焱)——第一章 总论

第一章 总论 1.1 信息社会 1.1.1 信息社会的形成 信息社会是指以信息技术为基础&#xff0c;信息产业为支撑&#xff0c;信息化为主要特征的社会形态。其形成经历了以下几个阶段&#xff1a; 信息化初期&#xff1a;20世纪60年代至70年代&#xff0c;电子计算机的出现和发展…

HummerRisk V1.0.0:架构全面升级,开启新篇章

HummerRisk V1.0.0发布&#xff1a; HummerRisk 由 SpringBoot 单体架构升级为 SpringCloud 微服务架构&#xff0c;性能和效率显著提升。同时新增 K8s 的检测规则组和规则实现&#xff0c;并优化多个模块的设计逻辑。 HummerRisk 保持高速的迭代&#xff0c;期待您的关注。 …

Cesium实践(3)——坐标系与相机系统

文章目录前言Cesium 坐标系屏幕坐标系空间直角坐标系WGS-84坐标系坐标系转换角度与弧度互转84坐标转笛卡尔空间坐标笛卡尔空间坐标转84坐标屏幕坐标转笛卡尔空间坐标笛卡尔空间直角坐标转屏幕坐标Cesium相机默认交互相机姿态参数常用方法DEFAULT_VIEW_RECTANGLEsetViewflyToflo…

关于DMA的笔记

DMA(Direct Memory Access, 直接储存器访问)&#xff0c;是部分总线架构提供的功能&#xff0c;DMA传输功能能将数据从一个地址空间复制到另一个地址空间&#xff0c;实现从附加设备/外设与储存器或储存器与储存器之间的高速传输。 我们结合案例解释DMA的功能&#xff1a;在我…

HTTPS 加密协议

✏️作者&#xff1a;银河罐头 &#x1f4cb;系列专栏&#xff1a;JavaEE &#x1f332;“种一棵树最好的时间是十年前&#xff0c;其次是现在” 目录HTTPS"加密" 是什么HTTPS 的工作过程引入证书HTTPS http 安全层 (SSL) SSL 用来加密的协议&#xff0c;也叫 TLS …