【王树森】Few-Shot Learning (3/3):Pretraining + Fine Tuning(个人向笔记)

news2024/11/24 13:33:23

Preliminary

Few-Shot Learning 很简单,但是却能达到比较高的准确度,相反一些复杂的模型反而不能达到很高的准确率

1. Cosine Similarity

余弦相似度可以衡量两个向量的相似度

  • 假设两个向量的长度都是1:那么它们余弦相似度的计算方法如下
    在这里插入图片描述
  • 若长度不等于 1 ,则需要先对它们做一个归一化:
    在这里插入图片描述

2. Softmax Function

  • Softmax 函数的输入是任意 k 维的向量
  • 把向量的每个元素做指数变换,得到 k 个大于 0 的数
  • 对所有元素做归一化,使其总和为 1
  • 输入为 k 维,输出也为 k 维,输出是一个概率分布
    在这里插入图片描述
  • Softmax示例:Softmax会让最大的值变大,其余的值变小
  • Softmax 的名字很形象,是更为 soft 的 max
    在这里插入图片描述

3. Softmax Classifier

  • 假设类别有 k 个,那么输出就是 k 维的:
    在这里插入图片描述
  • W 有 k 行,每一行对应一个类别
    在这里插入图片描述

Few-Shot Prediction using Pretrained CNN

  • 我们用一个 CNN 来提取图片的特征,可以用各种方法来预训练这个 CNN,但是不同的训练方法的效果不同
    在这里插入图片描述
  • 对 Query 的图片用 CNN 提取特征向量后进行归一化,它的二范数等于一。对 Support 的三个向量也做相同的操作,然后让 q 对 Support Set的三个特征向量分别求余弦相似度后取 Softmax,显然 q 离 μ 1 \mu_1 μ1 最近,所以模型判断 Query 和 Support Set 的第一张图是一样的:
    在这里插入图片描述

Fine-Tuning

  • 研究表明预训练后再做 Fine-Tuning 能大幅度提高准确率
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2101098.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HarmonyOS开发实战( Beta5版)线程间通信场景最佳实践

简介 在应用开发中,经常会需要处理一些耗时的任务,如果全部放在主线程中执行就会导致阻塞,从而引起卡顿或者掉帧现象,降低用户体验,此时就可以将这些耗时操作放到子线程中处理。通常情况下,子线程可以独立…

bcftools报错|The sequence “chr1“ not defined in the header: chr1.recode.vcf

1、报错信息 The sequence "chr1" not defined in the header: chr1.recode.vcf (Quick workaround: index the file.) 所使用的命令,目的是想合并所提取的特定染色体。 bcftools concat -O v / -o varscan.indel_merged.vcf chr1.recode.vcf chr2.reco…

超好用的图纸加密软件排行榜 | 2024图纸加密软件的七款最优选择!

数字化设计日益普及的今天,图纸作为设计与工程的核心载体,其安全性成为了企业和设计师们最为关注的焦点之一。 面对日益复杂的数据泄露风险,如何有效地保护图纸文件的安全呢? 下面,我们就来探讨一下2024图纸加密软件的…

Python的10个文件对比与合并高效策略

文末赠免费精品编程资料~~ 在日常编程或数据分析工作中,经常需要处理多个文件的对比与合并任务。Python因其强大的文件处理能力和丰富的库支持,成为了处理这类任务的理想选择。下面,我们将逐步探索10种高效的文件对比与合并策略,…

OpenGL/GLUT实践:粒子系统,并添加纹理、动态模糊、边界碰撞(电子科技大学信软图形与动画Ⅱ实验)

源码见GitHub:A-UESTCer-s-Code 文章目录 1 运行效果2 实验过程2.1 基本粒子系统2.1.1 定义粒子结构2.1.2 创建粒子并初始化2.1.2.1 创建粒子2.1.2.2 初始化 2.1.3 粒子状态更新与绘制2.1.3.1 绘制2.1.3.2 更新 2.1.4 实现效果 2.2 添加纹理2.2.1 纹理添加2.2.2 渲染…

PostgreSQL + PostGIS:空间数据存储及管理解决方案

在数据库领域,PostgreSQL 已成为最强大、最通用的选项之一。它管理大量数据的能力、对 SQL 标准的遵守以及可扩展的架构使其受到学术界和工业界的喜爱。然而,真正让 PostgreSQL 脱颖而出的原因之一是它与PostGIS的集成,这是一个允许您有效处理…

第七课,条件表达式与初识分支判断

一,什么是判断 判断,就是在做某件事前,先问问满不满足条件。 进行逻辑判断,是生活中常见的行为。 “今天出门你要带伞吗?” “那得看天气怎么样,如果下雨或者太阳太大就带伞,否则就不带。”…

内存卡乱码问题解析恢复方案

一、内存卡乱码现象探析 在数字化时代,内存卡作为便携式数据存储设备,广泛应用于手机、相机、行车记录仪等多种电子设备中。然而,不少用户在使用过程中会遇到内存卡乱码的问题,即原本有序存储的文件突然变得无法识别,…

【前端面试】设计循环双端队列javascript

题目 https://leetcode.cn/problems/design-circular-deque/description/ 存储循环队列的向量空间是循环的,用通俗的话来讲,就是我们在做next或者prev操作时,不会发生溢出 取模、或者直接判断是否为0/size返回一个值。 数组实现 用函数来实现一个类,定义容量、头尾指针…

青远生态为云南林业规划院定制开发的自然保护地规划智能编制系统顺利通过验收

8月30日,青远生态为云南省林业调查规划院开发的自然保护地规划智能编制系统顺利通过验收。该系统具有智能推荐规划内容、自动生成投资估算表、智能编制规划报告等功能,集合了拉丁名填充、表格制作等丰富实用的工具,显著提升了规划工作的效率和…

电力系统有滤波器还需要装电抗器吗

在电力系统中,滤波器和电抗器各有不同的功能,尽管它们都能改善电力质量。是否需要同时安装滤波器和电抗器,取决于系统的具体需求和现状。以下是一些考虑因素: 1、滤波器的功能: 谐波滤波:滤波器主要用于抑…

基于vue框架的超市会员管理系统设计与实现xeb8c(程序+源码+数据库+调试部署+开发环境)系统界面在最后面。

系统程序文件列表 项目功能:会员,商品分类,商品信息,订单信息,积分等级,礼品信息,礼品兑换 开题报告内容 基于Vue框架的超市会员管理系统设计与实现开题报告 一、研究背景与意义 随着消费者对个性化服务和优惠活动需求的增加,超市会员管理成为提升顾…

Docker安装及验证,小白必备

Docker安装 本教程以centos系统为例 1、Docker安装前准备工作 切换国内源 cp -a /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.bak #备份设置为华为云的yum wget -O /etc/yum.repos.d/CentOS-Base.repo https://repo.huaweicloud.com/repository…

专用于理解游戏场景的开源大模型-VideoGameBunny

大模型在游戏开发领域扮演了重要角色,从AI机器人生成到场景搭建覆盖各个领域。但在游戏场景理解、图像识别、内容描述方面很差。 为了解决这些难题,加拿大阿尔伯塔的研究人员专门开源了一款针对游戏领域的大模型VideoGameBunny(以下简称“VG…

7-8月月报 | Apache SeaTunnel社区进展一览

各位热爱 Apache SeaTunnel 的小伙伴们,社区 7-8 月份月报来啦!这两个月项目有了哪些进展?又有谁登上了我们社区的贡献者榜单呢?快来一睹为快吧。 Merge Stars 感谢以下小伙伴上两个月为 Apache SeaTunnel 项目和社区发展所做的…

非时序检查(Non-Sequential Check)

单元或宏(macro)的库文件可以将时序弧指定为非时序(non-sequential)检查,例如两个数据引脚之间的时序弧。非时序检查是指两个引脚之间的检查,两者都不是时钟。一个引脚是约束引脚,其作用类似于数…

WPF在MVVM架构下使用DataGrid并实现行删除

一、效果演示 二、Model创建 //User&#xff1a;用于绑定DataGrid控件的数据 private ObservableCollection<User> _users new ObservableCollection<User>();public ObservableCollection<User> Users{get { return _users; }set { _users value; }}//Sel…

day43|打家劫舍系列 198.打家劫舍 213. 打家劫舍 II 337.打家劫舍 III

文章目录 前言198.打家劫舍思路方法一213. 打家劫舍 II思路方法一337.打家劫舍 III思路方法一方法二 暴力搜索和记忆化递推总结前言 198.打家劫舍 思路 非常直接的思路 dp五部曲 dp极其下标含义:**考虑下标i(包括i)以内的房屋,最多可以偷窃的金额为dp[i]。**考虑的意思是…

IP地址安全与隐私保护

在当今数字化时代&#xff0c;IP地址作为网络设备的唯一身份标识&#xff0c;在网络安全与隐私保护中扮演着至关重要的角色。然而&#xff0c;随着网络技术的飞速发展&#xff0c;IP地址也面临着诸多挑战&#xff0c;对用户的隐私和网络安全构成了潜在威胁。本文将对IP地址在网…

JAVA基础:封装、继承和多态(详讲)

1 封装 面向对象的三大特征 &#xff1a; 封装&#xff0c; 继承&#xff0c; 多态 。 封装可以从三个层面理解 将属性和方法组合在一起&#xff08;封闭在一起&#xff09; 将属性隐藏起来&#xff0c; 对外提供可以间接操作属性的方法。&#xff08;提高程序设计安全性&…