【迁移学习】分布差异的度量以及迁移学习的统一表征方法

news2025/1/9 1:04:24
  • 在文本分类中,由于文本数据有其领域特殊性,因此,在一个领域上训练的分类器,不能直接拿来作用到另一个领域上,这就需要用到迁移学习。
    在这里插入图片描述
  • 迁移学习是机器学习中重要的研究领域,ICML、NIPS、AAAI、ICIR等国际人工智能顶会不断推出迁移学习相关主题的研讨会。
    在这里插入图片描述
  • 以计算机为载体,机器学习涉及统计学、概率论、凸优化、程序设计等多个子领域。

结构风险最小化

  • 机器学习就是要寻找一个最优函数 f f f,使得其在所有的训练数据上达到最小的损失。上述学习目标也可以被称为 经验风险最小化 (Empirical Risk Minimization, ERM),其中的损失函数也称为 经验风险
  • 事实上,一个好的机器学习模型,不仅需要对训练数据有强大的拟合能力,还需要对未来的新数据具有足够的预测能力。结构风险最小化(Structural Risk Minimization, SRM)是统计机器学习中一个非常重要的概念。
  • SRM准测要求模型在你和训练数据的基础上,也要具有相对简单的复杂性(较低的VC维(Vapnik-Chervonenkis dimension)。
  • 通常采用正则化(Regularization)的方法来控制模型的复杂性。
  • VC维 是用来衡量研究对象(数据集与学习模型)可学习性的指标。VC维反映了可学习性,与数据量和模型的复杂度相关。因此,VC维较低的模型,其复杂性也较低。
  • 常用的正则化项有:控制样本的稀疏程度、筛选样本的L1正则化,使求解简单、避免过拟合的L2正则化,控制目标熵值的熵最小化等。

数据的概率分布

  • 传统的机器学习假设模型的训练和测试数据服从同一数据分布。
  • 在真实的应用中,训练数据和测试数据的分布往往不尽相同。

迁移学习的问题定义

  • 领域(Domain)是学习的主体,主要由两部分构成: 数据 和 生成这些数据的概率分布。
  • 一个领域可以被表示为:
    在这里插入图片描述
  • 两个领域:被迁移的领域和待学习的领域。被迁移的领域、含有知识的领域被称为 源领域 (Source domain,源域),而待学习的领域,被称为 目标领域(Target domain,目标域)。
    在这里插入图片描述
  • 领域自适应(Domain Adaptation):前2种情形相同,第3种情形不同。
  • 领域自适应的问题定义如下:
    在这里插入图片描述
  • 领域自适应可以被分为三种:
    • 监督领域自适应(SDA)
    • 半监督领域自适应(SSDA)
    • 无监督领域自适应(UDA)

分布差异的度量

在这里插入图片描述

边缘分布自适应(Marginal Distribution Adaptation)

  • 边缘分布自适应的本质,与自变量偏移一样,针对的问题是源域和目标域的边缘概率分布不同, P s ( x ) ≠ P t ( x ) P_s(x)\ne P_t(x) Ps(x)=Pt(x)的情况。
  • 自变量漂移同时假设二者的条件概率分布相同,即 P s ( y ∣ x ) ≈ P t ( y ∣ x ) P_s(y|x)\approx P_t(y|x) Ps(yx)Pt(yx)
  • 在这个假设的前提下,边缘分布自适应方法的目标是:减少源域和目标域的边缘概率分布的距离。
    D ( P s ( x , y ) , P t ( x , y ) ) ≈ D ( P s ( x ) , P t ( x ) ) D(P_s(x,y), P_t(x,y)) \approx D(P_s(x), P_t(x)) D(Ps(x,y),Pt(x,y))D(Ps(x),Pt(x))

动态分布自适应(Dynamic Distribution Adaptation)

在这里插入图片描述

分布差异的统一表征

在这里插入图片描述

分布自适应因子的计算

  • 随机猜测法和最大最小平均法。这两种方法需要大量的重复计算,结果并不具有可解释性。
  • 动态迁移方法。A-distance 被定义为建立一个二分类器进行不同领域的分类得出的误差。
    在这里插入图片描述
    在这里插入图片描述
  • 由于特征的动态和渐进变化性,此估计需要在每一轮迭代中给出。

迁移学习统一表征

在这里插入图片描述

  • v ∈ R N s \boldsymbol{v}\in \mathbb{R} ^{N_s} vRNs 为源域样本的权重。
  • T T T 为作用于源域和目标域上的特征变换函数。
  • R ( T ( D s ) , T ( D t ) ) R(T(\mathcal{D_s} ),T(\mathcal{D_t} )) R(T(Ds),T(Dt))迁移正则化项(Transfer Regularization)。
  • 迁移学习可以被概括为寻找合适的迁移正则化项的问题。
  • 通过对 v i v_i vi T T T 取不同的情况,派生出三大类的迁移学习方法
    在这里插入图片描述

样本权重迁移法

在这里插入图片描述

特征变换迁移法

  • 目标是:如何求解特征变换 T T T,使得特征变化后的源域和目标域的概率分布差异达到最小。
    在这里插入图片描述
  • 从生成对抗网络的观点来看,网络中的判别器用来判断数据来自真实图像还是噪声,当其无法分别真实图像和噪声产生的图像时,我们认为判别器学习到了领域不变的特征。这种判别器可以被看成一种隐式距离。

模型预训练迁移法

在这里插入图片描述

总结

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/23021.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

号码认证平台有哪些?号码认证平台费用?

随着互联网的发展,电话经常接到骚扰电话、买房、保险等电话,让用户不胜其扰。目前提供电话标记的软件个数达到几十款之多,可以有效预防诈骗发生,也暴露出“号码标记随意性强”“错误标记取消难”等一系列问题。如果被恶意标记&…

Rancher 全球化部署最佳实践

作者 万绍远,CNCF 基金会官方认证 Kubernetes CKA&CKS 工程师,云原生解决方案架构师。对 ceph、Openstack、Kubernetes、prometheus 技术和其他云原生相关技术有较深入的研究。参与设计并实施过多个金融、保险、制造业等多个行业 IaaS 和 PaaS 平台设…

美欧之后,台湾地区推出芯片法案:搞研发、买设备最高抵减50%税额

前言 在全球科技博弈加剧的背景下,芯片作为资本与技术双密集型产业,在全球产业链的重要地位已经不言而喻。 今年以来,欧洲、美国、日本、韩国、印度等国家/地区陆续出台了扶持半导体产业发展的法案,以加强本土半导体实力。而台湾…

肝不完这份HTTP八股文的你,再强大也是假的

关于网络模型 OSI 网络模型 应用层,给用户提供应用功能;表示层,负责把数据转换成兼容另一个系统能识别的格式;会话层,负责建立、维持、同步会话;传输层,负责端到端的数据传输;网络…

创新型中小企业认定

目前申报省级专精特新之前需要先认定创新型中小企业。创新型中小企业需要满足哪些条件才能进行认定呢?下面我就来详细的介绍一下: 一、评价方式: 由企业按属地原则自愿登录培育平台参与自评,省级中小企业主管部门根据评价标准&a…

目标检测算法——YOLOv5/YOLOv7改进之结合​ASPP(空洞空间卷积池化金字塔)

>>>深度学习Tricks&#xff0c;第一时间送达<<< 目录 一、前沿介绍 1.空洞卷积&#xff08;Atrous Convolution&#xff09; 2.空洞空间卷积池化金字塔&#xff08;Atrous Spatial Pyramid Pooling&#xff09; 二、YOLOv5/YOLOv7改进之结合​​ASPP 1.…

CANoe-Ethernet IG和Ethernet Packet Builder的使用和区别

Ethernet IG和Ethernet Packet Builder都是CANoe仿真以太网报文发送的模块,但是在用途上各有不同 1. Ethernet IG 以太网IG模块允许用户以多种方式发送以太网帧、UDP报文和TCP报文。可以发送一次,也可以按照指定的周期时间循环发送 创建以太网IG的步骤如下: 在Simulation …

2.5A强驱动能力,舞台灯光驱动TMI8263锻造“中国芯”

舞台艺术&#xff0c;自古以来就是人们享受生活不可或缺的艺术形式&#xff0c;一段赏心悦目的舞台表演能为观众带来从视听感官到心灵的艺术洗礼。 现在的舞台艺术&#xff0c;越来越追求极致的视觉效果&#xff0c;舞台灯光起着非常关键的作用。 一场舞台表演&#xff0c;需要…

Linux 之 Linux/Ubuntu 中开发操作中常用的命令整理

Linux 之 Linux/Ubuntu 中开发操作中常用的命令整理 目录 Linux 之 Linux/Ubuntu 中开发操作中常用的命令整理 一、简单介绍 二、常用命令 1、 打开终端 &#xff1a;Ctrl Alt T 2、退出终端&#xff1a;exit 3、查看安装 Ubuntu 版本/显示系统等信息&#xff1a;uname…

豆瓣评分9.0,《Java核心技术与面试》神作,已帮助1374人拿到Offer

Java的知识点实在太多&#xff0c;如果什么都去学&#xff0c;而不是精学工作和面试中常用的知识点&#xff0c;那不仅会造成学习效率低下&#xff0c;而且会让大家迷失在海量的知识中。结果是&#xff0c;大家投入了大量时间&#xff0c;也学了不少知识点&#xff0c;但是无法…

汇编逆向-入门

Qt源码解析 索引 汇编逆向— 授权破解示例分析 问题模拟 运行环境 x64dbgWindows 10serial.exe 运行效果 输入注册信息不对提示错误。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tV3bdLGO-1669017713175)(D:\Work\Code\luxiang\CSDN\ASM-…

element 表格字段过长

element 表格 - 表头太长换行 解决方案一&#xff1a;show-overflow-tooltip Table表格&#xff0c;如果每列显示的内容过长则可以使用该属性&#xff0c;即 :show-overflow-tooltip“true”&#xff0c;该属性可以让内容在一行显示&#xff0c;如果显示不下时&#xff0c;显示…

智能晾衣架(一)--设计

本文素材来源于红河学院 工学院 作者&#xff1a;赵德森 张艺锦 潘志慧 曹紫康 指导老师&#xff1a;江洁 张龙超 一、简介 本作品设计的晾衣系统从人们日常生活研究设计&#xff0c;体积小&#xff0c;收纳方便&#xff0c;不占空间可以在日常生活中极大的便利用户。我们…

MyBatis 源码分析之 Select 语句执行(上)

三哥 内容来自【自学星球】 欢迎大家来了解我的星球&#xff0c;和星主&#xff08;也就是我&#xff09;一起学习 Java &#xff0c;深入 Java 体系中的所有技术。我给自己定的时间是一年&#xff0c;无论结果如何&#xff0c;必定能给星球中的各位带来点东西。 想要了解更多&…

盘点敏捷项目失败的6个主要原因

敏捷项目管理及其相关的方法和价值观正在迅速改变着许多企业的运作方式。改善灵活性、提高协作和生产力以及加强客户联系的承诺&#xff0c;敏捷的种种好处摆在企业决策者面前。 然而&#xff0c;直接运行成功的敏捷项目并不是必然的。是什么原因导致敏捷管理失败&#xff1f…

公众号免费调用题库

公众号免费调用题库 本平台优点&#xff1a; 多题库查题、独立后台、响应速度快、全网平台可查、功能最全&#xff01; 1.想要给自己的公众号获得查题接口&#xff0c;只需要两步&#xff01; 2.题库&#xff1a; 查题校园题库&#xff1a;查题校园题库后台&#xff08;点击…

Reading Note(8) ——GNN for DSE

这篇博客是一篇论文阅读札记&#xff0c;这篇论文的主题是使用GNN来优化加速器设计中的设计空间探索耗时过长的问题。 这篇文章的标题是《Enabling Automated FPGA Accelerator Optimization Using Graph Neural Networks》&#xff0c;值得注意的是这是它的预印版&#xff0c…

Java-内部类

内部类的概念 认识内部类 一个类的内部又完整的嵌套了另一个类结构。被嵌套的类称之为内部类inner class&#xff0c;嵌套该内部类的类称为外部类。就像双重for循环&#xff0c;外部for循环里面包含着另一个内层循环。内部类是类的第5大成员&#xff0c;[属性&#xff0c;方法…

让我们进入面向对象的世界(一)

让我们进入面向对象的世界 文章目录让我们进入面向对象的世界开场白一.面向对象概述二.认识对象和类2.1什么是类2.2 什么是对象呢&#xff1f;2.3 让我们来创建第一个对象2.3 让我们进一步了解&#xff0c;我们针对对象的操作&#xff0c;是怎样的开场白 大家好&#xff01;&a…

SpringMVC请求、响应与异步请求

文章目录SpringMVC核心架构的具体流程步骤一、SpringMVC请求与响应1、SpringMVC Handle原理与应用1.1 概念1.2 Spring MVC Handler的三种写法2、SpringMVC 视图解析器2.1 概念2.2 配置视图解析器二、SpringMVC异步请求1、 Ajax基本配置2、 异步与同步优缺点&#xff1a;如何设置…