Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

news2024/11/24 11:50:12

摘要

我们为元学习提出了一个算法是模型无关 m o d e l − a g n o s t i c model-agnostic modelagnostic.
在某种意义上,其与用梯度下降训练的模型是兼容的,可以应用在大量不同的学习问题上。包括:分类、回归、和加强学习

  • 元学习的目标是正在学习任务上变体的 m o d e l model model
  • 其能够仅使用小数量的训练示例去解决新的正在学习的任务
  • learning task
    在我们的方法中,模型的参数可以明确的被训练,这样,
  • a small number of gradient steps with a small amount
    of training data from a new task,在这些任务上将会产生更好的泛化性能。
  • 有效地,我们的方法训练一个模型可以容易微调,
  • 方法在 t w o f e w − s h o t i m a g e c l a s s i f i c a t i o n 基准数据集上 two few-shot image classification 基准数据集上 twofewshotimageclassification基准数据集上可以得到顶级的效果。
  • few-shot regression 上产生好的效果》
  • 为使用神经网络策略的梯度强化学习,加速微调。

介绍

  • 迅速的学习人工智能标志,其涉及从一些示例中识别目标,在只有几秒的实验中迅速的学习新技能。
  • 继续将更多的数据变成可利用的。
  • 快速灵活的种类是具有挑战性的。代理可以用一小数量的新信息,整合其先前经验。这可以避免在新数据上的过拟合。
  • 元学习算法是普遍的和模型无关的。
  • 某种意义上其能够被应用在任何学习问题上,使用一个梯度下降程序训练模型,我们聚焦在深度神经网络模型,
  • 我们表明,我们的方法如何处理更容易的处理不同的架构和不同的问题序列。problem settings
  • 包括:分类、回归和策略梯度加强学习。
    *** classification
  • regression
  • policy gradient reinforcement learning**
    在元学习中,训练模型的目标是可以迅速学习一个新任务,从新数据的小数量上。通过其 t h e m e t a − l e a r n e r the meta-learner themetalearner训练的模型有能力去学习大量的不同任务。
  • 我们的方法潜在的关键思想是训练模型的初始化参数 i n i t i a l p a r a m e t e r s initial parameters initialparameters,模型在参数更新之后有最大的效果。
  • 与先前的元学习方法不同的是,学习一个更新参数和学习规则。我们的方法即没有扩展学习参数的数量,也没有要求一个 a r e c u r r e n t m o d e l a recurrent model arecurrentmodel或孪生神经网络 S i a m e s e n e t w o r k Siamese network Siamesenetwork来约束模型架构,其能够用全连接、卷积、循环神经网络真实的结合
    *** * fully connected,
  • convolutional, or
  • recurrent neural networks**
  • 其也能够使用某种损失函数,
    differentiable supervised losses
    non-differentiable reinforcement learning objectives
    非可微分的加强学习目标

训练模型参数的过程

  • a few gradient steps,
  • even a single gradient step
  • 从特征学习浏览的新任务可以产生好的效果。
  • 构建一个内部的表示可以广泛的适用于许多任务。
  • 如果内部表示适合于许多任务,简单的微调参数。
  • *(在前馈网络中,初始化修改这个顶层权重
  • *有效地,我们的程序优化模型是是容易的和快速微调的 。

. Model-Agnostic Meta-Learning

  • 我们的目的是训练模型能够实现 r a p i d a d a p t a t i o n rapid adaptation rapidadaptation
  • 问题序列可以被形式化为一个少样本学习。
  • 在这篇文章中,我们将定义问题的步骤和提出我们算法的一般形式。

. Meta-Learning Problem Set-Up

  • 少样本元学习的目标是训练一个能迅速适应新任务的模型,使用一个小的数据点和训练迭代。
  • 为了完成这些,一系列任务整个元学习阶段训练的模型或 l e a r n e r learner learner,
  • the trained model can quickly adapt to
    new tasks using only a small number of examples or trials.
    少量的例子或实验,训练的模型可以迅速的适应新任务。
    实际上,元学习任务可以将完整的任务作为训练示例,在这篇文章中,我们以一般的方式形式化元学习问题示例,包括,不同的学习领域的简介示例,在章节3,我们将会详细的讨论两个不同的学习域。
  • 我们考虑一个模型denote f f f,
  • map observation x x x to outputs a a a → \rightarrow f f f
  • 整个元学习期间,训练的模型有能力去训练大量而且有限数量的任务。
  • 我们想要将我们的框架应用倒多种学习问题上
    • Classification and reinforcement learning 分类到加强学习
    • 形式化 each task
      T = L ( x 1 , a 1 , . . . , x H , a H ) , q ( x 1 ) , q ( x t + 1 ∣ x t , a t ) , H T = {L(x_1, a_1, . . . , x_H, a_H), q(x_1), q(x_{t+1}|x_t, a_t), H} T=L(x1,a1,...,xH,aH),q(x1),q(xt+1xt,at),H
  • a loss function L L L
  • a distribution over initial observations q ( x 1 ) q(x_1) q(x1)
  • a transition distribution q ( x t + 1 ∣ x t , a t ) q(x_{t + 1} | x_t,a_t) q(xt+1xt,at)
  • an episode length H H H
  • supervised learning problems H = 1 H =1 H=1
  • The model may generate samples
    of length H H H by choosing an outpu t a t a_t at at each time t t t
  • a Markov decision process. 马尔可夫决策过程
  • The loss L ( x 1 , a 1 , . . . , x H , a H ) → R L(x_1, a_1, . . . , x_H, a_H) \rightarrow R L(x1,a1,...,xH,aH)R
  • 提供一个特定任务的反馈。
  • which might be in the form of a misclassification
    loss or a cost function
    in a Markov decision process.
  • Markov decision process: 马尔可夫决策过程中
    在这里插入图片描述
    在这里插入图片描述

A Model-Agnostic Meta-Learning Algorithm

  • nonparametric methods 非参数方法

  • recurrent neural works: 双向循环神经网络

  • feature embeddings: 在测试阶段,结合非参数方法的特征嵌入。

  • a gradient-based learning rule on a new task : 基于梯度学习的规则.

  • 在这里插入图片描述

  • Species of MAML

  • specific instantiations 特定实例化

Supervised Regression and Classification

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

总结

到这吧,抽时间,将元学习框架的啥都学习完整,全部都将其搞定都行啦的理由与打算,慢慢的将其全部都搞定,将元学习啥的全部都搞定。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/158121.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TAZ生成实践(Intel芯片Mac Python 3.7.9)

参考文章 https://blog.csdn.net/weixin_42632778/article/details/115164518 TAZ生成 https://zhuanlan.zhihu.com/p/343576683 使用ArcGIS实现线转栅格 https://pro.arcgis.com/zh-cn/pro-app/latest/tool-reference/conversion/polyline-to-raster.htm ArcGIS Pro 折线转栅格…

第②篇 Spring IoC——容器

Spring最成功的是其提出的理念,而不是技术本身。 概念 Spring所依赖的两个核心理念: 一个是控制反转(IoC)。另一个是面向切面编程(Aspect Oriented Programming,AOP)。 IoC是Spring的核心&am…

JS入门到精通详解(1)

JavaScript概述(需要记)什么是javascript?是一门(基于对象)和(事件驱动)的(脚本语言)。js诞生于哪一年?哪个公司?谁?第一个名字叫什么?1995年 网景 布兰登 l…

【Python】type、isinstance、issubclass详解

type type方法有两种重载形式: type(o: object);type(name: str, bases:Tuple[type, ...], dict:Mapping[str: Any], **kwds) 使用第一种重载形式的时候,传入一个【object】类型,返回一个【type】对象,通常与object…

解决使用element-plus时使用el-select-v2组件时,选中后无法移除focus的状态的方法。

我们可以使用element-ui-plus的el-select-v2的组件&#xff0c;实现复合搜索和下拉框的功能。 使用如下模块&#xff1a; <template><el-select-v2 v-model"value" filterable :options"options" placeholder"Please select"visibleCha…

爸妈记性变差怎么办?

记不住事的时候&#xff0c;我们总会自嘲“老了&#xff0c;脑子不好使了”。记忆力总是和年龄挂钩的&#xff0c;所以很多子女听到父母这样说&#xff0c;也不会放在心上。但有时&#xff0c;记性变差不一定因为年龄&#xff0c;还有可能是患病的前兆。当父母出现频繁忘事的情…

zerotier虚拟网络配置,局域网与外网如同局域网一样访问。

zerotier:可以搭建用于自己的虚拟网络&#xff0c;经过授权连接成功之后彼此都在同一网段&#xff0c;可以像在局域网一样互相访问。 1.创建zerotier账户 2.创建网络&#xff08;Create A Network&#xff09;并记住网络标识&#xff08;NETWORK ID&#xff09; 一、openwrt设…

中华财险进击数字化

本文来源 / 瞭望 中华联合财产保险股份有限公司&#xff08;下称中华财险&#xff09;&#xff0c;是一家 36 年的老牌国有保险公司&#xff0c;全国营业网点超过 2900 个。近年来&#xff0c;中华财险在业务高速发展的同时&#xff0c;从难啃的硬骨头下手&#xff0c;重构核心…

Unity 之 Addressable可寻址系统 -- 可寻址系统面板介绍 -- 入门(二)

可寻址系统面板介绍 -- 入门&#xff08;二&#xff09;一&#xff0c;可寻址系统目录介绍1.2 创建分组1.2 目录介绍二&#xff0c;可寻址系统设置介绍2.1 Profile - 配置文件2.2 Catalog - 目录2.3 Content Update - 内容更新2.4 Downloads - 下载2.5 Build - 构建2.6 Build a…

【数据结构】5.6 树和森林

文章目录5.6.1 树的存储结构&#xff08;不是二叉树&#xff09;双亲表示法孩子表示法结构定义双亲孩子法孩子兄弟法5.6.2 二叉树的转换树与二叉树的转换将树转换成二叉树将二叉树转换成树森林与二叉树的转换森林转换成二叉树二叉树转换成森林5.6.3 树和森林的遍历树的遍历森林…

Nginx简介

一、什么是Nginx?Nginx是一个高性能的HTTP和反向代理Web服务器&#xff0c;同时也提供IMAP/POP3/SMTP服务。Nginx是一款轻量级的Web服务器/反向代理服务器及电子邮件&#xff08;IMAP/POP3/SMTP&#xff09;代理服务器。Nginx的特点是&#xff1a;占有内存少&#xff0c;并发能…

JJWT实现令牌Token

登录实现方式 Session 详情&#xff1a; https://www.cnblogs.com/andy-zhou/p/5360107.html 会话的概念 会话就好比打电话&#xff0c;一次通话可以理解为一次会话。我们登录一个网站&#xff0c;在一个网站上不同的页面浏览&#xff0c;最后退出这个网站&#xff0c;也是…

【Java AWT 图形界面编程】Container 容器 ② ( Frame 窗口示例 | Panel 示例 | 窗口中文乱码处理 )

文章目录一、Frame 窗口示例二、Panel 示例三、窗口中文乱码处理一、Frame 窗口示例 首先 , 创建 Frame 实例对象 , 该对象就是 操作系统中应用软件的 窗口 ; // 1. 创建窗口 Frame frame new Frame("AWT 图形界面编程");Frame 是 Window 的子类 , public class F…

前端号外—2022年最受欢迎居然是它,Node.js危已

导读 | 2022年是艰难的一年&#xff0c;不仅有互联网的寒冬、还有新冠疫情的洗礼。但是似乎这一切都阻挡不了JavaScript的内卷&#xff0c;一年不长不短的时间中&#xff0c;JavaScript从创新、性能、功能等多维度深度进化&#xff0c;给前端带来了诸多惊喜。本文基于github上流…

仓库管理系统demo搭建指南

1、简介 1.1、案例简介 本文将介绍&#xff0c;如何搭建云进销存-仓库管理。 1.2、应用场景 云进销存-仓库管理应用分仓管理并提供灵活的库存计算方式及库存预警。 2、设置方法 2.1、表单搭建 1&#xff09;新建表单【商品管理】&#xff0c;字段设置如下&#xff1a; …

TensorFlow笔记之神经网络完成多分类任务

文章目录前言一、数据集调用二、Tensorflow1.x1.单隐藏层2.模型保存与调用三、Tensorflow2.x1.全连接层类2.keras建模总结前言 对TensorFlow笔记之单神经元完成多分类任务进行修改&#xff0c;在tf1.x与tf2.x中使用神经网络完成手写体数字识别多分类任务。 一、数据集调用 数…

10、Javaweb_Cookkie会话Session修改IDEA代码模板

修改IDEA代码模板 选择Setting... 找到要修改的代码模板&#xff0c;点击ok修改即可 使用模板创建方法 ,点击文件包,右键New选择文件类型 点击ok即可 创建完成 会话技术 1. 会话&#xff1a;一次会话中包含多次请求和响应。 * 一次会话&#xff1a;浏览器第一次给服务器资…

JAVA开发(web常见安全漏洞以及修复建议)

web安全常见漏洞修复建议&#xff1a;SQL注入规避 代码层最佳防御sql漏洞方案&#xff1a;使用预编译sql语句查询和绑定变量。&#xff08;1&#xff09;使用预编译语句&#xff0c;使用PDO需要注意不要将变量直接拼接到PDO语句中。所有的查询语句都使用数据库提供的参数化查询…

92、【树与二叉树】leetcode ——222. 完全二叉树的节点个数:普通二叉树求法+完全二叉树性质求法(C++版本)

题目描述 原题链接&#xff1a;222. 完全二叉树的节点个数 解题思路 1、普通二叉树节点个数求法 &#xff08;1&#xff09;迭代&#xff1a;层序遍历BFS 遍历一层获取一层结点 /*** Definition for a binary tree node.* struct TreeNode {* int val;* TreeNode …

华为交换机、路由器设备批量配置端口方法步骤

华为交换机、路由器批量配置端口方法步骤 在现实工作中&#xff0c;如果要对多个端口做同样的配置&#xff0c;每个接口逐一进行相同的配置&#xff0c;很容易出错&#xff0c;而且造成大量重复工作。 配置端口组功能就可以解决这个问题啦。 你只需要将这些以太网接口加入同一…