EVA: Visual Representation Fantasies from BAAI

news2024/9/23 13:27:11

本文做个简单总结,博主不是做自监督领域的,如果错误,欢迎指正。

链接

Code:

        Official:baaivision/EVA

        MMpretrain:open-mmlab/mmpretrain/tree/main/configs/eva02

Paper:

        EVA01:EVA: Exploring the Limits of Masked Visual Representation Learning at Scale

        EVA02:EVA-02: A Visual Representation for Neon Genesis

EVA01

成就:

EVA 是第一个开源的十亿级视觉基础模型,在广泛的下游任务上实现了最先进的性能。

改进: 

    

  1. EVA是基于CLIP的预训练,而不是MIM预训练。

    1. MIM(Masked Image Modeling)预训练,即MAE做的事情,随机mask掉图片中一部分,生成原图。

      1. 缺点:MIM预训练只包含底层细节信息,没有高层语义信息。

    2. CLIP预训练,用“图像-文本”进行对比学习训练,

      1. 使用场景:根据文本搜索相关图片,根据图片生成相关描述。

      2. 优点:文本补充了MIM缺乏的高层语义信息,CLIP预训练细节和语义信息都有。CLIP预训练中的高层语义信息能够给下游任务提供更大的帮助。

  2. EVA 不需要昂贵的监督训练阶段,仅利用来自开源数据集的图像就可以。

  3. EVA 的迁移学习性能强。

  4. EVA 可以充当以视觉为中心的多模态支点

EVA02

成就:

        

  1. 使用可公开访问的训练数据,仅具有 304M 参数的 EVA-02 在 ImageNet-1K 验证集上实现了惊人的 90.0 微调 top-1 精度。

  2. EVA-02-CLIP 在 ImageNet-1K 上可以达到高达 80.4 的零样本 top-1,优于之前最大、最好的开源 CLIP,仅需要约 1/6 的参数和约 1/6 的图像文本训练数据。

改进:

        

  1. EVA02对原始ViT改进了结构(借鉴NLP上的一些改进Tricks)

  2. EVA V1使用CLIP模型的视觉Encoder作为Teacher,EVA V2使用EVA-CLIP作为Teacher。EVA-CLIP 与之前的 CLIP 模型相比性能更强大,参数数量相同,但训练成本显著降低

  3. EVA V2使用了更多的数据,多个开源公开的数据集合并到一起组成 Merged-38M,累计3800万张图片。

  4. 训练分为多阶段,

    1. 在Merged-38M上进行MIM预训练,

    2. 在ImageNet21K上进行finetuning,

    3. 在ImageNet1K上做最后的finetuning。

    4. EVA V2还支持微调多项下游任务,如目标检测,语义分割、实例分割等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/986416.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LAMP搭建WordPress

L linux A apache hhtpd M mysql/maridb P PHP1、 安装php yum -y install php php-fpm php-server php-mysql1.1、 启动php-fpm并自启 systemctl enable php-fpm --now[rootecs-1cee ~]# systemctl status php-fpm ● php-fpm.service - The PHP FastCGI Process ManagerLoa…

Ae 效果:CC Cross Blur

模糊和锐化/CC Cross Blur Blur & Sharpen/CC Cross Blur CC Cross Blur(CC 交叉模糊)可以通过单独控制水平和垂直方向的模糊程度来创建独特的交叉模糊效果,可以产生类似光线交错的视觉外观。 ◆ ◆ ◆ 效果属性说明 Radius X 半径 X 用…

CSS笔记(黑马程序员pink老师前端)盒子阴影,文字阴影

盒子阴影 属性值为box-shadow,盒子阴影不占空间,不影响盒子之间的距离. 值说明h-shadow必需,水平阴影位置,允许为负值v-shadow必需,水平阴影位置,允许为负值blur可选,模糊距离,数值越大影子越模糊spread可选,影子的尺寸color可选,影子的颜色inset可选, 将外阴影改为内阴影(省…

Python调试学习资料

Python调试学习资料 python -m pdb example.py网络资源 Python代码调试的几种方法总结Python 程序如何高效地调试?Python Debugging With Pdbpdb — The Python DebuggerThe Python Debugger (pdb)Python Debugger with Examples

Redis常用命令和Java操作Redis教程

Redis介绍 关系型数据库(RDBMS)非关系型数据库(NoSql)MysqlRedisOracleMongo dbDB2MemCachedSQLServer Redis是一个基于内存的key-value结构的数据库。 特点: 基于内存存储,读写性能高适合存储热点数据(…

Java8特性-Lambda表达式

📕概述 在Java 8中引入了Lambda表达式作为一项重要的语言特性,可以堪称是一种语法糖。Lambda表达式使得以函数式编程的方式解决问题变得更加简洁和便捷。 Lambda表达式的语法如下: (parameters) -> expression (参数) -> {代码}其中&…

Apache HTTPD 漏洞复现

文章目录 Apache HTTPD 漏洞复现1. Apache HTTPD 多后缀解析漏洞1.1 漏洞描述1.2 漏洞复现1.3 漏洞利用1.4 获取GetShell 2. Apache HTTPD 换行解析漏洞-CVE-2017-157152.1 漏洞描述2.2 漏洞复现2.3 漏洞利用 3. Apache HTTP Server_2.4.49 路径遍历和文件泄露漏洞-CVE-2021-41…

字体图标 IcoMoon

字体图标 展示的是图标,本质是字体。 轻量级︰一个图标字体要比一系列的图像要小。一旦字体加载了,图标就会马上渲染出来,减少了服务器请求 灵活性:本质其实是文字,可以很随意的改变颜色、产生阴影、透明效果、旋转等 兼容性:几乎…

MySQL视图用户管理

文章目录 视图视图的规则用户用户信息创建用户删除用户修改密码 用户权限给用户授权回收权限 视图 视图是一个虚拟表,其内容由查询定义。同真实的表一样,视图包含一系列带有名称的列和行数据。视图的数据变化会影响到基表,基表的数据变化也会…

@controller和@RestController的区别

//controller和RestController的区别:RestController的返回值就是结果被输出在浏览器 //controller的返回值会到resources的templates下找 返回值".html" 页面 1.controller 简单的来说,当我们的返回值需要跳转大另一个页面时候,我们就会使…

Jmeter系列-环境部署、详细介绍、安装目录介绍(1)

环境部署 官网下载Jmeter http://jmeter.apache.org/下载最新版本的 JMeter,解压文件到任意目录 安装JDK,配置Java环境 网上教程很多,这里就不详细介绍了 注意:应该避免JDK安装路径,Jmeter路径有中文和空格 配置…

多波束测线问题

多波束测线问题 问题的背景是海洋测深技术,特别是涉及单波束测深和多波束测深系统。这些系统利用声波传播原理来测量水体深度。 单波束测深系统通过向海底发射声波信号并记录其返回时间来测量水深。该系统的特点是每次只有一个波束打到海底,因此数据分布…

SAC算法

SAC算法 全称Soft Actor-Critic算法,为优化目标引入了熵约束项,增大了动作的探索性,避免陷入局部最优解,原论文 继承了Soft Q-Learning提出了Soft Policy Iteration,进而推导了Soft Actor-Critic参数更新时机&#xff…

YOLOV8改进:TripletAttention | 即插即用的轻量级注意力机制

1.该文章属于YOLOV5/YOLOV7/YOLOV8改进专栏,包含大量的改进方式,主要以2023年的最新文章和2022年的文章提出改进方式。 2.提供更加详细的改进方法,如将注意力机制添加到网络的不同位置,便于做实验,也可以当做论文的创新点。 3.涨点效果:TripletAttention,轻量级注意力机…

虹科新闻 | 虹科与LUMATEC正式建立合作伙伴关系

2023年7月,虹科与LUMATEC 正式建立合作伙伴关系,负责该品牌及其产品在大中华地区的销售和售后服务,共同为国内客户提供世界领先的高性能紫外光源产品和先进的液体光导技术。 关于LUMATEC 虹科伙伴LUMATEC公司成立于1976年(总部位…

Linux安装nginx教程

目录 一、Nginx下载 二、安装步骤 1、在 /docker目录下新建 nginx 文件夹 2、将解压包移动到nginx目录下并解压到nginx目录 3、进入 nginx目录,找到 configure 4、运行 configure,命令 5、安装 6、查看根目录 7、进入Nginx目录下的conf文件夹…

利用AOSP的开放特点,国产操作系统将如雨后春笋般涌现,反击谷歌

据了解又一款国产操作系统即将诞生,它初期也将利用AOSP开放的特点,兼容安卓应用,由此AOSP将成为国产操作系统发展的基点,不排除有更多国产手机企业站在巨人AOSP的肩膀上发展完全自主操作系统。 这家企业就是小米,早前有…

css实现滚动条一直显示,并且实现滚动条样式的修改

css实现滚动条一直显示,并且实现滚动条样式的修改 自带的滚动条只有当鼠标移上去的时候才会显示,其他时候隐藏,这样用户很难看出这个是能划动的,这就需要滚动条一直显示在页面上,并且需要按照自己一定的样式去修改。 …

22.0 Pycharm中编写js代码

1. 添加Node.js插件 PyCharm是一款主要用于Python开发的集成开发环境(IDE), 对于JavaScript等其他语言的开发支持相对有限. 如果你主要是进行JavaScript开发, 可能会有更适合的IDE, 如Visual Studio Code、WebStorm等.Node.js是一个基于Chrome V8引擎的JavaScript运行环境, 它…

Cpp/Qtday010906cpp基础

目录 封装一个结构体,结构体中包含一个私有数组,用来存放学生的成绩,包含一个私有变量,用来记录学生个数, 提供一个公有成员函数,void setNum(int num)用于设置学生个数 提供一个公有成员函数&#xff1…