多模态论文阅读之BLIP

news2024/11/28 13:53:07

BLIP泛读

  • Title
  • Motivation
  • Contribution
  • Model

Title

BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation

Motivation

  1. 模型角度:clip albef等要么采用encoder-base model 要么采用encoder-decoder model. However, encoder-based models are less straightforward to directly transfer to text generation tasks(e.g. image captioning), whereas encoder-decoder models have not been sucessfully adopted for image-text retrieval tasks. 那有没有一个统一的框架呢?
  2. 数据角度:SOTA的方法(如CLIP、ALBEF等)都在从web上收集到的图文对上进行预训练。尽管通过扩展数据集获得了性能提升,但本文的研究表明,对于视觉语言学习来说,有噪声的网络文本是次优(suboptimal)的。

Contribution

  1. Bootstrapping: 从网页上获得了嘈杂的数据集训练一个模型,再通过一些方法获得一个更干净的数据集,能不能训练处一个更好的模型。
  2. Unified:caption filter

Model

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1168676.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Proteus仿真--1602LCD显示电话拨号键盘按键实验(仿真文件+程序)

本文主要介绍基于51单片机的LCD1602显示电话拨号键盘按键实验(完整仿真源文件及代码见文末链接) 仿真图如下 其中右下方12个按键模拟仿真手机键盘,使用方法同手机键一样,拨打手机号码则在液晶显示屏上显示对应的号码 仿真运行…

MySQL 数据脱敏方式盘点

对于企业而言,数据脱敏可以在数据共享或测试时用于保护敏感数据(如信用卡,社保卡,地址等)。通过对敏感数据进行脱敏处理,组织可以最大限度地降低数据泄露和未经授权访问的风险,同时仍能够使用真…

自己动手实现一个深度学习算法——五、误差反向传播法

文章目录 五、误差反向传播法1.计算图1)概念2)计算图3)局部计算4)计算图解题优点 2.链式法则1)计算图的反向传播2)什么是链式法则3)链式法则和计算图 3.反向传播1)加法节点的反向传播2&#xff…

MySQL - Zero date value prohibited

问题: timestamp字段报Caused by: com.mysql.cj.exceptions.DataReadException: Zero date value prohibited 原因: timestamp字段存入了0值, 超出了最小值1900-01-01 00:00:00, 转Java对象的时候报错 解决: 1.修复或删除原数据 2. mysqlurl 中添加zeroDateTimeBehaviorconve…

软磁直流测试系统磁参量指标

软磁直流测试系统磁参量指标 测量条件:( 23 5 )℃ 环形试样应为薄壁环,外径与内径之比应小于1.1。 测试前环形试样应先退磁。 ① 采用标准样品测试。

Cell Reports | 表观组学和单细胞测序揭示在急性应激条件下FoxM1协调β细胞亚群的细胞分裂、蛋白质合成和线粒体活性

发表单位:瑞士分子健康科学研究所 期 刊 :Cell Reports(IF:8.8) 发表日期:2023年8月29日 研究技术:ATAC-seq、ChIP-seq 、RNA-seq、scRNA-seq(爱基百客均可以提供) 2023年8月…

2023NOIP A层联测23-涂鸦

有一面由 n m n\times m nm 个格子组成的墙,每个格子要么是黑色,要么是白色。你每次将会进行这样的操作:等概率随机选择一个位置 ( x , y ) (x,y) (x,y),和一个颜色 c c c(黑色或者白色)( 1…

docker 安装 minio (单体架构)

文字归档:https://www.yuque.com/u27599042/coding_star/qcsmgom7basm6y64 查询 minio 镜像 docker search minio拉取镜像 docker pull minio/minio创建启动 minio 容器 用户名长度至少为 3,密码长度至少为 8 docker run \ -p 9000:9000 \ -p 9090:909…

第6天:信息打点-Web架构篇amp;域名amp;语言amp;中间件amp;数据库amp;系统amp;源码

第6天:信息打点-Web架构篇&域名&语言&中间件&数据库&系统&源码 #知识点: 1、打点-Web架构-语言&中间件&数据库&系统等2、打点-Web源码-CMS开源&闭源售卖&自主研发等 开源:可以上网搜索&#x…

redis-plus-plus常用函数介绍以及redis的一些边缘知识

文章目录 渐进式遍历scan数据库管理使用C调用redis安装redis-plus-plus get, set, exists , del, keysexpire, typestring的set, mset, mgetgetrange, setrangeincr, decrlpush, lrange,lpop, rpopblpop, llensadd, smemberssismember, scardsinter, sinterstorehset, hget, he…

创意无限,体验非凡——Cinema 4D 2024 Mac 版强势来袭

尊贵的设计师们,艺术与技术的完美结合,正是我们对于设计行业的追求。而在这个追求中,Cinema 4D 2024 Mac 版的问世,必将成为您的得力助手,为您的创作之路注入无限的活力与灵感。 Cinema 4D 一直以来都是设计师们最爱用…

导轨电表适不适合家用?

导轨电表,作为一种新型的电能计量设备,近年来在我国得到了广泛的应用。然而,对于家用市场来说,导轨电表是否适用仍然存在争议。那么,导轨电表适不适合家用呢?接下来,小编来为大家讲解下&#xf…

kaggle使用说明

kaggle kaggle使用参考1、kaggle目录2、kaggle上传本地文件后,如何不改代码就可运行3、已上传文件的修改3.1 重新上传3.2 重写文件 4、创建文件夹5、结果下载5.1 多文件:先打包再下载5.2 重定文件下载链接 kaggle使用参考 Kaggle 新手入门必看&#xff…

InetAddress.getLocalHost() 执行非常慢

昨天同事反馈网关的请求非常慢,一个获取的token的接口响应都超过了30s,还好只是测试环境。 经过验证,几乎所有接口响应都很慢,很多都响应超时。 排查步骤: 0. 本地启动项目测试,没有这个问题。而且生产环…

COCOS2DX3.17.2 Android升级targetSDK30问题解决方案

一、luajit不兼容问题 不兼容版本:【2.1.0-bate2、2.1.0-bate3都存在异常】 出问题系统:Android11;Android10的系统部分机型有问题,部分机型正常 异常点1:c调用lua接口,pushObjiect的时候crash 异常点2…

Skywalking介绍

一个优秀的项目,除了具有高拓展的架构、高性能的方案、高质量的代码之外,还应该在上线后具备多角度的监控功能。现在企业中的监控服务也有很多,Skywalking除了提供多维度、多粒度的监控之外,也提供了良好的图形化界面以及性能剖析…

研究人员发现34个Windows驱动程序易受完全设备接管攻击

最近,研究人员发现了34个易受攻击的Windows驱动程序,这些漏洞可能被非特权威胁行为者利用来完全接管设备,并在底层系统上执行任意代码。这一发现引发了广泛关注,并引起了Windows用户的担忧。 导语 随着科技的不断进步,…

【23真题】最难!两电一邮中最难的!

今天分享的是23年西安电子科技大学821的信号与系统试题及解析。 本套试卷难度分析:22年西电811考研真题,我发布过,若有需要戳这里自取!这里统计了811的上岸平均分为110-120分!最高分为143分,该院校考察的是…

06.Oracle数据备份与恢复

Oracle数据备份与恢复 一、通过RMAN方式备份二、使用emp/imp和expdb/impdb工具进行备份和恢复三、使用Data guard进行备份与恢复 一、通过RMAN方式备份 通过 RMAN(Oracle 数据库备份和恢复管理器)方式备份 Oracle 数据库,可以使用以下步骤&a…

dubbo没有找到生产者

1、没有找到生产者 com.alibaba.dubbo.rpc.RpcException: No provider available from registry 127.0.0.1:2181 for service .... , please check status of providers(disabled, not registered or in blacklist)2、 查看是不是 对应的providers 没有 注册上去 找到 zk 对应…