CLIP探索笔记

CLIP探索笔记

news2025/4/20 5:17:51

CLIP探索笔记

记录CLIP的流水账，训练和推理是如何完成的？
每一次阅读都有不同的领悟和发现，一些简单的想法。

官方信息

Code
Paper
Blog
只有预测代码+模型，没有训练代码

训练阶段

Text Encoder不需要训练，直接拿现成的文本模型来用就可以了，比如GPT，提取文本特征
- 代码中用的是transformer
Image Encoder需要训练，提取图片特征
- 代码中用的是CNN,resnet结构
计算余弦相似度
- 论文中给出了伪代码，文本特征和图像特征，分别和真实标签特征做相似度计算，然后再求平均
对角线是正样本

在这里插入图片描述
计算LOSS的伪代码

推理阶段

对一张图，给出假设文本提示（任意n个），预设答案n个
- 预设的文本提示，很重要，影响特征值对比的值
- 文本的预测是模糊预测的，比如：一只猪或有一头猪，
- 以前咱们是直接预测是猫或是狗，CLIP说我们不这样干，不做精准的文本预测，我们考虑做相关性预测
计算图像数据的特征
计算图像特征和文本特征的相似度，相似度最高的就是答案

在这里插入图片描述

实验对比

在这里插入图片描述

代码测试

Hugging Face

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1404494.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

数据结构：堆与堆排序

数据结构：堆与堆排序

目录堆的定义： 堆的实现： 堆的元素插入： 堆元素删除： 堆初始化与销毁： 堆排序： 堆的定义： 堆是一种完全二叉树，完全二叉树定义如下： 一棵深度为k的有n个结点的二…

阅读更多...

cpu温度监测工具 -- Turbo Boost Switcher Pro

cpu温度监测工具 -- Turbo Boost Switcher Pro

Turbo Boost Switcher Pro是一款专为Mac电脑设计的CPU性能管理软件，它的技术背后是Intel Turbo Boost。Turbo Boost技术是一项能够自动加速处理器主频的技术，为Mac电脑提供更强大的计算能力。然而，这项技术在使用过程中会产生更多热量&#x…

阅读更多...

云风网（www.niech.cn）个人网站搭建（二）服务器域名配置

云风网（www.niech.cn）个人网站搭建（二）服务器域名配置

这里直接采用宝塔服务器运维管理面板来进行配置，简单无脑宝塔 Linux面板8.0.5安装脚本 //Centos安装脚本 yum install -y wget && wget -O install.sh https://download.bt.cn/install/install_6.0.sh && sh install.sh ed8484bec //Ubuntu/Deepi…

阅读更多...

JVM系列-4.类加载器

JVM系列-4.类加载器

👏作者简介：大家好，我是爱吃芝士的土豆倪，24届校招生Java选手，很高兴认识大家📕系列专栏：Spring原理、JUC原理、Kafka原理、分布式技术原理、数据库技术、JVM原理🔥如果感觉博主的文…

阅读更多...

java数据结构与算法刷题-----LeetCode645. 错误的集合(位运算解法需要重点掌握)

java数据结构与算法刷题-----LeetCode645. 错误的集合(位运算解法需要重点掌握)

java数据结构与算法刷题目录（剑指Offer、LeetCode、ACM）-----主目录-----持续更新(进不去说明我没写完)：https://blog.csdn.net/grd_java/article/details/123063846 文章目录法一：桶排序思想法二：位运算法一&#x…

阅读更多...

imu_utils安装及标定教程

imu_utils安装及标定教程

本文使用香港科技大学的imu_utils方差工具标定，首先将INDEMIND双目惯性模组静止放置三个小时。然后采集IMU数据，生成Allan方差数据，由图分析得到加速度和角速度的高斯白噪声和随机游走Bias误差。系统配置系统版本ubuntu18.04OpenCV3.4.13…

阅读更多...

C/C++读写文件和stringstream类

C/C++读写文件和stringstream类

目录 C处理文件打开文件两种函数的区别读文件两种函数区别其它读操作的函数fgetc：从文件中读取一个字符fgets：从文件中读取一个字符串fscanf：按格式从文件中读取指定内容，与scanf函数类似写文件其它的常用写操作函数fputc&#…

阅读更多...

【LeetCode-135】分发糖果(贪心)

【LeetCode-135】分发糖果(贪心)

LeetCode135.分发糖果题目描述老师想给孩子们分发糖果，有 N 个孩子站成了一条直线，老师会根据每个孩子的表现，预先给他们评分。你需要按照以下要求，帮助老师给这些孩子分发糖果： 每个孩子至少分配到 1 个糖果。…

阅读更多...

js中找出两个数组中不同的元素

js中找出两个数组中不同的元素

文章目录一、题目二、方法2.1、方法一2.2、方法二2.3、方法三三、最后一、题目两个数组 var A [1, 5, 6]; var B [2, 6, 7]，实现一个方法，找出仅存在于A 或者仅存在于B中的所有数字二、方法 2.1、方法一 const filterArr (arr1, arr2) > …

阅读更多...

5大免费代理IP合集，你的代理IP该换啦！

5大免费代理IP合集，你的代理IP该换啦！

一连代理代理IP提供平台，代理IP覆盖HTTP/HTTPS/SOCKS5协议，涵盖直连和隧道代理。一键操作可以随机更换IP，实现高效稳定的网络代理。支持在PC、iOS和安卓等平台上使用。当前免费试用选项，让用户能够在使用之前先了解服务的性能和效…

阅读更多...

归并排序模板

归并排序模板

模板在文末，以下步骤方便理解记忆。先贴一张快速排序模板步骤，用于对比记忆归并排序步骤： （0）如果数组左边界L ≥ 数组右边界，则不需要排序，直接return。 （1）直接取…

阅读更多...

力扣第92题——反转链表 II（C语言题解）

力扣第92题——反转链表 II（C语言题解）

题目描述给你单链表的头指针 head 和两个整数 left 和 right ，其中 left < right 。请你反转从位置 left 到位置 right 的链表节点，返回反转后的链表。示例 1： 输入：head [1,2,3,4,5], left 2, right 4 输出&#xff1…

阅读更多...

成绩等级分数段查询(python条件分支语句match...case...)

成绩等级分数段查询(python条件分支语句match...case...)

根据有效分数序列及等级差值，计算并打印等级相应分数区间。 (笔记模板由python脚本于2024年01月20日 23:57:32创建，本篇笔记适合会条件分支语句的初学者的coder翻阅) 【学习的细节是欢悦的历程】 Python 官网：https://www.python.org/ Free&…

阅读更多...

python：socket基础操作（2）-《udp发送信息》

python：socket基础操作（2）-《udp发送信息》

基础发送udp信息 1.导入socket模块 2.使用udp模块 3.发送内容 4.关闭套接字很简单的4步就可以实现udp的消息发送 import socket # 导入模块udp_socket socket.socket(socket.AF_INET,socket.SOCK_DGRAM) # 使用ipv4 udp协议udp_socket.sendto(b"hello world",(&…

阅读更多...

翻毛皮鞋脏了不会清洗怎么办？资深劳保鞋厂家来教你

翻毛皮鞋脏了不会清洗怎么办？资深劳保鞋厂家来教你

劳保鞋皮面材质中除了常见的牛皮材质，翻毛皮也是频繁使用的材料，材质不同，在养护上也有区别，今天百华小编来和大家聊聊翻毛皮材质的鞋子清洁方法。翻毛皮鞋清洗前的准备工作 1.除灰：对于表面灰尘，可以使用…

阅读更多...

C语言第六弹---分支语句(下)

C语言第六弹---分支语句(下)

✨个人主页： 熬夜学编程的小林 💗系列专栏： 【C语言详解】【数据结构详解】分支语句 1、逻辑操作符：&& , || , ！4.1、逻辑取反运算符 ！4.2、与运算符4.3、或运算符4.4、练习：闰…

阅读更多...

磁悬浮人工心脏的不良事件分析：美国FDA数据库的启示

磁悬浮人工心脏的不良事件分析：美国FDA数据库的启示

引言： 左心室辅助装置（LVAD）是治疗末期难治性心力衰竭（HF）患者的有效手段。磁悬浮人工心脏HeartMate-3（磁悬浮人工心脏）作为第三代LVAD，自2017年获得美国食品药品监督管理局&#x…

阅读更多...

pygame入门学习（四）位图的使用

pygame入门学习（四）位图的使用

大家好！我是码银🥰 欢迎关注🥰： CSDN：码银公众号：码银学编程载入图片 pygame.image.load( )，Pygame 可以通过pygame.image.load( )函数处理位图文件。大致可以支持以下文件：JPG…

阅读更多...

怎么给wordpress网站底部页脚添加备案号和链接？

怎么给wordpress网站底部页脚添加备案号和链接？

以前“WordPress后台 >> 常规”最底部是有一个ICP备案号的，我们只需要填写备案号并保存更改即可让WordPress自带主题底部显示ICP备案号，但是现在新版本的WordPress已经没有了这个ICP备案号选项，而且也无法直接添加公安联网备案号&#…

阅读更多...

前端基于XLSX实现数据导出到Excel表格，以及提示“文件已经被损坏，无法打开”的解决方法

前端基于XLSX实现数据导出到Excel表格，以及提示“文件已经被损坏，无法打开”的解决方法

文章目录一、vue实现导出excel1、前端实现1、安装xlsx依赖2、引入3、方法4、使用4.1、将一个二维数组转成sheet4.2、将一个对象数组转成sheet4.3、合并单元格4.4、一次导出多个sheet 5、支持的文件格式 2、后端实现二、导出文件损坏1、前端请求导出接口，增加返回类…

阅读更多...

推荐文章

最新文章