论文总结+公式分析

论文总结+公式分析

news2025/7/13 14:01:27

目录

- 1.Learning with Noisy Correspondence for Cross-modal Matching(NCR)
- - 1-1.贡献和创新点
  - 1-2.图
  - - 1-2-1.总图
    - 1-2-2.Co-divide
    - 1-2-3. Co-Rectify
    - 1-2-4.Robust Cross-modal Matching

1.Learning with Noisy Correspondence for Cross-modal Matching(NCR)

1-1.贡献和创新点

提出了Noisy Correspondence，其意思是不对齐(not correctly aligned)的数据对（传统noisy labels意思是错误地打上类标签）。
提出了新方法Noisy Correspondence Rectifier（NCR）解决Noisy Correspondence问题。（1）NCR具体功能为，先基于神经网络的记忆性将数据分为clean和noisy，然后通过an adaptive prediction model in a co-teaching manner来rectifies the correspondence。（2）NCR的创新点是使用了有soft margin的triplet loss来实现鲁棒的跨模态匹配。
在Flickr30K, MS-COCO, and Conceptual Captions数据集上验证了方法的有效性。

1-2.图

1-2-1.总图

在这里插入图片描述

1-2-2.Co-divide

式（1）是loss的集合，数据对从1到N
式（2）是用于GMM的loss，^意思是非原配，Σ下的符号代表遍历所有满足条件的数据对求和
式（3）是GMM的先验概率（这个算法里没有用到先验概率），l是某组数据对，θ是当前概率分布（我猜的），k是component即第k个高斯分布（该算法K=2），βk是混合系数，Φ(l|k)是k-component的概率密度，p(l|θ)是在该概率分布下（θ）数据对l出现的概率
下式是GMM的后验概率（用到了），k是component（该算法k是平均值较小的那个高斯分布，作为clean数据的高斯分布），li是第i组数据对，wi是取第i组数据对，其为clean数据的概率
下图是clean/noisy数据对的per-sample loss的概率分布，虚线是拟合两种数据的高斯分布，实线是混合高斯分布
总结：在这个阶段，通过loss和GMM求出每对数据对为clean的概率wi，通过wi和阈值0.5，将数据分为clean和noisy

1-2-3. Co-Rectify

式（4）用于求数据新标签y-hat。第一行意思是数据对i若被判为clean则新标签求法，y-hat^Ci是第i对数据对若被判为clean后的新标签，wi是Co-divide阶段获得的数据为clean的概率， y^Ci是第i数据对若被判为clean后的原标签（这里y^Ci都取1），Pk是用网络输出的S（相似度）求出来的数据为clean的程度，k表示与wi来自不同网络（wi来自A则Pk来自B的S）；第二行意思是数据对i若被判为noisy则新标签求法，PA/B来源分别是A/B的S，
式（5）是通过A/B网络输出的S相似度求数据对为clean的程度。Θ(s)指将s控制在一定范围内，即设置超过上限的数据为上限

1-2-4.Robust Cross-modal Matching

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/544467.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

来报名丨下一代因子挖掘统一框架：打破界限的流式实时计算平台

来报名丨下一代因子挖掘统一框架：打破界限的流式实时计算平台

大家期待已久的量化科技嘉年华，现在正式开启报名啦！ 2023年6月2日-3日，DolphinDB 联合主办的 “2023量化科技嘉年华” 将在上海世博中心召开，本次大会主题涵盖因子/数据/交易/算法/算力，通过国内外顶尖量化金融专家最…

阅读更多...

AIGC出击研发、营销，文心一言们要改变鞋服行业产业链条？

AIGC出击研发、营销，文心一言们要改变鞋服行业产业链条？

（图片来源于网络，侵删） 文 | 螳螂观察作者 | 叶小安你敢设想这样一种未来吗？ 看到的消费品广告都是AI设计的，甚至连电影、电视甚至直播带货都是由AI机器人制作好的画面。 2022年尾，ChatGPT的诞生刷爆…

阅读更多...

继内存条、固态硬盘后国产CPU再度发力，性能已媲美10代酷睿

继内存条、固态硬盘后国产CPU再度发力，性能已媲美10代酷睿

这两年内存条、固态硬盘之内卷，放在整个电脑硬件发展历程中也是相当炸裂了。国产厂商崛起带动了储存行业飞跃式发展，一是储存芯片成本大幅降低。二是经历了前几年经济冲击，大家对 PC 电子产品需求明显下滑，各大厂库存难以消化。…

阅读更多...

基于html+css的图展示78

基于html+css的图展示78

准备项目项目开发工具 Visual Studio Code 1.44.2 版本: 1.44.2 提交: ff915844119ce9485abfe8aa9076ec76b5300ddd 日期: 2020-04-16T16:36:23.138Z Electron: 7.1.11 Chrome: 78.0.3904.130 Node.js: 12.8.1 V8: 7.8.279.23-electron.0 OS: Windows_NT x64 10.0.19044 项目…

阅读更多...

DRMS-关于开展防范风险整改工作的工作计划

DRMS-关于开展防范风险整改工作的工作计划

防范风险整改工作工作计划 ２０２３年５月１０日尊敬的【DRMS】集群用户： 根据河南省郑州市国家高新技术产业开发区市场监督管理局《关于河南数权数字信息科技研究院网络违规整改通知》及…

阅读更多...

Unity 动画

Unity 动画

Unity现存两套动画系统：Legacy动画系统和Mecanim动画系统。 Unity的Mecanim动画系统，是一套基于状态机的动画控制系统，是一个面向动画应用的动画系统 Animator Avatar：动画节点导引替身，与动画复用（尤其…

阅读更多...

四信机房环境监测与安全预警解决方案

四信机房环境监测与安全预警解决方案

随着网络信息技术的不断发展，各行业对计算机依赖性显著提高，机房作为信息交换的枢纽，其数量及建设规模不断扩大。而机房系统的可靠与否直接关系着网络能否正常稳定的运行，因此企业必须严格按照国家相关标准和具体需要建立包含供配…

阅读更多...

华为OD机试真题 Java 实现【数字加减游戏】【2023Q1 200分】

华为OD机试真题 Java 实现【数字加减游戏】【2023Q1 200分】

一、题目描述小明在玩一个数字加减游戏，只使用加法或者减法，将一个数字s变成数字t。每个回合，小明可以用当前的数字加上或减去一个数字。现在有两种数字可以用来加减，分别为a，其中b没有使用次数限制。请问小明…

阅读更多...

常用MQ介绍与区别

常用MQ介绍与区别

RabbitMQ RabbitMQ是实现AMQP协议(0.9.1) 的消息中间件的一种，由RabbitMQ Technologies Ltd开发并且提供商业支持的，最初起源于金融系统，服务器端用Erlang语言编写，用于在分布式系统中存储转发消息，在易用性、扩展性、…

阅读更多...

bug：生产问题，Golang解决csv文件用excel打开中文乱码问题及常见编码和BOM头关系

bug：生产问题，Golang解决csv文件用excel打开中文乱码问题及常见编码和BOM头关系

bug：Golang解决csv文件用excel打开中文乱码问题 1 场景及分析场景：今天在生成csv文件之后，测试发现用office和wps打开乱码分析：经过测试之后发现使用记事本打开不乱码，同时用记事本打开之后另存为ANSI编码之后用off…

阅读更多...

Vivado 下 IP核之 PLL实验

Vivado 下 IP核之 PLL实验

目录实验任务：Vivado 下 IP核之 PLL实验 1、实验简介 2、实验环境 3、实验原理 3.1、PLL IP核简介 3.2、MMCM 和 PLL 各自的含义以及两者的区别 3.3、PLL 分频和倍频的工作原理 3.4、实验任务 4、建立工程 4.1、PLL IP 核配置 4.2、模块设计 4.…

阅读更多...

【STL模版库】vector的介绍及使用 {构造函数，迭代器，容量相关接口，增删查改；动态二维数组}

【STL模版库】vector的介绍及使用 {构造函数，迭代器，容量相关接口，增删查改；动态二维数组}

一、vector的介绍 vector是表示可变大小数组的序列容器。就像数组一样，vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问，和数组一样高效。但是又不像数组，它的大小是可以动态改变的，而且它…

阅读更多...

DMGI:Unsupervised Attributed Multiplex Network Embedding

DMGI:Unsupervised Attributed Multiplex Network Embedding

[1911.06750] Unsupervised Attributed Multiplex Network Embedding (arxiv.org) 目录 Abstract 1 Introduction 2 DGI 3 Deep Multiplex Graph Infomax: DMGI 特定关系类型的节点嵌入 Joint Modeling and Consensus Regularization Extension to Semi-Supervised Lea…

阅读更多...

在线视频(海康，大华等摄像头)平台

在线视频(海康，大华等摄像头)平台

项目下载地址 http://www.gxcode.top/code 功能： 1.接入设备 2.设备使用 3.国标级联 4.推流列表 5.拉流代理 6.电子地图 7.节点管理 8.云端录像 9.不间断录像一.项目运行图二.代码截图 1.在线视频前端 2.在线视频服务平台 3.在线视频录像服务平台

阅读更多...

大型医学影像PACS系统源码 VC + MSSQL

大型医学影像PACS系统源码 VC + MSSQL

PACS系统可以覆盖医院现有放射、CT、MR、核医学、超声、内镜、病理、心电等绝大部分DICOM和非DICOM检查设备，支持从科室级、全院级、集团医院级乃至到区域PACS的平滑扩展，能够与医院HIS、集成平台的有效集成和融合，帮助医院实现了全院医学影像…

阅读更多...

软件测试技术课程：软件测试流程

软件测试技术课程：软件测试流程

软件测试流程如下： 测试计划测试设计测试执行单元测试集成测试确认测试系统测试验收测试回归测试验证活动测试计划测试计划由测试负责人来编写，用于确定各个测试阶段的目标和策略。这个过程将输出测试计划，明确要完成的测试活动&#x…

阅读更多...

linux内核篇-进程间通信（信号，管道，共享内存，socket）

linux内核篇-进程间通信（信号，管道，共享内存，socket）

信号机制在linux操作系统中，为了响应各种各样的事件，也定义了很多信号。我们可以通过kill -l命令，查看所有的信号 # kill -l1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP6) SIGABRT 7) SIGBUS …

阅读更多...

【大数据模型】LeonardoAi让心中所想跃然纸上

【大数据模型】LeonardoAi让心中所想跃然纸上

汝之观览，吾之幸也！ 本文主要聊聊LeonardoAi绘图工具一、注册Discord账号不管LeonardoAi还是midjourney，都需要注册一个Discord账号，Discord是一个社区软件，在这里可以进行讨论和交流使用心得 LeonardoAi官网地址 …

阅读更多...

RabbitMQ集群安装

RabbitMQ集群安装

RabbitMQ集群安装 1.前言 OS: CentOS Linux release 7.9.2009 (Core) 机器: IPnodecpu内存存储10.106.1.241max-rabbitmg-018 核16 G100 G10.106.1.242max-rabbitmg-028 核16 G100 G10.106.1.243max-rabbitmg-038 核16 G100 G 因为操作系统版本是 centos7，所以…

阅读更多...

chatgpt赋能Python-python3_5_3怎么保存

chatgpt赋能Python-python3_5_3怎么保存

Python 3.5.3 保存指南如果你正在使用Python 3.5.3，你可能会发现你需要保存你的代码和文件。在这篇SEO文章中，我们将介绍如何在Python 3.5.3中保存你的代码和文件。保存Python代码当你编写Python代码时，你需要将它们保存在文件中。为了…

阅读更多...

推荐文章

最新文章