广读论文核心思路汇总笔记 (一些有意思的论文and论文在研究的一些有意思的问题or场景应用)

news2024/11/29 11:33:15

思路可借鉴和学习

On the Generalization of Multi-modal Contrastive Learning CoRR, ICML(2023)
摘要:多模态对比学习(MMCL)最近引起了广泛关注,因为它在视觉任务上的表现优于其他方法,这些方法通过嵌入多模态数据(如视觉 - 语言对)来实现。然而,关于 MMCL 如何从多模态对中提取有用的视觉表示以及如何超越自监督对比学习(SSCL)等先前方法的原理理解仍然不足。在本文中,我们通过将 MMCL 与非对称矩阵分解之间的内在联系进行对比,为视觉下游任务建立了 MMCL 的首个推广保证。基于这个框架,我们进一步通过表明 MMCL 隐含地执行了由文本对诱导的(伪)正对 SSCL,从而将 MMCL 与 SSCL 统一起来。从这个统一的视角出发,我们通过展示文本对可以诱导更多语义一致和多样的正对,来刻画 MMCL 的优势。根据我们的分析,这有利于下游泛化。受这一发现的启发,我们提出了一种 CLIP 引导的重采样方法,通过利用多模态信息,显著提高了 SSCL 在 ImageNet 上的下游性能。代码可在此处找到:https://github.com/PKU-ML/CLIP-Help-SimCLR。

BagFormer: Better Cross-Modal Retrieval via bag-wise interaction
摘要:在跨模态检索领域,单编码器模型通常比双编码器模型表现更好,但它们受到高延迟和低吞吐量的困扰。在本文中,我们提出了一种名为 BagFormer 的双编码器模型,它利用跨模态交互机制来提高召回率,同时不牺牲延迟和吞吐量。BagFormer 通过使用包级交互来实现这一点,这允许将文本转换为更合适的粒度,并将实体知识融入模型中。

Incorporating Biological Knowledge with Factor Graph Neural Network for Interpretable Deep Learning
在许多生物医学应用中,模型解释性和可解释性至关重要。为解决这个挑战,我们将概率图模型与深度学习相结合,开发了可解释且可预测的因素图神经网络模型。我们将生物知识(如基因本体论)直接编码为因素图,并将其嵌入模型架构中,使模型具有透明度和解释性。此外,我们设计了一种注意力机制,可以捕捉生物实体(如基因和基因本体论术语)之间的多尺度层次相互作用。通过参数共享机制,展开的因素图神经网络模型可以采用随机深度训练,并具有良好的泛化能力。我们将模型应用于两个癌症基因组数据集,以预测目标临床变量,并取得了比其他传统机器学习和深度学习模型更好的结果。我们的模型还可以用于基因集富集分析和选择对目标临床变量重要的基因本体论术语。

Factor Graph Neural Networks(因子GNN)
网络在图结构上操作,因此它们通常只考虑成对依赖关系。 为了捕捉更高阶的依赖关系,我们将图神经网络推广到因子图神经网络(FGNN)。 我们表明,FGNN 能够表示最大似然概率图模型的近似推理算法——最大积,因此,当最大积表现良好时,FGNN 也能表现良好。下面的图很有意思,感觉也比较创新。

在这里插入图片描述
BeMap: Balanced Message Passing for Fair Graph Neural Network
图神经网络可能对某些人口群体存在偏见,这需要考虑算法公平性。尽管在确保图神经网络算法公平性方面付出了越来越多的努力,但它们通常在训练过程中并不明确考虑 GNN 中的消息传递引起的偏差。在本文中,我们首先研究了消息传递中的偏差放大问题。我们通过实证和理论证明了当不同人口群体的 1-跳邻居不均衡时,消息传递可能放大偏差。在这样分析的指导下,我们提出了一种名为 BeMap 的公平消息传递方法,它利用一种平衡感知的抽样策略来平衡不同人口群体中每个节点的 1-跳邻居数量。在节点分类方面的广泛实验证明了我们的 BeMap 方法在减轻偏差的同时保持分类准确性的有效性。

Capturing Semantics for Imputation with Pre-trained Language Models ICDE 2021
提出了 IPM,它利用预训练语言模型捕捉填充的语义,把文本插补建模为分类任务,充分利用预训练语言模型捕捉语义的能力。
在这里插入图片描述

Interesting 兴趣阅读:

  • CSPRD: A Financial Policy Retrieval Dataset for Chinese Stock Market
    从大规模语料库中检索与给定问题相关的段落。现有的数据集主要通过事实查询对模型进行基准测试,这些查询通常涉及通用常识,而金融和经济等特定领域由于缺乏大规模高质量的数据集以及专家注释而尚未得到探索。在本文中,我们引入了中文股市政策检索数据集(CSPRD),提出了一种新的任务——策略检索,该数据集提供了 700 多个由经验丰富的专家标注的招股说明书段落,这些段落来自于我们收集的 10000 多个条目的中文政策语料库的相关文章。在词汇、嵌入和微调的双编码器模型上的实验证明了所提出的 CSPRD 的有效性,同时也表明了仍有许多改进的潜力。
  • Towards Open-World Feature Extrapolation: An Inductive Graph Learning Approach (NIPS 2021)
    我们针对开放世界特征扩展问题,其中输入数据的特征空间经过扩展,需要在未进行进一步重新训练的情况下处理测试数据中的新特征。该问题对于处理来自不同领域逐步收集的特征具有重要意义。为此,我们提出了一种新的图表示和学习的 learning paradigm。我们的框架包含两个模块:1) 一个骨干网络(例如,前馈神经网络)作为下层模型,将特征作为输入并输出预测标签;2) 一个图神经网络作为上层模型,通过在由观察到的数据构建的特征数据图上进行消息传递,学习扩展新特征的嵌入。基于我们的框架,我们设计了两种训练策略,一种是无监督的方法和一种归纳学习的方法,以赋予模型扩展能力并减轻特征级别的过拟合。我们还对具有新特征的测试数据的泛化误差进行了理论分析,剖析了训练特征和算法对泛化性能的影响。我们在多个分类数据集和大规模广告点击预测数据集上的实验证明了我们的模型可以为未见过的特征产生有效的嵌入,并且显著优于采用 KNN 和局部聚合的基线方法。 (感觉确实很有实际应用价值,解决了一个很实际的问题)
  • Predicting Biomedical Interactions with Probabilistic Model Selection for Graph Neural Networks
    生物系统是由异质分子实体及其相互作用组成的复杂网络,这些相互作用共同决定了系统的各种生物特性。然而,目前的生物网络是嘈杂的、稀疏的和 不完整的,限制了我们对生物系统进行全面了解和理解生物现象的能力。实验鉴定这些相互作用既耗时又昂贵。随着高通量数据生成技术的进步和计算能力的显著提高,已经开发出各种计算方法来预测嘈杂网络中的新型相互作用。最近,深度学习方法如图神经网络在图结构数据建模方面显示出有效性,并在生物医学相互作用预测中取得了良好的性能。然而,基于图神经网络的方法需要人类专业知识和实验来设计模型的适当复杂性,并对模型的性能产生重大影响。此外,深度图神经网络容易过拟合,并且在对预测错误的预测上倾向于高度自信且校准不佳。为解决这些挑战,我们提出使用贝叶斯模型选择进行图卷积网络,以同时推断数据所证明的最可能的图卷积层数(深度)并进行 dropout 正则化。 在四个相互作用数据集上的实验证明,我们提出的方法可以实现精确且校准的预测。 (很有趣的想法,感觉思考的角度比较新)
  • Incorporating Biological Knowledge with Factor Graph Neural Network for Interpretable Deep Learning
    在许多生物医学应用中,模型解释性和可解释性至关重要。为解决这个挑战,我们将概率图模型与深度学习相结合,开发了可解释且可预测的因素图神经网络模型。我们将生物知识(如基因本体论)直接编码为因素图,并将其嵌入模型架构中,使模型具有透明度和解释性。此外,我们设计了一种注意力机制,可以捕捉生物实体(如基因和基因本体论术语)之间的多尺度层次相互作用。通过参数共享机制,展开的因素图神经网络模型可以采用随机深度训练,并具有良好的泛化能力。我们将模型应用于两个癌症基因组数据集,以预测目标临床变量,并取得了比其他传统机器学习和深度学习模型更好的结果。我们的模型还可以用于基因集富集分析和选择对目标临床变量重要的基因本体论术语。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1008129.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ASP.NET dotnet 3.5 实验室信息管理系统LIMS源码

技术架构:ASP.NET dotnet 3.5 LIMS作为一个信息管理系统,它有着和ERP、MIS之类管理软件的共性,如它是通过现代管理模式与计算机管理信息系统支持企业或单位合理、系统地管理经营与生产,最大限度地发挥现有设备、资源、人、技术的…

Apifox 关于token的使用方式

前言,关于token的使用,仅做了简单的demo测试token效果。 1.手动登录获取token 顾名思义,因为只有登录之后才有token的信息,所以在调用其他接口前需要拥有token才能访问。 操作步骤 1)添加环境变量、全局参数 这里拿测试环境举…

vue基础 组合式和响应式 模板语法 计算属性

模板语法 | Vue.js 根据文档 组合式和响应式 响应式 响应api单网页实例式 组合式 组合式api单网页实例 模板语法 文本插值 {{msg}} 最基本的数据绑定形式是文本插值&#xff0c;它使用的是“Mustache”语法 (即双大括号)&#xff1a; <script setup> import {onMo…

Promethues(五)查询-PromQL 语言-保证易懂好学

一、介绍 普罗米修斯提供了一种称为PromQL&#xff08;普罗米修斯查询语言&#xff09;的函数式查询语言&#xff0c;允许用户实时选择和聚合时间序列数据。 表达式的结果可以显示为图形&#xff0c;在 Prometheus 的表达式浏览器中显示为表格数据&#xff0c;也可以通过 HTT…

EMQX的docker部署与使用(mqtt)

1&#xff1a;先创建一个挂载emqx的目录 2&#xff1a;docker拉去emqx docker pull emqx/emqx:latest2-1&#xff1a;先启动一次eqmx&#xff0c;然后停止&#xff0c;删除容器 docker run -d --name emqx --privilegedtrue -p 1883:1883 -p 8883:8883 -p 8083:8083 -p 8084…

Spring Bean生命周期图扩展接口介绍spring的简化配置

目录 1. 生命周期简图 2. 扩展接口介绍 2.1 Aware接口 2.2 BeanPostProcessor接口 2.3 InitializingBean 2.4 DisposableBean 2.5 BeanFactoryPostProcessor接口 3. spring的简化配置 3.1 项目搭建 3.2 Bean的配置和值注入 3.3 AOP的示例 1. 生命周期简图 2. 扩展接…

Mobileye CEO来华:只有能控制住成本的公司,才能活下来

‍作者|德新 编辑|王博 上午9点近一刻&#xff0c;Mobileye CEO Amnon Shuashua步入酒店的会议室。由于Amnon本人是以色列希伯来大学的计算机科学教授&#xff0c;大部分人更习惯称他为「教授」。 时近以色列的新年&#xff0c;这趟教授的中国之行安排十分紧凑。 他率领了一…

IP地址在各行业中的应用场景

1、互联网交易、支付反欺诈 通过分析IP应用场景、IP地址的出现位置的离散程度、分布情况综合用户行为及时间判断IP地址风险程度&#xff0c;过滤机器流量。在登陆、交易、支付等多个环节结合多重验证等技术减少欺诈行为。 2、P2P平台反“羊毛党” 通过分析IP应用场景、位置信…

得帆云“智改数转,非同帆响”-AIGC+低代码PaaS平台系列白皮书,正式发布!

5月16日下午&#xff0c;由上海得帆信息技术有限公司编写&#xff0c;上海市工业互联网协会指导的以“智改数转&#xff0c;非同帆响”为主题的《得帆云 AIGC低代码PaaS平台系列白皮书》正式在徐汇西岸国际人工智能中心发布。 本次发布会受到了上海市徐汇区政府、各大媒体和业内…

c刷题(四)

获得月份天数 获得月份天数_牛客题霸_牛客网 这道题可以用switch case语句解&#xff0c;不过这道题更简单的方法是数组&#xff0c;关键点在于判断是否为闰年。 #define _CRT_SECURE_NO_WARNINGS 1 #include <stdio.h> #include<assert.h> int year_run(int n) …

Go 异常处理

代码在执行的过程中可能因为一些逻辑上的问题而出现错误 func test1(a, b int) int {result : a / breturn result } func main() {resut : test1(10, 0)fmt.Println(resut) }panic: runtime error: integer divide by zero goroutine 1 [running]: …

【数据库】数据库系统概论(一)— 概念

theme: qklhk-chocolate 基本概念 数据 描述事物的符号记录称为数据。 记录时是计算机中表示和存储数据的一种格式或一种方法。 数据库 数据库是长期存储在计算机内、有组织、可共享的大量数据的集合。 数据库中的数据按一定的数据模型组织、描述和储存。具有较小冗余度…

我的创作纪念日(第1024天)

机缘 当我开始在CSDN上创作时&#xff0c;我的初心主要是出于对技术的热爱和对知识分享的渴望。我一直以来都对计算机科学和技术领域充满兴趣&#xff0c;并且热衷于学习和探索新的技术知识和应用。通过在CSDN上发表文章和分享我的经验和见解&#xff0c;我希望能够与更多的技…

基于webman的CMS,企业官网通用PHP后台管理系统

2023年9月11日10:47:00 仓库地址&#xff1a; https://gitee.com/open-php/zx-webman-website 还有laravelscui的版本目前还未开源&#xff0c;电商laravel版本差不多&#xff0c;后续在移植webman 算是比较标准的phpvue的项目 CMS&#xff0c;企业官网通用PHP后台管理系统 …

UE5 Foliage地形植被实例删不掉选不中问题

目前问题测试发生在5.2.1上 地形上先填充后刷的植被删不掉 首先这个就是bug&#xff0c;大概看到说是5.3上能解决了&#xff0c;对此我只能吐槽ue5上地形植被bug太多了 什么nanite还能产生bug&#xff0c;不过这次又不是&#xff0c;整个删掉instance可以删除所有植被&#…

C++项目实战——基于多设计模式下的同步异步日志系统-⑨-同步日志器类与日志器建造者类设计

文章目录 专栏导读Logger类设计同步日志器类设计同步日志器测试日志器建造者模式设计抽象日志器建造者类派生局部日志器建造者日志器建造者类测试 同步日志器类与日志器建造者类整理 专栏导读 &#x1f338;作者简介&#xff1a;花想云 &#xff0c;在读本科生一枚&#xff0c;…

将阿里云盘挂载到本地磁盘-CloudDrive工具使用教程

CloudDrive是什么&#xff1f; 支持将115、沃家云盘、天翼云盘、阿里云盘、WebDAV挂载到本地并创建本地磁盘。 CloudDrive是一个全方位的云存储管理平台&#xff0c;旨在无缝集成多个云存储服务&#xff0c;将它们统一整合到一个界面中。 使用CloudDrive&#xff0c;您可以轻松…

Python 图形化界面基础篇:监听按钮点击事件

Python 图形化界面基础篇&#xff1a;监听按钮点击事件 引言 Tkinter 库简介步骤1&#xff1a;导入 Tkinter 模块步骤2&#xff1a;创建 Tkinter 窗口步骤3&#xff1a;创建按钮和定义事件处理函数步骤4&#xff1a;创建显示文本的标签步骤5&#xff1a;启动 Tkinter 主事件循环…

杂牌行车记录仪删除后覆盖恢复案例

行车记录仪从一开始的新鲜设备&#xff0c;到现在汽车必备&#xff0c;有的厂商甚至直接出厂就带了行车记录仪&#xff0c;正因为如此重要所以市场上充斥着很多记录仪品牌。下边我们来看看这个杂牌的记录仪恢复案例。 故障存储:8G microSD卡 故障现象: 8G算是小卡&#xff0…

pta java版

7-1 厘米换算英尺英寸 如果已知英制长度的英尺foot和英寸inch的值&#xff0c;那么对应的米是(footinch/12)0.3048。现在&#xff0c;如果用户输入的是厘米数&#xff0c;那么对应英制长度的英尺和英寸是多少呢&#xff1f;别忘了1英尺等于12英寸。 思路&#xff1a; 1英尺12英…