IMF: Interactive Multimodal Fusion Model for Link Prediction

news2024/9/24 5:26:46

[2303.10816] IMF: Interactive Multimodal Fusion Model for Link Prediction (arxiv.org)

目录

1 背景

2 贡献

3 模型

3.1 Overall Architecture

3.2 Modality-Specific Encoders

3.3 Multimodal Fusion

3.4 Contextual Relational Model

3.5 Decision Fusion

3.6 Inference


1 背景

为了获得更好的结果,一些研究方法将多模态信息引入到连接预测。但是这些研究将所有模态投影到一个统一空间中,具有相同的关系来捕捉共性,可能无法保证每个模态中的特定信息;这些方法分别利用多模态信息,忽略不同模态之间的复杂交互,无法捕捉互补性。

2 贡献

作者提出了一种新的交互式多模式融合模型(IMF),用于知识图上的多模式链接预测。

IMF可以在每个模态中单独学习知识,并通过两阶段融合对不同模态之间的复杂交互进行联合建模,类似于人类自然识别过程。

在多模态融合阶段,采用双线性融合机制,通过对比学习充分捕捉多模态特征之间的复杂交互。

对于基本链路预测模型,作者利用关系信息作为上下文来对三元组进行排序,作为每个模态中的预测。

在最终决策融合阶段,作者整合来自不同模态的预测,并利用互补信息进行最终预测。

文章的贡献如下:

(1)提出了一种新的两阶段融合模型IMF,该模型能够有效地整合不同模式的互补信息,用于链路预测。

(2)设计了一个有效的多模态融合模块,通过对比学习来捕捉双线性交互,从而对共性和互补性进行联合建模。

(3)在四个广泛使用的多模态链路预测数据集上进行了大量实验,证明了IMF的有效性和通用性

3 模型

一个知识图谱被定义为\mathcal G = <\mathcal E,\mathcal R,\mathcal T>,每个实体由来自不同模态的多个特征表示\mathcal K=\{s,v,t,m\},s,v,t,m分别示图结构模态、视觉模态、文本模态和多模态模态。链接预测模型期望学习关系三元组的得分函数,以估计三元组的可能性。

3.1 Overall Architecture

IMF由四个关键组件组成:

(1)模态特定编码器用于提取结构、视觉和文本特征,作为多模态融合阶段的输入。

(2)多模态融合模块是第一个融合阶段,它基于Tucker分解和对比学习对不同模态之间的双线性相互作用进行了有效建模。

(3)上下文关系模型计算上下文实体表示的相似性,以将三元组得分公式化为决策融合阶段的模态特定预测。

(4)决策融合模块是第二个融合阶段,它考虑了结构、视觉、文本和多模态模型的所有相似性得分,以进行最终预测。

3.2 Modality-Specific Encoders

Structural Encoder作者使用了TransE损失的GAT,并采用了对比损失。Visual Encoder使用VGG16。Textual Encoder使用BERT。

3.3 Multimodal Fusion

多模态融合阶段旨在有效地获得多模态表示,充分捕捉不同模态之间的复杂交互。许多现有的多模态融合方法已经在许多任务中取得了有希望的结果,然而,他们中的大多数人旨在通过模态投射或跨模态注意力来寻找共性,以获得更精确的表示。这些类型的方法将遭受不同模态中独特信息的损失,并且无法实现模态之间的充分交互。因此,作者使用双线性模型进行多模态信息融合,因为双线性模型具有很强的实现全参数交互的能力。

作者基于Tucker分解的方法,结构,视觉,文本模态的实体嵌入e_{s},e_{v},e_{t}首先被投影到低维空间中,作者通过分解核心张量进一步降低复杂度,通过将所有模态的表示合并到具有逐元素乘积的统一空间中,得到每个实体的多模态表征向量e_{m}。(原来的结构,视觉,文本的实体嵌入在不同空间中,通过投影矩阵投影到相同的低维空间中)。

然后,文章对于三个模态中两两进行对比学习,正样例是不同模态之间的相同实体i,负样例是不同实体i与j

3.4 Contextual Relational Model

对于每一个模态k,作者在实体和关系嵌入之间使用双线性外积(因为它提高参数的交互),将上下文信息合并到实体表示中。利用关系在实体嵌入的转换矩阵中提供上下文,然后使用上下文转换矩阵来投影实体嵌入(转换矩阵等于权重矩阵乘关系向量,再加上偏差),从而获得上下文嵌入

上下文嵌入用于计算与所有候选实体的相似性。预测损失函数是交叉熵损失。

3.5 Decision Fusion

决策融合阶段的损失函数等于每个模块单独的预测损失式(9)和两两之间的对比学习损失式(6)的加权和。

3.6 Inference

作者联合考虑每个模态的预测以及多模态的预测的加权和。

最后,总体的算法流程为

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/464535.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

GNSS监测站在滑坡和地质灾害中的应用

《地质灾害防治条例》涉及的地质灾害包括崩塌、滑坡、泥石流、地面沉降、地面塌陷和地裂缝等&#xff0c;已成为我国主要的自然灾害&#xff0c;严重威胁着人民的生命财产安全和生存环境以及国家重大工程的建设&#xff0c;制约着我国国民经济的可持续发展。 我国的地质灾害监…

【gcd性质】最小公倍数挑战

题目-最小公倍数挑战 (51nod.com) 题意&#xff1a; 思路&#xff1a; 要找到三个数使得他们的lcm尽可能大 那就让这三个数都两两互质&#xff0c;且三个数的积尽可能大 若n为奇数&#xff0c;考虑n-1和n-2 n和n-1一定互质&#xff0c;那么考虑n和n-2是否互质 结论是&…

【计算机基本原理-数据结构】数据结构中树的详解

【计算机基本原理-数据结构】数据结构中树的详解 1&#xff09;总览2&#xff09;树的相关概念3&#xff09;二叉树、满二叉树、完全二叉树4&#xff09;二叉查找树 - BST5&#xff09;平衡二叉树 - AVL6&#xff09;红黑树7&#xff09;哈弗曼树8&#xff09;B 树9&#xff09…

【数据结构】删除二叉树中的结点;树与二叉树的相互转换(含二叉树/二叉排序树的基本运算)

定义二叉树结点和树结点结构体&#xff1a; #include<stdio.h> #include<stdlib.h> #include<assert.h> #include<stdbool.h>typedef int BTDataType; typedef int TDataType;//二叉树 typedef struct BinaryTreeNode {struct BinaryTreeNode* left;…

python requests一个非常蠢的问题: post请求中data和json的区别

问题 最近在写java的ODD cucumber的框架&#xff0c;其中的接口调用相比python来说非常繁琐&#xff0c;很不友好&#xff0c;如下图 所以我打算先用python调一下这个接口,代码如下&#xff0c;url已做脱敏处理 import requests url "http://xxxxxxxxxxxxxxxxxxx:966…

嵌入式安卓开发:使用Camera2获取相机

文章目录 Camera2介绍Camera2的主要API类介绍CameraManager通过CameraManage获取Cameracharacteristics通过CameraManage获取CameraDevice从CameraDevice获取CameraCaptureSession预览效果 参考 Camera2介绍 从Android 5.0开始&#xff0c;Google 引入了一套全新的相机框架 Ca…

银行数字化转型导师坚鹏:银行数字化转型培训方案

目录 一、银行数字化转型培训背景 二、银行数字化转型模型 三、银行数字化转型课程设计思路 四、 银行数字化转型课程基本介绍 五、 银行数字化转型课程设置 六、银行数字化转型课程大纲 七、培训方案实施流程 一、银行数字化转型培训背景 2020年1月3日&#xff…

2023年IC行业薪资有多高?(内含各岗位薪资对比)

在网上看到一个很火的提问&#xff1a;2023了&#xff0c;IC行业高薪还在吗&#xff1f;其实这也是很多同学比较关注的一个问题&#xff0c;下面我们就一起来了解一下IC行业薪资有多高。 不同高校层次硕士-IC设计薪资情况 从不同岗位类型的offer占比情况来看&#xff0c;从事I…

SaaS云HIS系统源码功能介绍

SaaS云HIS首页功能&#xff1a;包括工作计划、预警、主功能菜单、医院机构公告。 一、工作计划 1.值班概况&#xff1a;值班日期、值班时间、值班科室&#xff08;内科、外科等&#xff09; 2.待处理患者&#xff1a;内科人数、外科人数等 病历统计&#xff1a;入院病历、出…

Java冒泡排序(Bubble Sort)算法实例

何为冒泡排序&#xff1f; 冒泡&#xff1a;就像气泡从水中冒出来一样 在冒泡排序中&#xff0c;最小数或最大数取决于您是按升序还是降序对数组进行排序&#xff0c;向上冒泡到数组的开头或结尾。算法描述&#xff1a; 比较相邻的元素。如果第一个比第二个大&#xff0c;就交…

【网络编程】

1.网络基础&#xff08;见PDF文件&#xff09; file:///D:/0graduate/000%E5%AE%9E%E4%B9%A0%E5%B0%B1%E4%B8%9A/C/webserver/4.1/%E7%BD%91%E7%BB%9C%E5%9F%BA%E7%A1%80.pdf 2.协议 UDP协议 TCP协议 源端口号&#xff1a;发送方端口号目的端口号&#xff1a;接收方端口号序…

Dubbo (1)

目录 认识RPC Dubbo 认识RPC RPC是解决不同JVM之间数据调用的一个思想&#xff0c;比如说现在有2台不同的机器&#xff0c;业务代码需要在这2台机器间调用后台业务代码&#xff0c;RPC就可以解决这2台机器业务代码调用的问题&#xff1a; 而RPC实现流程是什么样的呢&#xff…

中文版gpt-最新的人工智能gpt

最新的人工智能gpt 什么是GPT&#xff1f; GPT是一种自然语言处理和语言生成技术&#xff0c;它能够学习和理解自然语言&#xff0c;并生成高质量的文本。GPT是由OpenAI开发的&#xff0c;它采用了最新的深度学习技术&#xff0c;具备了强大的自我学习能力和语言理解能力。它…

Mybatis关联查询【附实战案例】

目录 相关导读 一、Mybatis一对一关联查询 1. 新增持久层接口方法 2. 新增映射文件对应的标签 3. 新增测试方法 4. 运行效果 二、Mybatis一对多关联查询 1. 新增持久层接口方法 2. 新增映射文件对应的标签 3. 新增测试方法 4. 运行效果 三、Mybatis多对多关联查询 …

HCL Nomad Web 1.0.7发布和新功能验证

大家好&#xff0c;才是真的好。 要问在HCL Notes/Domino系列产品中&#xff0c;谁更新得最快&#xff0c;那么答案一定是HCL Nomad Web。 你看上图右边&#xff0c;从1.0.1更新到1.0.7&#xff0c;都没花多少时间。 从HCL Nomad Web 1.0.5版本开始&#xff0c;可以支持直接…

逐浪智能时代,网易数帆“重写”低代码

如今&#xff0c;越来越多行业正驶入数字化转型的深水区&#xff0c;如何彻底释放数据生产力&#xff0c;成为所有企业的一道必答题。 4月25日&#xff0c;“网易数帆低代码业务战略发布会”在线上举行。在发布会上&#xff0c;网易数帆发布了CodeWave智能开发平台&#xff0c…

C#之Class的实例化过程

总目录 文章目录 总目录前言一、class的成员二、实例化顺序&#xff08;无继承情况&#xff09;1.声明时进行初始化2.在构造函数中初始化 三、实例化顺序&#xff08;有继承情况&#xff09;结语 前言 在平常开发的过程中&#xff0c;经常需要new 一个class&#xff0c;但是呢…

平安银行广州分行:以金融赋能慈善 释放更大社会效能

4月8日&#xff0c;平安银行广州分行“为爱徒步 欢乐‘益’起行”活动在广州市白云区钟落潭镇云溪湾新乡村示范带圆满举行。本次活动由平安银行广州分行主办&#xff0c;通过白云区供销合作联社组织&#xff0c;在助农过程中&#xff0c;同时公益捐步&#xff0c;助力建设云溪湾…

gitlab部署及整合Jenkins持续构建(三)sonarqube9.9安装和使用(一步一坑)

文章目录 postgresql13.0安装1、配置postgresql数据库2、进入postgresql创建数据库 代码质量管理平台--sonarqube安装1、前置依赖下载2、安装unzip并解压sonarqube并移动到/usr/local&#xff1a;3、修改sonarqube相应的配置4、新增用户&#xff0c;并将目录所属权赋予该用户&a…

资料链接 网络/系统/华为

网络&#xff1a; 缺省路由 https://www.cnblogs.com/ricksteves/p/9702546.html AC热备 快搜预览中心https://search.ruijie.com.cn:8447/rqs/preview.html?wdeHAiOjE1NDU4NzUxNDcsIm5iZiI6MTU0NTYxNTk0N302018092015272000303LqqZuvMhE7V7Ygl6r5RWsTHbWazT BGP https:…