2023-02-20干活小计:

news2025/2/24 18:17:14

所以我今天的活开始了:

In this paper, the authors target the problem of Multimodal Name Entity Recognition(MNER) as an improvement on NER(text only)

The paper proposes a multimodal fusion based on a heterogeneous graph of texts and images to make the representaion more consisten and to get a better representation of texts and images.the paper first constructs the heterogeneous graph with dynamic links between textual and visual nodes. Therefore the model could get the delicate regions in the images to cast light on the entities in the texts.On the heterogeneous and dynamic graph, the paper designs a simple and novel contrastive learning strategy to classify the graph as the auxiliary task. The strategy could also alleviate the negative effects of images.

Strong Points:
1.The main problems of MNRE are clearly pointed out such as introducing negative effects of images ,in the meanwhile the model is contrapuntally designed and works as the experiment show.
2.The proposed approach is pretty novel such as the two-stream graph transformer ,  the heterogeneous graph with dynamic links between textual and visual nodes and so on.
3.Overall, this paper is clearly written and well organized.
4.Well-rounded related work, and sufficient baseline methods to be compared.


Weak Points:
1.The part of Auxiliary Contrastive Learning can be expanded so that the readers can understand the Ablations better.
2.The part of Tagging could be more breif or be more elaborated if necessery.
3.In Abstract and Introduction the modalities voices are mentioned but they are not mentioned later.The author could talk about the future word as well as some difficulties encountered in the modalities voices.

Details:
1.The case of "Martin Garrix" could be used to explain the part of Two-Stream Mechanism so that the reader could understand better.
2.The authors can introduce the future work.The paper do not introduce the effect of other modalities such as voices , videos.
3.Some figures of cases can be showed in the part of  Auxiliary Contrastive Learning and the part of detailed analysis .Figures of cases should not only appear in the part of case studies.

一上午加下午就整这个去了,晚上还要去和老板吃饭。= =

回家看了一下深度学习的花书
.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/362038.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Maven】(一)5分钟做完 Maven 的安装与配置

1.前言 在安装Maven之前,先简单的介绍一下。 Maven 是一款构建工具,它抽象项目构建的生命周期并提供了一个标准的、跨平台的构建流程,让我们在各类操作系统的环境中,都只需要使用一个简单的指令(如 mvn clean instal…

网络安全态势感知研究综述

摘要:随着物联网、云计算和数字化的迅速发展,传统网络安全防护技术无法应对复杂的网络威胁。网络安全态势感知能够全面的对网络中各种活动进行辨识、理解和预测。首先分别对态势感知和网络安全态势感知的定义进行了归纳整理,介绍了网络安全态…

使用带有 Moveit 的深度相机来避免碰撞

文章目录 什么是深度相机?如何将 Kinect 深度相机添加到您的环境中在 Rviz 中可视化深度相机数据在取放场景中使用深度相机将深度相机与您的 Moveit 设置一起使用有很多优势。机器人可以避免未知环境中的碰撞,甚至可以对周围的变化做出反应。然而,将深度相机连接到您的设置并…

vue2组件

文章目录注册组件组件的理解为什么使用组件组件化组件化思想的应用复用组件注册组件创建组件构造器注册组件使用组件全局组件和局部组件全局组件局部组件组件的嵌套注册组件的语法糖组件命名组件名关于组件标签组件模板的分离写法组件的data必须是一个函数关于VueComponent组件…

华为电脑录屏,3个方法,轻松录屏

华为电脑录屏是一项非常实用的功能,可以帮助小伙伴轻松的记录和分享屏幕上的操作内容。华为电脑提供了内置的录屏工具,可以进行全屏录制,小伙伴也可以选择使用电脑QQ录屏功能和数据蛙录屏软件进行华为电脑录屏。让我们一起来了解一下华为电脑…

一文掌握人才盘点工具方法及步骤【附实用模板】

很多人认为人才盘点是HR的事情,作为项目经理和PMO基本上没有操心过?但是真正用人的人是你,为公司拿结果的人也是你,但是你从来没有盘点过有多少人,什么样的人可用?这些人的能力如何?潜力如何&am…

Windows启动docker客户端报错:Hardware assisted virtualization and enabled in the BIOS

报错内容 : 🌟1.在控制面板中点击 启用或关闭Windows功能🌟2.勾选如下复选框🌟3.Windows功能中没有Hyper-V复选框怎么办?(如果有请跳过此步骤)此时不同人的电脑还会出现没有Hyper-V选项的情况1.打开 Windows PowerShell,输入 sys…

pytest进阶之html测试报告

pytest进阶之html测试报告 目录:导读 前言 pytest-html生成报告 安装 生成报告 效果 错误用例截图 添加描述 小结 allure2生成报告 安装allure 安装pytest-allure-adaptor插件 生成xml格式报告 添加环境变量 运行allure生成报告 效果 总结 前言 …

【UnityAR相关】Unity Vuforia扫图片成模型具体步骤

1 资产准备 导入要生成的fbx模型(带有材质), 你会发现导入fbx的材质丢失了: 选择Standard再Extract Materials导出材质到指定文件夹下(我放在Assets->Materials了 ok啦! 材质出现了, 模型…

linux查看WWN号及常见问题解决

linux查看WWN号及常见问题解决查看WWN号查看WWID号查询常见问题查看WWN号 要查看CentOS 6.7版本的WWN号,可以执行以下步骤: 1.确保已经连接了存储设备。 lspci | grep -i fibre2.在终端中输入命令:lsscsi,然后按 Enter 键。该命令…

Nacos快速使用指南

简单例子:springboot快速集成nacos官方github文档命名空间是绝对隔离的。group之间可以通过配置实现跨 group访问配置中心Nacos config官方文档应用级别的默认配置文件名(dataId)dataId 的完整格式如下:${prefix}-${spring.profil…

【C++】thread|mutex|atomic|condition_variable

本篇博客,让我们来认识一下C中的线程操作 所用编译器:vs2019 阅读本文前,建议先了解线程的概念 👉 线程概念 1.基本介绍 在不同的操作系统,windows、linux、mac上,都会对多线程操作提供自己的系统调用接口…

Linux Crontab命令定时任务基本语法与操作教程

Linux Crontab命令定时任务基本语法与操作教程 一、Crontab查看编辑重启 1、查看crontab定时执行任务列表 crontab -l 2、编辑crontab定时执行任务 crontab -e 3、删除crontab定时任务 crontab -r 4、相关命令: sudo service crond start #启动服务 sudo …

图论详解——Bellman-Ford(清晰易懂)

开学第一周,晚上属实作业有点乱于是就拖更了一周今天我们来讲解一下图论最短路径算法中最简单最清晰易懂同时时间复杂度最高的算法它的时间复杂度能达到O(VE)(点的数量*边的数量)在学习Bellman-Ford之前,你需要先学会链式前向星大…

固态继电器与普通继电器的区别

固态继电器 固态继电器是一种全电子电路组合元件,它依靠半导体器件和电子元件的电磁和光学特性来完成其隔离和继电器开关功能。与传统的电磁继电器相比,固态继电器是一种没有机械和运动部件的继电器,但具有与电磁继电器基本相同的功能。 固…

经典布局 (flex和传统两种实现) 左右两栏式

1.混合浮动普通流 混合浮动普通流 父级&#xff1a;宽度固定 left:宽度固定。浮动起来 right:宽度和父级一样&#xff0c;设定margin-right:left的宽度px,宽度随父级变化而变化&#xff08;固定自适应&#xff09; <!DOCTYPE html> <html lang"en"> <…

超店有数,为什么商家要使用tiktok达人进行营销推广呢?

近几年互联网发展萌生出更多的短视频平台&#xff0c;而tittok这个平台在海外也越来越火爆。与此同时&#xff0c;很多商家也开始用tiktok进行营销推广。商家使用较多的方式就是达人营销&#xff0c;这种方法很常见且转化效果不错。那为什么现在这么多商家喜欢用tiktok达人进行…

Jmeter参数提取器-如何使用 json提取器及设置全局变量来调用

在jmeter接口测试的过程中&#xff0c;经常会遇到了需要关联参数的情况&#xff0c;在接口响应后&#xff0c;提取请求返回结果中的某个值或者某一组值&#xff0c;作为下一个接口的入参&#xff0c;例如token或者其他变量&#xff0c;需要设置成全局变量或者局部变量来给下个接…

边界检测方法总结

1&#xff1a;经典的边界检测方法有sobel&#xff0c;拉普拉斯&#xff0c;canny等。 sobel&#xff1a; def get_sobel(in_chan, out_chan):filter_x np.array([[1, 0, -1],[2, 0, -2],[1, 0, -1],]).astype(np.float32)filter_y np.array([[1, 2, 1],[0, 0, 0],[-1, -2, -…

如何使用 ChatGPT 编写 SQL JOIN 查询

通过清晰的示例和解释&#xff0c;本文展示了 ChatGPT 如何简化和简化创建复杂 MySQL 查询的过程&#xff0c;使用户更容易与数据库交互并检索他们需要的数据。无论您是初学者还是经验丰富的开发人员&#xff0c;本文都提供了有关如何利用 ChatGPT 来增强您的 MySQL 查询编写技…