基于结构化跨模态表示一致性的临床辅助结直肠息肉识别

news2025/4/2 17:16:19

文章目录

Toward Clinically Assisted Colorectal Polyp Recognition via Structured Cross-Modal Representation Consistency
- 摘要
- 本文方法
- - Shared Transformer Block
  - Cross-Modal Global Alignment
  - Spatial Attention Module
- 实验结果

Toward Clinically Assisted Colorectal Polyp Recognition via Structured Cross-Modal Representation Consistency

摘要

背景
结直肠息肉的分类是一项重要的临床检查。为了提高分类精度，大多数计算机辅助诊断算法都采用窄带成像（NBI）来识别结肠息肉。然而，在实际临床场景中，NBI通常缺乏利用，因为当通过使用白光（WL）图像检测到息肉时，该特定图像的采集需要手动切换光模式。为了避免上述情况，提出了一种新的方法，通过进行结构化的跨模态表示一致性，直接实现白光结肠镜图像的精确分类

本文方法
在实践中，一对多模态图像，即NBI和WL被送到共享Transformer中以提取分层特征表示。然后，采用一种新设计的空间注意力模块（SAM）来计算特定模态图像的类标记和patch标记之间的相似性。

通过在不同级别对齐成对的NBI和WL图像的类标记和空间注意力图，Transformer实现了保持上述两种模态的全局和局部表示一致性的能力
代码地址

本文方法

在这里插入图片描述
我们提出的通过单个Transformer架构的跨模态共享结肠息肉识别框架以及提出的CGA和SAM的概述。注意，在推理阶段，所有由虚线连接的部分都可以删除

Shared Transformer Block

将双模态分别送入到transformer主干中
在这里插入图片描述

Cross-Modal Global Alignment

计算两个配对图像的两个模态特定类标记（class token）之间的余弦差。然后，对它们的余弦相似性施加损失函数会减少两种模态的图像对之间的平均余弦距离。这样，来自配对图像的特征表示可以更紧密地匹配，并且模型可以学习从NBI图像捕获硬特征（例如，在NBI图像中清晰但在WL图像中不清楚的纹理）。
在这里插入图片描述

Spatial Attention Module

尽管模态特定的类标记是全局对齐的，但我们也提出了空间注意力模块（SAM）来追求两种模态之间的多级结构化语义一致性。首先，我们通过SAM获得全局引导的亲和力，即每个图像的全局表示和局部区域之间的响应图。随后，我们通过限制两种模态的响应图之间的距离来调整两种模态之间的局部语义。

输出patchtoken特征{Fw，Fn}∈RN×d以及模态特定类标记{cw，cn}∈Rd作为输入，利用{Fw、Fn}通过线性投影来生成空间注意力（SpA）操作的key，而SpA的query是基于{cw，cn}获得的，描述如下
在这里插入图片描述

总损失为下面：

实验结果

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/509341.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Liunx下pip3换源（最详细）

Liunx下pip3换源（最详细）

在使用python时我们经常会安装各种包，我们一般安装的方式都是pip3 install xx模块，但是pip3默认源https://pypi.org/安装的过程非常慢，可能都是几k几k的，有时安装这安装着，直接error了，还有一种情况是直接飘…

阅读更多...

BSR：Block compressed Sparse Row matrix format

BSR：Block compressed Sparse Row matrix format

BSR块压缩存储是CSR行压缩存储的升级变形；可以降低图数据存储空间。有以下图的矩阵表示： 一、CSR表示 rowIndex [0 4 8 10 12 16 20] columns [0 1 2 3 | 0 1 2 3 | 2 3 | 2 3 | 2 3 4 5 | 2 3 4 5] values …

阅读更多...

倒计时 1 天：Tapdata LDP V3 发布会预告，看实时数据集成平台如何赋能企业 AI 落地

倒计时 1 天：Tapdata LDP V3 发布会预告，看实时数据集成平台如何赋能企业 AI 落地

更多 LDPAI 场景细节，敬请期待 5 月 10 日（今天）的 Tapdata 发布会。最近几个月，AI 领域可谓经历了近十年以来最为魔幻且不可思议的时刻。自 ChatGPT 发布以来，无论是底层大模型、训练框架、应用框架还是 GPT 插件等…

阅读更多...

如何将m4v转换成mp4格式？这些方法极速无损

如何将m4v转换成mp4格式？这些方法极速无损

如何将m4v转换成mp4格式？众所周知，M4V文件格式是一个由苹果公司开发的视频文件格式，它通常用于iTunes Store中售卖和租赁的电影、电视节目等内容。但是，在某些情况下，我们可能无法在其他设备或软件上播放M4V文件&#…

阅读更多...

2023年杭州助理工程师职称申报要求和申报材料是什么呢？

2023年杭州助理工程师职称申报要求和申报材料是什么呢？

一、杭州助理工程师职称申报条件要求： 1、中专学历毕业后，任技术员满四年或未认定技术员参加工作满六年，必须参加考核，考试合格才能成为助理级职称资格 2、大专学历毕业后，三年工作经验，考核合格&#xf…

阅读更多...

【AWS入门】利用CloudWatch监控EC2的CPU负载情况

【AWS入门】利用CloudWatch监控EC2的CPU负载情况

创建一个 EC2 实例 User data 配置如下 #!/bin/bash sudo -i amazon-linux-extras install epel -y yum install stress -y导航到 Cloudwatch->Metrics->All metrics-EC2->Per-Instance Metrics,选中创建的 EC2的 CPU 利用率，点击铃铛标识创建 alarm 设…

阅读更多...

以实战学习pandas使用方式：统计考生成绩统计及分布

以实战学习pandas使用方式：统计考生成绩统计及分布

以实战学习pandas使用方式：统计考生成绩统计及分布引子需求逐步实现使用 pandas 读 excel初始化一些数据获取 excel 列名获取总表的统计数据分班级数据各科目比率统计统计名次分布写入文件小结引子老顾日常工作，是用不到 python 的，所以…

阅读更多...

vue-admin-template中vue动态路由不显示问题解决

vue-admin-template中vue动态路由不显示问题解决

使用的的是vue-admin-template，这是一个极简的 vue admin 管理后台，它只包含了 Element UI & axios & iconfont & permission control & lint，这些搭建后台必要的东西。需要根据自己的需求二次开发。线上地址:vue-admin-tem…

阅读更多...

【操作系统】进程调度

【操作系统】进程调度

目录调度的概念调度目标所有系统批处理系统交互式系统实时系统调度算法非抢占式调度算法先来先服务最短作业优先非抢占式优先级调度抢占式调度算法最短剩余时间优先轮转调度抢占式优先级调度多级反馈队列彩票调度公平分享调度调度的概念进程是资源分配…

阅读更多...

Windows Nvm安装

Windows Nvm安装

前言在windows系统下安装的是nvm-windows，nvm只支持安装在在Linux和Mac系统下。之前在Linux上安装过，最近在Windows上安装，特记录一下。下载下载地址：传送门安装双击exe文件，选定安装路径，下一步…

阅读更多...

在外SSH远程连接macOS服务器【cpolar内网穿透】

在外SSH远程连接macOS服务器【cpolar内网穿透】

文章目录前言1. macOS打开远程登录2. 局域网内测试ssh远程3. 公网ssh远程连接macOS3.1 macOS安装配置cpolar3.2 获取ssh隧道公网地址3.3 测试公网ssh远程连接macOS 4. 配置公网固定TCP地址4.1 保留一个固定TCP端口地址4.2 配置固定TCP端口地址 5. 使用固定TCP端口地址ssh远程 …

阅读更多...

动态库和静态库的使用

动态库和静态库的使用

一、什么是库？ 库是一种可执行代码的二进制形式，可以被操作系统载入内存执行。就是将源代码转化为二进制格式的源代码，相当于进行了加密，别人可以使用库，但是看不到库中的内容。常见的库类型共享库静态库动态库…

阅读更多...

数据管理证书有哪些？DAMA-CDGA/CDGP含金量高

数据管理证书有哪些？DAMA-CDGA/CDGP含金量高

DAMA认证为数据管理专业人士提供职业目标晋升规划，彰显了职业发展里程碑及发展阶梯定义，帮助数据管理从业人士获得企业数字化转型战略下的必备职业能力，促进开展工作实践应用及实际问题解决，形成企业所需的新数字经济下的核心职业…

阅读更多...

小度即将推出智能手机产品，醉翁之意意在何为？

小度即将推出智能手机产品，醉翁之意意在何为？

5月8日，智哪儿从相关渠道获悉，小度即将于5月下旬发布首款智能手机产品。小度科技通过公开渠道确认了上述信息并透露将于下周披露更详细的产品信息。根据市场调查机构Counterpoint Research公布的最新报告，2023年第一季度全球智能手机市场出货…

阅读更多...

巩飞：构建自治智能的数据库云管平台，加速国产数据库应用进程

巩飞：构建自治智能的数据库云管平台，加速国产数据库应用进程

导语 4月8日下午，为期两天的第十二届数据技术嘉年华（DTC 2023）在北京新云南皇冠假日酒店圆满落下帷幕。大会以“开源融合数字化——引领数据技术发展，释放数据要素价值”为主题，汇聚产学研各界精英到场交流。云和恩墨数…

阅读更多...

什么是医学影像PACS系统？PACS系统功能有哪些？作用有哪些？对接哪些设备？业务流程是什么？

什么是医学影像PACS系统？PACS系统功能有哪些？作用有哪些？对接哪些设备？业务流程是什么？

一、什么是医学影像PACS系统 PACS：为Picture Archive and CommunicationSystem的缩写，是图象归档和通讯系统。PACS系统应用在医院影像科室的系统，主要的任务就是把日常产生的各种医学影像（包括核磁，CT，超声…

阅读更多...

入门PyTorch的学习路线指南

入门PyTorch的学习路线指南

PyTorch是目前最受欢迎的深度学习框架之一，它具有易于使用、灵活性强、支持动态图等优点，因此备受研究者和工程师的青睐。如果你想学习PyTorch，下面是一个入门PyTorch的学习路线。学习基础知识： 学习Python编程语言：…

阅读更多...

从入门到精通：教你如何使用Page Object模式提高WebUI自动化测试质量

从入门到精通：教你如何使用Page Object模式提高WebUI自动化测试质量

目录前言什么是Page Object模式？ 如何编写Page Object模式测试脚本？ 步骤1：创建页面对象类步骤2：编写测试用例步骤3：运行测试用例总结前言在进行Web应用程序开发的时候，我们经常需要进行自动…

阅读更多...

前端工程化搭建私有组件库组件从开发到发布私有npm仓库的全过程

前端工程化搭建私有组件库组件从开发到发布私有npm仓库的全过程

前言基于Vue3.0 TS的组件从开发组件库到发布私有npm仓库的全过程环境这里列出本文所使用的环境版本 vue 3.0 vue/cli 4.5.9 nodeJs 14.15.1 npm 6.14.8 vue --version vue/cli 4.5.9 npm -v 6.14.8 node -v v14.15.1 步骤创建项目使用 vue-cli 创建一个 vue3 项目&a…

阅读更多...

震坤行工业超市建设数字化采购供应链的实践

震坤行工业超市建设数字化采购供应链的实践

震坤行工业超市建设数字化采购供应链的实践行业洞察： 【行业洞察】是震坤行工业超市新媒体推出的专注于行业思考主题栏目。在这里，您可以收获：行业专家对于新理念、新模式、新技术的深度洞见，关于企业采购实操的干货分享。本…

阅读更多...

推荐文章

最新文章