AI在医学领域:Arges框架在溃疡性结肠炎上的应用

news2024/11/20 16:33:46

      溃疡性结肠炎(UC)是一种慢性炎症性肠病(IBD),在全球大约影响着500万人,导致肠道炎症和溃疡。在UC的临床试验中,通常通过内窥镜视频来评估结肠疾病的严重程度,并使用如Mayo内窥镜下分数(MES)和溃疡性结肠炎内窥镜严重指数(UCEIS)等标准评分系统来衡量。专家对视频的人工评估既耗时又容易受到评估者间差异的影响,这强调了自动化解决方案的必要性。然而,自动化内窥镜疾病评分面临着独特的挑战:

  • 在临床环境中,疾病评分并非常见做法,因此标注数据稀缺;
  • 在临床试验中,数据通常在视频级别进行标注,这挑战了基于帧的全监督网络的使用;
  • 由于视频通常很长,时长超过30分钟,对所有视频帧进行标注以及将完整视频作为3D CNN和LSTM的输入是具有挑战性的。此外,最近的发现表明,时间意识对于手动和算法疾病评分是一个重要组成部分,这表明需要超越静态的、基于帧的模型。

   本文介绍一个深度学习框架Arges,用于从内窥镜视频中对UC疾病进行表征。它包括一个基础SSL编码器(ArgesFM),后面跟着一个下游分类器(ArgesMES/ArgesUCEIS),用于估计每个视频的疾病严重程度得分。

1 数据和方法

1.1 Arges框架

Arges框架的组成

1.1.1 基础模型(ArgesFM)

目的: 提取视频帧的特征,为下游任务提供通用的表示。

模型架构: 基于自监督学习(SSL)的视觉Transformer(ViT-Base)。采用视觉变换器(ViT-Base)作为编码器,通过自注意力机制捕捉帧内的空间关系。

预训练方法: 使用DINOv2算法进行预训练,通过知识蒸馏的方式学习图像特征。

​​​​​​​1.1.2 下游分类器

目的: 利用ArgesFM提取的特征,评估视频级别的UC严重程度。

模型架构: 基于Transformer的网络结构,包含位置编码和时间注意力机制。

聚合方法: 使用基于注意力的多实例学习(MIL)聚合器,将视频帧的特征聚合为视频级别的表示。

下游分类器包括ArgesMES和ArgesUCEIS两个部分。

  • ArgesMES:用于估计Mayo内窥镜下分数(MES)。
  • ArgesUCEIS:用于估计Ulcerative Colitis Endoscopic Index of Severity (UCEIS)的三个组成部分得分,包括出血、糜烂和血管模式。

1.2 数据集

来自四个临床试验的IBD内镜视频数据,包括两个UC试验和两个CD试验。

  • 规模: 超过71M帧,是迄今为止最大的IBD数据集。
  • 内容: 包括视频级别的MES和UCEIS评分标签,以及用于模型预训练的未标注数据。
  • 特点: 数据集涵盖了不同地区、不同严重程度的IBD患者,具有高度的多样性和代表性。

1.3 训练过程

1.3.1 数据分割

将来自两个UC和两个CD临床试验的数据划分为80%的训练集和20%的测试集,用于模型训练和评估。

1.3.2 数据预处理

  • 视频被转换成帧,速率为每秒30帧。
  • 每帧的大小被调整为224x224像素,并使用ImageNet的标准化值进行归一化处理。
  • 原始视频的分辨率变化范围在640x510到1280x960之间。

1.3.3 训练细节

  • ArgesFM在4个A10G GPU上训练了300,000次迭代,使用1个全局裁剪(224x224x3)和8个局部裁剪(96x96x3),批次大小为256。
  • 下流任务中,独立训练了四个下游分类器模型,用于估计MES(ArgesMES)和三个UCEIS(ArgesUCEIS)组成部分得分。
  • 训练了15个周期,学习率为10^-4,权重衰减为10^-5,在1个A10G GPU上进行。
  • 使用多类别交叉熵损失和加权采样来解决数据中的类别不平衡问题。

2 实验和结果

2.1 实验设置

2.1.1数据集

使用来自两个UC和两个CD临床试验的数据集,包括61M帧的训练数据和20%的测试数据。

2.1.2 模型

  • ArgesFM: 使用ViT-Base作为编码器,DINOv2进行预训练。
  • ArgesMES/ArgesUCEIS: 使用Transformer作为下游分类器,包含位置编码和时间注意力机制,以及基于注意力的MIL聚合器。

2.1.3基准模型

  • 基于CNN的WSL模型: WSL(弱监督学习)CDW-CE改进的交叉熵损失函数
  • 基于SSL的模型: EndoFM

2.1.4 评估指标

使用F1分数和加权Cohen Kappa系数评估模型性能。

2.2 实验结果

  • MES评分: ArgesMES在测试集和前瞻性数据上均优于SOTA模型,F1分数提升4.1%。
  • UCEIS评分: ArgesUCEIS在测试集和前瞻性数据上均优于基于CNN的WSL模型,F1分数提升显著。
  • 模型泛化能力: 所有模型在未见过的前瞻性数据上均表现出非劣效的F1分数,证明模型的泛化能力。
  • 模型解释性: 基于注意力的MIL聚合器能够提供“高注意力”区域,便于临床解释和模型质量控制

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2185682.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

leetcode_198_打家劫舍

思路:首先定义一个数组对于dp[i]读作1->i能获取的最大利益,第i个房屋只有"偷"和不"偷"两种情况,分别进行讨论 "偷": 既然"偷"了 i那就肯定不能偷i-1了,但是为了使"偷"的尽可能多除了必…

Microsoft 解釋修改後的 Recall 將如何保障隱私與安全

Microsoft 為 Copilot AI 電腦推出的 Recall 功能,本意是藉由定期進行螢幕截圖,並分析上面的資訊,來協助用戶找到查看過的網頁、工作過的文件等各種資訊。然而雖然立意很好,但 Microsoft 推出之初似乎完全沒有考慮到用戶的隱私安全…

多区域OSPF路由协议

前言 之前也有过关于OSPF路由协议的博客,但都不是很满意,不是很完整。现在也是听老师讲解完OSPF路由协议,感触良多,所以这里重新整理一遍。这次应该是会满意的 一些相关概念 链路状态 链路指路由器上的一个接口,链路状…

Pikachu-Cross-Site Scripting-DOM型xss

DOM型xss DOM型XSS漏洞是一种特殊类型的XSS,是基于文档对象模型 Document Object Model (DOM)的一种漏洞。是一个与平台、编程语言无关的接口,它允许程序或脚本动态地访问和更新文档内容、结构和样式,处理后的结果能够成为显示页面的一部分。 dom就是一…

【微服务】初识(day1)

基础概念 集群 集群是将一个系统完整的部署到多个服务器,每个服务器提供系统的所有服务,多个服务器可以通过负载均衡完成任务,每个服务器都可以称为集群的节点。 分布式 分布式是将一个系统拆分为多个子系统,多个子系统部署在…

LeetCode[中等] 279.完全平方

给你一个整数 n ,返回 和为 n 的完全平方数的最少数量 。 完全平方数 是一个整数,其值等于另一个整数的平方;换句话说,其值等于一个整数自乘的积。例如,1、4、9 和 16 都是完全平方数,而 3 和 11 不是。 1…

【转载翻译】消息队列 - ActiveMQ、RabbitMQ、Kafka、ZeroMQ

转载自本人博客:【转载翻译】消息队列 - ActiveMQ、RabbitMQ、Kafka、ZeroMQ 转载自:The System Design Cheat Sheet: Message Queues - ActiveMQ, RabbitMQ, Kafka, ZeroMQ 本文由 Aleksandr Gavrilenko 发布于2023年12月21日 1. 前言 消息队列是异步服…

NASA:ATLAS/ICESat-2 L3B 平均内陆地表水数据 V002

目录 简介 摘要 代码 引用 网址推荐 0代码在线构建地图应用 机器学习 ATLAS/ICESat-2 L3B Mean Inland Surface Water Data V002 ATLAS/ICESat-2 L3B 平均内陆地表水数据 V002 简介 ATLAS/ICESat-2 L3B Mean Inland Surface Water Data V002是由NASA的ICESat-2 (Ice,…

JavaScript break与continue语句

break语句和continue语句都具有跳转作用&#xff0c;可以让代码不按既有的顺序执行。 break break语句用于跳出代码块或循环 for(i0;i<100;i){if(i5){break;}console.log(i);} continue continue语句用于应即终止本轮循环,返回循环结构的头部&#xff0c;开始下一轮循环。…

【从零开始实现stm32无刷电机FOC】【实践】【7.2/7 完整代码编写】

目录 stm32cubemx配置芯片选择工程配置stm32基础配置SPI的配置定时器的配置ADC的配置中断优先级的配置生成工程 工程代码编写FOC代码结构搭建电机编码器角度读取PWM产生FOC开环代码编写确定电机正负旋转方向电机旋转速度计算多圈逻辑角度电流采样极对数转子角度确定 闭环控制控…

两个月冲刺软考——网络与信息安全知识

1. 什么是网络监听&#xff1f; 网络监听是主机的一种工作模式&#xff0c;在这种模式下&#xff0c;主机可以接收到本网段在同一条物理通道上传输的所有信息。 2. 客户端与服务器建立连接的步骤 域名解析 建立TCP连接 发送HTTP请求 服务器处理请求 发送HTTP响应 客户端…

uniapp 上了原生的 echarts 图表插件了 兼容性还行

插件地址&#xff1a;echarts - DCloud 插件市场 兼容性这块儿不知道后期会不会支持其他浏览器 H5 的话建议可以用原生的不用这个插件

【单片机】单片机map表详细解析

1、RO Size、RW Size、ROM Size分别是什么 首先将map文件翻到最下面&#xff0c;可以看到 1.1 RO Size&#xff1a;只读段 Code&#xff1a;程序的代码部分&#xff08;也就是 .text 段&#xff09;&#xff0c;它存放了程序的指令和可执行代码。 RO Data&#xff1a;只读…

二叉树进阶练习——根据二叉树创建字符串

1.题目解析 题目来源&#xff1a;606.根据二叉树创建字符串 测试用例 2.算法原理 根据上面的题目我们知道这里需要根据前序遍历来创建字符串&#xff0c;并且需要将每棵子树使用括号括起来&#xff0c;但是要根据实际情况省略括号&#xff0c;比如当右子树为空左子树为空就可…

基于opencv-C++dnn模块推理的yolov5 onnx模型

前言 由于最近手边的项目要求&#xff0c;本人需要在一块算力吃紧的板端上部署yolov5目标检测模型&#xff08;纯CPU推理&#xff09;&#xff0c;考虑到python在板端上的运行速率和其运行时所占内存过大&#xff0c;因此使用torch.hub.load对训练好后的pt模型进行加载和运行不…

rtmp协议转websocketflv的去队列积压

websocket server的优点 websocket server的好处&#xff1a;WebSocket 服务器能够实现实时的数据推送&#xff0c;服务器可以主动向客户端发送数据 1 不需要客户端不断轮询。 2 不需要实现httpserver跨域。 在需要修改协议的时候比较灵活&#xff0c;我们发送数据的时候比较…

使用默认不可变的Rust变量会踩什么坑

讲动人的故事&#xff0c;写懂人的代码 Rust的变量真的是名不副实。名字中明明有个“变”字&#xff0c;却默认不可变。还美其名曰“不可变变量”。要想让变量名副其实&#xff0c;还必须费心额外加个mut关键字&#xff0c;并必须称其为“可变变量”&#xff0c;才能与前者区分…

对比学习与图像去雾在24TIP和CVPR经典图像去雾论文中的良好结合,展示出模型良好的泛化能力(本期内容较详细 多)

今天主要内容是图像去雾&#xff0c;对比学习&#xff0c;无监督学习&#xff0c;要分享的三篇论文分别是&#xff1a; 21CVPR Contrastive Learning for Compact Single Image Dehazing 24 TIP UCL-Dehaze: Toward Real-World Image Dehazing via Unsupervised Contrastive Le…

stm32f103调试,程序与定时器同步设置

在调试定时器相关代码时&#xff0c;注意到定时器的中断位总是置1&#xff0c;怀疑代码有问题&#xff0c;经过增大定时器的中断时间&#xff0c;发现定时器与代码调试并不同步&#xff0c;这一点对于调试涉及定时器的代码是非常不利的&#xff0c;这里给出keil调试stm32使定时…

HTB:Vaccine[WriteUP]

目录 连接至HTB服务器并启动靶机 1.Besides SSH and HTTP, what other service is hosted on this box? 2.This service can be configured to allow login with any password for specific username. What is that username? 3.What is the name of the file downloaded…