多模态分割医学数据集小调研

news2024/11/17 11:01:22

 QaTa-COV19 

V1: 该数据集由4603张COVID-19胸部x光片组成;该数据集首次包含了用于COVID-19感染区域分割任务的真值分割掩码。加上对照组的胸部x光片,QaTa-COV19由120,968张图像组成。图像位于“QaTa-COV19/ images /”文件夹下,ground-truth分割蒙版位于“QaTa-COV19/Ground-truths/”文件夹下。在4603张图像中,其中2951张具有相应的ground-truth分割掩码,其格式为mask_FILENAME.png。

V2:    Qatar - cov19数据集扩展,该数据集由9258张COVID-19胸部x射线组成,其中包括用于COVID-19感染区域分割任务的ground-truth分割掩码。图像具有相应的真值分割掩码,可以在mask_FILENAME.png中找到。(目前LViT和Ariadne’s Thread都是拿这个训练的,其中LViT的一个创新点就是为这个数据集添加了文字批注,Ariadne’s Thread的一个创新点就是人为修正了LViT的批注的一些错误)

Early-QaTa-COV19:该数据集是QaTa-COV19数据集的一个子集,该数据集由1065张胸部x光片组成,其中包括无或有限症状的COVID-19肺炎病例,用于早期发现COVID-19。

Control_Group: 控制组的胸部x光片可以在Control_Group/文件夹下找到。在这个文件夹中有两个控制组。对照组i仅包括12,544张正常(健康)胸部x光片。另一方面,对照组ii包括116,365张正常胸部x线片和14张不同胸部疾病图像。在Control Group II中,CHESTXRAY-14文件夹包括CHESTXRAY-14数据集的训练集和测试集。除此之外,小儿患者的细菌性和病毒性肺炎也可以在这个文件夹中找到。

文本+图像

我直接随机抽取几个图片,mask和几个描述

covid_1.png

Bilateral pulmonary infection, two infected areas, all left lung and middle lower right lung.

双侧肺部感染,两处感染区,均为左肺和右肺中下。

 covid_1043.png

Unilateral pulmonary infection, one infected area, middle left lung.

单侧肺部感染,一个感染区,左肺中部。

 

covid_1238.png

Unilateral pulmonary infection, one infected area, lower right lung.

单侧肺部感染,一个感染区域,右下肺。

 mask_covid_1423.png

Bilateral pulmonary infection, two infected areas, all left lung and all right lung.

双侧肺部感染,两个感染区域,左肺和右肺都感染了。

再来点纯文本描述↓

双侧肺部感染,两个感染区域,全部在左肺和中下部右肺。
双侧肺部感染,两个感染区域,全部在左肺和全部在右肺。
双侧肺部感染,两个感染区域,下部左肺和上部中下部右肺。
单侧肺部感染,一个感染区域,下部右肺。
双侧肺部感染,两个感染区域,下部左肺和中下部右肺。
单侧肺部感染,一个感染区域,下部左肺。
双侧肺部感染,三个感染区域,全部在左肺和上部中下部右肺。
单侧肺部感染,一个感染区域,中部右肺。
单侧肺部感染,一个感染区域,中下部左肺。
双侧肺部感染,三个感染区域,上部中下部左肺和全部在右肺。
双侧肺部感染,两个感染区域,中下部左肺和下部右肺。
双侧肺部感染,两个感染区域,下部左肺和下部右肺。
双侧肺部感染,三个感染区域,上部中下部左肺和上部中下部右肺。
双侧肺部感染,两个感染区域,上部中下部左肺和下部右肺。
双侧肺部感染,四个感染区域,上部中下部左肺和上部下部右肺。
单侧肺部感染,一个感染区域,中部左肺。

然后在看文本标签的时候发现其实里面大部分都是重复的,虽然七千多条数据但是只有三百多种标注,gpt总结一下它们的特征大概是↓

它们都涉及肺部感染,描述了感染的部位和区域,包括单侧感染和双侧感染,感染区域的位置(上、中、下)以及左右肺叶的涉及。这些描述中包含了不同的感染情况和位置组合。


关于语言描述这块:

模型在给出包含更详细位置信息的文本提示符时获得了更好的分割性能。

同时,当使用两种类型的文本提示时,即Stage3单独和Stage1 + Stage2 + Stage3性能几乎相同。这意味着文本提示中最详细的位置信息对提高分割性能起着最重要的作用。但这并不意味着文本提示符中其他粒度的位置信息对分割性能的改善没有贡献。即使输入文本提示只包含最粗略的位置信息(Stage1 +)在表3中的Stage2项中,我们提出的方法比没有文本提示的方法获得的Dice分数高1.43%
 

tips

(1)值得一提的是,多模态训练方法对数据量要求不算高 

SIIM-ACR

SIIM-ACR Pneumothorax Segmentation | Kaggle

呃呃,这个数据集寄了

COVID Rural

Chest Imaging with Clinical and Genomic Correlates Representing a Rural COVID-19 Positive Population (COVID-19-AR) 事实上,文献表明,关于农村人口COVID-19结局的数据非常有限,而已经确定的是,这些人群的关键合并症的表达差异很大。我们发表了一组COVID-19检测呈阳性患者的放射学和CT成像研究。每位患者都有一组有限的临床相关数据,包括人口统计学、合并症、选定的实验室数据和关键的放射学发现。这些数据与从同一种群的临床分离株中提取的SARS-COV-2 cDNA序列数据交联,并上传到Genbank存储库。我们相信这个集合将有助于定义适当的相关数据,并从这个通常代表性不足的人群中为全球研究界提供样本。

这个数据集在文章LoVT中使用过,因为下载太麻烦所以我摆烂不找图片了,反正跟文本描述关系也不是很大

文本

然后这是它的文本描述:

 第一行从左到右描述依次是:

病人ID 年龄 性别 种族 邮编 最新BMI 最新体重 最新身高 结核病 系统性红斑狼疮 类风湿性关节炎 广泛烧伤 脾切除术 脾功能减低 麻疹 巨细胞病毒感染 水痘 带状疱疹 营养不良 目前怀孕 慢性肾脏疾病 糖尿病类型I 糖尿病类型II 器官移植 透析前诊断 透析后诊断 癌症 COVID检测阳性 检测名称 ICU入院 ICU入院次数 死亡率

我寻思这种数据收集得挺不容易的,所以真要创新我还是优先考虑第一种

继续是脑部的调研↓这里是纯图像无文本的

汇总

CADA

该数据集显示对比度增强的脑血管树和一个或多个动脉瘤种子点。此外,分割掩码以NIFTI (.nii.gz)掩码图像和STL (. STL)几何文件两种形式提供,并被视为ground truth。

格式:MRI

Brain US

Brain US Dataset | Papers With Code

这个大脑解剖分割数据集有1300个2D美国扫描用于训练,329个用于测试。在2010年至2016年期间接受治疗的20名不同的受试者(年龄为1岁)共获得1629张体内b型US图像。该数据集包含有IVH和没有IVH的受试者(健康受试者,但有发生IVH的风险)。美国扫描是使用飞利浦美国机器与C8-5宽带弯曲阵列换能器收集的,使用冠状和矢状扫描平面。对于每个收集到的图像,由专家超声仪手动分割心室和膈膜。我们将这些图像随机分成1300张训练图像和329张测试图像进行实验。请注意,这些图像的大小为512 × 512。

best:88.840

格式:DICOM

BRaTS

格式:MRI

BRaTS 2021 Task 1 Dataset | Kaggle

2021

BRaTS 2021 Task 1 Dataset | Kaggle

BraTS2021脑肿瘤分割实战_宁远x的博客-CSDN博客

BraTS 2021脑肿瘤分割数据集介绍_brats 数据集_黄渡猿的博客-CSDN博客

2019

BRATS 2019 Benchmark (Brain Tumor Segmentation) | Papers With Code

acc:0.817

BRATS 2018 Benchmark (Brain Tumor Segmentation) | Papers With Code

acc:0.870

BraTS每个病例包含四个模态的磁共振成像(Magnetic Resonance Imaging,MRI),每个模态的维度为240×240×155(L×W×H)

四种模态:

T1

T1成像,利于观察解剖结构,病灶显示不够清晰

T1ce

在受试者做磁共振之前向血液内注射造影剂,使成像中血流活跃的区域更加明显,是增强肿瘤的重要判据

T2

T2成像,病灶显示较为清晰,判断整颗肿瘤

FLAIR

T2压水像(抑制脑脊液的高信号),含水量大则更亮眼,可以判断瘤周水肿区域

ATLAS

转存失败重新上传取消Examples of segmentation results on ATLAS dataset. The rows show the... |  Download Scientific Diagram

2.0

Home - Grand Challenge

dice:0.610 ± 0.260 

该挑战的目标是经验评估MR图像中病变分割的自动化方法。参与者的任务是自动生成T1w MR图像的病灶分割蒙版。

ISLES

都刷到96了,没必要

BrainPTM

Brainptm-2021 - Grand Challenge

 白质束的准确定位是神经外科手术计划和导航成功的关键

MRI

mean dice score 0.7249

Instance

Home - Grand Challenge

我们从10名经验丰富的放射科医生那里收集了200个带有精细标签的3D volume,100个用于训练数据集,70个用于封闭测试数据集,30个用于开放的验证数据集。采用DSC、HD、RVD作为分割的评价指标。这一挑战也将促进颅内出血治疗、研究者之间的互动和跨学科的交流。

 

DSC、HD、RVD:0.7953 ± 0.1718

看到这里感觉最合适的数据集是X光的,然后其实MRI也不错,不过之前没人做过倒是可能会有数据对齐的问题,这里确实可以琢磨琢磨。图片多模态的暂时就先不考虑了(?)

BONBID-HIE2023

Data - Grand Challenge

今年才开始的新任务,新比赛

缺氧缺血性脑病的波士顿新生儿脑损伤数据集

脑MRI中与hie相关的脑异常通常是弥漫性的(即多灶性),并且很小(超过一半的患者病变占脑体积的<1%)。HIE MRI数据的分割与其他分割任务(如具有大病灶和局灶性病变的脑肿瘤)明显不同,并且可以说比其他分割任务更具挑战性。例如,到目前为止,与U-Net和其他最先进的关于这种疾病的出版物的Dice重叠率保持在0.5左右,而脑肿瘤的Dice重叠率超过0.8。为实现准确的早期预后和医疗诊断,这是一项迫切但尚未得到满足的需求

数据集内容:
1ADC_ss:颅骨剥离表观扩散系数(ADC)图。
2Z_ADC: ZADC映射。
3LABEL:专家病变注释。

0.6115 ± 0.2567

好了又查了一圈脑部确实没有X光的数据集,现在要去看MRI怎么和文本对齐了。否则就Brain US的超声图像。

现在MRI面对的问题是现有CVPR2023的唯二的两篇3d多模态都是基于点云的,有点盲区了。但是个人认为还是能通过非点云方式解决的,主要是参考它数据对齐的方式

然后超声的那个应该是小孩子在子宫里的大脑,没有一个相对固定的位置,所以很难定位。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/888834.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

selector.replaceAll is not a function报错问题

个人项目地址&#xff1a; SubTopH前端开发个人站 &#xff08;自己开发的前端功能和UI组件&#xff0c;一些有趣的小功能&#xff0c;感兴趣的伙伴可以访问&#xff0c;欢迎提出更好的想法&#xff0c;私信沟通&#xff0c;网站属于静态页面&#xff09; SubTopH前端开发个人站…

Leetcode49. 字母异位词分组

给你一个字符串数组&#xff0c;请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。 字母异位词 是由重新排列源单词的所有字母得到的一个新单词。 解题思路&#xff1a;计数 思路&#xff1a;题意是字符串的字符都是小写&#xff0c;可以对每个字符串统计其中字符的…

什么是公网、私网、内网、外网?

中午好&#xff0c;我的网工朋友。 最近经常有很多小白朋友在问&#xff0c;公网、私网、内网、外网&#xff0c;这些的概念是啥样的&#xff0c;又该怎么去界定。 关于IP地址&#xff0c;确实没有太明确的区分&#xff0c;其实也不必太过咬文嚼字。 内网、外网就是一个参考…

SAP复杂表格转换为JASON格式的例子

分享一个三层表格转换伙JASON格式的例子&#xff0c;代码如下。 REPORT zjason_test. "// 定义 DATA: lv_json TYPE string.DATA: BEGIN OF ls_detail_l3,code_l3 TYPE string,name_l3 TYPE string,age_l3 TYPE string,END OF ls_detail_l3,lt_detail_l3 LIKE TABLE OF…

SSO单点登录(SpringSecurity OAuth2.0 redis mysql jwt)

SSO单点登录 什么是单点登录 SSO(Single Sign On) 在多系统架构中&#xff0c;用户只需要一次登录就可以无需再次登录(比如你在打开淘宝之后点击里边的天猫) 在以前我们的单系统中,用户如果登录多个服务需要多次登录&#xff0c;实现单点登录之后&#xff0c;可以实现一次登录…

Qt:隐式内存共享

隐式内存共享 Many C classes in Qt use implicit data sharing to maximize resource usage and minimize copying. Implicitly shared classes are both safe and efficient when passed as arguments, because only a pointer to the data is passed around, and the data i…

K8s实战4-使用Helm在Azure上部署Ingress-Nginx和Tokengateway

手动发布Ingress-Nginx 1 登录到aks(dfinder-gw-aks) az login az account set --subscription ${sub ID} az aks get-credentials --resource-group ${groupname} --name ${aks name} 2 下载 ingress-nginx-4.2.5.tgz curl -LO https://github.com/kubernetes/ingress-ngi…

Hyper-V增加桥接网络设置(其他方式类同)

点击连接到的服务器&#xff0c;右单击或者右边点击“虚拟交换机管理器” 选择网络种类 配置虚拟交换机信息 外部网络选择物理机网卡设备

CS1988|C#无法在异步方法中使用ref,in,out类型的参数的问题

CS1988|C#无法在异步方法中使用ref,in,out类型的参数 &#x1f300;|场景&#xff1a; BlazorServer的场景中推荐使用异步方法&#xff0c;使用ref,out,in为参数前缀则报错CS1988 原因如下: ref parameters are not supported in async methods because the method may not h…

torch模型转onnx

加载模型 modeltorch.load(saved_model/moudle_best_auc.pth, map_locationcpu) model.eval().cpu()注&#xff1a;由于导出的模型是用于推理的&#xff0c;因此必须指定模型加载的位置和模型验证的位置&#xff0c;这里我使用了cpu做出导出的硬件 分析模型的输入和输出 这里…

基于SSH框架实现的管理系统(包含java源码+数据库)

资料下载链接 介绍 基于SSH框架的管理系统 简洁版 &#xff1b; 实现 登录 、 注册 、 增 、 删 、 改 、 查 &#xff1b; 可继续完善增加前端、校验、其他功能等&#xff1b; 可作为 SSH&#xff08;Structs Spring Hibernate&#xff09;项目 开发练习基础模型&#xf…

维护平衡的艺术:如何与干系人建立和谐关系以确保项目成功

在项目管理领域中&#xff0c;干系人的作用是无法忽视的。他们的支持和参与往往是项目成功的关键。与干系人建立和维护良好的关系成为每一位项目经理必备的技能。接下来&#xff0c;我们将深入探讨如何有效地与干系人互动&#xff0c;从而为项目的成功奠定坚实基础。 干系人的…

中国“诺贝尔奖”未来科学大奖公布2023年获奖名单

未来科学大奖委员会于8月16日公布2023年获奖名单。柴继杰、周俭民因发现抗病小体并阐明其结构和在抗植物病虫害中的功能做出的开创性工作获得“生命科学奖”&#xff0c;赵忠贤、陈仙辉因对高温超导材料的突破性发现和对转变温度的系统性提升所做出的开创性贡献获得“物质科学奖…

2023骨传导耳机推荐,适合运动骨传导耳机推荐

相信很多人跟我一样&#xff0c;随着现在五花八门的耳机品种增多&#xff0c;选耳机的时候真是眼花缭乱&#xff0c;尤其还是网购&#xff0c;只能看&#xff0c;不能试&#xff0c;所以选择起来比较困难&#xff0c; 作为一个运动达人&#xff0c;为了让大家在购买耳机时少走弯…

YOLO系列解读DAY1—YOLOV1预训练模型

一、说在前面 小伙伴们好&#xff0c;博主很久没有写博客了&#xff0c;略感生疏&#xff0c;不到之处敬请谅解&#xff0c;欢迎指出文中错误&#xff0c;大家一起探讨。欲看视频讲解&#xff0c;可转至博主DouYin、B站&#xff0c;欢迎关注&#xff0c;链接如下&#xff1a; …

Cat(1):Cat入门

1 什么是调用链监控 1.1 架构的演进历史 单体应用 架构说明&#xff1a; 全部功能集中在一个项目内&#xff08;All in one&#xff09;。 在单体应用的年代&#xff0c;分析线上问题主要靠日志以及系统级别的指标。 微服务架构 架构说明&#xff1a; 将系统服务层完全独立…

亚马逊添加心愿单对卖家有什么好处

在亚马逊平台上&#xff0c;卖家可以从消费者的角度来看待心愿单的好处。消费者可以将自己感兴趣的商品添加到心愿单中&#xff0c;这对卖家来说也是有一些潜在好处的&#xff1a; 1、潜在销售机会增加&#xff1a;当消费者将商品添加到心愿单中&#xff0c;这可能表示他们对这…

mySQL 视图 VIEW

简化版的创建视图 create view 视图名 as select col ...coln from 表create view 视图名&#xff08;依次别名&#xff09; as select col ...coln from 表create view 视图名 as select col “别名1”&#xff0c;。。。col "别名n" from 表show tab…

Angular安全专辑之二——‘unsafe-eval’不是以下内容安全策略中允许的脚本源

一&#xff1a;错误出现 这个错误的意思是&#xff0c;拒绝将字符串评估为 JavaScript&#xff0c;因为‘unsafe-eval’不是以下内容安全策略中允许的脚本源。 二&#xff1a;错误场景 testEval() {const data eval("var sum2 new Function(a, b, return a b); sum2(em…

挖掘优质短视频超百万条,火山引擎DataLeap助力电商平台生态治理

更多技术交流、求职机会&#xff0c;欢迎关注字节跳动数据平台微信公众号&#xff0c;回复【1】进入官方交流群 在人们的日常生活中&#xff0c;网购已经成为人们生活中不可或缺的购物形式。 根据《中国社交电商行业发展白皮书&#xff08;2022&#xff09;》的数据显示&#x…