【ACDC数据集】:预处理ACDC心脏3D MRI影像数据集到VOC数据集格式,nii转为jpg,label转为png

news2024/11/17 17:52:10

【Segment Anything Model】做分割的专栏链接,欢迎来学习。
【博主微信】cvxiaoyixiao
本专栏为公开数据集的预处理,持续更新中。

文章目录

  • 1️⃣ ACDC数据集介绍
  • 2️⃣ ACDC数据集样例
  • 3️⃣ 预处理ACDC目标
  • 4️⃣ 处理结果样图
  • 5️⃣ 代码
  • 6️⃣ 划分测试集和训练集

1️⃣ ACDC数据集介绍

他是一个多类别的心脏3D MRI影像数据集`,2017年ACDC挑战赛(Automated Cardiac Diagnosis
Challenge)。

原数据集获取,网盘永久有效:
链接:https://pan.baidu.com/s/1F4Xq1crtUSmFcSKxwO4Eaw?pwd=ejfa 提取码:ejfa
–来自百度网盘超级会员V6的分享

2️⃣ ACDC数据集样例

首先夸夸👍 ,ACDC数据集存放格式非常规律👍 ,数据质量非常高👍 清晰了分为3类别。
在这里插入图片描述
training里有100例患者,testing里有50例患者。每个nii的切片个数不同根据勾画的肿瘤。
在这里插入图片描述

Info是媒体信息
patient001_4d.nii.gz是全部的切片,我也不知道从医学上怎么描述,就是这个患者的立体影像,包括没有肿瘤的部分
patient001_frame01.nii.gz是一个时期nii影响的压缩包
patient001_frame01_gt.nii.gz对应patient001_frame01.nii.gz的肿瘤勾画的label的压缩包。用四种像素对应了四个类别包括背景。
patient001_frame12.nii.gz是统一患者另一时期的影像
patient001_frame12_gt.nii.gz是对应的label

总之每个患者都有一个整体影像,还有两个不同成像和对应label。以下是打开之后的影像图。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3️⃣ 预处理ACDC目标

目标:处理ACDC的nii.gz数据集到VOC格式的2d的png图片
VOC格式 这篇文章有讲直达
在这里插入图片描述

例如:将patient001_frame01.nii.gz处理成几张png作为网络image的输入。将patient001_frame01_gt.nii.gz处理成几张png作为label。只处理了training的100例患者,把training当成了整个集合划分了训练测试。并且只关心了frame01第一阶段,第二个阶段的未关心。只关心了留下的部分。够了。
在这里插入图片描述

4️⃣ 处理结果样图

处理结果样图:
img转为jpg label转为png 并且像素为0-3. 0代表背景,1-3代表分类。label图像素太小,这里看不出来,可以看第三张数组图
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

5️⃣ 代码

事先准备好VOC文件夹在这里插入图片描述

"""
处理官网下载的ACDC到网络要求的VOC格式,按需调用
author: cvxiayixiao
Wechat: cvxiayixiao
"""
import os
from os.path import join
import nibabel as nib
import gzip
import shutil
import matplotlib.pyplot as plt
import numpy as np

ori_ACDC_train_path = './ACDC_challenge_20170617/training'


def niigz2nii():
    """
    解压每个患者的01阶段的nii.gz 和 gt.nii.gz 到输入文件夹"ACDC_nii"
    """

    input_path = ori_ACDC_train_path
    # 处理image
    # target='frame01.nii'
    # output_path = 'ACDC_nii/images'

    # 处理gt
    target = 'frame01_gt.nii'
    output_path = 'ACDC_nii/labels'

    for patient in os.listdir(input_path):
        # ACDC_challenge_20170617/training/patient001
        patient_path = join(input_path, patient)
        for niigz in os.listdir(patient_path):
            if target in niigz:
                niigzpath = join(patient_path, niigz)
                new_nii_path = join(output_path, niigz)
                shutil.copy(niigzpath, new_nii_path)


# niigz2nii()
def convert_nii_to_jpg():
    '''
    将ACDC_nii/images中的nii转到VOCjpg中
    :return:
    '''
    image_num = 0
    nii_path = "./ACDC_nii/images"
    output_dir = "./VOCdevkit/VOC2007/JPEGImages"
    for patient in os.listdir(nii_path):
        patient_path = join(nii_path, patient)
        for one in os.listdir(patient_path):
            one_patient_nii_path = join(patient_path, one)
            # 加载 .nii 文件
            nii_img = nib.load(one_patient_nii_path)
            data = nii_img.get_fdata()
            # 遍历数据的每个切片,并保存为 .png 文件
            for i in range(data.shape[2]):
                image_num += 1
                # 获取当前切片数据
                slice_data = data[:, :, i]
                # 创建输出文件路径
                num = f"{image_num}".zfill(6)
                output_path = os.path.join(output_dir, f'{patient}_{num}.jpg')
                # 以灰度图像格式保存切片数据为 .png 文件
                plt.imsave(output_path, slice_data, cmap='gray')


# convert_nii_to_jpg()

def convert_nii_to_png():
    '''
    将ACDC_nii/labels中的nii转到ACDC_nii/tmp_png_label中
    此时的像素是原label 中的像素,不是网络中的分类像素,还需要一部转换
    :return:
    '''
    image_num = 0
    nii_path = "./ACDC_nii/labels"
    output_dir = "./tmp"
    for patient in os.listdir(nii_path):
        patient_path = join(nii_path, patient)
        for one in os.listdir(patient_path):
            one_patient_nii_path = join(patient_path, one)
            # 加载 .nii 文件
            nii_img = nib.load(one_patient_nii_path)
            data = nii_img.get_fdata()
            # 遍历数据的每个切片,并保存为 .png 文件
            for i in range(data.shape[2]):
                image_num += 1
                # 获取当前切片数据
                slice_data = data[:, :, i]
                # 创建输出文件路径
                num = f"{image_num}".zfill(6)
                output_path = os.path.join(output_dir, f'{patient}_{num}.png')
                # 以灰度图像格式保存切片数据为 .png 文件
                plt.imsave(output_path, slice_data, cmap='gray')

from PIL import Image


def turnto255():
    from PIL import Image
    from PIL import Image
    for i in os.listdir("tmp"):
        output_path = os.path.join("./tmp1", i)
        png_path = join("tmp", i)
        # 读取图像
        image = plt.imread(png_path)

        # 取三个通道的平均值
        im_gray = np.mean(image, axis=2)
        im_gray = Image.fromarray((im_gray * 255).astype(np.uint8)).convert("L")
        # 保存输出图像
        im_gray.save(output_path)


def rename():
    """
    处理好的VOC2007 train和test名称不同,名称不对应不能训练
    转为对应的,之前的留作副本可以对应原图
    :return:
    """
    root = "VOCdevkit/VOC2007/SegmentationClass"
    for i in os.listdir(root):
        img_old_path = join(root, i)
        new_png_path = join(root, i[-10:])
        shutil.copy(img_old_path, new_png_path)


# rename()

def convert_Class():
Origin_SegmentationClass_path = "./tmp1"
Out_SegmentationClass_path = "./VOCdevkit/VOC2007/SegmentationClass"

# -----------------------------------------------------------------------------------#
#   Origin_Point_Value  原始标签对应的像素点值
#   Out_Point_Value     输出标签对应的像素点值
#                       Origin_Point_Value需要与Out_Point_Value一一对应。
#   举例如下,当:
#   Origin_Point_Value = np.array([0, 255]);Out_Point_Value = np.array([0, 1])
#   代表将原始标签中值为0的像素点,调整为0,将原始标签中值为255的像素点,调整为1。
#
#   示例中仅调整了两个像素点值,实际上可以更多个,如:
#   Origin_Point_Value = np.array([0, 128, 255]);Out_Point_Value = np.array([0, 1, 2])
#
#   也可以是数组(当标签值为RGB像素点时),如
#   Origin_Point_Value = np.array([[0, 0, 0], [1, 1, 1]]);Out_Point_Value = np.array([0, 1])
# -----------------------------------------------------------------------------------#
Origin_Point_Value = np.array([63, 127, 191, 255])
# Origin_Point_Value = np.array([0, 0.33333334, 0.6666667, 1])
Out_Point_Value = np.array([0, 1, 2, 3])

if not os.path.exists(Out_SegmentationClass_path):
    os.makedirs(Out_SegmentationClass_path)
png_names = os.listdir(Origin_SegmentationClass_path)
print("正在遍历全部标签。")
for png_name in tqdm(png_names):
    png = Image.open(os.path.join(Origin_SegmentationClass_path, png_name))
    w, h = png.size

    png = np.array(png)
    out_png = np.zeros([h, w])
    for i in range(len(Origin_Point_Value)):
        mask = png[:, :] == Origin_Point_Value[i]
        if len(np.shape(mask)) > 2:
            mask = mask.all(-1)
        out_png[mask] = Out_Point_Value[i]
    x=np.array(out_png, np.uint8)
    out_png = Image.fromarray(np.array(out_png, np.uint8))
    out_png.save(os.path.join(Out_SegmentationClass_path, png_name))

6️⃣ 划分测试集和训练集

import os
import random

import numpy as np
from PIL import Image
from tqdm import tqdm

#   修改train_percent用于改变验证集的比例 9:1
trainval_percent    = 1
train_percent       = 0.9
#-------------------------------------------------------#
#   指向VOC数据集所在的文件夹
#   默认指向根目录下的VOC数据集
#-------------------------------------------------------#
VOCdevkit_path      = 'VOCdevkit'

if __name__ == "__main__":
    random.seed(0)
    print("Generate txt in ImageSets.")
    segfilepath     = os.path.join(VOCdevkit_path, 'VOC2007/SegmentationClass')
    saveBasePath    = os.path.join(VOCdevkit_path, 'VOC2007/ImageSets/Segmentation')
    
    temp_seg = os.listdir(segfilepath)
    total_seg = []
    for seg in temp_seg:
        if seg.endswith(".png"):
            total_seg.append(seg)

    num     = len(total_seg)  
    list    = range(num)  
    tv      = int(num*trainval_percent)  
    tr      = int(tv*train_percent)  
    trainval= random.sample(list,tv)  
    train   = random.sample(trainval,tr)  
    
    print("train and val size",tv)
    print("traub suze",tr)
    ftrainval   = open(os.path.join(saveBasePath,'trainval.txt'), 'w')  
    ftest       = open(os.path.join(saveBasePath,'test.txt'), 'w')  
    ftrain      = open(os.path.join(saveBasePath,'train.txt'), 'w')  
    fval        = open(os.path.join(saveBasePath,'val.txt'), 'w')  
    
    for i in list:  
        name = total_seg[i][:-4]+'\n'  
        if i in trainval:  
            ftrainval.write(name)  
            if i in train:  
                ftrain.write(name)  
            else:  
                fval.write(name)  
        else:  
            ftest.write(name)  
    
    ftrainval.close()  
    ftrain.close()  
    fval.close()  
    ftest.close()

成功划分
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1036342.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【算法挨揍日记】day08——30. 串联所有单词的子串、76. 最小覆盖子串

30. 串联所有单词的子串 30. 串联所有单词的子串 题目描述: 给定一个字符串 s 和一个字符串数组 words。 words 中所有字符串 长度相同。 s 中的 串联子串 是指一个包含 words 中所有字符串以任意顺序排列连接起来的子串。 例如,如果 words ["…

SSM - Springboot - MyBatis-Plus 全栈体系(十一)

第二章 SpringFramework 五、Spring AOP 面向切面编程 6. Spring AOP 基于 XML 方式实现(了解) 6.1 准备工作 加入依赖和基于注解的 AOP 时一样。准备代码把测试基于注解功能时的 Java 类复制到新 module 中,去除所有注解。 6.2 配置 Sp…

SpringBoot项目(百度AI整合)——如何在Springboot中使用语音文件识别 ffmpeg的安装和使用

前言 前言:在实际使用中,经常要参考官方的案例,但有时候因为工具的不一样,比如idea 和 eclipse,普通项目和spring项目等的差别;还有时候因为水平有限,难以在散布于官方的各个文档读懂&#xff…

【广州华锐互动】VR虚拟党建云展馆:带你沉浸式领略红色文化

在新时代的背景下,科技与党建的结合已成为一种趋势。VR(Virtual Reality,虚拟现实)技术作为一种新兴的科技手段,为党建工作提供了全新的载体。VR虚拟党建云展馆,就是将VR技术应用于党建工作的一个典型例子&…

招聘程序员(软件开发工程师),如何做岗位胜任力测评?

一、 程序员的基本工作内容 1、 负责项目组内的代码维护和更新迭代,保证研发效率,对于运营产品提出的需求应积极沟通并实现。 2、 规范相关开发文档等相关资料,对于有变更的代码和功能需求,要对开发文档做出相应的变更。 3、 作为…

三维重建_纹理重建与表面细化

目录 前言:为什么要重建纹理? 1. 纹理图像的自动创建 1.1 基础知识 1.2 算法流程 1.2.1 视角选择 1.2.2 纹理坐标的计算 1.2.3 全局颜色调整 1.2.4 泊松图像编辑 1.2.5 OBJ文件 1.3 结果示例 2. 网格细化优化 2.1 基础知识与数学模型 2.2 优…

【Python基础】对Python的深入认识以及各种情况的报错汇总

📢:如果你也对机器人、人工智能感兴趣,看来我们志同道合✨ 📢:不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 📢:文章若有幸对你有帮助,可点赞 👍…

在给应用ASO优化时要注意些什么

应用名称是搜索引擎优化和转化率优化非常重要的元素。用户在搜索结果页面中看到我们的应用程序,这是他们决定是否想要更多地了解我们应用的地方。当用户已经在查看产品页面时,应用程序名称也会影响转化率,如果列表元数据有吸引力,…

Django的设计模式及模板层

Django的设计模式及模板层 设计模式MVC和MVT MVC 代表 Model-View-Controller(模型-视图-控制器)模式。 M 模型层(Model),主要用于对数据库层的封装 V 视图层(View),用于向用户展示结果 (WHAT HOW) C 控制(Controller,用于处理请求、获取数据、返回结果(重要) 作…

【数据集标注】上古软件LabelImg的保姆级使用教程

1:下载文件并解压 进入链接:mirrors / tzutalin / labelimg GitCode 点击绿色按钮【克隆】 ,再点击按钮【zip】,随后下载到本地 移动下载的压缩文件到合适的位置,此处我以桌面为例子 右键点击该zip压缩文件&#xff…

WINDOWS 7-11 磁盘分区教程

前言: 现在很多新电脑,尤其是用固态硬盘的电脑,往往内存不是很大,默认系统就给1个c盘(系统)或者再加一个D盘(软件盘)。为了更好的管理自己电脑的文件,我们需要增加一个或…

合约升级标准 ERC2535 的设计解析和不足

合约升级标准 ERC2535 的设计解析和不足 Safful最近审计了钻石标准的一份实现代码,这一标准是一种新的可升级合约模式。撰写标准是一项值得赞许的事业,但钻石标准及其实现有许多引人担忧的地方。这份代码是过度工程的产物,附带了许多不必要的…

004 Linux 调试器gdb的使用

前言 本文将会向您介绍gdb的基础操作 引入 程序的发布方式有两种,debug模式和release模式 Linux gcc/g出来的二进制程序,默认是release模式 要使用gdb调试,必须在源代码生成二进制程序的时候, 加上 -g 选项 以下是本文要示范的Makefile文件…

YOLOv5、YOLOv8改进:C3STR(Swin Transformer)

目录 1.介绍 2. YOLOv5、YOLOv8改进 2.1 common.py配置 2.2 yolo.py配置 2.3 yaml配置文件 1.介绍 视觉领域正在见证从 CNN 到 Transformers 的建模转变,纯 Transformer 架构在主要视频识别基准测试中达到了最高准确度。这些视频模型都建立在 Transformer 层之…

Solidity 小白教程:22. Call

Solidity 小白教程:22. Call 这一讲我们将介绍如何利用 Call 调用合约。 Call call 是address类型的低级成员函数,它用来与其他合约交互。它的返回值为**(bool, data),分别对应call**是否成功以及目标函数的返回值。 call是solidity官方推…

涛然自得周刊(第 10 期):搬到海岛生活是一种什么体验

作者:何一涛 日期:2023 年 9 月 24 日 涛然自得周刊主要精选作者阅读过的书影音内容,周末发布。历史周刊内容可以看这里。 影音 《德雷尔一家》是一部根据书籍《希腊三部曲》改编的英剧,共 4 季,每一季豆瓣评分都超…

[自然语言处理] 基于pycorrector实现文本纠错

文本纠错(Text Error Correction)技术旨在自动修正输入文本中的拼写、语法、标点符号等错误,以提高文本的准确性、通顺性和规范性。该技术可以通过自然语言处理技术实现,基于上下文和语言规则对文本进行分析和推断,发现…

使用香橙派学习 嵌入式数据库---SQLite

嵌入式数据库简介:SQLite & MySQL数据库 基于嵌入式的数据库主要有:SQLite,Firebird,Berkeley DB,eXtremeDB等 Firebird 是关系型数据库,功能强大,支持存储过程,SQL兼容等SQLi…

XCTF之新手Web题目

新手第一题:Training-WWW-Robots 图片提示: 解题流程: 具体操作:打开菜单-->Web开发者-->查看器(或者快捷键ctrlshiftc) robots.txt文件被网络爬虫使用,以检查它们是否被允许抓取和索引…

普通人也能秒变电子画册制作达人

你是不是觉得制作电子画册很难?需要专业的设计知识和软件?今天,小编告诉你,制作电子画册并不难!只要掌握一些简单技巧,你也可以轻松制精美的电子画册。下面,让我们一起来看看,如何从…