GPT编程(1)八分类图像数据集转换为二分类

news2024/11/26 2:05:48

一个核心问题就是要将这八类数据图片全部重命名,尝试了一步到位

有一个图像数据集,有八个类别'amusement','anger','awe','contentment','disgust',' excitement', 'fear','sadness'的图片,每张图片被命名为“类别+数字”。采用遍历的方式,按顺序阅读每一张图片,将其中‘amusement','anger','awe','contentment’四个类别文件夹的图片重新命名为“positive+n”,这里的n是阅读到的次序,每一张图片都有单独的次序号,并单独放在一个文件夹中;将,'disgust',' excitement', 'fear','sadness'四个类别文件夹的图片重新命名为“negetive+n”,这里的n是阅读到的次序,每一张图片都有单独的次序号,并单独放在文件夹中。用python来实现这个功能,并打印一个进度条来显示进度。

但是读取每一个类别都会重置positive序号,导致出错。所以分为了两步:(1)将八类数据图片放在两个文件夹中,先不改名称;(2)用上面的方法,给所有图片改名称 

1)将八类数据图片放在两个文件夹中,先不改名称;

有一个data文件夹中有八个存放图片的类别文件夹,分别是'amusement','anger','awe','contentment','disgust',' excitement', 'fear','sad',读取这些文件夹中的图片,将'amusement','anger','awe','contentment'这四个文件夹中的图片放进”positive“文件夹中,将'disgust',' excitement', 'fear','sadness'并将文件中的图片这四个文件夹中的图片放进”negetive“文件夹中。用python实现这个功能,并打印一个进度条来显示进度。

import os
from tqdm import tqdm

# 定义输入文件夹和输出文件夹的路径
input_folder = 'your_dataset_folder'
output_folder_positive = 'positive_images'
output_folder_negative = 'negative_images'

# 创建输出文件夹
os.makedirs(output_folder_positive, exist_ok=True)
os.makedirs(output_folder_negative, exist_ok=True)

# 定义类别列表
positive_categories = ['amusement', 'anger', 'awe', 'contentment']
negative_categories = ['disgust', 'excitement', 'fear', 'sadness']

# 遍历每个类别文件夹
for category in positive_categories + negative_categories:
    category_folder = os.path.join(input_folder, category)

    # 确保类别文件夹存在
    if os.path.exists(category_folder):
        # 使用tqdm显示进度条
        for i, filename in enumerate(tqdm(os.listdir(category_folder), desc=f"Processing {category}")):
            file_path = os.path.join(category_folder, filename)

            # 确保是文件而不是文件夹
            if os.path.isfile(file_path):
                # 确定输出路径和新文件名
                if category in positive_categories:
                    output_path = os.path.join(output_folder_positive, f"positive_{i+1}.jpg")
                else:
                    output_path = os.path.join(output_folder_negative, f"negative_{i+1}.jpg")

                # 复制文件到新文件夹并重新命名
                os.rename(file_path, output_path)

print("处理完成。")

(2)用上面的方法,给所有图片改名称 

有一个data文件夹中有八个存放图片的类别文件夹,分别是'amusement','anger','awe','contentment','disgust',' excitement', 'fear','sad',读取这些文件夹中的图片,将'amusement','anger','awe','contentment'这四个文件夹中的图片放进”positive“文件夹中,将'disgust',' excitement', 'fear','sadness'并将文件中的图片这四个文件夹中的图片放进”negetive“文件夹中。用python实现这个功能,并打印一个进度条来显示进度。

import os
from tqdm import tqdm
import shutil

# 定义输入文件夹和输出文件夹的路径
input_folder = 'data'
output_folder_positive = 'positive'
output_folder_negative = 'negative'

# 创建输出文件夹
os.makedirs(output_folder_positive, exist_ok=True)
os.makedirs(output_folder_negative, exist_ok=True)

# 定义类别列表
positive_categories = ['amusement', 'anger', 'awe', 'contentment']
negative_categories = ['disgust', 'excitement', 'fear', 'sad']

# 遍历每个类别文件夹
for category in positive_categories + negative_categories:
    category_folder = os.path.join(input_folder, category)
    
    # 确保类别文件夹存在
    if os.path.exists(category_folder):
        # 使用tqdm显示进度条
        for filename in tqdm(os.listdir(category_folder), desc=f"Processing {category}"):
            file_path = os.path.join(category_folder, filename)
            
            # 确保是文件而不是文件夹
            if os.path.isfile(file_path):
                # 确定输出路径和新文件名
                if category in positive_categories:
                    output_path = os.path.join(output_folder_positive, filename)
                else:
                    output_path = os.path.join(output_folder_negative, filename)
                
                # 复制文件到新文件夹
                shutil.copy(file_path, output_path)

print("处理完成。")

(3)把上述二分类数据集按照80:15:5划分为训练集,测试集,验证集

有一个图像数据集,有两个类别文件夹'positive',‘negative’,按照80:15:5划分为训练集,测试集,验证集,分别放在“train”,"test","val"文件夹中,在每个文件夹中的从“positive”获得的图片放在'positive'文件夹中,从“negative”获得的图片放在'negative'文件夹中,举例文件夹’train‘的下一级是文件夹“positive”和文件夹“negative”。用python来实现这个功能,并打印一个进度条来显示进度。

import os
import random
from shutil import copyfile
from tqdm import tqdm

def split_and_copy_images(input_folder, output_folder, split_ratios=(0.8, 0.15, 0.05), seed=42):
    random.seed(seed)

    # 创建输出文件夹
    for split in ['train', 'test', 'val']:
        split_path = os.path.join(output_folder, split)
        os.makedirs(os.path.join(split_path, 'positive'), exist_ok=True)
        os.makedirs(os.path.join(split_path, 'negative'), exist_ok=True)

    # 遍历每个类别的文件夹
    for category in ['positive', 'negative']:
        category_path = os.path.join(input_folder, category)
        image_files = os.listdir(category_path)
        random.shuffle(image_files)

        # 划分数据集
        total_files = len(image_files)
        train_count = int(total_files * split_ratios[0])
        test_count = int(total_files * split_ratios[1])

        # 复制文件到相应的文件夹
        for i, filename in enumerate(tqdm(image_files, desc=f"Processing {category}")):
            src_path = os.path.join(category_path, filename)

            if i < train_count:
                dst_path = os.path.join(output_folder, 'train', category, f'{category}_{i + 1}.jpg')
            elif i < train_count + test_count:
                dst_path = os.path.join(output_folder, 'test', category, f'{category}_{i + 1}.jpg')
            else:
                dst_path = os.path.join(output_folder, 'val', category, f'{category}_{i + 1}.jpg')

            copyfile(src_path, dst_path)

# 输入文件夹和输出文件夹路径
input_folder = 'path/to/dataset'
output_folder = 'path/to/split_dataset'

# 划分数据集并显示进度条
split_and_copy_images(input_folder, output_folder)
print("数据集划分完成。")

总结,如果思路清晰,有些脚本用ChatGPT来写还是非常方便的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1349895.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

架构设计的核心:从多个维度理论分析

文章目录 一、如何实现高内聚低耦合的架构1、确定边界2、内聚的分类3、耦合的分类4、如何实现高内聚低耦合&#xff08;1&#xff09;耦合关注点&#xff08;2&#xff09;低耦合原则&#xff08;3&#xff09;高内聚原则 二、如何实现可扩展性的架构1、扩展性&#xff1a;核心…

OpenHarmony之系统调用

背景 对于运行L0系统的硬件一般是mcu&#xff0c;资源有限&#xff0c;L0系统没有区分内核态和用户态&#xff0c;所有的代码都在内核态运行&#xff0c;所以不需要系统调用 L2系统用的是Linux内核&#xff0c;所以系统调用跟Linux Kernel的是一样的。 所以我们主要来看看L1系…

构建基础wlan网络 hcia无线

实验 旁挂组网 二层网络 ac为 dhcp的服务器给ap地址 s1给sta的ip地址 DHCP 业务为直接转发 实验步骤 第一步 poe 开启 poe en 开启 第二步 有线连接 vlan的配置 s1 vlan batch 100 101 连接的端口 port link-type trunk port trunk allow-pass …

阶段十-分布式-nginx服务器

一、Nginx简介 Nginx 是高性能的 HTTP 和反向代理的服务器&#xff0c;处理高并发能力是十分强大的&#xff0c;能经受高负载的考验,有报告表明能支持高达 50,000 个并发连接数。tomcat并发数量理论值是500&#xff0c;实际也就300左右。 1.2 正向代理 正向代理代理的是客户…

文心一言 VS 讯飞星火 VS chatgpt (170)-- 算法导论13.2 3题

三、用go语言&#xff0c;设在图 13-2 左边一棵树中&#xff0c;a、b和c 分别为子树a、β和γ中的任意结点。当结点 x 左旋之后&#xff0c;a、b和c 的深度会如何变化&#xff1f; 文心一言&#xff1a; 在二叉树中&#xff0c;左旋操作是改变节点的子节点顺序。原本的子节点…

高精度定位赛道爆发前夜 谁在强势崛起?|高工微报告

伴随着以NOA为代表的高阶智驾功能加速渗透&#xff0c;高精度定位赛道正进入快速增长通道。 整体技术链路上&#xff0c;高精度定位为高阶智驾的刚需&#xff1a;在“重地图、轻感知”阶段&#xff0c;其结合高精地图发挥作用&#xff1b;在“轻地图、重感知”阶段&#xff0c…

JavaScript编程进阶 – 迭代器

JavaScript编程进阶 – 迭代器 JavaScript Programming Advanced - Iterators By JacksonML 在JavaScript语言中&#xff0c;迭代器是对象(Object), 它事先定义好了一个序列&#xff0c;并在其终止时有可能地&#xff08;潜在地&#xff09;返回值。 本文简要介绍迭代器对象如…

收入支出记录,对需要的账目明细进行颜色标记

面对繁杂的账单和财务数据&#xff0c;你是否曾为记账而感到苦恼&#xff1f;别担心&#xff0c;我们为你带来了一款全新的记账软件——晨曦记账本&#xff0c;这不仅仅是一个简单的记账工具&#xff0c;更是你财务管理的得力助手。 所需工具&#xff1a; 一个【晨曦记账本】…

lora 生成图片 扭曲 的问题 【lora出图】

人物扭曲的原因&#xff1a; 生成图片是720X1080 而LORA制作的时候&#xff0c;图片大小为:512X512 所以生成图片时&#xff1a;设置为512X768 或512X512 生成图片大小以&#xff1a; 512X768 竖屏&#xff08;海报&#xff09; 768X512 横屏&#xff08;动画&…

Unity 如何打造”大厅+子游戏”架构

现在越来越多的手机游戏开始要做成大厅子游戏模式&#xff0c;简单的说就是&#xff0c;进入大厅后有很多子游戏&#xff0c;玩家选哪个完&#xff0c;就更新下载哪个子游戏&#xff0c;下次就直接进去玩子游戏就可以了。这就是现在要做的 “大厅子游戏”架构,要拿一套这样的架…

浙大链协2023年终总结

2 0 2 4 元旦 快乐 龙腾虎跃 01 引言 俗话说&#xff1a;"币圈一天&#xff0c;人间十年"&#xff0c;数字货币一天的涨跌可能抵上其他资产价格一年的波动幅度。而经历过漫长的熊市后&#xff0c;铭文的火爆十分生动地表述了这一口号...... 2023年&#xff0c;浙大链…

【Unity引擎技术整合】 Unity学习路线 | 知识汇总 | 持续更新 | 保持乐趣 | 共同成长

前言 本文对Unity引擎的知识进行了一个整理总结&#xff0c;基本包含了Unity中大部分的知识介绍。网上也有很多Unity相关的学习资料&#xff0c;但大多数都不成体系&#xff0c;学起来的时候难免会东奔西走的摸不着头脑。本文整理的多数文章都是有对应的系列性文章专栏&#x…

【C语言】Ubuntu 22上用GTK写GUI程序

一、GTK介绍 GTK (GIMP Toolkit) 是一个多平台的图形用户界面工具包。它最初是为图像处理程序 GIMP 开发的&#xff0c;后来演变成为许多操作系统上开发图形界面应用程序的通用库。GTK 是用C语言编写的&#xff0c;并且是自由和开源软件&#xff0c;遵循LGPL (GNU Lesser Gene…

x-cmd pkg | hyperfine - 命令行基准测试工具

目录 简介首次用户功能特点竞品和相关作品进一步阅读 简介 hyperfine 是一个用于命令行基准测试的开源工具&#xff0c;可以对多次命令运行的时间进行分析&#xff0c;帮助开发人员评估和比较不同命令或脚本的性能。它是用 Rust 语言开发的&#xff0c;可以在 Windows、macOS …

Redis 与 Spring: 解决序列化异常的探索之旅

&#x1f337;&#x1f341; 博主猫头虎 带您 Go to New World.✨&#x1f341; &#x1f984; 博客首页——猫头虎的博客&#x1f390; &#x1f433;《面试题大全专栏》 文章图文并茂&#x1f995;生动形象&#x1f996;简单易学&#xff01;欢迎大家来踩踩~&#x1f33a; &a…

【网络面试(5)】收发数据及断开服务器(四次挥手)

前面了解到服务器和客户端在创建套接字&#xff0c;建立连接后&#xff0c;就可以进入到下一步&#xff0c;双发可以互相发送和接收数据&#xff0c;本篇博客就来学习一下这个过程。  我们印象里&#xff0c;发送数据应该是我们在浏览器输入网址&#xff0c;敲击回车的一瞬间&…

RocketMQ 生产者源码分析:DefaultMQProducer、DefaultMQProducerImpl

&#x1f52d; 嗨&#xff0c;您好 &#x1f44b; 我是 vnjohn&#xff0c;在互联网企业担任 Java 开发&#xff0c;CSDN 优质创作者 &#x1f4d6; 推荐专栏&#xff1a;Spring、MySQL、Nacos、Java&#xff0c;后续其他专栏会持续优化更新迭代 &#x1f332;文章所在专栏&…

(九)上市企业实施IPD成功案例分享之——欧普

LED通用照明应用是LED照明应用市场的第一驱动力&#xff0c;由于LED照明技术发展迅速&#xff0c;以及成本快速下降&#xff0c;已成为全球主流照明光源。近年来&#xff0c;通过将智能控制模块嵌入LED通用照明终端&#xff0c;形成了具有自动控制、系统化控制等功能的智能照明…

Java8 Lambda 表达式

文章目录 &#x1f349; Java 8 介绍&#x1f349; Lambda 表达式&#x1f345;&#x1f345; 基础语法&#x1f345;&#x1f345; 案例 &#x1f349; 函数式接口&#x1f345;&#x1f345; 内置的四大核心函数式接口&#x1f345;&#x1f345; 案例 &#x1f349; Java 8 …

linux驱动(一):led

本文主要探讨210的led驱动相关知识。 驱动 操作系统驱动硬件的代码,驱动上层是系统调用API,下层是硬件 宏内核&#xff1a;内核整体上为一个过程实现,运行在同一地址空间,相互调用简单高效 微内核&#xff1a;功能为独立过程,过程间通过IPC通信 …