水下垃圾识别数据集
支持yolov5、yolov6、yolov7、yolov8、yolov9、yolov10
总共3131张数据
训练集1886张
带标注的txt文件
水下垃圾识别数据集介绍
数据集名称
水下垃圾识别数据集 (Underwater Trash Detection Dataset)
数据集概述
该数据集专为训练和评估基于YOLO系列目标检测模型(包括YOLOv5、YOLOv6、YOLOv7、YOLOv8、YOLOv9及YOLOv10)而设计,旨在帮助研究人员和开发者创建能够高效识别水下环境中各类垃圾的系统。通过使用这个数据集,可以开发出有助于清理海洋环境的技术解决方案。
数据集规格
- 总图像数量:3,131张
- 训练集:1,886张
- 验证集/测试集:具体划分比例未提供,通常建议按照70%(训练)、20%(验证)、10%(测试)的比例来分配。
- 标注格式:采用YOLO支持的标准txt格式,每行对应一个物体实例,包含类别ID以及边界框坐标(中心点x, 中心点y, 宽度w, 高度h),所有值均归一化到[0, 1]范围内。
- 分辨率:图像分辨率可能有所不同,但为了保证一致性,推荐将所有图像调整至统一尺寸,如640x640或1280x1280像素。
- 类别:涵盖了多种常见的水下垃圾类型,例如塑料瓶、渔网、金属罐等,具体的类别列表需参考数据集文档或
data.yaml
文件中的定义。
数据集结构
underwater_trash_dataset/
├── images/
│ ├── train/
│ └── val/ # 或者 test/
├── labels/
│ ├── train/
│ └── val/ # 或者 test/
└── data.yaml
images/
目录下存放的是原始图像文件。labels/
目录存放与图像对应的标注文件,每个图像文件都有一个同名的.txt文件存储其标注信息。data.yaml
文件包含了关于数据集的基本信息,如路径指向、类别数目及其名称等关键参数。
数据集配置文件 (data.yaml
)
# 训练集图像路径
train: path_to_your_train_images
# 验证集图像路径
val: path_to_your_val_images
# 测试集图像路径(如果有的话)
test: path_to_your_test_images
# 类别数量
nc: 10 # 假设共有10种不同的垃圾类型
# 类别名称
names: ['plastic_bottle', 'fishing_net', 'metal_can', 'glass_bottle', 'tire', 'rope', 'bag', 'other_plastics', 'paper', 'miscellaneous']
标注示例
对于一张图片中包含一个塑料瓶的情况,相应的.txt
文件内容可能是:
0 0.5678 0.3456 0.1234 0.2345
这里0
代表塑料瓶这一类别的ID,后续四个数字依次表示物体在图像中的相对位置(中心点x, 中心点y, 宽度w, 高度h)。
使用说明
- 准备环境:确保安装了必要的软件库以支持所选版本的YOLO模型。
- 数据预处理:根据需要调整图像大小,并确保所有标注文件正确无误。
- 修改配置文件:更新
data.yaml
以反映正确的数据路径。 - 开始训练:利用提供的训练脚本启动模型训练过程。
- 性能评估:训练完成后,使用验证集或测试集对模型进行评估,检查mAP等指标是否达到预期水平。
- 部署应用:将训练好的模型应用于实际场景中,实现水下垃圾自动检测功能。
此数据集为研究者们提供了一个良好的起点,用于探索如何有效地利用计算机视觉技术解决环境污染问题,特别是海洋污染领域内的挑战。