植物病虫害检测数据集 7800张 病虫害 带标注 voc yolo
label| pic_ num| box_ num
越橘: .
(932,980)
粘虫: (1104, 1104)
稻苞虫: (1389, 2269)
蝗虫: (1198, 1563)
蝽象若虫: (1594, 2576) .
绿蝽象: (1166, 1206)
夜蛾:
(580,580)
total: (7839, 10278)
植物病虫害检测数据集
名称
植物病虫害检测数据集 (Plant Pest and Disease Detection Dataset)
规模
- 图像数量:7839张图像。
- 类别:5种病虫害类别。
- 标注个数:10278个标注。
数据划分
- 训练集 (Train):通常占总数据的80%左右,约6271张图像。
- 验证集 (Validation):通常占总数据的20%左右,约1568张图像。
类别和数量
- 越橘:932张图像,980个标注。
- 粘虫:1104张图像,1104个标注。
- 稻苞虫:1389张图像,2269个标注。
- 蝗虫:1198张图像,1563个标注。
- 蝽象若虫:1594张图像,2576个标注。
- 绿蝽象:1166张图像,1206个标注。
- 夜蛾:580张图像,580个标注。
数据特点
- 高质量与高分辨率:所有图像均为高分辨率,适合进行详细的病虫害检测。
- 多样性和复杂性:图像覆盖了多种病虫害类型和程度,增加了模型的泛化能力。
- 详尽标注:每个图像都附有准确的边界框标注信息,确保了训练数据的质量。
应用领域
- 农业病虫害防治:帮助农民及早发现病虫害,采取有效措施防止病虫害扩散。
- 农作物产量预测:通过病虫害检测,评估作物健康状况,预测产量。
- 精准农业:结合遥感和无人机技术,实现大面积农田的自动化病虫害检测。
1. 安装依赖库
首先,确保安装了必要的依赖库。可以在项目目录中的requirements.txt
文件中列出这些依赖库,然后运行以下命令进行安装:
pip install -r requirements.txt
requirements.txt
文件内容示例:
torch==1.10.0
torchvision==0.11.1
pandas==1.3.4
cv2
albumentations==1.1.0
2. 创建数据集
定义一个自定义的数据集类,并创建数据加载器。
import os
import pandas as pd
import cv2
from torch.utils.data import Dataset, DataLoader
from torchvision.transforms import Compose, ToTensor, Normalize, Resize
from albumentations import HorizontalFlip, RandomBrightnessContrast, ShiftScaleRotate, BboxFromMasks, BBoxFormatPASCAL
from albumentations.pytorch import ToTensorV2
# 自定义数据集类
class PlantPestDataset(Dataset):
def __init__(self, data_root, annotations_file, transforms=None):
self.data_root = data_root
self.annotations = pd.read_csv(annotations_file)
self.transforms = transforms
def __len__(self):
return len(self.annotations)
def __getitem__(self, idx):
img_path = os.path.join(self.data_root, self.annotations.iloc[idx, 0])
image = cv2.imread(img_path)
bboxes = self.annotations.iloc[idx, 1:].values.reshape(-1, 4) # bounding box coordinates
labels = self.annotations.columns[1:]
if self.transforms:
augmented = self.transforms(image=image, bboxes=bboxes)
image = augmented['image']
bboxes = augmented['bboxes']
return image, bboxes, labels
# 图像预处理
def get_transforms():
"""构建预处理函数"""
_transform = [
Resize(height=416, width=416, interpolation=cv2.INTER_LINEAR),
HorizontalFlip(p=0.5),
RandomBrightnessContrast(p=0.2),
ShiftScaleRotate(p=0.5, shift_limit=0.0625, scale_limit=0.2, rotate_limit=15),
Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
ToTensorV2(),
BboxFromMasks(format=BBoxFormatPASCAL)
]
return Compose(_transform)
# 创建数据加载器
train_dataset = PlantPestDataset(
data_root='path_to_your_data_directory',
annotations_file='path_to_your_annotations.csv',
transforms=get_transforms()
)
val_dataset = PlantPestDataset(
data_root='path_to_your_data_directory',
annotations_file='path_to_your_annotations.csv',
transforms=get_transforms()
)
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True, num_workers=4)
val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False, num_workers=4)
3. 训练YOLOv5模型
使用YOLOv5进行训练。
!git clone https://github.com/ultralytics/yolov5 # 下载YOLOv5代码仓库
cd yolov5
# 使用YOLOv5训练模型
python train.py --weights yolov5s.pt --data path_to_your_data.yaml --name plant_pest_detection --img 416 --batch 16 --epochs 100 --device 0
- 数据配置文件:创建一个名为
data.yaml
的数据配置文件,其中包含训练和验证数据集的信息。
train: path_to_your_train_images
val: path_to_your_val_images
nc: 5 # 类别数量
names: [blueberry, armyworm, rice_bud_worm, locust, planthopper_nymph, green_plantbug, cutworm]
4. 调整模型
- 超参数调整:根据实际情况调整模型的超参数,例如学习率、批大小等。
- 数据增强:增加数据增强策略,如旋转、缩放、亮度对比度调整等,以提高模型的泛化能力。
5. 部署应用
- 模型优化:对模型进行微调,使其适应特定应用场景。
- 实时检测:将训练好的模型部署到实际环境中,实现实时病虫害检测功能。
总结
植物病虫害检测数据集为农业领域的病虫害识别提供了丰富且详尽的资源,有助于提高农业生产效率和质量。通过YOLOv5模型的训练和优化,我们可以得到一个高效且准确的病虫害检测系统