共52w例图像的建筑裂缝检测图像ai模型训练数据集
20 地上设施(公路桥梁、铁路桥梁、水坝(墙)、挡土墙)和地下 SOC 设施(公路/铁路隧道、地铁、水隧道);韩国40 个市、县、区 SOC 设施的数据,并考虑多样性分布;10种裂纹/缺陷(裂纹、网状裂纹、分层、剥落、泛白、漏水、钢筋外露、材料分离、提升、损坏)。数据集使用拍摄设备直接采集,主要记录灾害安全环境525000例格式为jpg;标签数据以折线和多边形记录525000例,格式为json;图片说明10000例。
项目背景:
建筑裂缝检测是基础设施维护和安全管理中的重要环节。裂缝不仅影响建筑物的美观,更重要的是会威胁到结构的安全性和使用寿命。传统的人工检查方法不仅效率低下,还可能因为人为因素而遗漏重要细节。随着计算机视觉技术的进步,利用AI模型进行自动裂缝检测已成为一种趋势。本数据集旨在为建筑裂缝检测提供高质量的标注数据,支持自动化检测系统的开发与应用。
数据集概述:
- 名称:建筑裂缝检测图像AI模型训练数据集
- 规模:共计525,000张图像
- 设施类型:涵盖地上设施(公路桥梁、铁路桥梁、水坝(墙)、挡土墙)和地下SOC设施(公路/铁路隧道、地铁、水隧道)
- 地域分布:来自韩国40个市、县、区的SOC设施数据
- 缺陷类型:包含10种裂纹/缺陷类型(裂纹、网状裂纹、分层、剥落、泛白、漏水、钢筋外露、材料分离、提升、损坏)
- 数据格式:图像格式为.jpg,标签数据以折线和多边形记录,格式为.json
- 图片说明:包含10,000例图像说明
数据集特点:
- 全面性:涵盖多种设施类型和地域,确保数据集的多样性和实用性。
- 高质量标注:每张图像都已详细标注,确保数据的准确性和可靠性。
- 适用范围广:适用于多种深度学习框架,方便科研人员和开发者直接使用。
- 标准格式:采用广泛使用的.jpg图像格式和.json标签格式,方便导入不同的检测框架。
数据集内容:
- 裂纹(Crack):标注了建筑表面的裂纹。
- 网状裂纹(Hairline Cracks):标注了建筑表面的细小裂纹网络。
- 分层(Delamination):标注了建筑表面的分层缺陷。
- 剥落(Spalling):标注了建筑表面的剥落区域。
- 泛白(Efflorescence):标注了建筑表面的泛白现象。
- 漏水(Leakage):标注了建筑表面的漏水点。
- 钢筋外露(Exposed Rebar):标注了建筑表面的钢筋外露情况。
- 材料分离(Material Separation):标注了建筑表面的材料分离情况。
- 提升(Heave):标注了建筑表面的提升缺陷。
- 损坏(Damage):标注了建筑表面的损坏情况。
数据集用途:
- 缺陷检测:可用于训练和评估深度学习模型,特别是在建筑裂缝检测方面。
- 质量控制:帮助实现建筑设施的安全管理,减少人工检测的工作量。
- 科研与教育:为建筑裂缝检测领域的研究和教学提供丰富的数据支持。
使用场景:
- 自动化检测:在基础设施巡检中,利用该数据集训练的模型可以自动识别建筑裂缝。
- 质量控制:在质量控制系统中,利用该数据集可以提高检测的准确性和速度。
- 生产管理:在建设和维护管理工作中,利用该数据集可以提高工作效率和安全性。
技术指标:
- 数据量:共计525,000张图像,覆盖多种建筑裂缝类型。
- 数据划分:考虑到地域和设施类型的多样性分布。
- 标注格式:标签数据以折线和多边形记录,格式为.json,方便导入不同的检测框架。
- 标注精度:所有图像均已详细标注,确保数据的准确性和可靠性。
注意事项:
- 数据隐私:在使用过程中,请确保遵守相关法律法规,保护个人隐私。
- 数据预处理:在使用前,建议进行一定的数据预处理,如图像归一化等。
获取方式:
- 下载链接:请访问项目主页获取数据集下载链接。
- 许可证:请仔细阅读数据集的使用许可协议。
关键代码示例:
以下是关键代码的示例,包括数据加载、模型训练、检测和结果展示。
数据加载:
1import os
2import cv2
3import numpy as np
4import json
5
6# 数据集路径
7DATASET_PATH = 'path/to/dataset'
8IMAGES_DIR = os.path.join(DATASET_PATH, 'images')
9LABELS_DIR = os.path.join(DATASET_PATH, 'labels')
10
11# 加载数据集
12def load_dataset(directory):
13 images = []
14 labels = []
15
16 for img_file in os.listdir(IMAGES_DIR):
17 if img_file.endswith('.jpg'):
18 img_path = os.path.join(IMAGES_DIR, img_file)
19 label_path = os.path.join(LABELS_DIR, img_file.replace('.jpg', '.json'))
20
21 image = cv2.imread(img_path)
22 with open(label_path, 'r') as f:
23 label = json.load(f)
24
25 images.append(image)
26 labels.append(label)
27
28 return images, labels
29
30train_images, train_labels = load_dataset(os.path.join(DATASET_PATH, 'train'))
31val_images, val_labels = load_dataset(os.path.join(DATASET_PATH, 'val'))
32test_images, test_labels = load_dataset(os.path.join(DATASET_PATH, 'test'))
模型训练:
1# 初始化YOLOv8模型
2model = YOLO('yolov8n.pt')
3
4# 定义训练参数
5EPOCHS = 100
6BATCH_SIZE = 16
7
8# 训练模型
9results = model.train(data='crack_detection.yaml', epochs=EPOCHS, batch=BATCH_SIZE)
模型检测:
1# 加载训练好的模型
2model = YOLO('best.pt')
3
4# 检测图像
5def detect_cracks(image):
6 results = model.predict(image)
7 for result in results:
8 boxes = result.boxes
9 for box in boxes:
10 x1, y1, x2, y2 = box.xyxy[0]
11 conf = box.conf
12 class_id = box.cls
13
14 # 显示结果
15 cv2.rectangle(image, (int(x1), int(y1)), (int(x2), int(y2)), (0, 255, 0), 2)
16 cv2.putText(image, f'Class: {class_id}, Conf: {conf:.2f}', (int(x1), int(y1)-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
17
18 return image
19
20# 测试图像
21test_image = cv2.imread('path/to/test_image.jpg')
22result_image = detect_cracks(test_image)
23cv2.imshow('Detected Cracks', result_image)
24cv2.waitKey(0)
25cv2.destroyAllWindows()
配置文件 crack_detection.yaml
:
1train: path/to/train/images
2val: path/to/val/images
3test: path/to/test/images
4
5nc: 10 # Number of classes
6names: ['Crack', 'Hairline Cracks', 'Delamination', 'Spalling', 'Efflorescence', 'Leakage', 'Exposed Rebar', 'Material Separation', 'Heave', 'Damage'] # Class names
7
8# Training parameters
9batch_size: 16
10epochs: 100
11img_size: [640, 640] # Image size
使用指南:
- 数据准备:确保数据集路径正确,并且数据集已准备好。
- 模型训练:运行训练脚本,等待训练完成。
- 模型检测:使用训练好的模型进行检测,并查看检测结果。
结语:
本数据集提供了一个高质量的建筑裂缝检测图像数据集,支持自动化检测、质量控制等多个应用场景。通过利用该数据集训练的模型,可以提高裂缝检测的效率和准确性。