wx供重浩:创享日记
对话框发送:39抽烟
获取完整源码源文件+4000张已标注的数据集+配置说明文件
可有偿59yuan一对一远程操作跑通
效果展示
基于深度学YOLOv8+PyQt5的抽烟吸烟检测识别系统(完整源码+跑通说明文件)
各文件说明
模型评价指标
精确度(Precision):这个指标告诉你,系统检测到的对象中,有多少是真正存在的。就像你在一个果园里找苹果,精确度就是你能正确找到的苹果数占你找到的所有“苹果”的比例。
召回率(Recall):这个指标衡量的是,所有真实存在的对象中,有多少被系统正确检测到了。继续果园的例子,召回率就是所有真实苹果中,你找到的苹果所占的比例。
F1分数(F1 Score):这是一个综合考虑精确度和召回率的指标。如果一个系统既有很高的精确度也有很高的召回率,那么它的F1分数就会很高。这就像是你既找到了很多苹果,又确保了几乎所有的苹果都被你找到了。
平均精度(Average Precision, AP):这个指标衡量的是,在不同的置信度阈值下,精确度和召回率的平均表现。置信度可以理解为系统对检测到的对象存在的把握程度。AP越高,表示系统在不同置信度下的表现越稳定。
mAP(Mean Average Precision):这是在多个类别上计算AP后的平均值。如果一个系统需要检测多种类型的对象,比如猫、狗、鸟等,mAP就是这些类别AP值的平均,它提供了一个整体的性能评价。
速度(Speed):虽然不是直接的评价指标,但速度对于实时对象检测系统非常重要。YOLO系列的一个优点就是它的速度非常快,可以在视频流中实时检测对象,而不会有明显的延迟。
模型大小(Model Size):这个指标衡量的是模型的文件大小。在资源有限的设备上,如手机或嵌入式系统,模型大小是一个重要的考虑因素。
泛化能力(Generalization):这个指标衡量的是模型在未见过的数据上的表现。一个好的对象检测系统应该能够在多种环境和条件下都能稳定地工作。
这些指标通常在研究论文或技术报告中被用来比较不同的对象检测系统。在实际应用中,根据具体需求,可能会更关注某些指标。例如,对于需要实时反馈的应用,速度可能比精确度更重要。而对于安全监控系统,精确度和召回率可能更为关键。
在现代社会,公共场所的禁烟政策越来越严格,以减少二手烟对非吸烟者的影响。然而,监管和执行这些政策仍然面临挑战。本文提出了一种基于YOLOv8(You Only Look Once version 8)的抽烟检测系统,该系统结合了深度学习技术和PyQt5图形用户界面框架,旨在实时监测并识别公共场所中的吸烟行为。该系统的设计考虑了实时性、准确性和用户友好性,为提高公共场所的空气质量和遵守禁烟规定提供了技术支持。
抽烟检测系统的设计和实现如下:
系统设计
数据集准备
为了训练YOLOv8模型,首先需要收集和标注一个包含各种吸烟行为的图像数据集。这个数据集应该包含不同背景、多种吸烟姿势、以及各种类型的香烟。图像标注需要明确指出吸烟者的位置和吸烟动作,以便模型学习识别吸烟行为。
模型训练
使用准备好的数据集,对YOLOv8模型进行训练。在训练过程中,需要调整学习率、批大小、训练周期等超参数,以优化检测效果。同时,可以采用数据增强技术,如随机裁剪、旋转、颜色变换等,以增强模型对不同场景的适应能力。
系统实现
系统的核心是YOLOv8模型,它负责从输入的实时视频流中检测吸烟行为。系统还包括一个基于PyQt5的用户界面,用于显示检测结果和发出警报。当模型检测到吸烟行为时,系统会通过声音或视觉信号提醒管理人员。
实时检测
为了实现实时检测,系统需要能够在低延迟的情况下处理视频流。这要求模型不仅要准确,还要高效。在实际部署中,可能需要在边缘设备上进行模型推理,以减少对中心服务器的依赖。
结果与讨论
在测试集上,YOLOv8模型展现出了较高的吸烟行为检测准确率。在不同的环境和光照条件下,模型都能稳定地识别吸烟者。然而,模型在处理遮挡严重或吸烟者与背景颜色相近的情况下仍有改进空间。
结论
本文提出的基于YOLOv8和PyQt5的抽烟检测系统,能够有效地辅助公共场所的禁烟管理。通过实时监测和提醒,该系统有助于提高禁烟规定的执行力度,保护非吸烟者免受二手烟的危害。未来的工作将集中在进一步提高模型的鲁棒性,以及探索更高效的模型部署和集成方案。
部分PyQt5可视化代码
# -*- coding: utf-8 -*-
import time
from PyQt5.QtWidgets import QApplication , QMainWindow, QFileDialog, \
QMessageBox,QWidget,QHeaderView,QTableWidgetItem, QAbstractItemView
import sys
import os
from PIL import ImageFont
from ultralytics import YOLO
sys.path.append('UIProgram')
from UIProgram.UiMain import Ui_MainWindow
import sys
from PyQt5.QtCore import QTimer, Qt, QThread, pyqtSignal,QCoreApplication
import detect_tools as tools
import cv2
import Config
from UIProgram.QssLoader import QSSLoader
from UIProgram.precess_bar import ProgressBar
import numpy as np
# import torch
class MainWindow(QMainWindow):
def __init__(self, parent=None):
super(QMainWindow, self).__init__(parent)
self.ui = Ui_MainWindow()
self.ui.setupUi(self)
self.initMain()
self.signalconnect()
# 加载css渲染效果
style_file = 'UIProgram/style.css'
qssStyleSheet = QSSLoader.read_qss_file(style_file)
self.setStyleSheet(qssStyleSheet)
def signalconnect(self):
self.ui.PicBtn.clicked.connect(self.open_img)
self.ui.comboBox.activated.connect(self.combox_change)
self.ui.VideoBtn.clicked.connect(self.vedio_show)
self.ui.CapBtn.clicked.connect(self.camera_show)
self.ui.SaveBtn.clicked.connect(self.save_detect_video)
self.ui.ExitBtn.clicked.connect(QCoreApplication.quit)
self.ui.FilesBtn.clicked.connect(self.detact_batch_imgs)
def initMain(self):
self.show_width = 770
self.show_height = 480
self.org_path = None
self.is_camera_open = False
self.cap = None
# self.device = 0 if torch.cuda.is_available() else 'cpu'
# 加载检测模型
self.model = YOLO(Config.model_path, task='detect')
self.model(np.zeros((48, 48, 3))) #预先加载推理模型
self.fontC = ImageFont.truetype("Font/platech.ttf", 25, 0)
# 用于绘制不同颜色矩形框
self.colors = tools.Colors()
# 更新视频图像
self.timer_camera = QTimer()
# 更新检测信息表格
# self.timer_info = QTimer()
# 保存视频
self.timer_save_video = QTimer()
# 表格
self.ui.tableWidget.verticalHeader().setSectionResizeMode(QHeaderView.Fixed)
self.ui.tableWidget.verticalHeader().setDefaultSectionSize(40)
self.ui.tableWidget.setColumnWidth(0, 80) # 设置列宽
self.ui.tableWidget.setColumnWidth(1, 200)
self.ui.tableWidget.setColumnWidth(2, 150)
self.ui.tableWidget.setColumnWidth(3, 90)
self.ui.tableWidget.setColumnWidth(4, 230)
# self.ui.tableWidget.horizontalHeader().setSectionResizeMode(QHeaderView.Stretch) # 表格铺满
# self.ui.tableWidget.horizontalHeader().setSectionResizeMode(0, QHeaderView.Interactive)
# self.ui.tableWidget.setEditTriggers(QAbstractItemView.NoEditTriggers) # 设置表格不可编辑
self.ui.tableWidget.setSelectionBehavior(QAbstractItemView.SelectRows) # 设置表格整行选中
self.ui.tableWidget.verticalHeader().setVisible(False) # 隐藏列标题
self.ui.tableWidget.setAlternatingRowColors(True) # 表格背景交替
# 设置主页背景图片border-image: url(:/icons/ui_imgs/icons/camera.png)
# self.setStyleSheet("#MainWindow{background-image:url(:/bgs/ui_imgs/bg3.jpg)}")
def open_img(self):
if self.cap:
# 打开图片前关闭摄像头
self.video_stop()
self.is_camera_open = False
self.ui.CaplineEdit.setText('摄像头未开启')
self.cap = None
# 弹出的窗口名称:'打开图片'
# 默认打开的目录:'./'
# 只能打开.jpg与.gif结尾的图片文件
# file_path, _ = QFileDialog.getOpenFileName(self.ui.centralwidget, '打开图片', './', "Image files (*.jpg *.gif)")
file_path, _ = QFileDialog.getOpenFileName(None, '打开图片', './', "Image files (*.jpg *.jepg *.png)")
if not file_path:
return
self.ui.comboBox.setDisabled(False)
self.org_path = file_path
self.org_img = tools.img_cvread(self.org_path)
# 目标检测
t1 = time.time()
self.results = self.model(self.org_path)[0]
t2 = time.time()
take_time_str = '{:.3f} s'.format(t2 - t1)
self.ui.time_lb.setText(take_time_str)
location_list = self.results.boxes.xyxy.tolist()
self.location_list = [list(map(int, e)) for e in location_list]
cls_list = self.results.boxes.cls.tolist()
self.cls_list = [int(i) for i in cls_list]
self.conf_list = self.results.boxes.conf.tolist()
self.conf_list = ['%.2f %%' % (each*100) for each in self.conf_list]
# now_img = self.cv_img.copy()
# for loacation, type_id, conf in zip(self.location_list, self.cls_list, self.conf_list):
# type_id = int(type_id)
# color = self.colors(int(type_id), True)
# # cv2.rectangle(now_img, (int(x1), int(y1)), (int(x2), int(y2)), colors(int(type_id), True), 3)
# now_img = tools.drawRectBox(now_img, loacation, Config.CH_names[type_id], self.fontC, color)
now_img = self.results.plot()
self.draw_img = now_img
# 获取缩放后的图片尺寸
self.img_width, self.img_height = self.get_resize_size(now_img)
resize_cvimg = cv2.resize(now_img,(self.img_width, self.img_height))
pix_img = tools.cvimg_to_qpiximg(resize_cvimg)
self.ui.label_show.setPixmap(pix_img)
self.ui.label_show.setAlignment(Qt.AlignCenter)
# 设置路径显示
self.ui.PiclineEdit.setText(self.org_path)
# 目标数目
target_nums = len(self.cls_list)
self.ui.label_nums.setText(str(target_nums))
# 设置目标选择下拉框
choose_list = ['全部']
target_names = [Config.names[id]+ '_'+ str(index) for index,id in enumerate(self.cls_list)]
# object_list = sorted(set(self.cls_list))
# for each in object_list:
# choose_list.append(Config.CH_names[each])
choose_list = choose_list + target_names
self.ui.comboBox.clear()
self.ui.comboBox.addItems(choose_list)
if target_nums >= 1:
self.ui.type_lb.setText(Config.CH_names[self.cls_list[0]])
self.ui.label_conf.setText(str(self.conf_list[0]))
# 默认显示第一个目标框坐标
# 设置坐标位置值
self.ui.label_xmin.setText(str(self.location_list[0][0]))
self.ui.label_ymin.setText(str(self.location_list[0][1]))
self.ui.label_xmax.setText(str(self.location_list[0][2]))
self.ui.label_ymax.setText(str(self.location_list[0][3]))
else:
self.ui.type_lb.setText('')
self.ui.label_conf.setText('')
self.ui.label_xmin.setText('')
self.ui.label_ymin.setText('')
self.ui.label_xmax.setText('')
self.ui.label_ymax.setText('')
# # 删除表格所有行
self.ui.tableWidget.setRowCount(0)
self.ui.tableWidget.clearContents()
self.tabel_info_show(self.location_list, self.cls_list, self.conf_list,path=self.org_path)
if __name__ == "__main__":
app = QApplication(sys.argv)
win = MainWindow()
win.show()
sys.exit(app.exec_())