当前位置: 首页 > news >正文

基于深度学习YOLOv8+Pyqt5的抽烟吸烟检测识别系统(源码+跑通说明文件)

wx供重浩:创享日记
对话框发送:39抽烟
获取完整源码源文件+4000张已标注的数据集+配置说明文件
可有偿59yuan一对一远程操作跑通


效果展示

基于深度学YOLOv8+PyQt5的抽烟吸烟检测识别系统(完整源码+跑通说明文件)

在这里插入图片描述
在这里插入图片描述


各文件说明

在这里插入图片描述


模型评价指标

精确度(Precision):这个指标告诉你,系统检测到的对象中,有多少是真正存在的。就像你在一个果园里找苹果,精确度就是你能正确找到的苹果数占你找到的所有“苹果”的比例。

召回率(Recall):这个指标衡量的是,所有真实存在的对象中,有多少被系统正确检测到了。继续果园的例子,召回率就是所有真实苹果中,你找到的苹果所占的比例。

F1分数(F1 Score):这是一个综合考虑精确度和召回率的指标。如果一个系统既有很高的精确度也有很高的召回率,那么它的F1分数就会很高。这就像是你既找到了很多苹果,又确保了几乎所有的苹果都被你找到了。

平均精度(Average Precision, AP):这个指标衡量的是,在不同的置信度阈值下,精确度和召回率的平均表现。置信度可以理解为系统对检测到的对象存在的把握程度。AP越高,表示系统在不同置信度下的表现越稳定。

mAP(Mean Average Precision):这是在多个类别上计算AP后的平均值。如果一个系统需要检测多种类型的对象,比如猫、狗、鸟等,mAP就是这些类别AP值的平均,它提供了一个整体的性能评价。

速度(Speed):虽然不是直接的评价指标,但速度对于实时对象检测系统非常重要。YOLO系列的一个优点就是它的速度非常快,可以在视频流中实时检测对象,而不会有明显的延迟。

模型大小(Model Size):这个指标衡量的是模型的文件大小。在资源有限的设备上,如手机或嵌入式系统,模型大小是一个重要的考虑因素。

泛化能力(Generalization):这个指标衡量的是模型在未见过的数据上的表现。一个好的对象检测系统应该能够在多种环境和条件下都能稳定地工作。

这些指标通常在研究论文或技术报告中被用来比较不同的对象检测系统。在实际应用中,根据具体需求,可能会更关注某些指标。例如,对于需要实时反馈的应用,速度可能比精确度更重要。而对于安全监控系统,精确度和召回率可能更为关键。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


在现代社会,公共场所的禁烟政策越来越严格,以减少二手烟对非吸烟者的影响。然而,监管和执行这些政策仍然面临挑战。本文提出了一种基于YOLOv8(You Only Look Once version 8)的抽烟检测系统,该系统结合了深度学习技术和PyQt5图形用户界面框架,旨在实时监测并识别公共场所中的吸烟行为。该系统的设计考虑了实时性、准确性和用户友好性,为提高公共场所的空气质量和遵守禁烟规定提供了技术支持。

抽烟检测系统的设计和实现如下:

系统设计
数据集准备
为了训练YOLOv8模型,首先需要收集和标注一个包含各种吸烟行为的图像数据集。这个数据集应该包含不同背景、多种吸烟姿势、以及各种类型的香烟。图像标注需要明确指出吸烟者的位置和吸烟动作,以便模型学习识别吸烟行为。

模型训练
使用准备好的数据集,对YOLOv8模型进行训练。在训练过程中,需要调整学习率、批大小、训练周期等超参数,以优化检测效果。同时,可以采用数据增强技术,如随机裁剪、旋转、颜色变换等,以增强模型对不同场景的适应能力。

系统实现
系统的核心是YOLOv8模型,它负责从输入的实时视频流中检测吸烟行为。系统还包括一个基于PyQt5的用户界面,用于显示检测结果和发出警报。当模型检测到吸烟行为时,系统会通过声音或视觉信号提醒管理人员。

实时检测
为了实现实时检测,系统需要能够在低延迟的情况下处理视频流。这要求模型不仅要准确,还要高效。在实际部署中,可能需要在边缘设备上进行模型推理,以减少对中心服务器的依赖。

结果与讨论
在测试集上,YOLOv8模型展现出了较高的吸烟行为检测准确率。在不同的环境和光照条件下,模型都能稳定地识别吸烟者。然而,模型在处理遮挡严重或吸烟者与背景颜色相近的情况下仍有改进空间。

结论
本文提出的基于YOLOv8和PyQt5的抽烟检测系统,能够有效地辅助公共场所的禁烟管理。通过实时监测和提醒,该系统有助于提高禁烟规定的执行力度,保护非吸烟者免受二手烟的危害。未来的工作将集中在进一步提高模型的鲁棒性,以及探索更高效的模型部署和集成方案。


部分PyQt5可视化代码

# -*- coding: utf-8 -*-
import time
from PyQt5.QtWidgets import QApplication , QMainWindow, QFileDialog, \QMessageBox,QWidget,QHeaderView,QTableWidgetItem, QAbstractItemView
import sys
import os
from PIL import ImageFont
from ultralytics import YOLO
sys.path.append('UIProgram')
from UIProgram.UiMain import Ui_MainWindow
import sys
from PyQt5.QtCore import QTimer, Qt, QThread, pyqtSignal,QCoreApplication
import detect_tools as tools
import cv2
import Config
from UIProgram.QssLoader import QSSLoader
from UIProgram.precess_bar import ProgressBar
import numpy as np
# import torchclass MainWindow(QMainWindow):def __init__(self, parent=None):super(QMainWindow, self).__init__(parent)self.ui = Ui_MainWindow()self.ui.setupUi(self)self.initMain()self.signalconnect()# 加载css渲染效果style_file = 'UIProgram/style.css'qssStyleSheet = QSSLoader.read_qss_file(style_file)self.setStyleSheet(qssStyleSheet)def signalconnect(self):self.ui.PicBtn.clicked.connect(self.open_img)self.ui.comboBox.activated.connect(self.combox_change)self.ui.VideoBtn.clicked.connect(self.vedio_show)self.ui.CapBtn.clicked.connect(self.camera_show)self.ui.SaveBtn.clicked.connect(self.save_detect_video)self.ui.ExitBtn.clicked.connect(QCoreApplication.quit)self.ui.FilesBtn.clicked.connect(self.detact_batch_imgs)def initMain(self):self.show_width = 770self.show_height = 480self.org_path = Noneself.is_camera_open = Falseself.cap = None# self.device = 0 if torch.cuda.is_available() else 'cpu'# 加载检测模型self.model = YOLO(Config.model_path, task='detect')self.model(np.zeros((48, 48, 3)))  #预先加载推理模型self.fontC = ImageFont.truetype("Font/platech.ttf", 25, 0)# 用于绘制不同颜色矩形框self.colors = tools.Colors()# 更新视频图像self.timer_camera = QTimer()# 更新检测信息表格# self.timer_info = QTimer()# 保存视频self.timer_save_video = QTimer()# 表格self.ui.tableWidget.verticalHeader().setSectionResizeMode(QHeaderView.Fixed)self.ui.tableWidget.verticalHeader().setDefaultSectionSize(40)self.ui.tableWidget.setColumnWidth(0, 80)  # 设置列宽self.ui.tableWidget.setColumnWidth(1, 200)self.ui.tableWidget.setColumnWidth(2, 150)self.ui.tableWidget.setColumnWidth(3, 90)self.ui.tableWidget.setColumnWidth(4, 230)# self.ui.tableWidget.horizontalHeader().setSectionResizeMode(QHeaderView.Stretch)  # 表格铺满# self.ui.tableWidget.horizontalHeader().setSectionResizeMode(0, QHeaderView.Interactive)# self.ui.tableWidget.setEditTriggers(QAbstractItemView.NoEditTriggers)  # 设置表格不可编辑self.ui.tableWidget.setSelectionBehavior(QAbstractItemView.SelectRows)  # 设置表格整行选中self.ui.tableWidget.verticalHeader().setVisible(False)  # 隐藏列标题self.ui.tableWidget.setAlternatingRowColors(True)  # 表格背景交替# 设置主页背景图片border-image: url(:/icons/ui_imgs/icons/camera.png)# self.setStyleSheet("#MainWindow{background-image:url(:/bgs/ui_imgs/bg3.jpg)}")def open_img(self):if self.cap:# 打开图片前关闭摄像头self.video_stop()self.is_camera_open = Falseself.ui.CaplineEdit.setText('摄像头未开启')self.cap = None# 弹出的窗口名称:'打开图片'# 默认打开的目录:'./'# 只能打开.jpg与.gif结尾的图片文件# file_path, _ = QFileDialog.getOpenFileName(self.ui.centralwidget, '打开图片', './', "Image files (*.jpg *.gif)")file_path, _ = QFileDialog.getOpenFileName(None, '打开图片', './', "Image files (*.jpg *.jepg *.png)")if not file_path:returnself.ui.comboBox.setDisabled(False)self.org_path = file_pathself.org_img = tools.img_cvread(self.org_path)# 目标检测t1 = time.time()self.results = self.model(self.org_path)[0]t2 = time.time()take_time_str = '{:.3f} s'.format(t2 - t1)self.ui.time_lb.setText(take_time_str)location_list = self.results.boxes.xyxy.tolist()self.location_list = [list(map(int, e)) for e in location_list]cls_list = self.results.boxes.cls.tolist()self.cls_list = [int(i) for i in cls_list]self.conf_list = self.results.boxes.conf.tolist()self.conf_list = ['%.2f %%' % (each*100) for each in self.conf_list]# now_img = self.cv_img.copy()# for loacation, type_id, conf in zip(self.location_list, self.cls_list, self.conf_list):#     type_id = int(type_id)#     color = self.colors(int(type_id), True)#     # cv2.rectangle(now_img, (int(x1), int(y1)), (int(x2), int(y2)), colors(int(type_id), True), 3)#     now_img = tools.drawRectBox(now_img, loacation, Config.CH_names[type_id], self.fontC, color)now_img = self.results.plot()self.draw_img = now_img# 获取缩放后的图片尺寸self.img_width, self.img_height = self.get_resize_size(now_img)resize_cvimg = cv2.resize(now_img,(self.img_width, self.img_height))pix_img = tools.cvimg_to_qpiximg(resize_cvimg)self.ui.label_show.setPixmap(pix_img)self.ui.label_show.setAlignment(Qt.AlignCenter)# 设置路径显示self.ui.PiclineEdit.setText(self.org_path)# 目标数目target_nums = len(self.cls_list)self.ui.label_nums.setText(str(target_nums))# 设置目标选择下拉框choose_list = ['全部']target_names = [Config.names[id]+ '_'+ str(index) for index,id in enumerate(self.cls_list)]# object_list = sorted(set(self.cls_list))# for each in object_list:#     choose_list.append(Config.CH_names[each])choose_list = choose_list + target_namesself.ui.comboBox.clear()self.ui.comboBox.addItems(choose_list)if target_nums >= 1:self.ui.type_lb.setText(Config.CH_names[self.cls_list[0]])self.ui.label_conf.setText(str(self.conf_list[0]))#   默认显示第一个目标框坐标#   设置坐标位置值self.ui.label_xmin.setText(str(self.location_list[0][0]))self.ui.label_ymin.setText(str(self.location_list[0][1]))self.ui.label_xmax.setText(str(self.location_list[0][2]))self.ui.label_ymax.setText(str(self.location_list[0][3]))else:self.ui.type_lb.setText('')self.ui.label_conf.setText('')self.ui.label_xmin.setText('')self.ui.label_ymin.setText('')self.ui.label_xmax.setText('')self.ui.label_ymax.setText('')# # 删除表格所有行self.ui.tableWidget.setRowCount(0)self.ui.tableWidget.clearContents()self.tabel_info_show(self.location_list, self.cls_list, self.conf_list,path=self.org_path)if __name__ == "__main__":app = QApplication(sys.argv)win = MainWindow()win.show()sys.exit(app.exec_())

相关文章:

  • ElasticSearch学习篇10_Lucene数据存储之BKD动态磁盘树
  • 割点原理及封装好的割点类
  • 【Docker】在 Ubuntu20.04 上配置 Docker 开发环境
  • 【Pytorch】新手入门:基于sklearn实现鸢尾花数据集的加载
  • 软件测试APP完整测试作业流程(附流程图),公司级软件测试流程化办公
  • 拼图小游戏制作教程:用HTML5和JavaScript打造经典游戏
  • Authid Current_User 通过role获取到的权限 package不生效
  • 转移表回调函数实现
  • ARMv8/ARMv9架构入门到精通-学习方法
  • Java - Spring MVC 实现跨域资源 CORS 请求
  • Windows电脑安装Linux(Ubuntu 22.04)系统(图文并茂)
  • unity text 文本符号显示问题与打字机效果的结合
  • RabbitMQ备份交换机
  • CentOS系统上安装Redis操作教程
  • linux系统Docker容器Dockerfile示例
  • [分享]iOS开发-关于在xcode中引用文件夹右边出现问号的解决办法
  • echarts的各种常用效果展示
  • IndexedDB
  • IP路由与转发
  • JavaWeb(学习笔记二)
  • JS+CSS实现数字滚动
  • LintCode 31. partitionArray 数组划分
  • mysql 数据库四种事务隔离级别
  • Objective-C 中关联引用的概念
  • 搭建gitbook 和 访问权限认证
  • 解析 Webpack中import、require、按需加载的执行过程
  • 经典排序算法及其 Java 实现
  • 使用API自动生成工具优化前端工作流
  • 一文看透浏览器架构
  • 专访Pony.ai 楼天城:自动驾驶已经走过了“从0到1”,“规模”是行业的分水岭| 自动驾驶这十年 ...
  • ​Java并发新构件之Exchanger
  • ​业务双活的数据切换思路设计(下)
  • # C++之functional库用法整理
  • #1015 : KMP算法
  • $redis-setphp_redis Set命令,php操作Redis Set函数介绍
  • (1)svelte 教程:hello world
  • (超简单)构建高可用网络应用:使用Nginx进行负载均衡与健康检查
  • (翻译)Entity Framework技巧系列之七 - Tip 26 – 28
  • (牛客腾讯思维编程题)编码编码分组打印下标(java 版本+ C版本)
  • (强烈推荐)移动端音视频从零到上手(下)
  • (四)图像的%2线性拉伸
  • (原創) 如何將struct塞進vector? (C/C++) (STL)
  • (原創) 如何使用ISO C++讀寫BMP圖檔? (C/C++) (Image Processing)
  • (转)eclipse内存溢出设置 -Xms212m -Xmx804m -XX:PermSize=250M -XX:MaxPermSize=356m
  • (轉貼) UML中文FAQ (OO) (UML)
  • (最优化理论与方法)第二章最优化所需基础知识-第三节:重要凸集举例
  • .mysql secret在哪_MySQL如何使用索引
  • .NET LINQ 通常分 Syntax Query 和Syntax Method
  • .Net MVC + EF搭建学生管理系统
  • .net websocket 获取http登录的用户_如何解密浏览器的登录密码?获取浏览器内用户信息?...
  • .NET 跨平台图形库 SkiaSharp 基础应用
  • .NET 命令行参数包含应用程序路径吗?
  • .net 桌面开发 运行一阵子就自动关闭_聊城旋转门家用价格大约是多少,全自动旋转门,期待合作...
  • .NetCore项目nginx发布
  • .NET与 java通用的3DES加密解密方法