使用OpenCV和MediaPipe库——抽烟检测（姿态监控）

使用OpenCV和MediaPipe库——抽烟检测（姿态监控）

news2026/2/15 14:04:31

目录

抽烟检测的运用

1. 安全监控

(1) 公共场所禁烟监管

(2) 工业安全

2. 智能城市与执法

(1) 城市违章吸烟检测

(2) 无人值守管理

3. 健康管理与医疗

(1) 吸烟习惯分析

(2) 远程监护

4. AI 监控与商业分析

(1) 保险行业

(2) 商场营销

5. 技术实现

(1) 计算机视觉

(2) 传感器检测

(3) 结合物联网（IoT）

6. 挑战与优化

(1) 误报问题

(2) 夜间检测难度

(3) 隐私问题

代码实现思路

实现思路

1. 初始化检测模型

2. 读取视频流

3. 手部检测

4. 香烟检测

5. 嘴部检测

6. 抽烟行为判断

7. 可视化输出

8. 运行主循环

完整代码

效果展示

抽烟检测的运用

1. 安全监控

(1) 公共场所禁烟监管

应用场景：机场、火车站、地铁站、医院、商场、学校等禁烟区域。
作用：利用摄像头自动检测吸烟行为，触发警报或通知管理人员干预，减少人工巡逻成本。

(2) 工业安全

应用场景：化工厂、加油站、煤矿、仓库等易燃易爆场所。
作用：实时监测抽烟行为，防止安全事故，提高生产安全管理。

2. 智能城市与执法

(1) 城市违章吸烟检测

应用场景：公交站、公共厕所、电梯、餐厅等区域。
作用：结合智能监控系统，对违规吸烟行为进行抓拍、存证，甚至自动处罚。

(2) 无人值守管理

应用场景：智能楼宇、写字楼、电影院等无人巡逻区域。
作用：通过 AI 检测+语音提醒，劝阻违规吸烟者。

3. 健康管理与医疗

(1) 吸烟习惯分析

应用场景：医院、戒烟中心、健康管理 APP。
作用：记录个人抽烟次数、时间、环境等数据，帮助戒烟计划制定。

(2) 远程监护

应用场景：养老院、精神病院等特殊场所。
作用：监测老年人或患者是否有吸烟行为，防止健康风险。

4. AI 监控与商业分析

(1) 保险行业

应用场景：人寿保险、健康保险公司。
作用：检测投保人是否吸烟，调整保费或健康建议。

(2) 商场营销

应用场景：便利店、烟草店。
作用：分析吸烟人群的特征，优化营销策略。

5. 技术实现

(1) 计算机视觉

算法：基于 YOLO、Faster R-CNN 等目标检测模型。
数据：训练数据包含吸烟者的手部、嘴部、烟雾等特征。

(2) 传感器检测

红外摄像头：检测烟头的温度特征。
空气质量传感器：监测 PM2.5、尼古丁气味等。

(3) 结合物联网（IoT）

智能监控摄像头：内置 AI 识别系统，边缘计算本地处理数据。
云平台：接收数据并发出警报。

6. 挑战与优化

(1) 误报问题

误将吸烟动作与喝水、拿笔等动作混淆。
解决方案：使用时间序列分析、骨骼检测等方法提高准确率。

(2) 夜间检测难度

夜间光照条件差，普通摄像头难以检测烟雾。
解决方案：采用 红外摄像头 结合 AI 算法提高夜间识别率。

(3) 隐私问题

监控摄像头涉及个人隐私，可能引发争议。
解决方案：使用 边缘计算，仅上传检测结果，不存储人脸信息。

代码实现思路

实现思路

1. 初始化检测模型

MediaPipe Hands：用于检测 手部位置，得到手的边界框（bounding box）。
dlib 人脸关键点检测：用于检测 嘴部关键点，确定嘴巴的位置。
YOLOv3：用于检测香烟，需要加载权重（yolov3.weights）、配置文件（yolov3.cfg）和类别标签（coco.names）。

2. 读取视频流

通过 cv2.VideoCapture(0) 打开摄像头，逐帧读取视频。

3. 手部检测

MediaPipe Hands 处理帧图像，返回检测到的手部 关键点。
计算手部的 边界框（x_min, y_min, x_max, y_max）。
使用 cv2.rectangle() 画出手部边界框。

4. 香烟检测

通过 YOLOv3 目标检测 识别图像中的物体（包括香烟）。
过滤出 类别为 "cigarette" 的目标，并记录香烟的边界框信息（cigarette_bboxes）。
使用 cv2.rectangle() 画出香烟的位置。

5. 嘴部检测

通过 dlib 人脸检测器 定位人脸，并使用 68个面部关键点 识别嘴部（第48-67号点）。
计算 嘴部中心位置。
用 cv2.polylines() 画出嘴部区域。

6. 抽烟行为判断

遍历每只 手的边界框：
1. 判断是否持有香烟（手与香烟的 IOU 交并比 是否超过阈值 0.3）。
2. 计算手部到嘴部的距离：
  - 获取手部中心 (hand_center_x, hand_center_y)。
  - 计算与 最近的嘴部中心 的欧几里得距离 distance。
3. 综合判断抽烟行为：
  - 若 手持香烟且距离嘴部<100像素，则判定 正在抽烟。
  - 若 手部靠近嘴部<50像素，但未持有香烟，则 可能在抽烟（警告）。

7. 可视化输出

如果检测到 正在抽烟：
- 在屏幕上显示 "WARNING: Active Smoking Detected!"（红色警告）。
如果 疑似抽烟（手靠近嘴但未持烟）：
- 显示 "Potential Smoking!"（黄色提示）。
画出所有检测到的 手部、香烟、嘴部。

8. 运行主循环

不断读取摄像头画面，并调用 detect_smoking(frame) 进行检测。
按下 ESC 退出程序。

完整代码

import cv2
import numpy as np
import dlib
import mediapipe as mp

# 初始化MediaPipe手部检测
mp_hands = mp.solutions.hands
hands = mp_hands.Hands(
    max_num_hands=2,
    min_detection_confidence=0.7,
    min_tracking_confidence=0.5
)

# 初始化dlib人脸检测
detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor("shape_predictor_68_face_landmarks.dat")

# 加载YOLOv3模型（需包含自定义训练的香烟类别）
net = cv2.dnn.readNet("yolov3.weights", "yolov3.cfg")
layer_names = net.getLayerNames()
output_layers = [layer_names[i - 1] for i in net.getUnconnectedOutLayers().flatten()]

with open("coco.names", "r") as f:
    classes = [line.strip() for line in f.readlines()]


def is_holding_cigarette(hand_bbox, cigarette_bboxes, iou_threshold=0.3):
    """判断手部是否持有香烟（基于IOU）"""
    for cig_bbox in cigarette_bboxes:
        # 计算IOU
        x1 = max(hand_bbox[0], cig_bbox[0])
        y1 = max(hand_bbox[1], cig_bbox[1])
        x2 = min(hand_bbox[2], cig_bbox[2])
        y2 = min(hand_bbox[3], cig_bbox[3])

        intersection = max(0, x2 - x1) * max(0, y2 - y1)
        area_hand = (hand_bbox[2] - hand_bbox[0]) * (hand_bbox[3] - hand_bbox[1])
        area_cig = (cig_bbox[2] - cig_bbox[0]) * (cig_bbox[3] - cig_bbox[1])

        iou = intersection / (area_hand + area_cig - intersection)
        if iou > iou_threshold:
            return True
    return False


def detect_smoking(frame):
    # 转换为RGB格式（MediaPipe需要）
    rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)

    # 手部检测
    hand_bboxes = []
    results = hands.process(rgb_frame)
    if results.multi_hand_landmarks:
        for landmarks in results.multi_hand_landmarks:
            # 获取手部边界框
            x_coords = [lm.x * frame.shape[1] for lm in landmarks.landmark]
            y_coords = [lm.y * frame.shape[0] for lm in landmarks.landmark]
            x_min, x_max = min(x_coords), max(x_coords)
            y_min, y_max = min(y_coords), max(y_coords)
            hand_bboxes.append((x_min, y_min, x_max, y_max))
            cv2.rectangle(frame, (int(x_min), int(y_min)),
                          (int(x_max), int(y_max)), (255, 0, 0), 2)

    # YOLOv3香烟检测
    cigarette_bboxes = []
    blob = cv2.dnn.blobFromImage(frame, 0.00392, (320, 320), swapRB=True)
    net.setInput(blob)
    outs = net.forward(output_layers)

    for out in outs:
        for detection in out:
            scores = detection[5:]
            class_id = np.argmax(scores)
            confidence = scores[class_id]
            if confidence > 0.5 and classes[class_id] == "cigarette":
                center_x = int(detection[0] * frame.shape[1])
                center_y = int(detection[1] * frame.shape[0])
                w = int(detection[2] * frame.shape[1])
                h = int(detection[3] * frame.shape[0])
                x = center_x - w // 2
                y = center_y - h // 2
                cigarette_bboxes.append((x, y, x + w, y + h))
                cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2)

    # 人脸关键点检测
    mouth_positions = []
    faces = detector(frame)
    for face in faces:
        landmarks = predictor(frame, face)
        mouth_points = [(landmarks.part(i).x, landmarks.part(i).y)
                        for i in range(48, 68)]
        mouth_center = np.mean(mouth_points, axis=0)
        mouth_positions.append(mouth_center)
        # 绘制嘴巴区域
        cv2.polylines(frame, [np.array(mouth_points, dtype=np.int32)],
                      True, (0, 0, 255), 2)

    # 综合判断逻辑
    warning = False
    for hand in hand_bboxes:
        # 判断是否持烟
        holding = is_holding_cigarette(hand, cigarette_bboxes)

        # 计算手部中心点
        hand_center = ((hand[0] + hand[2]) / 2, (hand[1] + hand[3]) / 2)

        # 找最近的人脸
        min_distance = float('inf')
        for mouth in mouth_positions:
            distance = np.sqrt((hand_center[0] - mouth[0]) ** 2 +
                               (hand_center[1] - mouth[1]) ** 2)
            min_distance = min(min_distance, distance)

        # 判断条件
        if holding and min_distance < 100:  # 持烟且距离<100像素
            warning = True
        elif min_distance < 50:  # 未持烟但手部靠近嘴部
            cv2.putText(frame, "Potential Smoking!",
                        (int(hand[0]), int(hand[1]) - 10),
                        cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 255, 255), 2)

    if warning:
        cv2.putText(frame, "WARNING: Active Smoking Detected!",
                    (20, 50), cv2.FONT_HERSHEY_SIMPLEX,
                    1, (0, 0, 255), 3, cv2.LINE_AA)

    return frame


# 视频处理主循环
cap = cv2.VideoCapture(0)
while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    frame = cv2.flip(frame, 1)  # 镜像翻转
    result = detect_smoking(frame)

    cv2.imshow('Smoking Detection', result)
    if cv2.waitKey(1) == 27:
        break

cap.release()
cv2.destroyAllWindows()

效果展示

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2316146.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

怎么有效降低知网AIGC率

怎么有效降低知网AIGC率

在学术创作日益规范且数字化检测技术不断发展的当下，知网 AIGC 检测成为了众多创作者关注的焦点。许多人苦恼于如何有效降低知网 AIGC 率，让自己的作品在通过检测的同时，彰显出真实的创作水平与独特性。接下来，我们就深入探讨降低…

阅读更多...

C语言每日一练——day_8

引言针对初学者，每日练习几个题，快速上手C语言。第八天。（连续更新中） 采用在线OJ的形式什么是在线OJ？ 在线判题系统（英语：Online Judge，缩写OJ）是一种在编程竞赛中用…

阅读更多...

Mac中nvm切换node版本失败，关闭终端再次打开还是之前的node

Mac中nvm切换node版本失败，关闭终端再次打开还是之前的node

Mac中使用 nvm 管理 node 版本，在使用指令：nvm use XXX 切换版本之后。关闭终端，再次打开，输入 node -v 还是得到之前的 node 版本。原因： 在这里这个 default 中有个 node 的版本号，使用 nvm use 时&a…

阅读更多...

更改 Windsuf 插件 Market

更改 Windsuf 插件 Market

前言之前一直用 VScode，现在全部迁移到 Windsuf 了，但是，Windsuf 默认的插件市场里没有我喜欢的主题……我又有点强迫症，所以，把Windsuf 默认的插件市场换成 VScode 的😑 不废话原本的： 改…

阅读更多...

Vue 过滤器深度解析与应用实践

Vue 过滤器深度解析与应用实践

文章目录 1. 过滤器概述1.1 核心概念1.2 过滤器生命周期 2. 过滤器基础2.1 过滤器定义2.2 过滤器使用 3. 过滤器高级用法3.1 链式调用3.2 参数传递3.3 动态过滤器 4. 过滤器应用场景4.1 文本格式化4.2 数字处理4.3 数据过滤 5. 性能优化与调试5.1 性能优化策略5.2 调试技巧 6. …

阅读更多...

AI时代到来，对电商来说是效率跃升，还是温水煮青蛙

AI时代到来，对电商来说是效率跃升，还是温水煮青蛙

凌晨三点的义乌商贸城，95后创业者小王，静静地盯着屏幕上的AI工具，竟露出了笑容。这个月他的跨境玩具店销量提升了不少，从之前的状态翻了3倍；而且团队人数有所变化，从5人缩减到了2人（其中包括他…

阅读更多...

Androidstudio实现一个app引导页(超详细)

Androidstudio实现一个app引导页(超详细)

文章目录 1. 功能需求2. 代码实现过程1. 创建布局文件2. 创建引导页的Adapter3. 实现引导页Activity4. 创建圆点指示器的Drawable5. 创建“立即体验”按钮的圆角背景 2.效果图 1. 功能需求 1、需要和原型图设计稿对应的元素保持一致的样式。 2、引导页需要隐藏导航栏&#xff…

阅读更多...

[思考记录]关于AI辅助独立思考

[思考记录]关于AI辅助独立思考

本来是写两个反思类的记录，已经有了一些思路，并且都写了个开头。但手欠，去试着问了下AI，发现它的分析总结比我透彻。额......既然你这么厉害，那就你来，我向你学！ 那么，后续我再做类似…

阅读更多...

CVPR-2025 | 长程视觉语言导航平台与数据集：迈向复杂环境中的智能机器人

CVPR-2025 | 长程视觉语言导航平台与数据集：迈向复杂环境中的智能机器人

作者：Xinshuai Song, Weixing Chen, Yang Liu, Weikai Chen, Guanbin Li, Liang Lin 单位：中山大学，Independent Researcher，鹏城实验室项目主页：https://hcplab-sysu.github.io/LH-VLN 论文地址：https…

阅读更多...

Apifox Helper 自动生成API接口文档

Apifox Helper 自动生成API接口文档

在我们开发过程中我们在编写请求地址和编写请求参数的时候特别花费时间耗费了我们很多时间，作为一个程序员，更应该把精力时间集中在开发上， Apifox Helper 是 Apifox 团队针对 IntelliJ IDEA 环境所推出的插件，可以在 IDEA 环境中…

阅读更多...

历年云南大学计算机复试上机真题

历年云南大学计算机复试上机真题

历年云南大学计算机复试机试真题在线评测：传送门：pgcode.cn 喝饮料题目描述商店里有 n 中饮料，第 i 种饮料有 mi 毫升，价格为 wi。小明现在手里有 x 元，他想吃尽量多的饮料，于是向你寻求帮助&#x…

阅读更多...

Postman中Authorization和Headers的区别

Postman中Authorization和Headers的区别

案例笔者在进行token验证的时候碰到的问题一般如果是进行token验证，大部分是在Headers下面添加token名称及token的值这样：后端提取请求头的token即可还有一种是，左侧选择Bearer Token，右侧添加token的值,后端传递的大概…

阅读更多...

python使用openai的api的时候声明不要走系统代理，默认是走的

python使用openai的api的时候声明不要走系统代理，默认是走的

配置了以上的方式，还是不行。因为项目默认使用的是国内的大模型服务商，但是接口是和openapi通用的，所以可以直接使用，但是项目中有的链接还是要走系统代理的，所以就需要将两者区分开，配置openapi不走系统代…

阅读更多...

【免费】1949-2020年各省人均GDP数据

【免费】1949-2020年各省人均GDP数据

1949-2020年各省人均GDP数据 1、时间：1952-2020年 2、来源：国家统计局、统计年鉴 3、指标：各省人均GDP 4、范围：31省 5、指标解释：人均GDP（Gross Domestic Product per capita）是指一个国家…

阅读更多...

《Python实战进阶》No24: PyAutoGUI 实现桌面自动化

《Python实战进阶》No24: PyAutoGUI 实现桌面自动化

No24: PyAutoGUI 实现桌面自动化摘要 PyAutoGUI 是一个跨平台的桌面自动化工具，能够模拟鼠标点击、键盘输入、屏幕截图与图像识别，适用于重复性桌面任务（如表单填写、游戏操作、批量文件处理）。本集通过代码截图输出日志的实战形…

阅读更多...

功耗电流和耗电量的获取

功耗电流和耗电量的获取

1. 实验室环境： 在受控的实验条件下，我们使用 PowerMonitor 精确控制变量（如固定设备型号和系统版本、清理后台应用、设置恒定的亮度与音量、确保稳定的网络连接等），以获取高精度的电流测量数据，从而准确评…

阅读更多...

医疗送药机器人“空间拓扑优化+动态算法决策+多级容错控制”三重链式编程技术解析与应用

医疗送药机器人“空间拓扑优化+动态算法决策+多级容错控制”三重链式编程技术解析与应用

一、引言 1.1 研究背景与意义在医疗体系中，高效精准的药品配送是保障医疗服务质量和患者安全的关键环节。随着医疗技术的不断进步和医疗需求的日益增长，传统的人工送药方式逐渐暴露出诸多弊端，如配送效率低下、易受人为因素干扰导致错误率上升、人力成本高昂等。特别是在…

阅读更多...

[CISCN 2022 初赛]ezpop（没成功复现）

[CISCN 2022 初赛]ezpop（没成功复现）

打开在线环境可以看到： 记得之前做过一个类似的就是有点像照着漏洞去复现。应该可以直接在网上找到链子去打。 www.zip查看路由是 Index/test，然后 post 传参 a： exp（参考了别的大神的wp）： <?php //…

阅读更多...

QT编程之QGIS

QT编程之QGIS

一、QGIS介绍 Quantum GIS（QGIS）是开源地理信息系统桌面软件，使用GNU（General Public License）授权， 属于 Open Source eospatial Foundation（ OSGeo ）的官方计划。在 GNU 授权下&am…

阅读更多...

嵌入式C语言中堆栈管理与数据存储的精髓

嵌入式C语言中堆栈管理与数据存储的精髓

在嵌入式开发中，理解C语言的内存管理和数据存储机制是至关重要的。本文将从堆栈管理和数据存储两个方面，深入探讨C语言在嵌入式Linux开发中的应用。一、堆栈管理 1.1 栈的初始化与作用栈是C语言运行的基础，主要用于存储函数参数、局部变量、函数返回值和编译器生成的临时…

阅读更多...

推荐文章

最新文章