基于深度学习框架设计的货运管家(功能总结)

news2024/9/22 3:52:41

项目背景:

在快递行业发达的今天,有数不胜数的货运公司、快递公司,这些公司都有自己的运输车辆,请师傅开车送货。

比如:快递公司、烟草运输公司、货物运输公司等等。 为了能方便管理货车,了解车辆行驶路线(是否是公司规定的路线)、行驶过程中是否违规吸烟、疲劳驾驶、未系安全带等等。根据需求开发了这一套智能货运管家系统。

功能框架:

img

货运管家的车载主机–显示屏界面:

img

img

img

img

下面介绍这套货运管家系统功能实现的技术指标:

1 识别过程原理

通过采集数据,做二值化分类,给神经网络输入正向的图片(例如抽烟)和负向的图片(例如不抽烟),进行训练学习。神经网络会把这个特征学会。神经网络并不知道某个行为是什么意思。但是通过卷积神经网络学到了这个特征。所以过程需要采集各类正负向图片。

识别的思路,首先需要先识别图像中是否有人体,若检测到至少1个人体,将目标最大的人体作为驾驶员,进一步识别驾驶员的属性行为,再逐步分析识别是否使用手机、抽烟、未系安全带、双手离开方向盘、视线未朝前方、未佩戴口罩、闭眼、打哈欠、低头等典型行为姿态。 通过分析人体行为的这项技术还可以针对出租车、客车、公交车、货车等各类营运车辆,实时监控车内情况,识别驾驶员抽烟、使用手机、未系安全带、未佩戴口罩、疲劳、视线偏离等违规行为,及时预警,降低事故发生率,保障人身财产安全。

识别的图像需要提前使用算法训练得到模型,深度学习算法里面的基本模型大致分为了3类:多层感知机模型;深度神经网络模型和递归神经网络模型。其代表分别是DBN(Deep belief network) 深度信念网络、CNN(Convolution Neural Networks)卷积神经网络、RNN(Recurrent neural network) 递归神经网络。

2 动作定义

对于某些“动作”其实可以理解为单帧图片识别。例如,抽烟这个动作。我们对抽烟的严谨定义就是,一个张图片里只要嘴巴位置叼着烟就是吸烟。宽松定义就是,图片中的嘴巴位置出现烟,或者手上出现烟就认为这个特征是吸烟。

再宽松一点,图片中的嘴巴位置或者手上的位置出现类似烟的东西(例如白纸),就认为是抽烟。

3 单个动作识别和连续动作识别

单个动作识别就是只需要对任意一帧图片进行识别,便可以得出该帧图片到底是包含还是不不包含某个特征。它和前后帧没有多大联系。例如,抽烟、未系安全带、打电话等,基本通过单帧图像识别。

而对于疲劳驾驶,则要求更复杂一些,因为某些情况下一帧图片(例如张嘴)不能代表疲劳。它也有可能表示正常的张嘴。此时需要对连续动作进行识别,根据前后帧的结果进行计算。来判断当前连续动作是否属于疲劳的范畴。

4 一些要求

1 自带NPU的芯片。

2 采集摄像头要带有夜视功能。

5 识别抽烟

类别:单帧图像识别。

识别率:85%

6 识别未系安全带

类别:单帧图像识别。

识别率:85%

7 识别打电话

类别:单帧图像识别。

识别率:85%

8 识别疲劳驾驶

疲劳驾驶主要是通过检测眼睛的闭合频率来识别的,眼睛闭合的频率和持续时间在某种程度上可以反映疲劳的状态。卡内基梅隆研究所经过反复试验和论证,提出了度量疲劳的物理PERCLOS。PERCLOS定义为一定时间内眼睛的闭合程度,它已经成为度量疲劳状态的一种科学有效的方法。

当一定时间间隔内眼睛闭合所占的时间比例超过15%时即认为是疲劳状态。PERCLOS方法通过眼睛闭合所占的时间比例进行疲劳驾驶的判定。但是,眼睛的大小因人而异,眼睛的面积因受所在场景和头部运动的影响也是动态变化的,眼睛的睁开程度是相对于自身的最大睁开状态而言的。当然,时间可以转换为视频帧数,在判断眼睛的状态特征时我们使用的是类PERCLOS的方法。

目前,PERCLO方法有三种判断疲劳的不同准则,分别E准则、P70准则、P80准则。其具体含义如下:

EM准则:瞳孔被眼睑覆盖超50%的面积,则认为眼睛是闭合的;

P70准则:瞳孔被眼睑覆盖超70%的面积,则认为眼睛是闭合的;

P80准则:瞳孔被眼睑覆盖超过80%的面积,则认为眼睛是闭合的。

当人注意力特别集中或处在沉思状态时可能也会有眼睑覆盖瞳孔超过50%甚至70%的可能,所以系统采用的是P80准则。

正常情况下,人在一分钟之内要眨十次左右的眼睛,每次需要0.30.4秒左右,两次眨眼之间的间隔约为2.84.0秒。然而,由于管制员工作性质的不同,需要其在工作中注意力高度集中,所以眨眼次数略少,约5~10次。眼睛闭合的频率以及闭合时间的长短与疲劳有密切联系,如果连续监测到管制员的PERCLOS>30%且平均闭眼时长>0.25s,就判定管制员处于疲劳状态,并发出报警。

类别:连续

帧识别。

识别率:80%~85%。

动作定义:

①连续n秒内取出x帧画面出现y次张嘴动作(涉及张嘴幅度的计算)

n取3-5,是一个根据反馈调节的参数。

x取10~25,是一个根据反馈调节的参数。

y取10~25。

②连续n秒内取出x帧画面出现y次眼睛闭合动作(涉及闭眼幅度的计算)。

n取3-5,是一个根据反馈调节的参数。

x取10~25,是一个根据反馈调节的参数。

y取10~25。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/188618.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

49.Isaac教程--Cartographer

Cartographer ISAAC教程合集地址: https://blog.csdn.net/kunhe0512/category_12163211.html 文章目录Cartographer数据要求配置启动 Cartographer 示例应用程序监控和可视化输出Cartographer 是 Google 的一个(同步定位和映射)SLAM 系统,能够…

2023最新前端面试题5(持续更新)

Vue 74、vue 生命周期 74.1、什么是 Vue 生命周期? Vue 实例从创建到销毁的过程,就是生命周期。也就是从开始创建、初始化数据编译模板、挂载 Dom一渲染、更新一渲染、卸载等一系列过程,我们称这是 Vue的生命周期 74.2、Vue 生命周期的作用是什么?…

函数递归+青蛙跳台阶——“C”

各位CSDN的uu们你们好呀,今天小雅兰的内容终于要回到我们的C语言了,在之前,我写函数这篇博客的时候就讲过,会把函数递归的内容单独拿出来,然后呢当时是说下一篇博客就会更函数递归和青蛙跳台阶,由于一系列原…

拼多多控价,低价投诉,不被支持怎么办

治理电商平台上的低价乱价链接,首选方法是沟通调整,成本低、见效快。针对沟通调整不成功的,再进行平台投诉,通过电商平台的力量对其进行约束。 但是,平台投诉一定要注意一点:不要以低价为理由!…

原命题和逆否命题

看Boyd的凸优化看到这样一个证明: 从左到右的证明是 使用了一个逆否命题的方法进行证明,有点忘记了原命题和逆否命题之间的相互转换,记录一下。 简单形式命题 简单形式命题没有全称量词∀\forall∀和存在两次∃\exists∃,也没有…

字符流、字节流、缓冲流、序列化流

1.文件拷贝的基本代码 2.一次读取多个字节 3.异常处理 但是上述的释放过程太繁琐,于是便用AutoCloseable接口简化释放过程 JDK7: JDK9: 4.各种字词计算机存储规则 所以底层二进制文件就是根据正负来区别英文和中文的。 5.乱码 6.字符流 7.字符输入流和输出流底层原理…

ASEMI桥式整流电路KBP206特性参数的计算

编辑-Z 什么是桥式整流电路? 桥式整流电路由四个二极管以闭环“桥式”配置连接,以产生所需的输出。这种桥式电路的主要优点是不需要特殊的中央抽头变压器,从而减小了尺寸和成本。单个次级绕组连接到二极管桥网络的一侧,负载连接到…

【正点原子FPGA连载】第二十一章根文件系统构建 摘自【正点原子】DFZU2EG_4EV MPSoC之嵌入式Linux开发指南

1)实验平台:正点原子MPSoC开发板 2)平台购买地址:https://detail.tmall.com/item.htm?id692450874670 3)全套实验源码手册视频下载地址: http://www.openedv.com/thread-340252-1-1.html 第二十一章根文件…

ch3_1系统总线的概念

1. 总线的基本概念 总线概念: 是连接各个部件的信息传输线,是各个部件共享的传输介质; 1.1 为何需要总线 总线结构便于增减 外设, 同时 减少了信息传输线的条数。 总线是信号的公共传输线, 1.2 总线上信息的传送 …

深入理解堆与优先队列

目录一、什么是堆?二、堆的实现2.1 上滤与下滤2.2 堆的常用操作2.3 建堆三、堆排序四、优先队列References一、什么是堆? 堆(Heap)是一种特殊的完全二叉树,满足性质:除叶节点外每个节点的值都大于等于&…

【Window 入侵排查】

Window 入侵排查1、文件的排查1.1 开机启动有无异常文件启动1.2 对系统敏感文件路径的查看1.3 查看Recent1.4 查看文件时间1.5 webshell 文件排查2、进程、端口排查2.1 查看进程2.2 进程排查2.3 使用powershell 进行查询2.4 使用WMIC 命令进行排查3、检查启动项、计划任务、服务…

全志V85X系列芯片PCB设计需要注意些什么?

全志V85X (包括V853、V853S、V851S、V851SE等)是一颗面向智能视觉领域推出的新一代高性能、低功耗的处理器SOC,可广泛用于智能门锁、智能考勤门禁、网络摄像头、行车记录仪、智能台灯等智能化升级相关行业。V85X 集成ARM Cortex-A7和RISC-V E…

一个跨平台执行外部命令的C#开源库

更多开源项目请查看:一个专注推荐.Net开源项目的榜单 对于我们程序员来说,在日常开发项目中,调用外部的命令是非常常见的,比如调用批处理命令、调用其他应用,这里面就涉及到进程的通讯、管理、启动、取消等一些操作&am…

Spring Native打包本地镜像,无需通过Graal的maven插件buildtools

简介 在文章《GraalVM和Spring Native尝鲜,一步步让Springboot启动飞起来,66ms完成启动》中,我们介绍了如何使用Spring Native和buildtools插件,打包出本地镜像,也打包成Docker镜像。本文探索一下,如果不通…

一文细说Linux Out Of Memory机制

有时候我们会发现系统中某个进程会突然挂掉,通过查看系统日志发现是由于 OOM机制 导致进程被杀掉。 今天我们就来介绍一下什么是 OOM机制 以及怎么防止进程因为 OOM机制 而被杀掉。 什么是OOM机制 OOM 是 Out Of Memory 的缩写,中文意思是内存不足。而…

【CLYZ集训】人人人数【数学】

思路: 先转转转,把答案变成求每种数的出现次数都小于i的方案书除以Cnm−1mC_{n m - 1}^{m}Cnm−1m​ 对于每个1到m中的数,设每个数的出现次数为xi,则所有x加起来要等于m,且都小于i。 容斥,设其中k个不小于…

目标检测算法——YOLOV8——算法详解

一、主要贡献 主要的创新点:其实到了YOLOV5 基本创新点就不太多了,主要就是大家互相排列组合复用不同的网络模块、损失函数和样本匹配策略。 Yolo v8 主要涉及到:backbone 使用C2f模块,检测头使用了anchor-free Decoupled-head&a…

HTB_Unified_log4j_jndi注入mongodb修改用户hash

文章目录信息收集漏洞复现漏洞验证漏洞利用提权信息收集 nmap -sV -v 这次扫描时间很长,因为默认只扫 1000 个常用端口,如果扫到大端口就会自动扫描全端口,可以自行加速 22/tcp open ssh OpenSSH 8.2p1 Ubuntu 4ubuntu0.3 (…

Markdown语法-从基础到进阶

时代在进步,越来越多的人和软件开始使用Markdown进行文字编辑,其编辑方便性让很多人爱不释手。但是,不可避免的问题是,在编辑的时候,经常会需要去google,毕竟,习惯了office的可视化操作符号,很多…

在成都Java培训班学习五个多月有用吗?

不知道“有用”的标准是什么,是能入行上岗工作,还是想只通过几个月的培训一跃成为资深开发攻城狮?这里不得不给大家泼瓢冷水,短期培训能让你对口上岗工作就很不错了;想要成为技术大佬?大学里面四年都没能让…