瑞芯微RV1126——人脸识别框架分析

news2024/10/6 11:39:35

项目核心是在Linux平台上利用摄像头采集人脸,并进行人脸识别。这个项目使用的是FFMPEG+OPENCV+虹软框架完成。

  • FFMPEG的主要工作是负责采集摄像头的数据并把摄像头数据发送给opencv。

  • Opencv的主要工作则是把摄像头数据转换成矩阵数据。

  • 虹软的主要功能则是利用Opencv的数据进行数据检测和识别并且和人脸数据库进行比较,如果识别成功则显示这个人的姓名,并把数据显示出来。

1.虹软人脸识别

(1).初始化所有的固件,如虹软SDK的激活、sqlite3人脸数据库的初始化并存放到map

init_asfort_device函数是激活虹软SDK
init_face_data函数是把人脸识别库查询出来并存放到Map,Map的key是人脸的名称,Value是人脸的特征(特征是blob数据)

(2).初始化工作线程,这三个线程分别是视频采集线程、虹软识别线程、显示线程。这三个线程的关系如下图:

视频采集线程(read_camera_thread):利用FFMPEG去进行采集摄像头的数据,并把摄像头的YUV存放到缓存队列里面,这里的缓存队列使用的是AVFifoBuffer进行存储(操作的API是av_fifo_generic_write写入YUV数据)。

虹软识别线程(process_asfort_recognize_thread):从AVFifoBuffer队列里面取出YUV数据(操作的API是av_fifo_generic_read读取YUV数据)并利用OPENCV框架进行转换,转换完成之后,利用虹软人脸识别API进行识别操作。识别完成之后,则把识别结果存放到显示队列(putMatQueue)里面

视频显示线程(show_opencv_thread):从opencv_queue队列取出每一帧数据(getMatQueue操作)处理过后的数据,显示到播放器里面。

**重点:**这个项目重点在于多线程和队列的操作,一般一个大型的项目都需要用到多线程的操作。因为使用多线程能够充分利用CPU资源,并快速响应。这个项目使用了三个线程去处理,分别是视频采集线程、 虹软识别线程、 视频显示线程。而线程之间的通信则利用队列进行通信。

2.Rockx Face人脸识别流程

1.目前本项目用rockx_face框架进行人脸识别

本项目的流程是先初始化rv1126的输入设备节点还有HDR设备功能(HDR功能是因为我的设备需要开启HDR才能够正常显示,这个看具体的设备),还有VO设备节点(设备输出节点)。

1.1.VI设备的初始化:

VI_CHN_ATTRS vi_chn_attr;
vi_chn_attr.pcVideoNode = pDeviceName;
vi_chn_attr.u32Bufcnt = u32Bufcnt;
vi_chn_attr.u32Width =u32width;
vi_chn_attr.u32Height = u32Height;
vi_chn_attr.enPixFmt = IMAGE TYPE NV12;
vi_chn_attr.enBufType =VI_CHN_BUF_TYPE_MMAP;
vi_chn_attr.enWorkMode =VI_WORK_MODE_NORMAL;
ret =RK_MPI_VI_SetchnAttr(s32CamId, l,&vi_chn_attr);
ret |= RK_MPI_VI_Enablechn(s32camId, 1);
if(ret){
	printf("ERROR: create VI[o] error! ret=d\n",ret);
    return 0;
}

上述代码是VI设备的初始化操作,这里涉及的参数包括pcVideoNode(设备节点)、u32Width(长度)、u32Height(高度)、enPixFmt(像素类型)、enBufType(VI捕获视频缓冲区计数)、enWorkMode(VI通道工作模式)。

1.2.HDR设备的初始化:

rk_aiq_working_mode_t hdr mode = RK_AIQ_WORKING_MODE_NORMAL;
SAMPLE_COMM_ISP_Init(hdr_mode, RK_FALSE);
SAMPLE_COMM_ISP_Run();
SAMPLE_COMM_ISP_SetFrameRate(25);

if(poutPath){
    g_output_file = fopen(poutPath,"w");
    if(!g_output_file){
        printf("ERROR: open file:&s fail,exit\n", poutPath);
        return 0;
    }
}

上述代码则是启动HDR功能的流程代码,这里直接调用SAMPLE_COMM_ISP_Run API进行HDR功能的开启。

1.3. VO设备的初始化

VO_CHN_ATTR_S stVoAttr ={0};stVoAttr.pcDevNode ="/dev/dri/card";stVoAttr.emPlaneType = VO_PLANE_OVERLAY;stVoAttr.enImgType = IMAGE_TYPE_NV12;stVoAttr.u16Zpos = 0;stVoAttr.stImgRect.s32X = 0;stVoAttr.stImgRect.s32Y = 0;stVoAttr.stImgRect.u32Width = disp width;stVoAttr.stImgRect.u32Height = disp height;stVoAttr.stDispRect.s32X = 0;stVoAttr.stDispRect.s32Y = 0;stVoAttr.stDispRect.u32Width = disp width;stVoAttr.stDispRect.u32Height = disp height;ret = RK MPI Vo Createchn(0,&stVoAttr);if(ret){    printf("Create vo[0] failed! ret=%d\n", ret);    return -1;}

上述代码是VO设备的初始化,这里涉及的参数包括:pcDevNode(输出设备节点)、emPlaneType(视频输出图层类型)、enImgType(视频输出类型)、stImgRect(视频输入图像格式)、stDispRect(输出图层尺寸参数)。

2.初始化完成之后,则开启两个线程进行开发,分别是rockx_rga_vi_test_thread线程、rockx_process_vo_thread线程。

rockx_rga_vi_test_thread线程主要功能是,从rv1126摄像头数据拿到原始数据(NV12)数据,并利用rockx框架进行人脸检测、人脸识别、实时画框等操作。并把处理过后的原始数据存放到队列rockx_queue里面。

rockx_process_vo_thread线程的主要功能是,阻塞rockx_queue队列操作,等待数据的到来。当rockx_queue有数据来的时候,则把处理过后的数据传送给VO设备。

具体的看流程图:

3.YOLOV3目标识别说明

1.加载YOLOV3的文件,并把标签名称存放到容器里面

std::ifstream ifs(yolov3_model_file.c_str());
    if (!ifs.is_open())
    {
        std::cerr << "File " + yolov3_model_file + " not found";
        return -1;
    }
    std::string line;
    while (std::getline(ifs, line))
    {
        classes.push_back(line);
}

2.初始化工作线程,这三个线程分别是视频采集线程、yolov3识别线程、显示线程。这三个线程的关系如下图:

**视频采集线程(read_camera_thread):**利用FFMPEG去进行采集摄像头的数据,并把摄像头的YUV存放到缓存队列里面,这里的缓存队列使用的是AVFifoBuffer进行存储(操作的API是av_fifo_generic_write写入YUV数据)。

**Yolov3识别线程(process_avframe_dnn_thread):**从AVFifoBuffer队列里面取出YUV数据(操作的API是av_fifo_generic_read读取YUV数据)并利用OPENCV框架进行转换,转换完成之后,利用Opencv DNN API进行YOLOV3识别操作(具体的YOLOV3识别步骤非常复杂,后面会慢慢讲到)。识别完成之后,则把识别结果存放到显示队列(putMatQueue)里面.

**视频显示线程(show_opencv_thread):**从opencv_queue队列取出每一帧数据(getMatQueue操作)处理过后的数据,显示到播放器里面。

重点:这个项目重点在于多线程和队列的操作,一般一个大型的项目都需要用到多线程的操作。因为使用多线程能够充分利用CPU资源,并快速响应。这个项目使用了三个线程去处理,分别是视频采集线程、 YOLOV3识别线程、 视频显示线程。而线程之间的通信则利用队列进行通信。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1709490.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AGI |一文快速上手LangChain的新利器:LangGraph!

目录 前言 Part1 LLM Agent &#xff08;一&#xff09;Agent概述 &#xff08;二&#xff09;Agent框架 Part2 LangGraph &#xff08;一&#xff09;LangGraph介绍 &#xff08;二&#xff09;LangGraph组成 &#xff08;三&#xff09;LangGraph使用 &#xff08;四…

MQTT 5.0 报文解析 06:AUTH

欢迎阅读 MQTT 5.0 报文系列 的最后一篇文章。在上一篇中&#xff0c;我们已经介绍了 MQTT 5.0 的 DISCONNECT 报文。现在&#xff0c;我们将介绍 MQTT 中的最后一个控制报文&#xff1a;AUTH。 MQTT 5.0 引入了增强认证特性&#xff0c;它使 MQTT 除了简单密码认证和 Token 认…

Xinstall全渠道统计服务,洞悉App推广效果

在当今数字化时代&#xff0c;App已经成为企业和个人进行业务推广和服务提供的重要渠道。然而&#xff0c;随着App市场的日益饱和&#xff0c;如何有效地推广和运营App成为了众多广告主和开发者面临的难题。而App渠道统计作为衡量推广效果、优化运营策略的重要手段&#xff0c;…

RSC英国皇家化学学会文献查找下载

英国皇家化学学会(Royal Society of Chemistry&#xff0c;简称RSC)是以促进全球化学领域研究发展与传播为宗旨的国际权威学术机构&#xff0c;是化学信息的一个重要宣传机关和出版商。RSC出版的期刊是化学领域的核心期刊&#xff0c;大部分被SCI和MEDLINE收录&#xff0c;如An…

SQL 语言:数据操作

文章目录 SELECT 基本结构简单查询连接查询子查询聚集函数和更名操作分组查询字符串操作集合操作UNION 运算INTERSECT 运算EXCEPT 运算 视图查询和更新WITH 子句其他语句总结 SQL 的数据操作包括 SELECT(查询)、INSERT(插入)、DELETE(删除)和 UPDATE(修改)四条语句。 SELECT 基…

大坝安全位测设备:位移监测站

TH-WY1大坝安全位移监测设备是用于监测水库大坝位移变化的设备&#xff0c;旨在确保大坝的安全运行。以下是关于大坝安全位移监测设备的一些重要信息&#xff1a; 作用&#xff1a;大坝位移监测设备能够实时监测大坝的位移情况&#xff0c;包括水平位移和垂直位移。通过对这些…

【数据结构与算法】七大排序算法(上)

【数据结构与算法】七大排序算法(上) &#x1f955;个人主页&#xff1a;开敲&#x1f349; &#x1f525;所属专栏&#xff1a;数据结构与算法&#x1f345; &#x1f33c;文章目录&#x1f33c; 1. 排序的概念及应用 1.1 排序的概念 1.2 排序的应用 1.3 常见排序算法 2. 常…

使用 Django 显示表中的数据

1、问题背景 当我们使用 Django 进行 Web 开发时&#xff0c;经常需要在 Web 页面上显示数据库中的数据。例如&#xff0c;我们可能需要在一个页面上显示所有用户的信息&#xff0c;或者在一个页面上显示所有文章的标题和作者。那么&#xff0c;如何使用 Django 来显示表中的数…

SSDReporter for Mac:守护您硬盘健康的守护者

SSDReporter for Mac是一款专为Mac用户设计的固态硬盘&#xff08;SSD&#xff09;健康状况检测工具。以下是关于这款软件的详细介绍&#xff1a; SSDReporter for Mac的主要功能是全面检测、监控Mac设备中SSD的工作状态&#xff0c;以确保数据的完整性和设备的稳定性。它能够…

常见的数据分析方法

1.周期性分析法 一个指标的观察时间拉长,看它是否有周期变化规律。周期性分析常见的有两者:自然周期和生命周期。自然周期,指业务指标会随着时间自然变化,如节假日用户/业绩出现下滑、产品销售额随季节变动等;生命周期,譬如“商品生命周期”、“APP生命周期”、“用户生…

卤菜销售|基于SSM+vue的智能卤菜销售平台的设计与实现(源码+数据库+文档)

智能卤菜销售平台 目录 基于SSM&#xff0b;vue的智能卤菜销售平台的设计与实现 一、前言 二、系统设计 三、系统功能设计 1系统功能模块 2管理员功能模块 3用户功能模块 4商家功能模块 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八…

力扣63 不同路径Ⅱ Java版本

文章目录 题目描述代码 题目描述 一个机器人位于一个 m x n 网格的左上角 &#xff08;起始点在下图中标记为 “Start” &#xff09;。 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角&#xff08;在下图中标记为 “Finish”&#xff09;。 现在考虑网格…

媒体发布会怎么邀请媒体,到场采访报道?

传媒如春雨&#xff0c;润物细无声&#xff0c;大家好&#xff0c;我是51媒体网胡老师。 媒体发布会的邀请和组织是一个需要精心策划的过程&#xff0c;以下是一些基本步骤和建议&#xff0c;以确保媒体发布会能够吸引媒体到场并进行有效的采访报道&#xff1a; 明确宣传目的和…

leetCode. 85. 最大矩形

leetCode. 85. 最大矩形 部分参考上一题链接 leetCode.84. 柱状图中最大的矩形 此题思路 代码 class Solution { public:int largestRectangleArea( vector<int>& h ) {int n h.size();vector<int> left( n ), right( n );stack<int> st;// 求每个矩形…

特定车型专属AI模型解决方案,高清图像,稳定输出

美摄科技凭借其对人工智能领域的深刻理解和技术积累&#xff0c;为企业带来了一项革命性的解决方案——特定车型专属AI模型。这一方案以专属车型照片为基础&#xff0c;通过先进的AI生成模型训练&#xff0c;为企业提供个性化、高清、稳定的车辆图像和视频生成服务&#xff0c;…

【招聘帖】资深数通专家 ,薪资最高3.5W

资深数通专家 薪资&#xff1a;25000-35000 元/月 工作职责 岗位职责&#xff1a; 1、负责统筹管理客户全网问题&需求跟踪管理及汇报、日常数通团队工作的每日分解协调、人员技能内训及跟踪闭环&#xff1b; 2、负责统筹对架构基线梳理评估、软件版本管理、应急方案可执行…

2024年第七届管理、经济和社会科学国际会议(ICMESS 2024)

2024年第七届管理、经济和社会科学国际会议(ICMESS 2024) 会议简介 2024年第七届管理、经济和社会科学国际会议&#xff08;ICMESS 2024&#xff09;将为“管理、经济与社会发展”等最新研究领域的研究人员、专家、学者和行业专家提供一个平台&#xff0c;介绍他们的最新研究…

【区块链】fisco网络运维之添加节点黑名单

基于已完成的区块链系统与管理平台搭建工作&#xff0c;开展区块链节点的黑名单工作&#xff0c;具体操作如下 以node3为例子 1查看node0节点的连接状态日志&#xff08;现有4个节点连接&#xff09; 注意&#xff1a;如果查询不到连接状态&#xff0c;修改node0的配置文件中…

同时安装python2 和python3

最近的项目因为工具的原因 需要同时安装python2 和python3 我又想学着使用python 写东西 导致遇到了很多问题 记录下来 1 同时安装 python2 和python 1.1 安装完把/确认 Path 环境变量里 同时有python2,python2\Scripts和python3 ,python3\Scripts四个环境变量 修改python3…

前端本地项目启动供后端或者测试调试

目录 1、项目本地启动的地址 2、打开终端输入 ifconfig 查找ip 3、将localhost替换成ip即可供他人测试 1、项目本地启动的地址 http://localhost:8100/?module220&webRoutevpc-gray&backRoutevpc-gray........................... 2、打开终端输入 ifconfig 查找i…