opencv学习:CascadeClassifier和detectMultiScale算法进行人脸识别

news2025/1/20 12:13:51

CascadeClassifier

CascadeClassifier 是 OpenCV 提供的一个用于对象检测的类,它基于Haar特征和AdaBoost算法。它能够识别图像中的特定对象,比如人脸、眼睛、微笑等。CascadeClassifier 需要一个预训练的XML分类器文件,该文件包含了用于检测对象的特征。

CascadeClassifier 的工作流程

  1. 特征选择:从大量的 Haar 特征中选择最有区分力的特征。这些特征能够最好地区分对象和背景。
  2. 训练 AdaBoost 分类器:使用选定的 Haar 特征训练 AdaBoost 分类器。这个过程会生成一系列弱分类器,每个弱分类器都基于一个 Haar 特征。
  3. 构建级联分类器:将训练好的 AdaBoost 分类器组织成一个级联结构。级联分类器由多个阶段组成,每个阶段包含多个弱分类器。图像首先通过第一阶段的所有弱分类器,如果通过,则进入第二阶段,以此类推。
  4. 检测对象:在新的图像中检测对象时,图像会依次通过级联分类器的每个阶段。如果图像在某个阶段被拒绝,则检测过程结束。如果图像通过了所有阶段,则认为图像中存在目标对象。

detectMultiScale

detectMultiScaleCascadeClassifier 类的一个方法,用于在给定的图像中检测对象。这个方法会返回一个对象列表,每个对象由其在图像中的矩形框坐标表示。这个方法能够处理不同大小的对象,因为它可以在多个尺度上进行检测

1. 滑动窗口(Sliding Window)机制

detectMultiScale 方法使用滑动窗口机制来扫描整个图像。窗口在图像上从左到右、从上到下移动,每次移动一定的步长(不是像素步长,而是窗口步长)。在每个窗口位置,分类器都会被用来评估该区域是否包含目标对象。

2. 多尺度检测

为了检测不同大小的对象,detectMultiScale 方法会对图像进行多次扫描,每次扫描使用不同的窗口尺寸。这是通过调整图像的尺度来实现的,即图像被多次缩放,每次缩放后都进行滑动窗口检测。scaleFactor 参数控制每次缩放时图像尺寸的减小比例。

3. Haar 特征和分类器评估

在每个窗口位置,分类器会评估该窗口内是否包含目标对象。分类器是基于 Haar 特征的,这些特征是从图像的小块区域计算出来的。分类器使用这些特征来评估窗口内的目标对象。

4. 级联分类器

detectMultiScale 方法使用的分类器是一个级联分类器,它由多个阶段组成。每个阶段包含多个基于 Haar 特征的弱分类器。级联分类器的工作方式如下:

  • 第一阶段:快速排除大部分背景区域。如果一个窗口通过了第一阶段的所有弱分类器,它被认为是一个候选区域,进入第二阶段。
  • 后续阶段:更详细地评估候选区域。每个阶段都试图更准确地评估窗口是否包含目标对象。
  • 最终阶段:如果一个窗口通过了所有阶段的分类器,它被认为是一个真正的目标对象。

5. 非极大值抑制(Non-Maximum Suppression)

在检测过程中,可能会在同一个对象上得到多个重叠的候选区域。为了解决这个问题,detectMultiScale 方法使用非极大值抑制。这个步骤会保留最佳的候选区域,并去除那些与最佳区域重叠且置信度较低的区域。

6. 输出结果

detectMultiScale 方法的输出是一个候选区域列表,每个候选区域由其在图像中的矩形框坐标(x, y, width, height)表示。这些坐标定义了检测到的对象的位置和大小。

代码流程

读取图像

import cv2
img=cv2.imread('renlian1.jpg')

图像尺寸调整

def resize(image,width=None,height=None ,inter=cv2.INTER_AREA):
    dim=None
    (h,w) = image.shape[:2]#获取输入图像的高度和宽度。
    if width is None and height is None:#如果宽度和高度都没有指定,则直接返回原始图像。
        return image
    if width is None:#如果只指定了高度,计算新的宽度以保持图像的宽高比。
        r=height/float(h)
        dim=(int(w*r),height)
    else:#如果只指定了宽度,计算新的高度以保持图像的宽高比。
        r=width/float(w)
        dim=(width,int(h*r))
    #根据计算出的尺寸 dim 调整图像大小。
    resized=cv2.resize(image,dim,interpolation=inter)     # 默认为cV2.INTER_AREA,即面积插值,适用于缩放图像。
    return resized
img=resize(img,1000)

转换图像为灰度图

gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

 加载Haar特征分类器

加载OpenCV提供的Haar特征分类器XML文件,该文件用于检测图像中的脸部。

faceCase=cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

 检测图像中的脸部

使用加载的分类器和灰度图像,调用detectMultiScale函数来检测图像中的脸部。

faces=faceCase.detectMultiScale(gray,scaleFactor=1.05,minNeighbors=9,minSize=(8,8))

绘制矩形框

遍历检测到的脸部,使用cv2.rectangle函数在每个脸部周围绘制绿色的矩形框。

for (x,y,w,h) in faces:
    cv2.rectangle(img,(x,y),(x+w,y+h),(0,255,0),2)
cv2.imshow('result',img)
cv2.waitKey(0)

运行结果

完整代码

import cv2
img=cv2.imread('renlian1.jpg')
def resize(image,width=None,height=None ,inter=cv2.INTER_AREA):
    dim=None
    (h,w) = image.shape[:2]#获取输入图像的高度和宽度。
    if width is None and height is None:#如果宽度和高度都没有指定,则直接返回原始图像。
        return image
    if width is None:#如果只指定了高度,计算新的宽度以保持图像的宽高比。
        r=height/float(h)
        dim=(int(w*r),height)
    else:#如果只指定了宽度,计算新的高度以保持图像的宽高比。
        r=width/float(w)
        dim=(width,int(h*r))
    #根据计算出的尺寸 dim 调整图像大小。
    resized=cv2.resize(image,dim,interpolation=inter)     # 默认为cV2.INTER_AREA,即面积插值,适用于缩放图像。
    return resized
img=resize(img,1000)
gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
faceCase=cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
faces=faceCase.detectMultiScale(gray,scaleFactor=1.05,minNeighbors=9,minSize=(8,8))
print('数目{}'.format(len(faces)))
print('坐标',faces)
for (x,y,w,h) in faces:
    cv2.rectangle(img,(x,y),(x+w,y+h),(0,255,0),2)
cv2.imshow('result',img)
cv2.waitKey(0)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2213833.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SHA1算法学习

SHA-1(安全哈希算法1)是一种加密哈希函数,它接受一个输入并生成一个160位(20字节)的哈希值,通常表示为一个40位的十六进制数。 SHA1的特点 输入与输出:SHA-1可以接受几乎任意大小的输入&#…

21世纪20年代最伟大的情侣:泰勒斯威夫特和特拉维斯凯尔西每张照片都在秀恩爱

在时代的长河中,每一代都毫无例外地拥有属于自己的 it couple(当红情侣),他们成为了那个特定时期大众瞩目的焦点和津津乐道的话题。 千禧年间,确实涌现出了诸多令人瞩目的情侣组合。就像汤姆克鲁斯和凯蒂霍尔姆斯&…

【H2O2|全栈】更多关于HTML(2)HTML5新增内容

目录 HTML5新特性 前言 准备工作 语义化标签 概念 新内容 案例 多媒体标签 音频标签audio 视频标签 video 新增部分input表单属性 预告和回顾 后话 HTML5新特性 前言 本系列博客是对入门专栏的HTML知识的补充,并伴随一些补充案例。 这一期主要介绍H…

从源码上剖析AQS的方方面面(超详细版)

AQS在 ReentrantLock 的使用方式(非公平锁) 我们之前学习过 ReentrantLock 非公平锁与公平锁的区别在于,非公平锁不会强行按照任务等待队列去等待任务,而是在获取锁的时候先去尝试使用 CAS 改变一下 State,如果改变成…

架构设计笔记-18-安全架构设计理论与实践

知识要点 常见的安全威胁: 信息泄露:信息被泄露或透露给某个非授权的实体。破坏信息的完整性:数据被非授权地进行增删、修改或破坏而受到损失。拒绝服务:对信息或其他资源的合法访问被无条件地阻止。攻击者向服务器发送大量垃圾…

多选框的单选操作 Element ui

文章目录 样式预览Q:为什么要这么做?实现原理探索路程 样式预览 Q:为什么要这么做? 单选框的样式不够好看单选框因为框架等原因,无法取消选择 实现原理 判断多选框绑定的 value,如果长度为2,那…

实缴新玩法:公司注册资金与知识产权的完美结合

在当今商业环境中,公司注册资金的实缴方式不断创新和发展。其中,将公司注册资金与知识产权相结合,成为了一种引人注目的新玩法。 以往,公司注册资金的实缴往往依赖于货币资金的注入。然而,随着知识经济的崛起&#xf…

中文学术期刊(普刊)-全学科

文章目录 一、征稿简介二、重要信息三、服务简述四、投稿须知五、联系咨询 一、征稿简介 二、重要信息 期刊官网:https://ais.cn/u/3eEJNv 三、服务简述 中国知网是最负盛名的中文数据图书馆,收录来自自然科学、社会科学的优质学术期刊;维…

Redis哨兵TILT模式问题解决方案

Redis sentinel的TILT影响范围 Redis版本影响范围:5、6、7版本 部署方式为k8s部署,都会受到影响,裸金属部署没有问题 当redis哨兵集群进入TILT模式后,业务无法正常连接到redis集群,无法正常使用redis集群。 TILT 模式&…

你用过最好用的AI工具有哪些?探寻用户心中的最爱与最佳

随着人工智能技术的飞速发展,AI 工具如雨后春笋般涌现,广泛应用于各个领域。在 10 月 8 日至 10 月 27 日这段时间里,我们深入探讨了人们在使用 AI 工具时的偏好和体验,旨在揭示那些最受用户喜爱以及被认为最好用的 AI 工具&#…

构造函数

引入&#xff1a;构造函数的由来 对于以下Date类&#xff1a; class Date { public:void Init(int year, int month, int day){year year;_month month;_day day;}void Print(){cout << _year << "-" << _month << "-" <&…

STL源码剖析:STL算法

STL 算法总览 质变算法 mutating algorithms—会改变操作对象之值 所有的 STL算法都作用在由迭代器(first,last)所标示出来的区间上。所谓“质变算法”,是指运算过程中会更改区间内(迭代器所指)的元素内容。诸如拷贝(copy)、互换(swap)、替换(replace)、填写(fill)、删除(remov…

吐槽kotlin之垃圾设计

本文重点在于吐槽垃圾设计&#xff0c;基本直只说缺点。 一.没有static关键字 static其实不是很面向对象&#xff0c;但是是很有必要和方便的。 kotlin为了实现java的static功能&#xff0c;必须使用伴生类&#xff0c;一般情况下没啥问题&#xff0c;但是反编译之后的class多…

数据结构与算法——Java实现 36.求数据流中位数

就借着月光&#xff0c;再与你对望 —— 24.10.14 295. 数据流的中位数 中位数是有序整数列表中的中间值。如果列表的大小是偶数&#xff0c;则没有中间值&#xff0c;中位数是两个中间值的平均值。 例如 arr [2,3,4] 的中位数是 3 。例如 arr [2,3] 的中位数是 (2 3) / 2 …

Java jconsole.exe 调试工具

寻找JDK所在路径&#xff1a; 打开 jconsole.exe 启动之前确保idea程序已经运行了有的同学需要用管理员方式运行&#xff0c;即 右键 jconsole.exe 选择用管理员方式运行 上面的折线图&#xff0c;表示随着时间有哪些线程 下面的左边的线程中&#xff1a;Thread tnew MyThre…

【Java数据结构】链表面试题

【Java数据结构】链表面试题 一、移除链表元素二、反转链表三、链表的中间结点四、删除链表的倒数第 N 个结点五、合并两个有序链表六、链表分割七、链表的回文结构八、相交链表九、环形链表 此篇博客希望对你有所帮助&#xff08;帮助你更加了解链表&#xff09;&#xff0c;不…

stm32 为什么有2个晶振?8mhz+32.768k

1个是系统时钟晶振是单片机内部系统的主时钟源&#xff0c;它负责控制整个系统的时钟频率。这个晶振的频率一般比较高&#xff0c;通常在几十MHz到几百MHz不等。它和CPU以及各种总线之间相互配合&#xff0c;从而协同工作。 另外一个是外设时钟晶振则通常用于单片机的内部外设…

pnpm报错 cannot find package xxx,有的电脑正常运行,只有这个的电脑报错

pnpm build报错 cannot find package xxx&#xff0c;有的电脑正常运行&#xff0c;只有这一个报错 在网上查找各种资料发现是项目在电脑里的目录层级比较深导致的。 问题&#xff1a;在 Windows 系统上&#xff0c;文件路径过长&#xff08;超过 260 个字符&#xff09;可能…

2024年10月14日读书笔记第三篇-

我们继续学习 自下而上思考&#xff0c;总结概括 如果你将所有的信息进行归类分组、抽象概括&#xff0c;并以自上而下的方式表达出来&#xff0c;那么你的文章结构会如图1-3所示。每个方框代表你希望表达的一个思想。 你的思维从最底部的层次开始构建&#xff0c;将句子按照某…

CUDA 事件计时

CUDA 事件 可以为主机代码和设备代码计时。 基本的语法 // 定义事件变量 cudaEvent_t start, stop; // 初始化 cudaEventCreate(&start); cudaEventCreate(&stop); // 记录代表时间开始的事件&#xff0c;注意不是地址 cudaEventRecord(start); // 在TCC的驱动下可以…