图像特征描述和人脸识别

news2024/11/26 7:46:16

CV_tutorial2

  • 特征检测
    • 使用HOG实现行人检测
    • Harris角点检测
    • 关键特征检测SIFT
    • 纹理特征 LBP算法
  • 模板匹配
  • 人脸识别

特征检测

使用HOG实现行人检测

HOG方向梯度直方图

实现过程:

  1. 灰度化(为了去掉颜色、光照对形状的影响);
  2. 采用Gamma校正法对输入图像进行颜色空间的标准化(使得图像输入更符合肉眼看上去更加柔和的状态);
  3. 计算每个像素的梯度,包括方向和大小;
  4. 将图像划分成小cells;
  5. 统计每个cell的梯度直方图,得到cell的描述子;
  6. 将每几个cell组成一个block,得到block的描述子;
  7. 将图像image内的所有block的HOG特征descriptor串联起来就可以得到HOG特征,该特征向量就是用来目标检测或分类的特征。
import cv2
import numpy as np
# 判断矩形i是否完全包含在矩形o中
def is_inside(o, i):
 ox, oy, ow, oh = 0
 ix, iy, iw, ih = i
 return ox > ix and oy > iy and ox+ow < ix+iw and oy+oh < iy+ih

# 对人体绘制颜色框
def draw_person(image, person):
	x, y, w, h = person
	cv2.rectangle(image, (x,y), (x+w, y+h), (0,0,255), 1)
img = cv2.imread("person.png")
hog = cv2.HOGDescriptor() # 启动检测器对象
hog.setSVMDetector(cv2.HOGDescriptor_getDefaultPeopleDetector()) # 指定检测器类型为人体
found, w = hog.detectMultiScale(img, 0.1, (1,1)) # 加载并检测对象
print(found)

# 丢弃某些完全被其它矩形包含在内的矩形,即其他都加入队列里
found_filtered = []
for ri, r in enumerate(found):
	for qi, q in enumerate(found):
		if ri != qi and is_inside(r, q):
			break
		else:
			found_filtered.append(r)
			print(found_filtered)
# 对其他有效矩形进行框定
for person in person_filtered:
	draw_person(img, person)
cv2.imshow("person detection", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

行人检测结果:
在这里插入图片描述
换了其他图片,发现这是效果最好的一张☝️

Harris角点检测

实现过程:

  1. 计算图像在x和y方向的梯度
  2. 计算图像两个方向的梯度的乘积
  3. 使用高斯函数对三者进行高斯加权,生成矩阵M的A, B, C
  4. 计算每个像素的Harris响应值R,并对小于某一阈值t的R置为零
  5. 在3x3或5x5的邻域内进行非最大值抑制,局部最大值点即为图像的角点
import cv2
import numpy as np
img = cv2.imread("img.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray = np.float32(gray) # 转换成numpy矩阵

# 输入图像必须是float32,blockSize,kernelsize,最后一个自由参数
#(经验取值在0.03~0.06之间)
dst = cv2.cornerHarris(gray, 2, 3, 0.03)

# 设定角点阈值,不同图像阈值不同
# 将角点用红色标注
img[dst>0.01*dst.max()]=[0, 0, 255]
# print(dst.max()) # 533091900.0
cv2.imshow("dst_img",img)
cv2.waitKey(0)
cv2.destryAllWindows()

角点检测:
在这里插入图片描述在原图上进行角点标注:
在这里插入图片描述
可以对角点进行膨胀,看得更清楚:

dst = cv2.dilate(dst,None)

在这里插入图片描述
单纯使用Harris的话,稍微复杂一点检测效果不佳
在这里插入图片描述

关键特征检测SIFT

Scale-invariant feature transform, 尺度不变特征变换算法
实现过程:

  1. 尺度空间极值检测点检测
  2. 关键点定位:去除一些不好的特征点
  3. 关键点方向参数:获取关键点所在尺度空间的邻域,然后计算该区域的梯度和方向,根据计算结果创建方向直方图,直方图的峰值为主方向的参数
  4. 关键点描述:每个关键点用一组向量(位置、尺度、方向)将这个关键点描述出来,使其不随着光照、视角等等影响而改变【优势】
  5. 关键点匹配:分别对模板图和实时图建立关键点描述符集合,通过对比关键点描述符来判断两个关键点是否相同

OpenCV > 4.0受到专利限制移除了xfeatures2d函数

import cv2
import numpy as np
img = cv2.imread("1.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

sift = cv2.xfeatures2d.SIFT_create()
kp = sift.detect(gray, None) # 找到关键点
img = cv2.drawKeypoints(gray, kp, img) # 绘制关键点

cv2.imshow('sp', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

纹理特征 LBP算法

Local Binary Pattern, 局部二值模式
LBP算子定义在3X3的窗口内,以窗口中心为阈值,与相邻的8个像素的灰度值比较,若周围的像素值大于中心像素值,则该位置被标为1;否则标记为0。

def LBP(src):
	height = src.shape[0]
	width = src.shape[1]
	dst = src.copy() # 浅拷贝
	lbp_value = np.zeros((1, 8), dtype=np.uint8)
	neighbours = np.zeros((1, 8), dtype=np.uint8)
	for x in range(1, width-1):
		for y in range(1, height-1):
			neighbours[0, 0] = src[y - 1, x - 1]
			neighbours[0, 1] = src[y - 1, x]
    		neighbours[0, 2] = src[y - 1, x + 1]
 	   		neighbours[0, 3] = src[y, x - 1]
   	  	    neighbours[0, 4] = src[y, x + 1]
        	neighbours[0, 5] = src[y + 1, x - 1]
        	neighbours[0, 6] = src[y + 1, x]
        	neighbours[0, 7] = src[y + 1, x + 1]
	        center = src[y, x]
        	for i in range(8):
        		if neighbours[0, i] > center:
        			lbp_value[0, i] = 1
      	  	else:
        			lbp_value[0, i] = 0
			# 计算lbp值(即二进制到十进制)
			lbp = lbp_value[0, 0] * 1 + lbp_value[0, 1] * 2 + lbp_value[0, 2] * 4 + lbp_value[0, 3] * 8 \
			 + lbp_value[0, 4] * 16 + lbp_value[0, 5] * 32 + lbp_value[0, 6] * 64 + lbp_value[0, 7] * 128
			# 将中心值改为lbp值
			dst[y, x] = lbp
		
	return dst

import cv2
import numpy as np
img = cv2.imread('building.png', 0) # 以单通道读入图像
# 看下源图
cv2.imshow('src',img)
cv2.waitKey(0)
cv2.destroyAllWindows()

new_img = LBP(img)

cv2.imshow('lbp',new_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述
在这里插入图片描述

模板匹配

人脸识别

一个完整的人脸识别系统一般包含4个主要组成部分:

  1. 人脸检测(人脸位置)Face Detect
  2. 人脸对齐(五官位置)Face Alignment
  3. 人脸特征提取(抽象为字符串信息)Face Feature Extraction
  4. 人脸识别(计算相似度,确认身份)Face Recognition
  • OpenCV封装的人脸检测方法
import cv2

img = cv2.imread("1.png")
# 检测器,加载人脸特征(该文件在python安装目录下)
face_cascade = cv2.CascadeClassifier(r'haaracascade_frontalface_default.xml')
# 灰度图减少计算强度(避免颜色干扰)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 检测的一个人脸坐标[x,y,w,h]是一个list,所以list的数量就是人脸数量
faces = face_cascade.detectMultiScale(gray, scaleFactor = 1.15, minNeighbors = 4, minSize = (5, 5))
print("Faces:{0}".format(len(faces)))

# 用矩形圈出人脸的位置(提供左上角和右下角坐标)
for(x, y, w, h) in faces:
	cv2.rectangle(img, (x, y), (x + w, y + h), (0, 0, 255), 2)

cv2.imshow("Faces", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

Face : 1
在这里插入图片描述
通过其他照片的试验,OpenCV自带的方法和dilb对于标准正脸检测OK的,但是对于侧脸(不同角度)以及低像素基本完全不OK

  • 使用dlib中的方法
# -*- coding:utf-8 -*-
import cv2
import dlib
import numpy as np

predictor_model = 'shape_predictor_68_face_landmarks/shape_predictor_68_face_landmarks.dat'
detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor(predictor_model)

dlib库没办法直接pip安装
找python3.8对应的dlib的轮子找了好一会儿,放百度盘了需要自取

许多博客尤其是CSDN,免费开源的放自己文章里收费😅,很不友好,目前还是习惯在这里记一些流水帐笔记😞

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/941044.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

拉美市场,跨境电商的最后一片蓝海市场?真的值得入场吗?

拉美&#xff0c;是跨境卖家公认的蓝海市场&#xff0c;甚至经常被称为“跨境电商的最后一片蓝海市场”。那么拉美市场的前景究竟如何&#xff1f;现在真的是跨境卖家入场的最佳时机吗&#xff1f;接下来就一起来看一看吧&#xff01; 拉美市场基本概况 1、消费潜力大&#x…

软件测试工程师必会技术:Python带你上手WebSocket

关于Socket那些事 Socket&#xff0c;即网络套接字&#xff0c;是双向通信通道的端点&#xff08;是抽象的&#xff09;。 套接字可以在一个进程内、同一台机器上的进程之间&#xff0c;或者在不同机器上的进程之间进行通信。 网络套接字可以通过多种不同的通道类型得以实现…

[ 云计算 | AWS ] Java 应用中使用 Amazon S3 进行存储桶和对象操作完全指南

文章目录 一、前言二、所需 Maven 依赖三、先决必要的几个条件信息四、创建客户端连接五、Amazon S3 存储桶操作5.1. 创建桶5.2. 列出桶 六、Amazon S3 对象操作6.1. 上传对象6.2. 列出对象6.3. 下载对象6.4. 复制、重命名和移动对象6.5. 删除对象6.6. 删除多个对象 七、文末总…

Linux 云服务器挂载数据盘

1、检查linux服务器磁盘情况 df -h 可以看到无磁盘挂载信息。 2、查看待挂载磁盘信息 fdisk -l 可以看到40G系统盘、50G数据盘&#xff08;盘符&#xff1a;/dev/vdb&#xff09; 3、对数据盘分区 fdisk /dev/vdb 根据提示&#xff0c;依次输入“n”&#xff0c;“p”“1…

ModaHub魔搭社区:向量数据库产业的现状与技术挑战

I. 向量数据库的崛起 什么是向量数据库 在过去的一段时间里,向量数据库逐渐在数据库领域崭露头角。那么,什么是向量数据库呢?简单来说,向量数据库是一种专门设计用来处理向量数据的数据库。这些向量数据可以是物理测量、机器学习模型输出、地理空间数据等。向量数据库使用…

归纳整理:开发多用户商城系统的关键细节

电子商务的迅速发展&#xff0c;越来越多的企业和商家选择开发多用户商城系统来进入线上商城市场。然而&#xff0c;在选择和开发多用户商城系统时&#xff0c;有一些关键的细节需要特别关注&#xff0c;以确保系统的顺利运行和用户的满意度。 一、安全性与数据保护 多用户商城…

浅析SAS协议:链路层

文章目录 概述原语通用原语连接管理原语连接通信原语 地址帧IDENTIFY地址帧OPEN地址帧 链路复位Link ResetHard ResetSATA的Link Reset 连接管理建立连接连接仲裁 流量控制SSP流控Credit Advance SMP流控 相关参考 概述 SAS链路层用于定义原语、地址帧以及连接相关的内容&…

和鲸冠名,全权支持!全国高校青年教师数据科学与商业分析案例教学竞赛成功举办

为推动数据科学与商业分析领域教学模式的创新&#xff0c;以赛促教&#xff0c;激发教师们的教学热情和创新能力&#xff0c;以赛促创&#xff0c;激发学生们的创新潜能和能动性&#xff0c;中国商业统计学会举办了首届“和鲸杯”全国高校青年教师数据科学与商业分析案例教学竞…

关于yarn安装时报“node“ is incompatible with this module的解决办法

前提&#xff1a; 在用vue写一个h5页面时&#xff0c;当在用yarn安装时&#xff0c;提示如下错误&#xff1a; The engine “node” is incompatible with this module. Expected version "^14.18.0 || ^16.14.0 || >18. 解决办法 我是使用命令忽略错误&#xff1a…

设计模式中的关系

文章目录 一、依赖概念 二&#xff0c;关联概念 三、聚合概念 四、组合概念 五、实现概念 六、继承概念 图总结整体总结 一、依赖 概念 依赖是一种临时使用关系&#xff0c;代码层体现为作为参数。 具体体现&#xff1a;依赖者调用被依赖者的局部变量、参数、静态方法&#…

认识Mat容器

目录 1.什么是Mat类 2.Mat类能存储的数据 整数类型&#xff08;有符号和无符号&#xff09;&#xff1a; 浮点数类型&#xff1a; 布尔类型&#xff1a; 3.Mat类的创建 1.利用矩阵宽、高和类型参数创建Mat类 2.利用矩陈Size(结构和数据类型参数创建Mat类 3.利用已有Mat…

c++ day6

1.编程题&#xff1a; 以下是一个简单的比喻&#xff0c;将多态概念与生活中的实际情况相联系&#xff1a; 比喻&#xff1a;动物园的讲解员和动物表演 想象一下你去了一家动物园&#xff0c;看到了许多不同种类的动物&#xff0c;如狮子、大象、猴子等。现在&#xff0c;动…

RSA私钥解密操作

RSA私钥解密操作 一、背景二、操作三、常见问题3.1 invalid key format3.2 解密的数据太长3.3 Decryption error 一、背景 项目数据库中存放的敏感字段已使用rsa加密的方式&#xff0c;将内容加密成密文存放, 现在需要在使用的时候&#xff0c;使用私钥进行解密。 二、操作 …

无涯教程-Python机器学习 - AdaBoost函数

它是最成功的增强集成算法之一。该算法的主要关键在于它们对数据集中的赋予权重的方式。因此,在构建后续模型时,该算法无需过多关注。 在以下Python配方中,我们将通过使用Pima Indians糖尿病数据集上的 sklearn 的 AdaBoostClassifier 类来构建用于分类的Ada Boost集成模型。 …

【计算机基础】一文带你了解 Linux

&#x1f449;博主介绍&#xff1a; 博主从事应用安全和大数据领域&#xff0c;有8年研发经验&#xff0c;5年面试官经验&#xff0c;Java技术专家&#xff0c;WEB架构师&#xff0c;阿里云专家博主&#xff0c;华为云云享专家&#xff0c;51CTO 专家博主 ⛪️ 个人社区&#x…

【DevOps视频笔记】6 - 7. Jenkins 介绍 和 安装

一、Integrate 工具 二、Jenkins 介绍 1. Jenkins 最主要的工作 2. CI / CD 可以理解为&#xff1a; 2.1 CI 过程 2.2 CD 过程 三、Jenkins 安装 1. 安装准备工作 2. 安装 Jenkins Stage 1&#xff1a;拉取 jenkins 镜像 Stage 2&#xff1a;编写docker-compose.yml St…

Postgresql的一个bug_涉及归档和pg_wal

故障描述&#xff1a; 服务器ocmpgdbprod1&#xff0c;是流复制主节点&#xff0c;它的从节点是ocmpgdbprod2&#xff0c;两个节点的Postgresql数据库版本都是PostgreSQL 11.6&#xff0c;主节点ocmpgdbprod1配置了pg_wal归档&#xff0c;从节点ocmpgdbprod2没有配置pg_wal归档…

雅思作文复习

目录 我使用的词汇&#xff1a; 上升&#xff1a; 下降&#xff1a; 波动&#xff1a; 保持&#xff1a; 幅度 大变化&#xff1a; 小变化&#xff1a; 雅思评价标准改变 小作文一般花费20分钟&#xff0c;我觉得自己能在18分钟解决是最好 考生在雅思考试中的小作文&a…

kali的学习

网络配置 1.kali的网络设置 首先我们了解kali的网络设置 DHCP&#xff1a;动态主机配置协议 是一个局域网的协议 使用UDP 协议工作静态IP&#xff1a;用于大部分的中小型网络 通过网络管理员手动分配IP原理进程 /etc 系统大部分服务启动过程都要访问该目录 我们直接去看看…

高效便捷的法律咨询小程序的设计与实践

现如今&#xff0c;随着智能手机的普及和移动互联网的发展&#xff0c;小程序成为了一种新兴的应用形式。对于律师事务所来说&#xff0c;开发一款专属的法律咨询小程序&#xff0c;无疑可以为客户提供更加便捷和高效的服务。那么&#xff0c;对于初次接触小程序制作的新手来说…