OpenCV 关键点定位

news2025/4/15 19:42:58

一、Opencv关键点定位介绍

关键点定位在计算机视觉领域占据着核心地位,它能够精准识别图像里物体的关键特征点。OpenCV 作为功能强大的计算机视觉库,提供了多种实用的关键点定位方法。本文将详细阐述关键点定位的基本原理,深入探讨 OpenCV 中几种常用的关键点定位算法,通过具体代码示例展示其使用方法,并介绍关键点定位在不同领域的实际应用。

在当今数字化时代,计算机视觉技术发展迅猛,广泛应用于图像识别、目标跟踪、机器人导航等众多领域。关键点定位作为计算机视觉的基础任务之一,旨在找出图像中具有代表性的特征点,这些点能够反映物体的结构和形状信息。OpenCV 凭借其丰富的函数库和高效的算法实现,成为了关键点定位的首选工具。

二、关键点定位原理

2.1 特征点的定义
特征点是图像中具有独特性质的点,通常具有以下特点:
独特性:在图像中能够明显区别于周围的点。
稳定性:在不同的光照、旋转、缩放等条件下,特征点的位置和特征能够保持相对稳定。
可重复性:在不同的图像或同一图像的不同视角下,能够可靠地检测到相同的特征点。
2.2 关键点定位的基本步骤
特征检测:在图像中找出可能的特征点。常用的方法有基于灰度变化、边缘检测等。
特征描述:为检测到的特征点生成一个描述符,用于表示该特征点的特征信息。描述符通常是一个向量,能够在不同的图像中匹配相同的特征点。
特征匹配:将不同图像中的特征点进行匹配,找出它们之间的对应关系。

三、代码实现

1. 导入必要的库

import numpy as np
import cv2
import dlib

numpy:是一个用于科学计算的基础库,提供了多维数组对象和处理这些数组的工具。
cv2:是 OpenCV 库,用于计算机视觉任务,如读取图像、绘制图形等。
dlib:是一个强大的机器学习库,在人脸检测和关键点定位方面有很好的表现。

2. 读取图像

img = cv2.imread("cr73.png")

cv2.imread:用于读取指定路径的图像文件,这里读取的是名为 cr73.png 的图像,并将其存储在变量 img 中。

3. 初始化人脸检测器

detector = dlib.get_frontal_face_detector()
faces = detector(img, 0)

dlib.get_frontal_face_detector():返回一个预训练好的人脸检测器对象 detector,用于检测图像中的人脸。
detector(img, 0):调用人脸检测器对图像 img 进行人脸检测。第二个参数 0 表示不进行图像金字塔的上采样,即只在原始图像上进行检测。检测结果存储在 faces 中,faces 是一个包含检测到的人脸矩形区域的列表。

4. 初始化关键点检测器

predictor = dlib.shape_predictor("shape_predictor_68_face_landmarks.dat")

dlib.shape_predictor:用于加载预训练好的 68 个关键点检测器模型。这里需要提供模型文件的路径 "shape_predictor_68_face_landmarks.dat",该模型可以根据检测到的人脸区域预测出 68 个关键点的位置。

5. 遍历检测到的人脸并标注关键点

for face in faces:
    shape = predictor(img, face)
    landmarks = np.array([[p.x, p.y] for p in shape.parts()])
    for idx, point in enumerate(landmarks):
        pos = (point[0], point[1])
        cv2.circle(img, pos, 2, color=(0, 255, 0), thickness=-1)
        cv2.putText(img, str(idx), pos, cv2.FONT_HERSHEY_SIMPLEX, 0.4,
                    (255, 255, 255), 1, cv2.LINE_AA)

shape = predictor(img, face):对于每个检测到的人脸区域 face,使用关键点检测器 predictor 在图像 img 上预测 68 个关键点的位置,结果存储在 shape 中。
landmarks = np.array([[p.x, p.y] for p in shape.parts()]):将 shape 中的关键点位置信息转换为 numpy 数组 landmarks,每个关键点用二维坐标 [x, y] 表示。
for idx, point in enumerate(landmarks):遍历 landmarks 中的每个关键点,idx 是关键点的编号(从 0 到 67),point 是关键点的坐标。
pos = (point[0], point[1]):将关键点的坐标转换为元组 pos,用于后续的绘制操作。
cv2.circle(img, pos, 2, color=(0, 255, 0), thickness=-1):在图像 img 上以 pos 为圆心,半径为 2 像素绘制一个绿色的实心圆,用于标记关键点。
cv2.putText(img, str(idx), pos, cv2.FONT_HERSHEY_SIMPLEX, 0.4, (255, 255, 255), 1, cv2.LINE_AA):在图像 img 上以 pos 为位置,使用 cv2.FONT_HERSHEY_SIMPLEX 字体,字号为 0.4,颜色为白色,线宽为 1 绘制关键点的编号 str(idx),并使用抗锯齿线条 cv2.LINE_AA 使文字更平滑。

6. 显示图像并等待按键

cv2.imshow("img", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.imshow("img", img):在名为 "img" 的窗口中显示处理后的图像 img。
cv2.waitKey(0):等待用户按下任意按键,0 表示无限等待。
cv2.destroyAllWindows():关闭所有由 OpenCV 打开的窗口。

完整代码:

import numpy as np
import cv2
import dlib
img = cv2.imread("cr73.png")
detector = dlib.get_frontal_face_detector()
faces =detector(img,0)
predictor = dlib.shape_predictor("shape_predictor_68_face_landmarks.dat")
for face in faces:
    shape=predictor(img,face)
    landmarks =np.array([[p.x,p.y]for p in shape.parts()])
    for idx, point in enumerate(landmarks):
        pos = (point[0], point[1])
        cv2.circle(img, pos, 2,color=(0,255, 0),thickness=-1)
        cv2.putText(img, str(idx),pos,cv2.FONT_HERSHEY_SIMPLEX,0.4,
                    (255,255,255),1,cv2.LINE_AA)
cv2.imshow("img",img)
cv2.waitKey(0)
cv2.destroyAllWindows()

结果显示:

四、总结

OpenCV 提供了丰富的关键点定位算法,每种算法都有其特点和适用场景。Harris 角点检测简单快速,适用于对实时性要求较高的场景;SIFT 算法具有尺度和旋转不变性,但计算复杂度较高;ORB 算法结合了速度和性能,是一种较为均衡的选择。
随着计算机视觉技术的不断发展,关键点定位算法也在不断改进和创新。未来,关键点定位将在更多的领域得到应用,如自动驾驶、增强现实等。同时,如何提高关键点定位的准确性和鲁棒性,仍然是研究的热点问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2334488.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

arm_math.h、arm_const_structs.h 和 arm_common_tables.h

在 ​​FOC(Field-Oriented Control,磁场定向控制)​​ 中,arm_math.h、arm_const_structs.h 和 arm_common_tables.h 是 CMSIS-DSP 库的核心组件,用于实现高效的数学运算、预定义结构和查表操作。以下是它们在 FOC 控…

buuctf sql注入类练习

BUU SQL COURSE 1 1 实例无法访问 / Instance cant be reached at that time | BUUCTF但是这个地方很迷惑就是这个 一个 # 我们不抓包就不知道这个是sql注入类的判断是 get 类型的sql注入直接使用sqlmap我们放入到1.txt中 目的是 优先检测 ?id1>python3 sqlmap.py -r 1.t…

具身导航中的视觉语言注意力蒸馏!Vi-LAD:实现动态环境中的社会意识机器人导航

作者:Mohamed Elnoor 1 ^{1} 1, Kasun Weerakoon 1 ^{1} 1, Gershom Seneviratne 1 ^{1} 1, Jing Liang 2 ^{2} 2, Vignesh Rajagopal 3 ^{3} 3, and Dinesh Manocha 1 , 2 ^{1,2} 1,2单位: 1 ^{1} 1马里兰大学帕克分校电气与计算机工程系, 2…

全局前置守卫与购物车页面鉴权

在很多应用里,并非所有页面都能随意访问。例如购物车页面,用户需先登录才能查看。这时可以利用全局前置守卫来实现这一鉴权功能。 全局前置守卫的书写位置在 router/index.js 文件中,在创建 router 对象之后,暴露 router 对象之前…

layui 弹窗-调整窗口的缩放拖拽几次就看不到标题、被遮挡了怎么解决

拖拽几次,调整窗口的缩放,就出现了弹出的页面,右上角叉号调不出来了,窗口关不掉 废话不多说直入主题: 在使用layer.alert layer.confirm layer.msg 等等弹窗时,发现看不到弹窗,然后通过控制台检查代码发现…

网络空间安全(57)K8s安全加固

一、升级K8s版本和组件 原因:K8s新版本通常会引入一系列安全功能,提供关键的安全补丁,能够补救已知的安全风险,减少攻击面。 操作:将K8s部署更新到最新稳定版本,并使用到达stable状态的API。 二、启用RBAC&…

2025蓝桥杯C++A组省赛 题解

昨天打完蓝桥杯本来想写个 p y t h o n python python A A A 组的题解,结果被队友截胡了。今天上课把 C A CA CA 组的题看了,感觉挺简单的,所以来水一篇题解。 这场 B B B 是一个爆搜, C C C 利用取余的性质比较好写&#…

论文学习:《通过基于元学习的图变换探索冷启动场景下的药物-靶标相互作用预测》

原文标题:Exploring drug-target interaction prediction on cold-start scenarios via meta-learning-based graph transformer 原文链接:https://www.sciencedirect.com/science/article/pii/S1046202324002470 药物-靶点相互作用(DTI&…

十八、TCP多线程、多进程并发服务器

1、TCP多线程并发服务器 服务端&#xff1a; #include<stdio.h> #include <arpa/inet.h> #include<stdlib.h> #include<string.h> #include <sys/types.h> /* See NOTES */ #include <sys/socket.h> #include <pthread.h>…

AIGC-文生图与图生图

在之前的文章中&#xff0c;我们知道了如何通过Web UI和Confy UI两种SD工具来进行图片生成&#xff0c;今天进一步地讲解其中的参数用处及如何调节。 文生图 参数详解 所谓文生图&#xff0c;就是通过文字描述我们想要图片包含的内容。初学的话&#xff0c;还是以Web UI为例…

量化交易 - 聚宽joinquant - 多因子入门研究 - 源码开源

先看一下我们的收益&#xff1a; JoinQuant直达这里看看 下面讲解原理和代码。 目录 一、是否为st 二、是否停牌 三、市值小、roe大 四、编写回测代码 今天来研究一下多因子回测模型&#xff0c;这里以‘市值’、‘roe’作为例子。 几个标准&#xff1a;沪深300里选股&am…

FPGA 37 ,FPGA千兆以太网设计实战:RGMII接口时序实现全解析( RGMII接口时序设计,RGMII~GMII,GMII~RGMII 接口转换 )

目录 前言 一、设计流程 1.1 需求理解 1.2 模块划分 1.3 测试验证 二、模块分工 2.1 RGMII→GMII&#xff08;接收方向&#xff0c;rgmii_rx 模块&#xff09; 2.2 GMII→RGMII&#xff08;发送方向&#xff0c;rgmii_tx 模块&#xff09; 三、代码实现 3.1 顶层模块 …

上篇:《排序算法的奇妙世界:如何让数据井然有序?》

个人主页&#xff1a;strive-debug 排序算法精讲&#xff1a;从理论到实践 一、排序概念及应用 1.1 基本概念 **排序**&#xff1a;将一组记录按照特定关键字&#xff08;如数值大小&#xff09;进行递增或递减排列的操作。 1.2 常见排序算法分类 - **简单低效型**&#xff…

红宝书第三十四讲:零基础学会单元测试框架:Jest、Mocha、QUnit

红宝书第三十四讲&#xff1a;零基础学会单元测试框架&#xff1a;Jest、Mocha、QUnit 资料取自《JavaScript高级程序设计&#xff08;第5版&#xff09;》。 查看总目录&#xff1a;红宝书学习大纲 一、单元测试是什么&#xff1f; 就像给代码做“体检”&#xff0c;帮你检查…

CST1019.基于Spring Boot+Vue智能洗车管理系统

计算机/JAVA毕业设计 【CST1019.基于Spring BootVue智能洗车管理系统】 【项目介绍】 智能洗车管理系统&#xff0c;基于 Spring Boot Vue 实现&#xff0c;功能丰富、界面精美 【业务模块】 系统共有三类用户&#xff0c;分别是&#xff1a;管理员用户、普通用户、工人用户&…

HTTP:五.WEB服务器

web服务器 定义:实现提供资源或应答的提供者都可以谓之为服务器!web服务器工作内容 接受建立连接请求 接受请求 处理请求 访问报文中指定的资源 构建响应 发送响应 记录事务处理过程 Web应用开发用到的一般技术元素 静态元素:html, img,js,Css,SWF,MP4 动态元素:PHP,…

0基础 | 硬件滤波 C、RC、LC、π型

一、滤波概念 &#xff08;一&#xff09;滤波定义 滤波是将信号中特定波段频率滤除的操作&#xff0c;是抑制和防止干扰的重要措施。通过滤波器实现对特定频率成分的筛选&#xff0c;确保目标信号的纯净度&#xff0c;提升系统稳定性。 &#xff08;二&#xff09;滤波器分…

图论基础理论

在我看来&#xff0c;想要掌握图的基础应用&#xff0c;仅需要三步走。 什么是图&#xff08;基本概念&#xff09;、图的构造&#xff08;打地基&#xff09;、图的遍历方式&#xff08;应用的基础&#xff09; 只要能OK的掌握这三步、就算图论入门了&#xff01;&#xff0…

企业级低代码平台的架构范式转型研究

在快速迭代的数字时代&#xff0c;低代码平台如同一股清流&#xff0c;悄然成为开发者们的新宠。 它利用直观易用的拖拽式界面和丰富的预制组件&#xff0c;将应用程序的开发过程简化到了前所未有的程度。通过封装复杂的编程逻辑和提供强大的集成能力&#xff0c;低代码平台让…

怎么免费下载GLTF/GLB格式模型文件,还可以在线编辑修改

​ 现在非常流行glb格式模型&#xff0c;和gltf格式文件&#xff0c;可是之类模型网站非常非常少 1&#xff0c;咱们先直接打开http://glbxz.com 官方glb下载网站 glbxz.com 2 可以搜索&#xff0c;自己想要的模型关键词 3&#xff0c;到自己想下载素材页面 4&#xff0c;…