12月13日 OpenCV 实战基础学习笔记——Harris、SIFT

news2026/2/14 13:00:37

文章目录

前言
一、Harris 角点检测
- 1、公式推导
- 2、找到 $E (u, v)$ 的最大值
二、SIFT
- 1、关键点定位 keypoint localisation
- 2、特征描述 feature description

前言

本文为12月13日 OpenCV 实战基础学习笔记，分为两个章节：

Harri 角点检测；
SIFT。

一、Harris 角点检测

使用一个固定窗口在图像上进行任意方向上的滑动，比较滑动前与滑动后两种情况，窗口中的像素灰度变化程度，如果存在任意方向上的滑动，都有着较大灰度变化，那么我们可以认为该窗口中存在角点。

1、公式推导

设窗口平移 $[U, V]$ 产生灰度变化 $E (u, v)$ :
${\textstyle \sum_{x, y}} w(x, y)[I(x+u, y+v) - I(x, y)]^2$

其中：

$u, v$ : 窗口偏移量；
$x, y$ : 窗口内像素的坐标；
$w (x, y)$ : 窗口函数，内含权重信息，常用的有权重为1和呈二元高斯正太分布的权重;
$I$ : 像素密度函数，类比与像素值.

2、找到 $E (u, v)$ 的最大值

泰勒展开式：
$\approx f(x, y) + uf_x(x, y) + vf_y(x, y)$

所以：
$\sum [I(x+u, y+v) - I(x, y)]^2 \approx \sum [ I(x, y) + uI_x(x, y) + vI_y(x, y)- I(x, y)]^2 = \sum u^2 I_x^2 + 2vu I_x I_y + v^2 I_y^2 = \sum [uv]\begin{bmatrix} I_x^2 & I_x I_y \\ I_x I_y & I_y^2 \end{bmatrix} \begin{bmatrix} u \\ v \end{bmatrix}\\ M = {\textstyle \sum_{x, y}}w(x, y) \begin{bmatrix} I_x^2 & I_x I_y \\ I_x I_y & I_y^2 \end{bmatrix}$

其中， ${\textstyle \sum_{x, y}}w(x, y)$ 为窗口功能， $I_x, I_y$ 分别为每个像素点 x 方向的强度和 y 方向的强度。对 $I_x, I_y$ 求偏导得：

$\lambda_1$ : X 轴方向的偏导的特征值;
$\lambda_2$ : Y 轴方向的偏导的特征值.

代码如下：
cv2.cornerHarris()

import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt

img = cv.imread("./Harris_SIFT/test_1.jpg")
# img = cv.cvtColor(img, cv.COLOR_BGR2RGB)

cv.imshow("Origin", img)
cv.waitKey(0) 
cv.destroyAllWindows()

img_gray = cv.cvtColor(img, cv.COLOR_RGB2GRAY)
# img_gray = np.float32(img_gray)
dst = cv.cornerHarris(img_gray, 2, 3, 0.04)

print("dst.shape: ", dst.shape)
>>> dst.shape:  (800, 1200)

img[dst > 0.01 * dst.max()] = [0, 0, 255]

cv.imshow("Dst", img)
cv.waitKey(0) 
cv.destroyAllWindows()

二、SIFT

Scale-Invariant Feature Transform. 步骤主要分两步：

1. 关键点定位 keypoint localisation;
1. 特征描述 feature description.

1、关键点定位 keypoint localisation

尺度空间极值检测： 通过使用高斯差分函数来计算并搜索所有尺度上的图像位置，用于识别对尺度和方向不变的潜在兴趣点。

DoG空间极值检测： 将每个像素点和其图像域（同一尺度空间）和尺度域（相邻的尺度空间）的所有相邻点进行比较。
当其大于（或者小于）所有相邻点时，该点就是极值点。
中间的检测点要和其所在图像的 $3\times 3$ 邻域 8 个像素点，以及其相邻的上下两层的 $3\times 3$ 领域 18 个像素点，共 26 个像素点进行比较。
关键点精确定位： 通过一个拟合精细的模型在每个候选位置上确定位置和尺度，关键点的选择依赖于它们的稳定程度。

方向匹配： 基于局部图像的梯度方向，为每个关键点位置分配一个或多个方向，后续所有对图像数据的操作都是相对于关键点的方向、尺度和位置进行变换，从而而这些变换提供了不变形。

2、特征描述 feature description

使用直方图统计邻域内像素的梯度和方向：

为了保证特征矢量的旋转不变性，要以特征点为中心，在附近邻域内将坐标轴旋转θ角度，即将坐标轴旋转为特征点的主方向。

旋转之后的主方向为中心取 $8\times 8$ 的窗口，求每个像素的梯度幅值和方向，箭头方向代表梯度方向，长度代表梯度幅值，然后利用高斯窗口对其进行加权运算，最后在每个 $4\times 4$ 的小块上绘制 8 个方向的梯度直方图，计算每个梯度方向的累加值，即可形成一个种子点，即每个特征的由 4 个种子点组成，每个种子点有 8 个方向的向量信息。

代码如下：

import cv2 as cv
import numpy as np

img = cv.imread("./Harris_SIFT/test_1.jpg")
img_gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)

cv.imshow("Gray", img_gray)
cv.waitKey(0)
cv.destroyAllWindows()

# 得到特征点
sift = cv.SIFT_create()
kp = sift.detect(img_gray, None)

img = cv.drawKeypoints(img_gray, kp, img)
cv.imshow("Keypoints", img)
cv.waitKey(0)
cv.destroyAllWindows()

# 计算特征
kp, des = sift.compute(img_gray, kp)
print(np.array(kp).shape)

des.shape
>>> (6809, 128)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/86603.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

12月13日 OpenCV 实战基础学习笔记——Harris、SIFT

文章目录

前言

一、Harris 角点检测

1、公式推导

2、找到 $E (u, v)$ 的最大值

二、SIFT

1、关键点定位 keypoint localisation

2、特征描述 feature description

相关文章

docker安装Gitlab、修改密码、创建组、创建项目、创建用户、Git拉取代码

图解外包验收流程V2.0及详细说明实例

Python读取Word文档中的Excel嵌入文件

SpringBoot多模块项目初始化搭建

数据结构与算法——Java实现单链表、双向链表、环型链表、约瑟夫

MySQL入门到精通经典50题，看这一篇就够了

基于鸽群算法优化的lssvm回归预测-附代码

你的项目需要自动化测试吗？看看这篇文章再说吧

央企招聘：中国大唐集团2023年度公开招聘公告

Qt+VS+VTK综合开发环境配置

git_No.1_版本管控的全流程

HTTP介绍

[036]基于Vue+Nodejs的网上作业批改系统(含源码、数据库、万字课设报告)

分享几个宝藏微信小程序

基于java+springboot+mybatis+vue+mysql的乒乓球预约管理系统

基于C+++FLTK实现（WinForm）超市收银系统【100010032】

抖音视频怎么拼接？分享一款功能强大的软件

扩散模型类似的方式训练text_to_text可不可以

Springboot整合Netty，自定义协议实现

Unity物理系统-物理材质-Collider碰撞体的弹力不够大如何处理

12月13日 OpenCV 实战基础学习笔记——Harris、SIFT

文章目录

前言

一、Harris 角点检测

1、公式推导

2、找到 E ( u , v ) E(u, v) E(u,v) 的最大值

二、SIFT

1、关键点定位 keypoint localisation

2、特征描述 feature description

相关文章

2、找到 $E (u, v)$ 的最大值