OpenCV中的SIFT特征提取

news2025/4/26 2:39:34

文章目录

  • 引言
  • 一、SIFT算法概述
  • 二、OpenCV中的SIFT实现
    • 2.1 基本使用
      • 2.1.1 导入库
      • 2.1.2 图片预处理
      • 2.1.3 创建SIFT检测器
      • 2.1.4 检测关键点并计算描述符
      • 2.1.5 检测关键点并计算描述符并对关键点可视化
      • 2.1.6 印关键点和描述符的形状信息
    • 2.2 参数调优
  • 三、SIFT的优缺点分析
    • 3.1 优点
    • 3.2 缺点
  • 结语

引言

在计算机视觉领域,特征提取是许多任务的基础步骤,如图像匹配、目标识别和三维重建等。SIFT(Scale-Invariant Feature Transform,尺度不变特征变换)是一种经典的特征提取算法,由David Lowe在1999年提出。本文将详细介绍SIFT算法的原理,并通过OpenCV实现展示其应用。

一、SIFT算法概述

SIFT是一种基于局部特征的图像处理算法,具有以下突出特点:

  1. 尺度不变性:在不同尺度的图像中都能检测到相同的特征点
  2. 旋转不变性:不受图像旋转的影响
  3. 光照鲁棒性:对光照变化不敏感
  4. 视角部分不变性:能够处理一定程度的视角变化

二、OpenCV中的SIFT实现

OpenCV提供了简洁的SIFT接口:

2.1 基本使用

2.1.1 导入库

import cv2
import numpy as np
  • 导入opencv库和numpy库

2.1.2 图片预处理

image = cv2.imread('man.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
  • 读取图像并转换为灰度图

2.1.3 创建SIFT检测器

sift = cv2.SIFT_create()
  • 功能:创建一个 SIFT 特征检测器 对象。
  • 细节:SIFT 是一种经典的 局部特征提取算法,对尺度、旋转、光照变化具有鲁棒性。
  • cv2.SIFT_create() 是 OpenCV 中初始化 SIFT 检测器的方式(需 OpenCV ≥ 4.4.0,早期版本用cv2.xfeatures2d.SIFT_create())。

2.1.4 检测关键点并计算描述符

kp = sift.detect(gray)

功能:在灰度图像 gray 上检测关键点(keypoints)

细节
sift.detect() 会返回一个列表 kp,其中每个元素是一个 KeyPoint 对象,包含以下属性:

  • pt:关键点的坐标 (x, y)。
  • size:关键点的尺度(scale)。
  • angle:方向(角度,0-360°)。
  • response:关键点的强度(可用于筛选)。
  • octave:所在金字塔层级(尺度空间)

2.1.5 检测关键点并计算描述符并对关键点可视化

man_sift = cv2.drawKeypoints(man,kp,None,
					flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)

输入参数:

  • man:原始 BGR 彩色图像(NumPy 数组)。
  • kp:SIFT 检测到的关键点列表(cv2.KeyPoint 对象组成的列表)。
  • None:可选参数,表示输出图像(如果为 None,函数会新建一个图像)。
  • flags:控制关键点的绘制方式。

输出

  • man_sift:绘制了关键点后的新图像(BGR 格式)

关键参数详解:flags

flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS 表示 “以丰富格式绘制关键点”,具体效果包括:

  • 圆圈标记:每个关键点用一个圆圈表示,圆圈的 半径 表示该关键点的 尺度(scale)(尺度越大,圆圈越大)。
  • 方向指示:圆圈内有一条直线,表示关键点的 主方向(angle)(方向由 SIFT 计算得出)。
  • 颜色对比:默认关键点会以醒目的颜色(如红色、绿色)绘制,与原始图像形成对比。

如果省略 flags 或设置为 cv2.DRAW_MATCHES_FLAGS_DEFAULT,则仅用简单的小点标记位置,不显示尺度和方向。

2.1.6 印关键点和描述符的形状信息

kp,des = sift.compute(man,kp)
print(np.array(kp).shape,des.shape)

1.sift.compute(man, kp)

功能:基于原始图像 man 和已检测到的关键点 kp,计算每个关键点的 描述符(descriptor)。
输入参数:

  • man:原始图像(BGR 或灰度格式)。虽然 SIFT 检测通常在灰度图上进行,但 compute() 可以接受彩色图像(内部会自动转换为灰度)。
  • kp:之前通过 sift.detect() 得到的关键点列表(cv2.KeyPoint 对象的列表)。

输出:

  • kp:更新后的关键点列表(可能与输入相同,但某些实现可能会过滤掉无法计算描述符的关键点)。
  • des:描述符的 NumPy 数组,形状为 (n_keypoints, 128),数据类型通常为 np.float32。

2.print(np.array(kp).shape, des.shape)

功能:打印关键点列表 kp 和描述符数组 des 的形状。

输出含义:

  • np.array(kp).shape:将关键点列表 kp 转换为 NumPy 数组后的形状。由于 kp 是 cv2.KeyPoint对象的列表,直接转换后的形状是 (n_keypoints,)(表示有 n_keypoints 个关键点)。
  • 注意:cv2.KeyPoint 对象的属性(如坐标、尺度等)需要通过 kp[i].pt、kp[i].size 等方式单独访问。
  • des.shape: 描述符数组的形状为 (n_keypoints, 128),表示每个关键点对应一个 128 维的特征向量(SIFT 描述符的固定维度)。

2.2 参数调优

OpenCV的SIFT实现提供了多个可调参数:

# 自定义参数创建SIFT
sift = cv2.SIFT_create(
    nfeatures=0,          # 保留的特征点数量,0表示不限制
    nOctaveLayers=3,      # 每组(octave)中的层数
    contrastThreshold=0.04,  # 对比度阈值
    edgeThreshold=10,      # 边缘阈值
    sigma=1.6            # 高斯模糊的初始sigma值
)

三、SIFT的优缺点分析

3.1 优点

  1. 对尺度、旋转、光照变化具有鲁棒性
  2. 特征区分性强,匹配准确率高
  3. 算法成熟,有大量实际应用验证

3.2 缺点

  1. 计算复杂度高,实时性较差
  2. 对模糊图像和非刚性变形敏感
  3. 专利限制(已过期)

结语

SIFT作为计算机视觉领域的里程碑算法,尽管已有20多年历史,但其核心思想仍影响着现代特征提取方法的发展。通过OpenCV的简洁接口,我们可以轻松地将这一强大工具应用到各种视觉任务中。理解SIFT的原理和实现,对于掌握更先进的视觉算法也大有裨益。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2342887.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【金仓数据库征文】-《深入探索金仓数据库:从基础到实战》

目录 前言 什么是金仓数据库? 金仓数据库的特点 金仓数据库的核心特点 金仓数据库与其他数据库的对比 金仓数据库的安装 常见的语句 总结 前言 为助力开发者、运维人员及技术爱好者快速掌握这一工具,本文将系统性地介绍金仓数据库的核心知识。内…

RocketMQ 主题与队列的协同作用解析(既然队列存储在不同的集群中,那要主题有什么用呢?)---管理命令、配置安装

学习之前呢需要会使用linux的基础命令 一.RocketMQ 主题与队列的协同作用解析 在 RocketMQ 中,‌主题(Topic)‌与‌队列(Queue)‌的协同设计实现了消息系统的逻辑抽象与物理存储分离。虽然队列实际存储在不同集群的 B…

从岗位依附到能力生态:AI革命下“什么叫就业”的重构与价值

在人工智能(AI)技术深刻重塑社会生产关系的当下,“就业”这一概念正经历着从“职业绑定”到“能力变现”的范式转移。本文将从传统就业观的解构、AI赋能艺术教育的价值逻辑、以及未来就业形态的进化方向三个维度,探讨技术驱动下就业的本质变革,并揭示AI技术如何通过教育创…

海外版高端Apple科技汽车共享投资理财系统

这一款PHP海外版高端Apple、科技汽车、共享投资理财系统phplaravel框架。

企业为何要禁止“片断引用开源软件代码”?一文看透!

开篇故事:一段“开源代码”引发的百亿级灾难 某电商平台为快速上线新功能,从GitHub复制了一段“高性能加密算法”代码到支付系统中。 半年后,黑客通过该代码中的隐藏后门,盗取百万用户信用卡信息。 事后调查:这段代…

【C++指南】告别C字符串陷阱:如何实现封装string?

🌟 各位看官好,我是egoist2023! 🌍 种一棵树最好是十年前,其次是现在! 💬 注意:本章节只详讲string中常用接口及实现,有其他需求查阅文档介绍。 🚀 今天通过了…

国内ip地址怎么改?详细教程

在中国,更改IP地址需要遵守规则,并确保所有操作合规。在特定情况下,可能需要修改IP地址以满足不同需求或解决特定问题。以下是一些常见且合法的IP地址变更方法及注意事项: 一、理解IP地址 IP地址是设备在网络中的唯一标识&#x…

模式设计简介

设计模式简介 设计模式是软件开发中经过验证的最佳实践解决方案,它是针对特定问题的通用解决方案,能够帮助开发者提升代码的可维护性、可扩展性和复用性。设计模式并非具体的代码实现,而是一种解决问题的思路和方法论,它源于大量的实践经验总结,旨在解决软件开发过程中反…

众趣科技X世界读书日丨数字孪生技术赋能图书馆空间智慧化运营

4月23日,是第30个“世界读书日”,不仅是庆祝阅读的日子,更是思考知识传播未来的契机。 图书馆作为主要传播图书的场所,在科技的发展中,图书馆正面临前所未有的挑战,联合国数据显示,全球近30%的…

MySQL 事务(详细版)

目录 一、事务简介 1、事务的概念 2、事务执行的案例 3、对于事务的理解 二、事务操作 (一)未控制事务 (二)控制事务一 (三)控制事务二 三、事务四大特性 四、并发事务问题 五、事务隔离…

c++之网络编程

网络编程:使得计算机程序能够在网络中发送和接受数据,从而实现分布式系统和网络服务的功能。 作用:使应用程序能够通过网络协议与其他计算机程序进行数据交换 基本概念 套接字(socket): 套接字是网络通信…

MySQL8的安装方法

概述: MySQL对于开发人员来说,并不陌生。但是很多朋友提起安装MySQL就很头疼,如果一不小心安装失败,再现安装第二遍就变得更加头疼。今天给大家分享一个比较非常简单好安装的方法,并且删除或者卸载也都非常容易 下载…

CF每日4题

1500左右的做到还是有点吃力 2093E 1500 二分答案 题意:给定一个长度为 n 的数组,现在要把它切成 k 份,求每一份最小的MEX中的最大值。 就是找最大值,但是这个值是所有段最小的值采用二分答案,二分这个值&#xff0…

基于 Spring Boot 瑞吉外卖系统开发(七)

基于 Spring Boot 瑞吉外卖系统开发(七) 新增菜品页面 菜品管理页面提供了一个“新增菜品”按钮,单击该按钮时,会打开新增菜品页面。 菜品分类列表 首先要获取分类列表数据。 请求路径/category/list,请求方法GE…

二项式分布html实验

二项式分布html实验 本文将带你一步步搭建一个纯前端的二项分布 Monte-Carlo 模拟器。 只要一个 HTML 文件,打开就能运行: 动态输入试验次数 n、成功概率 p 与重复次数 m点击按钮立刻得到「模拟频数 vs 理论频数」柱状图随着 m 增大,两组柱状…

大模型如何作为reranker?

大模型如何作为reranker? 作者:爱工作的小小酥 原文地址:https://zhuanlan.zhihu.com/p/31805674335 只为了感动自己而去做一些事情纯属浪费时间。 ————爱工作的小小酥 引言 用于检索的模型中,我们最熟悉的就是单塔和双塔了&…

发放优惠券

文章目录 概要整体架构流程技术细节小结 概要 发放优惠券 处于暂停状态,或者待发放状态的优惠券,在优惠券列表中才会出现发放按钮,可以被发放: 需求分析以及接口设计 需要我们选择发放方式,使用期限。 发放方式分…

试完5个AI海报工具后,我投了秒出设计一票!

随着AI技术的不断发展,越来越多的AI生成工具进入了设计领域,海报生成工具成为了其中的重要一员。今天,我们将为大家介绍三款热门的AI海报生成工具,并进行对比分析,帮助大家选择最适合的工具。 1. 秒出设计:…

PH热榜 | 2025-04-25

1. LambdaTest Accessibility Testing Suite 标语:轻松点击,确保网站的包容性和合规性。 介绍:LambdaTest 的可访问性测试工具可以自动识别你的网站和网络应用中是否符合 WCAG(网页内容无障碍指南)标准。你可以设置定…