一、说明
特征提取如何实现?其手段并不是很多,有四个基本方法,作为AI工程师不能不知。因此,本篇将对四种特征提取给出系统的方法。
二、概述
图像分类长期以来一直是计算机视觉领域的热门话题,并希望能够保持这种状态。为什么不应该呢?随着一次又一次的装备,它配备了机器来回答一个非常基本的问题!“我看到了什么?”尽管听起来引人入胜,但这个问题的答案不仅满足了人们对模仿我们自己的感知和决策能力的事物的渴望,而且开辟了无数的创造性可能性领域。生成式人工智能的最新进展通过利用这些辨别能力来创造创新和创造力的手段,从而改变了范式,以剪切优雅实现了显然不可逾越的壮举。然而,这个领域的每一个进步都围绕着视觉理解的概念,即有效辨别的能力。
特征提取在确定识别模型的性能方面起着重要作用。基于CNN的特征提取提供了一个自动化框架,但它缺乏可解释性,并且计算成本很高。相反,传统的特征提取技术是劳动密集型的,可能需要领域知识才能在特定情况下成为CNN的更好替代品。在本文中,我们将探讨用于图像分类的 4 种经典特征提取技术。
- 定向梯度的直方图
- 本地二进制模式
- 加博尔过滤器
- 灰度共现矩阵
为了简化理解,下面给出了该技术的逐步说明以及描述性解释。
三、定向梯度直方图 (HOG)
HOG表示图像中局部梯度的分布。它计算小图像块中的梯度大小和方向,并形成这些方向的直方图,可用作分类的特征。
- 将图像分成小单元格。
- 计算每个像元中每个像素的梯度(幅度和方向)。
- 在每个单元格内创建渐变方向的直方图。
- 归一化直方图以考虑照明和对比度的局部变化。
- 连接归一化直方图以形成表示图像的最终特征向量。
四、本地二进制模式 (LBP)
LBP 捕获图像中的局部纹理信息。它根据每个像素的强度值与相邻像素的比较为每个像素定义二进制模式。这些模式的直方图可用作分类特征。
- 将图像划分为小区域(例如,3x3 邻域中的像素)。
- 阈值中心像素值并将其与其相邻像素进行比较。
- 如果邻居的值大于或等于,则为其分配二进制值 1;否则,分配 0。
- 将二进制模式转换为十进制数。
- 在整个图像中构建十进制值的直方图以创建 LBP 特征表示。
五、加博尔过滤器
Gabor滤波器是一组调谐到不同频率和方向的线性滤波器。它们捕获图像中的局部频率和方向信息。Gabor 滤波器响应可用作纹理分类的特征。
- 定义一组Gabor滤波器,这些滤波器是由高斯包络调制的复杂正弦波模式。
- 将每个Gabor滤波器与输入图像进行卷积。
- Gabor滤波器响应突出显示图像中的不同频率和方向信息。
- 从过滤后的响应中提取特征,通常使用均值、方差或直方图等技术。
- 生成的特征表示捕获以不同频率和方向存在的纹理和结构信息。
六、灰度共现矩阵 (GLCM)
灰度共现矩阵(GLCM)是另一种用于图像分类的经典特征提取技术。GLCM 根据像素的强度值捕获像素之间的空间关系。
图片 : 5 — 作者
- 将图像转换为灰度(如果尚未转换为灰度)。
- 定义距离和角度(或角度集)以指定像素对的相对位置。
- 通过计算指定距离和角度处像素强度对的出现次数来创建共现矩阵。
- 对矩阵进行归一化以获得像素强度共现的概率。
- 从归一化GLCM中提取统计特征(例如,对比度,能量,熵)来表示图像。
七、关键要点
- HOG(定向梯度直方图)
- 有效检测图像中的对象边缘和形状。
- 对照明和对比度的变化具有鲁棒性。
- 广泛用于行人检测和物体识别任务。
- 提供简单有效的图像渐变表示形式。
2. LBP(局部二进制模式)
- 有效地描述图像中的局部纹理图案。
- 对照明和对比度的变化不敏感。
- 可用于纹理背景中的面部识别、纹理分类和对象检测。
- 易于计算,需要最少的计算资源。
3. GLCM(灰度共现矩阵):
- 捕获有关图像中纹理和结构的二阶统计信息。
- 对像素强度之间的空间关系敏感。
- 常用于纹理分析、遥感和医学成像。
- 提供对比度、能量和熵等功能,有助于区分不同的纹理。
4. 加博尔过滤器
- 非常适合捕获图像中的纹理和频率信息。
- 强调图像的特定频率和方向分量。
- 适用于纹理分割、指纹识别和人脸识别等任务。
- 可以组合成一个对各种频率和方向特征进行编码的特征集。
八、结论
在本文中,我们讨论了四种经典的特征提取技术,它们可以用作计算昂贵的卷积技术的有效替代方案。此外,还简要介绍了这些技术的用例、优缺点。上述技术可以单独使用或组合使用,以产生出色的效果。因此,您应该尝试一下这些技术,并使它们成为您武器库的一部分。
关注 Medium,了解更多与计算机视觉相关的内容。
直到下一次,保持幸福!
九、引用
- N. Dalal 和 B. Triggs,“用于人类检测的定向梯度直方图”,2005 年 IEEE 计算机学会计算机视觉和模式识别会议 (CVPR'05),美国加利福尼亚州圣地亚哥,2005 年,第 886-893 卷第 1 卷,doi:10.1109/CVPR.2005.177。
- A. Hadid,“局部二元模式方法及其在面部分析中的应用”,2008 年第一届图像处理理论、工具和应用研讨会,突尼斯苏塞,2008 年,第 1-9 页,doi:10.1109/IPTA.2008.4743795。
- Haralick,Robert & Shanmugan,K&Dinstein,Itshak。(1973). 图像分类的纹理.IEEE 跨系统人网络。3.
- KAFUO, ASMAA & DIAF, SAMERA & GONIFEDA, AISHA & ALSHATOURI, ZAMZAM & Baba, Abdullatif.(2017). Gabor滤波及其应用研究综述.10.13140/RG.2.2.11079.50085.
纳比尔汗