数字图像处理(第四版)-冈萨雷斯-学习过程的笔记

news2025/1/11 15:04:45

  • 作者介绍
  • 1.绪论
    • 自己读书存在一个问题,书太厚,重点难以把握,对如此经典的书籍,希望自己的学习历程和重点记录下来。 目前在持续更新和学习中,觉得有帮助的话可以先收藏和关注我博客的内容--更新于2023/1/10
  • 2.数字图像基础
    • 2.4图像的采样与量化
      • 2.4.3 线性索引(一维+偏移)和坐标索引(二维坐标)
      • 2.4.4 空间分辨率和灰度分辨率
      • 2.4.5 图像内插(在图像放大缩小旋转和几何矫正时用)
    • 2.5 像素间的基本关系
      • 2.5.1 邻域
      • 2.5.2 邻接 连通 区域 边界
      • 2.5.3 距离测度
    • 2.6 数字图像中所用的基本数学工具
      • 2.6.1 集合运算和逻辑运算
      • 2.6.5 空间运算
      • 2.6.6 向量和矩阵运算
      • 2.6.7 图像变换
  • 3.灰度变换与空间滤波
      • 3.2.1 图像反转
      • 3.2.2 对数变换
      • 3.2.3 伽马变换(幂变换)**
      • 3.2.4 分段线性变换
    • 3.3 直方图处理
    • 3.4 空间滤波基础
      • 3.4.3 可分离滤波器核(要确定一个核是否可分离,只需确定其秩是否为 1)
      • 3.4.4 空间域滤波和频率域滤波的一些重要比较
    • 3.5 平滑 (低通)空间滤波器
      • 3.5.1 盒式滤波器核(不满足各向同性)
      • 3.5.2 低通高斯滤波器核
      • 3.5.3 统计排序(非线性) 滤波器(中值)
      • 3.6锐化(高通)空间滤波器
    • 3.6.1基础
      • 3.6.2 使用二阶导数锐化图像一拉普拉斯
      • 3.6.4使用梯度增强边缘
  • 4.频率域滤波
  • 5.图像复原与重建
  • 6.彩色图像处理
  • 7.小波变换和其他图像变换
  • 8.图像压缩与水印
  • 9.形态学图像处理
  • 10.图像分割
  • 11.特征提取

作者介绍

张伟伟,男,西安工程大学电子信息学院,2019级硕士研究生,张宏伟人工智能课题组。
微信公众号:可随时查阅,搜索—张二牛的笔记,回复[数字图像处理]可以直接获取对应的书籍。
研究方向:机器视觉与人工智能。
电子邮件:zhangweiweicpp@163.com

  • 课题组CSDN官方账号,欢迎一键三连: https://blog.csdn.net/m0_37758063/article/details/113527955?spm=1001.2014.3001.5501.

1.绪论


自己读书存在一个问题,书太厚,重点难以把握,对如此经典的书籍,希望自己的学习历程和重点记录下来。
目前在持续更新和学习中,觉得有帮助的话可以先收藏和关注我博客的内容–更新于2023/1/10

目标
(1)定义图像处理的范围
(2)应用领域和现状
(3)图像处理的主要方法
(4)图像处理系统的组成
(5)相关文献

数字图像: 可以定义为一个二维函数f(x,y),x,y是空间坐标,(x,y)处的幅值称为图像在该点的强度(灰度)。灰度值为有限的离散量时,称为数字图像。
图像处理的范围:输入输出都是图像的处理,包含从图像中提取特征的处理,直至目标识别。
图像处理的应用领域:
电磁波可见光成像占主导地位。
图像处理重要性:人类只能感知电测波谱的可见光谱,波长只有 380nm~780nm,图像处理可处理为人类所能看到的图像形式,由此增加了人类获取信息的能力。
在这里插入图片描述

  • 数字图像处理的基本步骤
    在这里插入图片描述
    图像增强是主观的,好的增强效果,主观偏好;图像复原是客观的,复原技术倾向于以图像退化的数学或概率模型为基础。
    小波和傅里叶变换,以不同的分辨率表示图像的基础。
    彩色图像–彩色模型和基本的彩色图像处理,彩色也是提取图像中感兴趣区域的基础。
  • 图像处理系统的组成
    在这里插入图片描述

2.数字图像基础

目标
1.人类视觉的功能和限制
2.光的性质
3.如何产生,采样和量化图像
4.图像像素间的几何关系
在这里插入图片描述

  • 图像感知和获取:单个传感器,条带传感器,CCD

2.4图像的采样与量化

为了将传感器输出的电压波形转为数字图像,需要进行数据转换。转换包括:取样和量化。同时将亮度值分为离散的区间。这样每个取样点的值就被量化为了离散值。
在这里插入图片描述
在这里插入图片描述
离散时像素中心 M/2 N/2取整,灰度级数L=2的K次方。灰度级范围:[0,L-1]

灰度跨越的值域称为动态范围,定义为系统中最大可度量灰度与最小可检测灰度之比。上限取决于饱和度,下限取决于噪声。
对比度:一幅图像中最高和最低灰度级间的灰度差。反差比是这两个量的比率。图像中可观像素居于高动态范围时,称为图像有高对比度。

图像存储的比特数

k比特图像:一幅图像具有 个可能的灰度级时,称为“k比特图像”。如256级图像称为8比特图像。
在这里插入图片描述
在这里插入图片描述

2.4.3 线性索引(一维+偏移)和坐标索引(二维坐标)

图像行的索引
在这里插入图片描述
在这里插入图片描述

2.4.4 空间分辨率和灰度分辨率

空间分辨率 是图像中最小可辨别细节的测度。
单位距离的线对数和单位距离的点数(像素数)是最常用的测度。
灰度分辨率 指在灰度级中可分辨的最小变化。用于生成数字图像的空间样本数。灰度级通常是2的整数次幂,常用的数是8比特。

2.4.5 图像内插(在图像放大缩小旋转和几何矫正时用)

内插是用已知数据来估计未知位置数据的过程。

最近邻插值(会产生直边失真)
双线性插值(结果较好)
双三次内插(复杂度较高)
在这里插入图片描述

内插可以使用更多的邻点,并且存在使用样条和小波的复杂技术。通用的数字图像处理尝试用双线性内插和双三次内插。

2.5 像素间的基本关系

2.5.1 邻域

坐标(x,y)处的像素p

邻域:点p的相邻像素的图像位置集。

4邻域:2个水平的相邻像素和2个垂直的相邻像素。(x+1, y), (x-1, y), (x, y+1), (x, y-1) 这组像素称为p的4邻域,用 N4(P)表示。
8邻域:在4邻域的基础上,加上对角相邻像素,(x+1, y+1), (x+1, y-1), (x-1, y+1), (x-1, y-1)。

2.5.2 邻接 连通 区域 边界

边界与边缘的区别:有限区域的边界形成一个闭合通路,它是一个整体性的概念,边界。
边缘是由其倒数超过某个预设阈值的像素形成的,边缘是一个局部的概念。

2.5.3 距离测度

在这里插入图片描述

2.6 数字图像中所用的基本数学工具

2.6.1 集合运算和逻辑运算

图像可以视作矩阵,很多情况下图像间的运算时用矩阵理论执行的。点积。
重要:图像处理方法最重要的分类是,它是线性的还是非线性的,对给定的一副输入图像f(x,y)产生一幅输出图像g(x,y),加性和同质性(乘以一个常数可以变到输出)。

  • 线性和非线性的区分
    在这里插入图片描述

算数运算
图像相加:平均噪声(降低噪声)
图像相减:比较图像
图像相乘(相除):校正阴影和模板。
集合运算

2.6.5 空间运算

  • 单像素运算
    在这里插入图片描述
  • 邻域运算
    在这里插入图片描述
  • 几何变换

在这里插入图片描述在这里插入图片描述
在这里插入图片描述

2.6.6 向量和矩阵运算

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

2.6.7 图像变换

在这里插入图片描述
在这里插入图片描述

3.灰度变换与空间滤波

目标
灰度变换(使用的函数:线性、对数、幂函数)
直方图
空间滤波
图像增强

3.2.1 图像反转

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.2.2 对数变换

这里是引用
在这里插入图片描述
在这里插入图片描述

3.2.3 伽马变换(幂变换)**

伽马变换是为了产生输入图像的忠实显示。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.2.4 分段线性变换

在这里插入图片描述

3.3 直方图处理

在这里插入图片描述在这里插入图片描述
通常所说的直方图是出现灰度级的像素数目数量所占总的比例------灰度级概率的估计。
在这里插入图片描述
将输入图像灰度级为 r 的像素,映射为输出图像中灰度级为 s0 的对应像素,得到输出图像。称为直方图均衡化或直方图线性变换。
在这里插入图片描述

.

图像均衡化通常会拓展灰度级范围,进而增强图像的对比度,因此输入图像覆盖的灰度级区间越小,直方图均衡对其影响越大。
直方图匹配(直方图规定化):用于生成具有规定直方图的图像的方法。

将某幅影像或某一区域的直方图匹配到另一幅影像上。使两幅影像的色调保持一致。两幅图像比对前,通常要使其直方图形式一致。

3.4 空间滤波基础

滤波:是指通过、修改或抑制图像的规定频率分量。
低通滤波器:通过低频的滤波器称为低通滤波器。低通滤波器的作用是通过模糊图像来平滑图像。使用空间滤波器可以直接对图像本身进行类似的平滑处理。
线性空间滤波器在图像f和滤波器核 w 之间执行乘积之和运算。
分段滤波:有时,图像是被顺序地、分阶段地滤波(即卷积)的,每个阶段会使用不同的核。例如,对于阶段的滤波,图像广首先用核w1滤波。

3.4.3 可分离滤波器核(要确定一个核是否可分离,只需确定其秩是否为 1)

可分离:若二维函数G(x,y)可写为一维函数G1(x)和G2(x)的乘积即G(x,y)=G1(x)G2(y)则它是可分离的。

3.4.4 空间域滤波和频率域滤波的一些重要比较

1.卷积是空间域滤波的基础,它等效于频率域中的乘法,反之亦然
2.空间域中振幅为A的冲激,是频率域中值为A的一个常数,反之亦然
线性滤波就是找到合适的方法来修改图像的频率内容。

3.5 平滑 (低通)空间滤波器

平滑(也称平均)空间滤波器用于降低灰度的急剧过渡。由于随机噪声通常由灰度的急剧过渡组成因此平滑的一个明显应用就是降噪。
线性空间滤波是指图像与滤波器核进行卷积。一个平滑核与一幅图像的卷积会模糊图像,模糊程度取决于核的大小及其系数的值

3.5.1 盒式滤波器核(不满足各向同性)

盒式核:最简单的可分离低通滤波器核,其系数的值相同(通常为 1)。来自一个常量核,以三维方式查看它时,它类似于一个盒子。

归一化适用于所有低通核。
归一化有两个目的:第一,一个恒定灰度区域的灰度平均值将等于滤波后的图像中的灰度值。第二,采用这种方式对核归一化时,可以防止在滤波过程中引入偏差(保证滤波后像素和相同);

零填充:填充零会扩展图像的边界,以避免在滤波期间核的一部分位于图像边界之外时执行未定义的运算

3.5.2 低通高斯滤波器核

盒式滤波器优点:通常会产生视觉上能够接受的平滑结果,希望减少边缘平滑的效应时,它们也是很有用的.
盒式滤波器缺点:盒式滤波器往往会沿垂直方向模糊图像。在涉及精细细节不太适合。
==高斯核:可分离,圆对称。决定着平滑程度是由参数σ表征的,而且σ和平滑程度的关系是非常简单的.σ越大,高斯滤波器的频带就越宽,平滑程度就越好。==可分离核的计算优势对大核而言意义重大.
在这里插入图片描述
高斯核必须大于盒式滤波器才能实现同样程度的模糊。

零填充的缺点:对图像填充零会在滤波结果中引人黑色的边框,边框的宽度取决于所用滤波器核的大小和类型。
复制填充: 它将边界之外的值设为最接近的图像边界值,当图像边界附近的区域为常数时,复制填充更适用:
而当边界附近的区域包含图像细节时,镜像填充更适用。

3.5.3 统计排序(非线性) 滤波器(中值)

统计排序滤波器是非线性空间滤波器,其响应基于滤波器所包含区域内的像素的排序。
平滑是将中心像素的值替代为由排序结果确定的值来实现的。
中值滤波器用中心像素的邻域内的灰度值的中值替代中心像素的值(计算中值时包括中心像素的值 )。去除椒盐噪声

线性滤波就是找到合适的方法来修改图像的频率内容。
使用:

核与图像大小的关系 使用低通滤波和阈值处理提取区域 图像阴影矫正。

3.6锐化(高通)空间滤波器

锐化作用是突出灰度中的过渡,图像微分将增强边缘和其他不连续( 如噪声 ),并且不强调灰度缓慢变化的区域。
锐化通常称为高通滤波。此时,通过(负责细节的)高频,而衰减或抑制低频。
使用拉普拉斯锐化图像的基本方法
拉普拉斯是导数算子,因此会突出图像中的急剧灰度过渡,并且不强调缓慢变化的灰度区域。这往往会产生具有灰色边缘线和其他不连续性的图像,**它们都叠加在暗色无特征背景上。

3.6.1基础

主要讲述了一阶导数和二阶导数的性质和证明,例3.18展示了拉普拉斯锐化后的图像。

3.6.2 使用二阶导数锐化图像一拉普拉斯

3.6.4使用梯度增强边缘

重要的综合的例子:P129页人体医学骨骼分析。

4.频率域滤波

理论相对较高,放在后面阅读,需要到频域用到进行查阅。
2023/1/10

5.图像复原与重建

6.彩色图像处理

7.小波变换和其他图像变换

8.图像压缩与水印

9.形态学图像处理

10.图像分割

11.特征提取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/154051.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C语言进阶——自定义类型——结构体

目录 一. 结构体类型的声明 结构体的声明 特殊的声明 二. 结构的自引用 三. 结构体变量的定义和初始化 定义 初始化 四. 结构体内存对齐 未完待续 一. 结构体类型的声明 结构体的声明 结构是一些值的集合,这些值称为成员变量。结构的每个成员可以…

08-Alibaba微服务组件Nacos配置中心实战源码分析

Nacos配置中心源码分析 Config相关配置 Nacos 数据模型 Key 由三元组唯一确定, Namespace默认是空串,公共命名空间(public),分组默认是DEFAULT_GROUP 配置中心的架构 nacos config client源码分析 获取配置 获取配置的主要方…

windows配置java环境

windows配置java环境下载JDK安装JDK配置环境变量java9及以上版本配置环境变量(以java17为例,只需要配置JAVA_HOME和Path变量)配置JAVA_HOME变量配置Path变量java8及以下版本配置环境变量(以java8为例,需要配置JAVA_HOM…

Unity官方本地化插件localization

官方文档地址:https://docs.unity3d.com/Packages/com.unity.localization1.0/manual/QuickStartGuideWithVariants.html 使用流程 安装 PackageManager搜索Localization完成对应插件的安装 配置 PlayerSetting->Localization 创建本地化相关配置 创建之后点…

python的安装以及pycharm的配置

大家好,我是csdn的博主:lqj_本人 这是我的个人博客主页:lqj_本人的博客_CSDN博客-微信小程序,html特效,vue2基础领域博主 哔哩哔哩欢迎关注:小淼前端 小淼前端的个人空间_哔哩哔哩_bilibili 本篇文章主要讲述python的安装以及pych…

【Linux】小程序进度条

目录回车换行问题日常中的换行代码中的回车换行倒计时函数进度条回车换行问题 日常中的换行 即: 回车:回到当前行的最开始 换行:列不变,新起一行 代码中的回车换行 我们先看一段代码: 这个是带\n的 🌍结…

什么是运动神经元 你们真的知道吗

大家好,你们知道什么运动神经元吗,你们有误入这些误区吗? 运动神经元是一种神秘的疾病,导致的原因尚且不明确。这种疾病的发生可能是体内的运动神经元细胞的减少或是凋亡导致的,是一种慢性发展的神经类疾病。虽然导致运…

【晶振】NTP网络校时服务器(卫星时钟)电路里的主心跳

【晶振】NTP网络校时服务器(卫星时钟)电路里的主心跳 【晶振】NTP网络校时服务器(卫星时钟)电路里的主心跳 晶振是NTP网络校时服务器(卫星时钟)电路板数字电路的"心跳",在…

阿狸(Hans设计卡通形象)的幸福生活 ---- 充满趣味性(可自定义更改)

Ali the fox 目录 一、前言 二、关于代码 三、效果展示 四、详细介绍 五、编码实现 index.html css 文件夹 88rh.css js 文件夹 img 文件夹 fonts 文件夹 六、获取源码 需要源码,可以私信我(⊙o⊙)?关注我? 一、前言 时光荏苒&…

MyBatis­Plus快速入门

介绍 MyBatisPlus(简称 MP)是一个 MyBatis的增强工具,在 MyBatis 的基础上只做增强不做改变,为简化开发、提高效率而生。 特性: 无侵入:只做增强不做改变,引入它不会对现有工程产生影响&#xf…

冰冰学习笔记:异常处理

欢迎各位大佬光临本文章!!! 还请各位大佬提出宝贵的意见,如发现文章错误请联系冰冰,冰冰一定会虚心接受,及时改正。 本系列文章为冰冰学习编程的学习笔记,如果对您也有帮助,还请各位…

Github-Action-Workflow-概念和基本操作

workflow 文件 GitHub Actions 的配置文件叫做 workflow文件,存放在代码仓库的.github/workflows/目录下。比如写一个first.yaml文件,存储的目录就是.github/workflows/first.yaml workflow/下的文件采用 YAML 格式,文件名可以任意取&#xf…

代码随想录第56天|● 583. 两个字符串的删除操作 ● 72. 编辑距离

583.两个字符串的删除操作 思路一 dp[i][j]:以i-1为结尾的字符串word1,和以j-1位结尾的字符串word2,想要达到相等,所需要删除元素的最少次数。 当word1[i - 1] 与 word2[j - 1]相同的时候 dp[i][j] dp[i - 1][j - 1];当word1[…

检修盒面板AI视觉检测系统,赋能工业发展!

制造业是中国工业化的源头,也是工业生产大国。任何一步的质量都可能影响生产过程的变化。表面缺陷不仅影响产品的美观和舒适性,还会对其性能产生不良影响。因此,制造商对产品的表面缺陷检测非常重视。传统的检修盒面板按钮安装是否正确的质量…

【深度学习】CNN应用于图像分类的建模全流程

文章目录1.摘要2.图片的准备及预处理3.打包并保存数据4.搭建模型5.训练模型6.测试模型7.总结1.摘要 图像分类,也可以称作图像识别,顾名思义,就是辨别图像中的物体属于什么类别。核心是从给定的分类集合中给图像分配一个标签的任务。实际上&a…

DBeaver连接InterSystems IRIS、Ensemble、Cache操作说明

一、驱动获取 1.1、本地安装目录获取 JDBC驱动:“安装目录\dev\java\lib\JDK18” 如需获取ODBC等其他连接驱动则返回“安装目录\dev”路径选择对应文件夹2.1、Intersystems官方获取 官方下载:https://intersystems-community.github.io/iris-driver-…

深度学习基本部件-激活函数详解

激活函数概述 前言激活函数定义激活函数性质 Sigmoid 型函数 Sigmoid 函数Tanh 函数 ReLU 函数及其变体 ReLU 函数Leaky ReLU/PReLU/ELU/Softplus 函数 Swish 函数激活函数总结参考资料 本文分析了激活函数对于神经网络的必要性,同时讲解了几种常见的激活函数的原理…

纸牌游戏红心大战拱猪设计(C语言)

纸牌游戏红心大战设计 ( C语言 ) 红心大战是Windows的经典游戏,中国式的红心是拱猪游戏,加入了方块J羊和梅花10 变压器(即俗称加倍)。加大了游戏难度和趣味性。 试制此游戏是准备编制网络版拱猪或红心大战的基础框架&#xff0c…

Linux下时间处理相关函数

Linux下时间处理相关函数 1 .系统时间和 RTC 时间 Linux 系统下包含两个时间: 系统时间和 RTC 时间。   系统时间: 是由主芯片的定时器进行维护的时间, 一般情况下都会选择芯片上最高精度的定时器作为系统时间的定时基准, 以避…

深度聚类方法之对比聚类(Contrastive Clustering,CC)

1.参考文献 《Contrastive Clustering》 2.深度聚类方法 深度聚类方法大致分为以下几类: ①分阶段:使用深度网络进行对比学习or自动编码器完成表征学习(目的:把同类样本集中到一起,拉开不同类样本的聚类),然后使用聚…