第一章 计算机视觉概述

news2025/1/10 1:29:22

《计算机视觉开发实战 基于Python》 朱文伟,李建英 著

1.1 图像的基本概念

图像和图形

  1. 图像是输入设备捕捉的实际画面产生的数字图像,由像素点构成的位图。
  2. 图形是用数学规则产生的或具有一定规则的团,由外部轮廓线条构成的矢量图,往往用一组符号或线条来表示。

数字图像及其特点

  1. 数字图像又称数码图像或数位图像,是二维图像用有限数值像素的表示。由数组或矩阵表示,其光照位置和强度都是离散的。数字图像由模拟图像数字化得到,以像素为基本单位。
  2. 特点
    • 信息量大:512 * 512个像素点(8bit)组成,256KB
    • 占用频带宽大:语言带宽的4倍
    • 相关性大 :图像中相邻像素点具有很大相关性
    • 非客观性:与环境条件、视觉特性、情结、精神状态等有关

图像的单位

  1. 像素是数字图像的基本元素,像素越多,图像越清晰。
  2. 像素是在模拟图像数字化时对连续空间进行离散化得到的,每个像素具有整数行高和列宽位置坐标,同时每个像素都具有整数灰度值或颜色值。
  3. 像素的大小是没有固定长度的,不同设备上一个单位像素色块的大小是不一样的。

图像的分辨率与屏幕分辨率

  1. 图像分辨率是指每英寸图像内的像素点数,单位是像素每英寸。分辨率越高,图像越逼真
  2. 屏幕分辨率是屏幕每行的像素点数乘以每列的像素点数。

图像的灰度与灰度级

  1. 把白色与黑色之间按对数关系分为若干等级,称为灰度。灰度分为256阶,0为黑色。灰度即没有色彩,RGB色彩分量全部相等,如RGB(100, 100, 100)代表灰度为100。
  2. 一副图像中不同位置的亮度是不一样的,可用f(x, y)来表示(x, y)上的亮度。光是一种能量形式,因此亮度为非负有限值。
  3. 在单色图像中,坐标(x, y)点的亮度成为该点的灰度或灰度级。设灰度为L,则L_min ≤ L ≤ L_max, 间隔称为灰度范围。
  4. 灰度级表明图像中不同灰度值的最大数量。灰度级越大,图像亮度范围越大。
  5. 灰度(值)表示灰度图像单个像素点的亮度值,值越大,像素点越亮,反之越暗。

图像的深度

  • 图像的深度是指存储每个像素所用的位数,也用于量度图像的色彩分辨率。
  • 图像深度确定色彩图像的每个像素可能有点颜色数,或灰度图像中每个像素可能有的灰度级数。
  • 例:一副彩色图像RGB三个分量的像素位数分别为4,4,2,则最大颜色数目为2的8次方,1024,即像素的深度为10位,每个像素可以是1024种颜色中的一种。

二值图像、灰度图像与彩色图像

二值图像
  • 每个像素只有两种可能的取值或灰度等级状态,可用黑白,B&W、单色图像表示。
  • 每个像素只需要1bit即可完整存储信息,同样尺寸的图像,二值图像保存到信息更少。
灰度图像/灰阶图像
  • 用灰度表示的图像,二值图像与彩色图像的中间版本。
  • 灰度图像只包含一个通道的信息,彩色图像通常包含三个通道的信息,单一通道可以理解为单一波长的电磁波,so红外遥感、X断层成像等产生的图像均为灰度图像
  • 灰度图易于采集和传输,导致了基于灰度图像开发的算法非常丰富
  • 灰度图像是每个像素只有一个采样颜色的图像,但不同于黑白图像,灰度图像在黑白之间还有许多级的颜色深度。
彩色图像
  • RGB图像,每个像素由3个通道进行表示,通常由红绿蓝表示,分量介于(0, 255)

通道

通道表示把图像分解成一个或多个颜色成分,通常可以分为单通道、三通道和四通道。

  • 单通道:一个像素点只需要一个数值表示。只能表示灰度,0为黑色。
  • 三通道:把图像分为红、绿、蓝三个通道,可表示彩色,0为黑色。
  • 四通道:在RGB基础上加上alpha通道。alpha通道表示透明度,0为全透明。

图像存储

  • 用MN的矩阵表示一副尺寸大小为MN的数字图像,矩阵元素的值就是该图像位置上对应的像素值。三通道图像的数据在内存中的存储是连续的,每个通道元素按照矩阵行列顺序进行排列。
  • 通常计算机按照RGB方式存储,图像采集设备输出图像格式一般为BGR格式。

1.2 图像噪声

图像噪声的定义

  1. 一般图像噪声是不可预测的随机信号,只能用概率统计的方法去认识
  2. 图像噪声是指图像中的随机、不希望的、影响观感和质量的像素值变化。这些变化可以是由于电子噪声、照明条件、图像传输或图像捕捉设备的性能等因素引起的。
  3. 图像噪声会使图像细节和轮廓模糊不清,降低图像的清晰度、对比度和色彩鲜艳度,从而影响视觉体验和信息提取。
  4. 数字图像的噪声主要来源于图像获取的数字化过程。

图像噪声的来源

外部噪声:

  • 系统外部干扰以电磁波或经电源串进系统内部而引起的噪声,如电气设备、天体放电等引起的噪声

内部噪声:

  • 光电的基本性质所引起的噪声
  • 电器的机械运动产生的噪声
  • 器材材料本身引起的噪声
  • 系统内部设备电路引起的噪声

图像噪声的滤除

  • 通过图像平滑可以有效地减少和消除图像中的噪声,以改善图像的质量,有利于抽取对象特征进行分析。
  • 经典的平滑技术对噪声图像使用局部算子,进队他的局部小邻域内的一些像素进行处理,有点事计算效率高,且可以对多个像素并行处理。
图像噪声的滤除——chatGTP回答

图像噪声的滤除是数字图像处理中的一个重要任务,目的是去除噪声,提高图像的质量和清晰度。下面介绍一些常用的图像噪声滤除方法:

  1. 均值滤波
    均值滤波是一种简单的线性平滑滤波方法,其原理是将像素周围的邻域内的像素值取平均值,用平均值来代替中心像素的值。均值滤波能够消除噪声,但会对图像细节造成一定程度的模糊。

  2. 中值滤波
    中值滤波是一种非线性滤波方法,它将像素周围的邻域内的像素值进行排序,取中间值作为中心像素的值。中值滤波能够有效去除椒盐噪声和脉冲噪声等随机噪声,对于保留图像边缘和细节有较好的效果。

  3. 高斯滤波
    高斯滤波是一种线性平滑滤波方法,它基于高斯函数的权值进行滤波,具有消除高频噪声和保留图像细节的特点。高斯滤波的主要优点是它可以在平滑图像的同时保留图像的边缘和细节,但它可能会在滤波时降低图像的对比度。

  4. 双边滤波
    双边滤波是一种非线性滤波方法,它可以同时平滑图像和保留图像细节和边缘。它使用两个高斯分布,一个用于平滑图像,一个用于平滑图像中像素之间的差异,从而保留图像的细节和边缘。

  5. 小波变换
    小波变换是一种基于频率分析的方法,它能够在时域和频域之间进行转换,从而消除噪声。小波变换可以对图像进行多尺度分解,将高频和低频信号分离,然后对高频信号进行降噪处理。

总的来说,不同的图像噪声滤波方法适用于不同类型的噪声和不同的应用场景。在实际应用中,需要根据具体情况选择合适的方法来去除噪声,同时需要注意保留图像细节和边缘。

1.3 图像处理

图像处理的分类

  • 光学模拟处理
  • 电学模拟处理
  • 计算机数字处理

数字图像处理

  1. 图像信息的获取
    一般包括图像的摄取、转换及数字化,该部分主要由处理系统硬件完成。
  2. 图像信息的存储与交换
    数字图像信息量大,并且在处理过程中必须对数据进行存储和交换,该功能主要由硬件完成。
  3. 具体的图像处理
  • 数字图像处理指把在空间上离散、在幅度上量化分层的数字图像经过一些特定数理模式的加工处理,达到有利于人眼视觉或某种接收系统所需的图像过程。
  • 具体方法:图像变换、图像编码压缩、图像增强和复原、图像分割、图像描述、图像分类识别和图像重建等。
  1. 图像的输出和显示
    一般图像输出方式可分为硬拷贝(照相、打印、扫描)和软拷贝(平板监视器)。

数字图像处理常用方法

  1. 图像变换
  • 由于图像阵列很大,直接在空间域中处理计算量很大,往往采用图像变换的方法,将空间域处理转换为变换域处理,不仅减少计算量,还可更有效的处理。
  • 图像编码压缩技术可减少描述图像的数据量,压缩可在不失真的前提下获得,也可在允许失真的条件下进行。
  1. 图像增强
    • 目的是为了提高图像质量,如去噪声、提高图像清晰度等。
    • 一个数字图像处理系统来讲,处理流程可分为3个阶段:图像预处理阶段、特征抽取阶段、识别分析阶段。图像增强是预处理阶段的重要步骤。
    • 图像增强的主要内容是突出图像中感兴趣的部分,减弱或去除不需要的信息。
    • 图像增强就是增强图像中用户感兴趣的信息,主要两个目的:一是改善图像的视觉效果,提高图像成分的清晰度;二是使图像变得更有利于计算机处理。
    • 图像增强指利用各种数学方法和变换手段,提高图像中感兴趣区域与背景的对比度与图像清晰度,更明显的突出感兴趣的区域。
      (1) 空域法
      直接在空间域内对图像进行运算处理,分为点运算算法和邻域去噪算法。
      (2) 频域法
      利用图像变换方法将原来的图像空间中的图像以某种形式转化到其他空间去,利用该空间的特有性质进行图像处理,最后转换回原来的图像空间。频域法增强技术的基础是卷积理论。
      图像增强方法分类

图像分割

将图像中有意义的特征部分提取出来,包括图像中的边缘、区域等

图像描述

图像描述是图像识别和理解的必要前提。
一般图像的描述方法采用二维形状描述:

  • 边界描述
  • 区域描述

图像分类/识别

图像分类属于模式识别范畴,主要内容是图像经过预处理后进行图像分割和特征提取,进行判决分类。

图像重建

一些三维物体,取得物体内部结构数据,将数据进行运算处理构成物体内部某些部位的图像。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/373298.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

有趣的Hack-A-Sat黑掉卫星挑战赛——卫星平台内存dump

国家太空安全是国家安全在空间领域的表现。随着太空技术在政治、经济、军事、文化等各个领域的应用不断增加,太空已经成为国家赖以生存与发展的命脉之一,凝聚着巨大的国家利益,太空安全的重要性日益凸显[1]。而在信息化时代,太空安…

AI_Papers周刊:第三期

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 2023.02.20—2023.02.26 文摘词云 Top Papers Subjects: cs.CL 1.LLaMA: Open and Efficient Foundation Language Models 标题:LLaMA:开放高效的基础语言模型 作者&#…

14、KL散度

KL 散度,是一个用来衡量两个概率分布的相似性的一个度量指标。 现实世界里的任何观察都可以看成表示成信息和数据,一般来说,我们无法获取数据的总体,我们只能拿到数据的部分样本,根据数据的部分样本,我们会…

5、算法MATLAB---矩阵的运算和索引

矩阵的运算和索引1、矩阵的运算1.1 获取矩阵的行列数1.2 矩阵转置、逆矩阵1.3 特征值和特征向量1.4 加减乘除乘方运算1.5 广播机制1.6 逻辑运算2、矩阵的索引1、矩阵的运算 1.1 获取矩阵的行列数 使用size函数 1.2 矩阵转置、逆矩阵 使用【】和inv函数 1.3 特征值和特征…

NLP中的对话机器人——预训练基准模型

引言 本文是七月在线《NLP中的对话机器人》的视频笔记,主要介绍FAQ问答型聊天机器人的实现。 场景二 上篇文章中我们解决了给定一个问题和一些回答,从中找到最佳回答的任务。 在场景二中,我们来实现: 给定新问题,从…

【华为OD机试模拟题】用 C++ 实现 - 匿名信(2023.Q1)

最近更新的博客 【华为OD机试模拟题】用 C++ 实现 - 货币单位换算(2023.Q1) 【华为OD机试模拟题】用 C++ 实现 - 选座位(2023.Q1) 【华为OD机试模拟题】用 C++ 实现 - 停车场最大距离(2023.Q1) 【华为OD机试模拟题】用 C++ 实现 - 重组字符串(2023.Q1) 【华为OD机试模…

全网最全——Java 数据类型

一、数据类型方法论 程序本质上是对数据的处理(逻辑运算),因此任何语言都需先解决如何表征【数据】这个核心概念。数据作为抽象的概念,天然的包含2个方面属性: 类型:类型决定了数据只能和同类型的数据进行…

18、MySQL8其它新特性

文章目录1 MySQL8新特性概述1.1 MySQL8.0 新增特性1.2 MySQL8.0移除的旧特性2 新特性1:窗口函数2.1 使用窗口函数前后对比2.2 窗口函数分类2.3 语法结构2.4 分类讲解1 序号函数2 分布函数3 前后函数4 首尾函数5 其他函数2.5 小 结3 新特性2:公用表表达式…

Objective-C 构造方法的定义和声明规范

总目录 iOS开发笔记目录 从一无所知到入门 文章目录源码中 NSArray 的构造方法与命名规律自定义类的构造方法命名截图代码输出源码中 NSArray 的构造方法与命名规律 interface NSArray<ObjectType> (NSArrayCreation) (instancetype)array;(instancetype)arrayWithObject…

Spring Cloud Alibaba全家桶(二)——微服务组件Nacos注册中心

前言 本文为微服务组件Nacos注册中心相关知识&#xff0c;下边将对什么是 Nacos&#xff0c;Nacos注册中心&#xff08;包括&#xff1a;注册中心演变及其设计思想、核心功能&#xff09;&#xff0c;Nacos Server部署&#xff08;包括&#xff1a;单机模式、集群模式&#xff…

常见的开发模型和测试模型

软件的生命周期软件开发阶段的生命周期需求分析->计划->设计->编码->测试->运维软件测试阶段的生命周期需求分期->测试计划->测试设计与开发->执行测试->测试评估开发模型瀑布模型可以看到,这个模型和我们上面的软件开发生命周期很相似采用的是线性…

[LeetCode周赛复盘] 第 334 场周赛20230226

[LeetCode周赛复盘] 第 334 场周赛20230226 一、本周周赛总结二、 [Easy] 6369. 左右元素和的差值1. 题目描述2. 思路分析3. 代码实现三、[Medium] 6368. 找出字符串的可整除数组1. 题目描述2. 思路分析3. 代码实现四、[Medium] 6367. 求出最多标记下标1. 题目描述2. 思路分析3…

软件测试面试项目问答怎么回答才能让面试官认可?

四、项目4.1 简单介绍下最近做过的项目根据自己的项目整理完成&#xff0c;要点&#xff1a;1&#xff09;项目背景、业务、需求、核心业务的流程2&#xff09;项目架构&#xff0c;B/S还是C/5&#xff0c;数据库用的什么? 中间件用的什么&#xff1f;后台什么语言开发的&…

vue3+rust个人博客建站日记1-框架开发环境配置。

背景 阅读了陈皓老师《左耳听风》栏目后&#xff0c;更觉个人知识体系停留在“知道”的阶段&#xff0c;真正动起手来&#xff0c;处处制肘。故决定重新上路&#xff0c;按照《左耳听风》的路线&#xff0c;锻炼一下自己。 个人博客建站&#xff0c;主要是为了熟悉一门前端与…

springboot+vue结合,后端学习前端(三)(前端拦截器+后端拦截器)未登录访问其他页面,直接进入登陆界面

前端拦截器后端拦截器处理#号问题使用 History 模式前端部署到后端项目里&#xff08;tomcat版本由8.5.23需要提高到9.0.56了&#xff09;默认的错误页面后端登录拦截器LoginController添加sessionLoginInterceptor拦截器配置到项目里Vuex 与前端登录拦截器下载 Vuex引入Vuex修…

我继续问了ChatGPT关于SAP顾问职业发展前景的问题,大家感受一下

目录 SAP 顾问 跟其他IT工作收入情况相比是怎么样的&#xff1f; 如何成为SAP FICO 优秀的顾问 要想成为SAP FICO 优秀的顾问 &#xff0c;需要ABA开发技能吗 SAP 顾问中哪个类型收入最多&#xff1f; 中国的ERP软件能够取代SAP吗&#xff1f; SAP 顾问 跟其他IT工作收入情…

java+springboot+vue高校学生医疗保险管理系统

医保管理系统是对与职工健康息息相关的档案进行的系统化、自动化的管理&#xff0c;主要是对职工办理的医疗保险的管理&#xff0c;本系统能够很好的适应社会的需求&#xff0c;最大化的为城镇职工提供服务。医疗保险是国家社会保障体系的重要组成部分&#xff0c;也是社会保险…

【Linux】零成本在家搭建自己的私人服务器解决方案

我这个人自小时候以来就特喜欢永久且免费的东西&#xff0c;也因此被骗过&#xff08;花巨款买了永久超级会员最后就十几天&#xff09;。 长大后骨子里也是喜欢永久且免费的东西&#xff0c;所以我不买服务器&#xff0c;用GitHubPage或者GiteePage搭建自己的静态私人博客&…

Python控制CANoe使能TestCase

前面介绍了多种CANoe配置下的dbc文件添加,常见的配置我们能够常用的就是testcase的使能和环境变量的设置,针对于环境变量的问题,我们下次再进行详聊,今天主要聊一下测试脚本的使能。在做这块之前,我们第一步就需要了解我们的测试脚本的层级是都包含有哪些? 一、测试脚本结…

Mysql 数据库版本升级V1.0

序号版本描述修改审查11.0mysql升级描述&#xff1a;甲方安全审计&#xff0c;发现数据库漏洞&#xff0c;或者定期排查数据库漏洞环境&#xff1a; linux系统准备&#xff1a;第一步下载mysql 安装包https://downloads.mysql.com/archives/community/https://dev.mysql.com/do…