【计算机视觉】完整版复习

news2025/1/18 17:10:18

计算机标定

齐次坐标

齐次坐标,将欧氏空间的无穷远点,与投影空间中有实际意义的消失点,建立起映射关系

把齐次坐标转化为笛卡尔坐标的方法:是前面n-1个坐标分量分别除以最后一个分量即可

image-20221204123738060

一些解释和性质:

image-20221204123928555

img

比较好的理解:

表达一个点比一个向量需要额外的信息。如果我写出一个代数分量表达(1, 4, 7),谁知道它是个向量还是个点!

如果用齐次坐标————上面的(1, 4, 7)如果写成(1,4,7,0),它就是个向量;如果是(1,4,7,1),它就是个点。因此可以用齐次坐标很好的将向量和点统一起来表示。

详见:https://blog.csdn.net/wonengguwozai/article/details/126123349

线性变换

线性变换包括:欧式变换Euclidean、仿射变换affine和透视变换projective。

欧式变换Euclidean

欧式变换保持了长度和角度平移旋转是欧式变换。也叫刚体变换。

平移

将一个点从一个位置转换到另一个位置

image-20221204144606996

其中:

image-20221204144503649

推广到三维:

旋转

image-20221204160006245

推广到三维:

image-20221204160039937

仿射变换affine

仿射变换保持了长度和角度比值,仿射变换的例子是剪切缩放

缩放

image-20221204160230100

剪切

image-20221204160252458

透视变换projective

透视变换可以来实现有限范围的点变换为无穷远点,将图像投影到一个新的视平面(也叫投影变换)

image-20221204160551432

图像成像

针孔透视

针孔模型中,光线通过一个无限小的孔,并且在成像平面上呈现出倒像。

**透视投影:**将三维物体的信息映射到二维平面上。

image-20221204161745792

弱透视

弱透视投影:平面中的所有线段都以相同的放大倍数进行投影。

相机事实上成像在后面,然后取倒像

image-20221204161841404

摄像机镜头

Snell定律

image-20221204162230448

薄透镜

image-20221204162328694

厚透镜

image-20221204162344794

z是镜到cmos的距离,Z是物体到镜的距离

相机的视野

相机的视野:即实际投影到相机视网膜上的景物部分,不仅由焦距定义,还取决于视网膜的有效面积(例如,相机中可曝光的胶片面积,或数码相机中的传感器面积)。

球形像差

简单地说:就是大光圈进光亮大造成虚化。

标准答案:

球形像差,顾名思义是由于透镜的球形表面造成的像差。实际上,球面镜不能将所有光线聚焦在同一点,透过镜片边缘进入的光线会偏离焦点形成像差。尤其在大光圈的时候,有较多光线可以通过镜片。最明显就是一些光点会虚化成一团光,这是由于边缘位置进入的光线与中心聚焦的偏差较大所致。

色差

不同波长(颜色)的光线由于折射系数的差异(色散),在通过透镜时将发生不同程度的折射然后与光轴相交于不同的位置,并在同一图像平面上形成不同的模糊圈(横向色差)。

摄像机的几何标定

内参矩阵

在u和v方向上分辨率分别为mu和mv,tu和tv是平移量。

image-20221204163348061

外参矩阵

相机的投影中心不在(0,0,0),主轴不在Z轴上,图像平面虽然仍然与主轴正交,但也不平行于XY平面。

设这个平移矩阵为T(Tx, Ty, Tz)。让主轴与Z轴重合的旋转矩阵由3×3旋转矩阵R给出,子矩阵(RT是平移矩阵)相乘得到3×4变换矩阵。

image-20221204164900311

E被称为外参矩阵

相机标定矩阵

image-20221204165051674

张正友标定法

image-20221204170055552

1.求解内参矩阵和外参矩阵的积H

image-20221204171818688

image-20221204170443815

当一张图片上的标定板角点数量等于4时,即可求得该图片对应的矩阵H 。当一张图片上的标定板角点数量大于4时,利用最小二乘法回归最佳的矩阵H 。

最小二乘法:简单地说就是通过n组X(u,v)和Y(U,V),求解八个参数。

https://blog.csdn.net/W1995S/article/details/118153146

2.求解内参矩阵

image-20221204175704911

image-20221204175733225

3.求解外参矩阵

image-20221204175824030

4、标定相机的畸变参数

image-20221204181321248

r为图像像素点到图像中心点的距离,即 image-20221204181517165

在这里,x->u y->v

image-20221204181808329

图像形成与颜色

光照及阴影

辐射度学

image-20221204185226005

颜色

颜色信息反映了入射光的能量分布与波长,可见光的波长在400nm760nm之间。

RGB

RGB分别代表三个基色(R-红色、G-绿色、B-蓝色),如(0,0,0)表示黑色、(255, 255, 255)表示白色。其中255表示色彩空间被量化成255个数,最高亮度值为255(255 = 2^8 - 1,即每个色彩通道用8位表示)。

CMYK

CMY是色料三原色,分别是青(Cyan)、品红(Magenta)、黄(Yellow),再增加一个独立的黑色(K)

RGB 转换至CMYK

image-20221204184415977

CMYK 转换至 RGB

image-20221204184449057

Lab

Lab是基于人对颜色的感觉来设计的,更具体地说,它是感知均匀(perceptual uniform)的,如果数字(L、a、b这三个数)变化的幅度一样,那么它给人带来视觉上的变化幅度也差不多。

HSI

色调H(Hue):与光波的频率有关,它表示人的感官对不同颜色的感受,如红色、绿色、蓝色等。

饱和度S(Saturation):表示颜色的纯度,纯光谱色是完全饱和的,加入白光会稀释饱和度。饱和度越大,颜色看起来就会越鲜艳,反之亦然。

亮度I(Intensity):对应成像亮度和图像灰度,是颜色的明亮程度。

RGB转HSI:

image-20221204184713427

HSI转RGB:

image-20221204184757850

HSV

H (Hue)色相:取值范围 [0, 360]

S (Saturation)饱和度,即色彩纯净度,0饱和度为白色;取值范围:[0, 1]

V (Value):明度,0明度为纯黑色;取值范围:[0, 1]

HSV转换至RGB:

image-20221204184857163

RGB转换至HSV

image-20221204184905318

色彩还原

全世界目前主流使用8位每通道SRGB色彩描述体系来记录我们的颜色信息,8位的灰阶256非常有限。人眼的特点是对暗部更为敏感。如果用256灰阶直

接记录物理渐变的话,那么暗部只有56个灰阶,暗部就会出现巨大的色阶断层。如果我们做一次非线性映射,也就是Gamma矫正。把0.218的光信号提到中间。那么亮部和暗部各会分配到128个色阶。

光度处理

直方图处理

image-20221204185100718

手工实现直方图均衡化
了解直方图均衡化的原理之后,我们以一个简单的例子来手工计算均衡化后的图像。这里我们假设存在以下这张图像(假定图像的灰度级范围是 [0, 9]):

img
计算过程如下:

image-20221204192832794

image-20221204192902240

原文链接:https://blog.csdn.net/qq_15971883/article/details/88699218

图像融合

直接剪切粘贴技术(cut-and-paste)

ps抠图

Alpha融合

实现平滑过渡的更好方法是在图像中央选择一个宽度w,并使alpha掩模在这w个像素上从0平滑过渡到1,这个过程被称为羽化,能够实现更平滑的混合。线性减小或增大的混合函数会导致梯度不连续,从平滑区域过渡到线性区域时产生被称为马赫带的可见噪声。

拉普拉斯金字塔

综合考虑混合函数对特征大小和平滑度的约束,混合图像的理想方法是

分辨率混合。可以用拉普拉斯金字塔进行这种多分辨率分解,其中金字塔的每一层提供不同的分辨率,而组合所有层能恢复原图像

全景图像生成

两个相邻图像的区域进行混合

光度立体视觉

光度立体法的用途是可以重建出物体表面的法向量,以及物体不同表面点的反射率,最关键的是它不像传统的几何重建(例如立体匹配)方法那样需要去考虑图像的匹配问题,因为所需要做的只是采集三张以上,由不同方向的光照射物体的图像。这个过程中,物体和相机都不动,因此图像天然就是对齐的,这使得整个过程非常的简洁。

图像预处理

线性滤波与卷积

线性滤波

线性滤波使用的加权模式通常称为滤波的核,使用滤波的过程称为卷积

卷积

image-20221204195742923

对称性高斯模型

处理模糊问题的较好模型是对称性高斯模型

image-20221205002854716

●如果高斯分布的标准差很小(甚至小于一个像素)平滑效果将会很差,因为偏离中心的所有像素的

权重都非常小。

●如果是一个大一些的标准差,相邻的像素在加权平均过程中将有大一些的权重,意味着平均的结果将偏向多数相邻点的共识,这样能够得到一个像素值的较好估计,噪声随着平滑也将大大降低,但代价是图像会有些模糊。

●最后,一个具有很大标准差的核将导致图像细节随同噪声一同消失。

非线性滤波示例

噪声是散粒噪声(或椒盐噪声),而不是高斯噪声,即图像偶尔会出现很大的值。这种情况下,用高斯滤波器对图像进行模糊,噪声像素是不会被去除的,它们只是转换为更柔和但仍然可见的散粒(图f)。使用中值滤波器是一个较好的选择。中值滤波器选择邻域像素的中值作为输出。

由于中值滤波只选一个像素作为输出像素,所以一般很难有效去除规则的高斯噪声。这时采用α﹣截尾均值滤波会得到更好的效果。α﹣截尾均值滤波是指去掉百分率为α的最小值和最大值后剩下的像素的均值。

双边滤波:

image-20221205004435623

形态学算子

image-20221205004601242

边缘检测

检测器

基于梯度的检测器——Sobel算子

我们将梯度计算表示成或者滤波器的形式。当图像与这样的滤波器卷积时,我们就能得到两幅梯度图像,一个对应x方向,另一个对应y方向。计算出梯度后,如果某个像素处的边缘强度超过一定的值,我们就将该像素检测为边缘子,该选定的值称为阈值,是边缘子检测过程的一个参数。这种通过选择阈值生成二值图像的过程称为阈值化(Thresholding)。阈值化后,除了生成二值图像,我们也可以生成灰度图,其中边缘根据其方向或者强度使用不同的灰度值表示。此时,灰度值将会编码θ或者||∇f||信息。

image-20221205121217547

image-20221205121159627

因为它具有减少高频泄漏的特性。边缘算子之后被应

用于平滑后的图像来实现边缘检测

image-20221205123130863

基于曲率的检测器

拉普拉斯算子

image-20221205133300642

Canny检测器

image-20221205140059925

详见:https://blog.csdn.net/weixin_51571728/article/details/121452303

边缘子聚合

用于检测参数化对象

傅里叶变换

image-20221205142045230

image-20221205150242316

image-20221205145732472

通过傅里叶变换方法求图像卷积

特征与分类器

查找角点

Harris角点检测的基本思想:算法基本思想是使用一个固定窗口在图像上进行任意方向上的滑动,比较滑动前与滑动后两种情况,窗口中的像素灰度变化程度,如果存在任意方向上的滑动,都有着较大灰度变化,那么我们可以认为该窗口中存在角点。

image-20221205221508548

image-20221205221547167

image-20221205221951432

分类器模式

决策树

image-20221206083311368

image-20221206085006585

image-20221206085020252

image-20221206085034100

image-20221206085120115

支持向量机

基于训练集D在样本空间中找到一个划分超平面,将不同类别的样本分开。

image-20221206153545436

image-20221206153602488

image-20221206153618941

详见:https://blog.csdn.net/qq_42192693/article/details/121164645

https://zhuanlan.zhihu.com/p/270298485

考到就去世吧。。。

贝叶斯分类器

image-20221206161933168

image-20221206161950865

image-20221206173925709

集成学习

image-20221206163627378

太多了,自己查吧,毁灭吧。。。

基础神经网络

神经元和多层感知机

image-20221206224559796

image-20221206224632866

image-20221206225218262

image-20221206231533757

image-20221206232233367

image-20221206232242197

误差反向传播算法

image-20221206232750410

例题:https://blog.csdn.net/qq_39276337/article/details/120414795

本质上是链式求导法则

image-20221207011327521

image-20221207011010826

image-20221207010925957

image-20221207011528092

image-20221207011538112

卷积神经网络

有可能考到的关键问题:

1.简述卷积神经网络的结构:

卷积神经网络是一种前馈神经网络,由一个或多个卷积层和顶端的全连通层组成,同时也包括关联权重和池化层。

卷积层可以产生一组平行的特征图,功能是对输入数据进行特征提取。它通过在输入图像上滑动不同的卷积核并执行一定的运算而组成。此外,在每一个滑动的位置上,卷积核与输入图像之间会执行一个元素对应乘积并求和的运算以将感受野内的信息投影到特征图中的一个元素。

卷积层中包含激励函数以协助表达复杂特征。

池化层(pooling layer)

在卷积层进行特征提取后,输出的特征图会被传递至池化层进行特征选择和信息过滤,它实际上是一种非线性形式的降采样。池化层包含预设定的池化函数,其功能是将特征图中单个点的结果替换为其相邻区域的特征图统计量。池化层选取池化区域与卷积核扫描特征图步骤相同,由池化大小、步长和填充控制。

完全连接层

最后,在经过几个卷积和最大池化层之后,神经网络中的高级推理通过完全连接层来完成。就和常规的非卷积人工神经网络中一样,完全连接层中的神经元与前一层中的所有激活都有联系。卷积神经网络中的全连接层等价于传统前馈神经网络中的隐含层。全连接层位于卷积神经网络隐含层的最后部分,并只向其它全连接层传递信号。

输出层

卷积神经网络中输出层的上游通常是全连接层,因此其结构和工作原理与传统前馈神经网络中的输出层相同。对于图像分类问题,输出层使用逻辑函数或归一化指数函数输出分类标签。

image-20221207141710338

image-20221207130514833

预处理步骤包括以下内容:

image-20221207130912085

局部对比归一化,PCA白化

卷积层:

image-20221207133152914

image-20221207133345648

image-20221207133435354

具体描述:

image-20221207134245980

image-20221207134539733

image-20221207134555130

image-20221207134745852

image-20221207134817911

池化:

image-20221207141539306

image-20221207134905788

image-20221207134931215

**空间金字塔池化层(SSP)**背后的灵感是令人关注的判别特征可以在各种尺度的卷积特征图中出现。因此,将此信息合并用于分类是有用的。

image-20221207135100247

image-20221207140629205

image-20221207140652325

损失函数

image-20221207141055957

image-20221207141105306

image-20221207141114554

图像分类与目标检测

图像分类

ImageNet 是一个计算机视觉系统识别项目,是目前世界上最大的图像识别数据库。此项目由斯坦福大学李飞飞教授于 2009 年发起。

用CNN进行图像分类最早可以追溯到LeNet,后续发展包括AlexNet、GoogLeNet、VGG、ResNet、ResNeXt和SENet。

目标检测与定位

image-20221207145322263

基于锚点框的目标检测方法为空间每一个位置设定多个矩形框,以便尽可能地覆盖图像中存在的所有物体。基于锚点框的目标检测可以分为两类:两阶段目标检测方法和单阶段目标检测方法。

两阶段方法:首先提取 k 个类别未知的候选检测窗口,然后进一步对这些候选检测窗口进行分类和回归,生成最终的检测结果。

与两阶段方法不同,单阶段方法直接对锚点框进行分类和回归。一般而言,两阶段方法具有较高的检测精度,而单阶段方法具有较快的推理速度。

来不及复习了。。这一章算了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/69631.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

idea远程debug

有时候我们需要进行远程的debug,本文研究如何进行远程debug,以及使用 IDEA 远程debug的过程中的细节。看完可以解决你的一些疑惑。 1.配置idea 如图,依次点击或者填写对应的ip和端口,需要debug的服务 2.修改启动命令 选择 jdk …

东郊到家、往约到家预约上门理疗按摩系统小程序模式讲解

东郊到家和往约到家都是做上门理疗按摩推拿等服务的线上预约平台,目前已经在全国很多一二线城市都开设了分站,今天我们就来对这两个程序进行讲解。 为什么这类上门服务平台能发展的这么迅速? 一是因为平台成本投入比较低,线上预…

微服务框架 SpringCloud微服务架构 22 DSL 查询语法 22.4 地理查询

微服务框架 【SpringCloudRabbitMQDockerRedis搜索分布式,系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】 SpringCloud微服务架构 文章目录微服务框架SpringCloud微服务架构22 DSL 查询语法22.4 地理查询22.4.1 地理查询22 DSL 查询语法 22.4 地理…

【强化学习论文】多智能体强化学习是一个序列建模问题

文献题目:Multi-Agent Reinforcement Learning is A Sequence Modeling Problem时间:2022代码:https://github.com/PKU-MARL/Multi-Agent-Transformer. 摘要 GPT 系列和 BERT 等大序列模型(SM)在自然语言处理、视觉和…

FL Studio免费升级21完整版新功能新插件介绍

万众期待的 FL Studio 21 版本正式发布上线,所有FL Studio的用户,都可以免费升级到21版! 按照惯例,本次新版也会增加全新插件,来帮助大家更好地创作。今天先给大家分享一下,新增的4款插件简单介绍&#xf…

基于AT89S52单片机的蘑菇大棚环境监测系统论文(附录代码)

目 录 第1章 绪 论 1 1.1 研究背景和意义 1 1.2 国内外发展现状 2 1.3 设计内容和指标 4 第2章 系统设计方案 5 2.1 系统组成 5 2.1.1 总体结构 5 2.1.2 单片机的选型 5 2.1.3 温湿度传感器选型 6 2.1.4 二氧化碳传感器选型 6 2.1.5 PH值传感器选型 7 2.1.6 加热器选型 8 2.1.7…

HTTP协议分析 实验报告

实验名称: HTTP协议分析 一、实验预习 1、实验目的 利用抓包工具(Wireshark/Windump/Sniffer)抓取HTTP报文,以进一步熟悉和理解HTTP报文格式规范与HTTP协议的工作原理 2、实验内容(…

《Linux-权限的理解、shell的理解和粘滞位》

目录 一、shell的理解 二、Linux权限 一、用户的引入 二、权限管理 一、什么是权限 二、Linux下的权限 三、视图展示 四、文件类型 五、为什么gcc编译器编译.txt后缀的文件有问题? 六、修改权限 一、chmod设置文件的访问权限 一、基本使用 二、八进制方案(访…

es的自动补全查询——DSL语句java代码实现

1、DSL语句 elasticsearch提供了Completion Suggester查询来实现自动补全功能。这个查询会匹配以用户输入内容开头的词条并返回。 为了提高补全查询的效率,对于文档中字段的类型有一些约束: 参与补全查询的字段必须是completion类型。 字段的内容一般…

SpringMVC的执行流程

文章目录1 初始化阶段2 匹配阶段3 执行阶段我们把整个流程分成三个阶段初始化阶段匹配阶段执行阶段 1 初始化阶段 在 Web 容器第一次用到 DispatcherServlet 的时候,会创建其对象并执行 init 方法 init 方法内会创建 Spring Web 容器,并调用容器 refre…

阿里十年技术沉淀|深度解析百PB级数据总线技术

云原生场景下数据总线需求场景及挑战 数据总线简介 数据总线作为大数据架构下的流量中枢,在不同的大数据组件之间承载着数据桥梁的作用。通过数据总线,可以实时接入来自服务器、K8s、APP、Web、IoT/移动端等产生的各类异构数据,进行统一数据…

【java 新特性】java8新特性

核心内容 lambda 函数编程 在Java世界里面,面向对象还是主流思想,对于习惯了面向对象编程的开发者来说,抽象的概念并不陌生。面向对象编程是对数据进行抽象,而函数式编程是对行为进行抽象。现实世界中,数据和行为并…

【机器学习实战】使用SGD、随机森林对MNIST数据集实现多分类(jupyterbook)

1. 获取数据集并重新划分数据集 # 获取MNIST数据集 from sklearn.datasets import fetch_openml mnist fetch_openml(mnist_784, version1, cacheTrue, as_frameFalse)# 查看测试器和标签 X, y mnist[data], mnist[target] X_train, X_test, y_train, y_test X[:60000], X[…

Nuxt3使用echart,使用中国地图

目录 第一步安装echart 第二步配置plugins 第三步使用 例如使用饼状图 例如使用中国地图 第一步安装echart npm install echarts --save 第二步配置plugins 在plugins创建echarts.ts文件并写入下面内容 import * as echarts from echartsexport default defineNuxtPlugin((…

springboot事件监听机制二:基本工作原理

前言 这是继《springboot事件监听机制一:实战应用》第二篇,知其然,当然还要知其所以然,深入的源码里面探寻一下这一有套机制的工作原理。spring生态很茂盛,这里不会站太高去分析这个问题,大扯spring的一些原…

优秀的项目跟踪管理软件有哪些?

国内外优秀的项目跟踪管理软件有:1、软件项目跟踪管理PingCode;2、通用项目跟踪管理Worktile;3、小型团队项目跟踪管理Asana;4、基于桌面的项目跟踪软件Microsoft Project;5、适用所有类型项目的跟踪软件Clickup&#…

[ vulhub漏洞复现篇 ] GhostScript 沙箱绕过(任意命令执行)漏洞CVE-2018-16509

🍬 博主介绍 👨‍🎓 博主介绍:大家好,我是 _PowerShell ,很高兴认识大家~ ✨主攻领域:【渗透领域】【数据通信】 【通讯安全】 【web安全】【面试分析】 🎉点赞➕评论➕收藏 养成习…

Cellobiose-PEG-DBCO 纤维二糖-聚乙二醇-二苯基环辛炔,DBCO-PEG-纤维二糖

Cellobiose-PEG-DBCO 纤维二糖-聚乙二醇-二苯基环辛炔,DBCO-PEG-纤维二糖 中文名称:纤维二糖-二苯基环辛炔 英文名称:Cellobiose-DBCO 别称:二苯基环辛炔修饰纤维二糖,二苯基环辛炔-纤维二糖 PEG分子量可选&…

2023年湖北安全员ABC报名时间和考试时间是什么时候?甘建二

2023年湖北安全员ABC报名时间和考试时间是什么时候? 安全员ABC考试和报名时间,12月份安全员ABC考试时间是12月底,12月份湖北安全员ABC报名是现在开始报名了,目前报名入口已经开通需要开始报名了。 2023年湖北安全员ABC报名时间&am…

人工智能历史上的重要一步:ChatGPT影响到谷歌地位?

AI神器ChatGPT 火了。 能直接生成代码、会自动修复bug、在线问诊、模仿莎士比亚风格写作……各种话题都能hold住,它就是OpenAI刚刚推出的——ChatGPT。 有脑洞大开的网友甚至用它来设计游戏:先用ChatGPT生成游戏设定,再用Midjourney出图&…