深度学习图像处理基础

news2025/3/10 15:31:58

这里写目录标题

  • 分辨率
    • 是什么
  • 视网膜屏
    • 视网膜屏
    • 人眼的视觉
      • 视力
    • 像素密度
    • 设置合适的PPI,制造视网膜屏
  • 色彩
    • 是什么
    • 色匹配实验
    • 色彩匹配的意义
    • 量化色彩匹配
      • 白色合为1
      • 色度图
    • 总结
  • HDR
    • 光亮度(尼特)
    • 灰阶
    • 亮度范围
    • HDR显示技术
    • 总结
  • 数字图像化
    • 概览
  • 人脸检测
    • 需要关注的两个问题
      • 人脸的判别
        • 人脸检测算法
          • 第一步
            • 类哈尔特征
            • 集成学习
          • 第二步
          • 第三步
            • 积分图算法
      • 人脸的定位
        • 滑动窗口与滑动尺寸
      • 补充(关于机器学习)
  • 深度学习十大应用
    • 分辨率增强
    • 帧率增强
    • 色彩增强
    • 风格迁移
    • 图像分类
    • 物体检测
    • 物体分割
    • 特征检测
    • 人脸识别
    • 物体生成
  • 神经网络
    • 神经元
      • 工作原理
        • 简介
        • 实例
    • 神经网络
      • 简介
      • 深度神经网络
    • 总结

分辨率

是什么

在这里插入图片描述
一张照片被拍摄出来之后,我们将其放大,可以看多许多的小方块单元,这些单元称为像素,组成了整个照片,而分辨率就是水平像素个数和垂直像素个数组合而成

在这里插入图片描述
上图相机的最高像素可以达到三千万,像素越高成像越清晰

视网膜屏

视网膜屏

在这里插入图片描述
视网膜屏就是像素颗粒很小,很细腻,细腻到人眼看不出来像素颗粒的存在,就被称为视网膜屏

视网膜屏的设计,可以欺骗人类的大脑,将一些零散的画面,反馈到大脑后成为连续的画面,这是视网膜屏的重大意义

人眼的视觉

视力

在这里插入图片描述
视力是你将两条线看成一条线之后,人眼与两条线形成的夹角,就是视力吗,这个角被称为极限分辨角度
在这里插入图片描述
在这里插入图片描述

当我们使用E子表,测试视力时,上面所反馈得到的数值,是极限分辨角度的倒数,单位是角分

像素密度

在这里插入图片描述
我们通常使用像素密度来判断像素的大小,像素密度是对角线的像素个数/对角线尺寸(单位英寸),得出这块屏幕的像素密度,简称PPI

设置合适的PPI,制造视网膜屏

在这里插入图片描述
想要计算出一个视网膜屏的PPI,需要得知这个人的视力以及观看距离,视力与观看距离可以计算出视野范围,也就是尺寸,拿到尺寸之后,根据人眼能分辨的最小的像素单元大小,就可以计算出像素的密度,即PPI

色彩

是什么

在这里插入图片描述
在这里插入图片描述
颜色是光反射的结果,光的本质是电磁波,而人类能够捕捉到的光的频率范围是400nm至700nm

色匹配实验

在这里插入图片描述
根据色匹配实验得出,同一种颜色,可以由完全不同的光谱分布实现
在这里插入图片描述
且,任何一种颜色,都可以使用红绿蓝三原色不同的比例分配进行合成

色彩匹配的意义

在这里插入图片描述
由以上结论可知,我们想要显示一个颜色,无需真的把那个颜色调出来,而是用三原色红绿蓝调制特定的比例从而合成我们想要的颜色,从而用更少的资源更高效的做事

量化色彩匹配

白色合为1

在这里插入图片描述
我们规定三原色等比例合成白色时,三色和为1

色度图

在这里插入图片描述
将400nm至700nm的点画在上面的图中,会显示出独特的曲线,而从中取三个点形成三角形,那么该三角形内的色彩就可以由这三个点的不同比例匹配出来,所以三角形越大,匹配的色彩越多
但是从工业的角度出发,为了成本,我们只需要一个能将我们日常生活中较为常见的色彩匹配出来的三角形即可,所以出现了许多的三角形标准,如下图
在这里插入图片描述

总结

在这里插入图片描述

HDR

光亮度(尼特)

人对亮度的差异的分辨能力存在极限

灰阶

在这里插入图片描述
一个器件亮度从最暗到最亮被划分为有限个等级,这些等级称为灰阶
而这些有限个灰阶的划分是按照二进制的位数划分的
例如一个8bit的灰阶,有2的8次方个不同的等级,且等级变化不连续,是间断变化的,8bit就是用二进制表示就是100000000,转为十进制就是2的8次方,计算结果为256
在这里插入图片描述
但是由于人眼对亮度差异的分辨存在极限,所以,对于不连续的灰阶,在人眼看来,是连续的

亮度范围

在这里插入图片描述
人眼能感知的亮度范围是10的-6次方到10的8次方,但是目前所有的感光器件(例如相机),他的亮度范围都没能达成人眼的范围,都要比人眼的范围小

HDR显示技术

在这里插入图片描述
所以,HDR就是将一个相机拍摄的从最暗到最亮的几张有代表性的照片合成到一起,这就是HDR技术
但是HDR技术有可能会造成原来的亮度差异的变化,造成画面的失真
所以,捕捉到更多的灰阶以及足够大的尼特范围,是HDR努力的方向

总结

在这里插入图片描述

数字图像化

概览

在这里插入图片描述
首先我们得到一张照片
之后,由于相机cmos的限制,我们将其分成3808*2856个像素
之后,根据三原色匹配原理,将其分成三层颜色不同的像素图
最后,根据颜色的比例,将其用8bit的灰阶进行编码量化

人脸检测

需要关注的两个问题

在这里插入图片描述
人脸检测需要关注这两个问题

人脸的判别

人脸检测算法

在这里插入图片描述

第一步

在这里插入图片描述

类哈尔特征

在这里插入图片描述
根据不同区域亮暗的区别,以及区域的大小,可以得到如下图所示的类哈尔特征:
在这里插入图片描述
白色代表亮的区域,黑色代表暗的区域,而大小则代表像素的多少

集成学习

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
如上几图所示,集成学习就是集成一些正确率不高的线索,最终达到目的,而我们要集成的对象就是弱分类器,他之所以叫做弱分类器,是因为他们单独行动时,准确率不高,但是将他们集成起来,就能达到不错的效果

第二步

在这里插入图片描述
在这里插入图片描述
将一些集成分类器时,将分类器进行等级划分,对于一些可以获取到大前提信息的分类器,要放在前面,优先级要高,因为如果大前提不满足,那么更别提细节了
所以,以人脸检测来说,最高级是判断是否是人脸,如果不是,直接排除,无需进行后续运算,可以大大提高效率

第三步

在这里插入图片描述

积分图算法

在这里插入图片描述
积分图中,一个点的亮度等于其与左上角所组成的矩形的亮度之和,那么如果要计算一个矩形的亮度,就是C+A-B-D

人脸的定位

滑动窗口与滑动尺寸

在这里插入图片描述
设置一个滑动窗口以及滑动尺寸,该窗口从上至下从左进行滑动,每次到达停止位置时,进行类哈尔特征级联检测,同时使用亮度积分图进行加速

补充(关于机器学习)

在这里插入图片描述
viola-Jones算法的特征是自己设置的,而参数是机器自己通过样本自己得到的,这一过程称为机器学习
今后还有一种算法,特征和参数都是机器学习得到的,该算法是基于深度学习构建的

深度学习十大应用

分辨率增强

在这里插入图片描述
分辨率增强,是在空间维度,增强画面的细腻度

帧率增强

在这里插入图片描述
帧率增强是在时间维度,增强视频的流畅度

色彩增强

在这里插入图片描述
给一张照片或者视频上色

风格迁移

在这里插入图片描述

图像分类

在这里插入图片描述
根据图像中的内容对图像进行分类

物体检测

在这里插入图片描述
之前的人脸检测的更优算法,就是该项的一个应用

物体分割

在这里插入图片描述
在这里插入图片描述
对物体进行检测时,能够分割出一个物体的轮廓,就是物体分割

特征检测

在这里插入图片描述
一个应用是判断摄像头捕捉到的是不是人脸

人脸识别

在这里插入图片描述
人脸识别要检测这张脸是谁的脸

物体生成

在这里插入图片描述
类似于,无中生有生成一张照片或者视频

神经网络

深度学习,更为详细的翻译是:基于深度神经网络的机器学习,所以,神经网络是深度学习的核心概念
在这里插入图片描述

神经元

工作原理

简介

在这里插入图片描述
神经网络是参考生物中的神经元进行设计的,有若干个输入和一个输出

实例

在这里插入图片描述

在这里插入图片描述
a1 a2 a3在w1 w2 w3的权重下求和,得到的值再经过f函数,会得到结果
在这里插入图片描述
该函数称为激活函数

神经网络

简介

在这里插入图片描述
假设我们有五个神经元,即有五个MP模型,将其分成两组,将第一组的输出连到第二组的输入,就构成了神经网络,神经网络的关键就在于将神经元以层级的方式链接起来
两层的神经网络还有一个别称:感知机

深度神经网络

在这里插入图片描述
两层的神经网络叫做感知机,而两层以上的神经网络,就被称为深度神经网络,他的第一层是输入层,第二层是输出层,中间的所有层,称为隐藏层
感知机只能解决线性问题,而深度神经网络可以解决非线性问题

要注意:
在这里插入图片描述

总结

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1461371.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Excel SUMPRODUCT函数用法(乘积求和,分组排序)

SUMPRODUCT函数是Excel中功能比较强大的一个函数,可以实现sum,count等函数的功能,也可以实现一些基础函数无法直接实现的功能,常用来进行分类汇总,分组排序等 SUMPRODUCT 函数基础 SUMPRODUCT函数先计算多个数组的元素之间的乘积…

German Prepositions

German Prepositions 一, ab and auerhalb1, ab2,auerhalb 二, an三,auf 一, ab and auerhalb 1, ab 2,auerhalb 二, an 静三 动四 时间(节日省略dem) 表近似 三,auf 静三 动四 meas wann 加一段时间 表方式 固定搭…

若依前后端分离版如何集成的mybatis以及修改集成mybatisplus实现Mybatis增强

场景 若依前后端分离版手把手教你本地搭建环境并运行项目: 若依前后端分离版手把手教你本地搭建环境并运行项目_本地运行若依前后端分离-CSDN博客 SpringBoot中使用PageHelper插件实现Mybatis分页: SpringBoot中使用PageHelper插件实现Mybatis分页-C…

本地创建Git仓库

在 Windows 下,可以通过以下步骤在本地创建一个 并模拟远程Git 仓库。 1、在命令行中打开模拟远程Git 仓库目标文件夹: 打开命令提示符或 PowerShell。例如: 创建裸仓库(模拟远程仓库):创建一个裸仓库&am…

【Flutter】底部导航BottomNavigationBar的使用

常用基本属性 属性名含义是否必须items底部导航栏的子项List是currentIndex当前显示索引否onTap底部导航栏的点击事件, Function(int)否type底部导航栏类型,定义 [BottomNavigationBar] 的布局和行为否selectedItemColor选中项图标和label的颜色否unsel…

Java学习小记——设计模式

设计模式 设计模式简介Singleton模式Singleton模式简介Singleton的创建双重锁模式Double checked locking作为Java类的静态变量 变继承关系为组合关系组合模式装饰器模式 如何创建对象抽象工厂模式 设计模式简介 设计模式(Design pattern)代表了最佳的实…

2024 年了,如何 0 基础开始学习 Vue ?

最近 5 个月,我都在忙着构建我的第一开源项目 HexoPress,这个项目是使用 Electron Vue 3 TypeScript 等技术实现的,一方面,我真的很需要一款合自己心意的博客编辑器,另一方面,我也是真心想学习 Electron …

QT应用软件【协议篇】周立功CAN接口卡代码示例

文章目录 USBCAN系列CAN接口卡规格参数资料下载QT引用周立功的库安装sdk代码USBCAN系列CAN接口卡 USBCAN系列CAN接口卡兼容USB2.0全速规范,可支持1/2/4/8路CAN接口。采用该接口卡,PC机可通过USB连入CAN网络,进行CAN总线数据采集和处理,主要具备以下几大优势特点: 支持车载…

【HarmonyOS应用开发】三方库(二十)

三方库的基本使用 一、如何获取三方库 目前提供了两种途径获取开源三方库: 通过访问Gitee网站开源社区获取 在Gitee中,搜索OpenHarmony-TPC仓库,在tpc_resource中对三方库进行了资源汇总,可以供开发者参考。 通过OpenHarmony三…

Day 30 标准IO

文章目录 1.什么是标准IO1.1 概念1.2 特点1.3 操作 2.缓存区3.函数接口3.1 打开文件fopen3.2 关闭文件 fclose3.3 读写文件操作3.3.1 每次读写一个字符:fgetc()、fputc()每次读一个字符fgetc()每次写一个字符fputc()(1)针对文件(2)针对终端feof和ferror 3.3.2 每次一…

Java+SpringBoot+Vue的大学生就业信息管理系统

一、项目介绍 基于Java (spring-boot)的大学生就业信息管理系统分为三个角色:管理员、企业、求职者。 功能:登录、注册功能、学生信息管理、企业信息管理、岗位分类管理、学历信息管理、应聘信息管理、求职者信息管理、招聘信息管理。 二、作品包含 三、项目技术 后…

srs集群下行edge处理逻辑

官方关于源站集群的介绍: Origin Cluster | SRS 下行边缘是指观众端从边缘edge拉流,边缘edge回源到源站origin节点拉流,然后再 把流转给客户端 边缘处理类SrsPlayEdge 当服务器收到播放请求时,创建对应的consumer消费者。在创…

2.1_1 进程的概念、组成、特征

2.1_1 进程的概念、组成、特征 (一)进程的概念 程序:是静态的,就是一个存放在磁盘里的可执行文件,就是一系列的指令集合。 进程(Process):是动态的,是程序的一次执行过程…

Java学习--黑马SpringBoot3课程个人总结-2024-02-16

1.添加文章 1.1 富文本编辑器 文章内容需要使用到富文本编辑器,这里咱们使用一个开源的富文本编辑器 Quill 官网地址: https://vueup.github.io/vue-quill/ 安装: npm install vueup/vue-quilllatest --save导入组件和样式: …

基于springboot+vue的B2B平台的医疗病历交互系统(前后端分离)

博主主页:猫头鹰源码 博主简介:Java领域优质创作者、CSDN博客专家、阿里云专家博主、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战,欢迎高校老师\讲师\同行交流合作 ​主要内容:毕业设计(Javaweb项目|小程序|Pyt…

【git 使用】git 中head、工作树、和索引分别是什么,有什么关系和区别

HEAD 定义:HEAD 是指向当前所在分支(或者是某个特定的提交)的指针,它表示当前工作目录正在处于哪个提交或分支上。作用:HEAD 指示了当前工作目录的状态,可以通过 HEAD 来确定当前处于哪个分支上&#xff0…

【已解决】PPT无法复制内容怎么办?

想要复制PPT文件里的内容,却发现复制不了,怎么办? 这种情况,一般是PPT文件被设置了以“只读方式”打开,“只读方式”下的PPT无法进行编辑更改,也无法进行复制粘贴的操作。 想要解决这个问题,我…

百度地图接口 | 实现校验收货地址是否超出配送范围

目录 1. 环境准备 2. 代码开发 2.1 application.yml 2.2 OrderServiceImpl 🍃作者介绍:双非本科大三网络工程专业在读,阿里云专家博主,专注于Java领域学习,擅长web应用开发、数据结构和算法,初步涉猎Py…

单片机03--按键--寄存器版

GPIO端口相关寄存器(STM32F40x芯片) 目标: 开关KEY1控制开灯。 分析: KEY1---PA0--->输入---->浮空输入/下拉输入 KEY1不导通时,PA0输入为低电平,KEY1导通时,PA0输入为高电平。 实现…

Elasticsearch 别名(Aliases)的作用

Elasticsearch 8.4.3 别名(Aliases) 一. 介绍二. 别名的优势三. 别名的基本操作3.1 创建别名3.2 查询别名关联的索引3.3 删除别名3.4 更新别名3.5 通过别名查询数据 前言 这是我在这个网站整理的笔记,有错误的地方请指出,关注我,接…