【计算机视觉】1. 计算机视觉基础理论知识和框架(Basic Concepts)

news2024/12/26 3:38:29

什么是计算机视觉?

  • 一、什么是计算机视觉
  • 二、二个研究维度
  • 三、研究挑战
    • 3.1 像素与语义之间的GAP
    • 3.2 视觉变化
    • 3.3 光照变化
    • 3.4 尺度变化
    • 3.5 形态变化
    • 3.6 背景复杂
    • 3.7 遮挡
    • 3.8 内外
  • 四、计算机视觉框架
    • 4.1 计算机视觉基础
    • 4.2 深度学习算法理论基础
    • 4.3 深度学习算法
  • 五、计算机视觉基础内容
    • 5.1 图像预处理
    • 5.2 图像特征和描述
    • 5.3 深度学习之前的方法
  • 六 神经网络与深度学习基础
  • 七 主要研究问题
    • 7.1 图片分类
    • 7.2 目标检测
    • 7.3 图片分割
    • 7.4 图像描述
    • 7.5 图像生成 GAN

一、什么是计算机视觉

  1. 研究如何使机器看的科学
  2. 让计算机具有人类视觉的所有功能
  3. 从图像数据中,提取到有用的信息和知识
  4. 模拟人类视觉的优越能力
    a. 识别人、物体、场景
    b. 估计立体空间、距离
    c. 躲避障碍物进行导航
    d. 想象并描述故事
    e. 理解并讲解图片
  5. 弥补人类视觉的缺陷
    a. 容易忽视很多细节
    b. 不擅长精细感知,容易受幻觉干扰
    c. 主观,不擅长长时间稳定的执行同一任务

在这里插入图片描述

二、二个研究维度

  1. 语义感知
  2. 几何属性

在这里插入图片描述

三、研究挑战

3.1 像素与语义之间的GAP

在这里插入图片描述

3.2 视觉变化

在这里插入图片描述

3.3 光照变化

在这里插入图片描述

3.4 尺度变化

3.5 形态变化

3.6 背景复杂

3.7 遮挡

3.8 内外

四、计算机视觉框架

4.1 计算机视觉基础

  1. 图像预处理
  2. 图像特征及描述
  3. 传统算法

4.2 深度学习算法理论基础

  1. BP神经网络
  2. 深度学习基础

4.3 深度学习算法

  1. 图像分类:CNN => 卷积神经网络
  2. 图像检测:R-CNN => 区域卷积神经网络
  3. 图像分割:FCN => 全卷积神经网络
  4. 图像描述:RNN => 迭代神经网络
  5. 图像生成:GAN => 生成对抗网络

五、计算机视觉基础内容

5.1 图像预处理

  1. 图像显示与存储
  2. 图像增强目标
  3. 点运算
  4. 形态学处理
  5. 空间域处理:卷积
  6. 卷机的应用:【平滑、模糊、边缘检测、锐化】
  7. 频域处理:傅立叶变换,小波变换

5.2 图像特征和描述

  1. 颜色
    a. 量化颜色直方图
    b. 聚类颜色直方图
  2. 几何特征
    a. Edge
    b. Corner
    c. Blob
  3. 基于关键点的特征描述子
    a. SIFT
    b. SURF
    c. ORB
  4. 其他特征
    a. LBP
    b. Gabor

5.3 深度学习之前的方法

  1. 图像分割
    a. 基于阈值、基于边缘
    b. 基于区域、基于图论
  2. 人脸检测
    a. Haar-like 特征+ 级联分类器
  3. 行人检测
    a. HOG+SVM
    b. DPM

六 神经网络与深度学习基础

  1. 神经网络
    a. 神经元
    b. 前馈网络
    c. 梯度下降
    d. 误差反向传播
  2. 深度学习
    a. 与传统神经网络的区别
    b. 目标函数
    c. 该进的梯度下降
    d. 避免过拟合

七 主要研究问题

7.1 图片分类

一、问题:求解有没有某一个Object
二、卷积神经网络CNN

  1. 基础网络
  2. 有监督深度模型时代的起点
  3. AlexNet-> VGG -> GoogleNet -> ResNet -> ResNeXt

三、GoogleNet

  1. nception V1->V2->V3->V4
  2. Inception ResNet V1->V2

四、结构趋势

  1. 更深 8 -> 1000+
  2. 更广 1分支 -> 4分支
  3. 更多基数 1-> 32

7.2 目标检测

一、检测对象

  1. 物体检测
  2. 人脸检测
  3. 姿态检测

二、检测方法R-CNN

  1. 让基础网络具备区域输出能力
  2. 第一阶段:R-CNN -> SPP-Net -> Fast/Faster R-CNN
  3. 第二阶段:YOLO-> SSD -> R-FCN

三、目的
检测更快、更准确

四、工业应用

  1. 智能监控
  2. 辅助驾驶

7.3 图片分割

一、处理问题

  1. 前景分割
  2. 语义分割

二、检测方法FCN

  1. 让基础网络做像素输出
  2. FCN-> SegNet/ DeconvNet -> DeepLab

三、目的
语义推断、分割更精确

四、工业应用
辅助驾驶

7.4 图像描述

一、处理问题

  1. 图片描述
  2. 图片问答

二、检测方法FCN

  1. 让网络具有记忆功能,构建不定长序列数据的模型
  2. Vanilla RNN -> LSTM -> GRU

三、应用
文本序列、区域序列、视频序列

7.5 图像生成 GAN

一、网络结构

  1. 生成器网络:Generator
  2. 判别器网络:Discriminator

二、网络改进
GAN -> CGAN -> DCGAN -> wGAN
SRGAN

三、应用
样本数据分布学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1022998.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot3与IDE中配置JDK17

概述 SpringBoot3需要JDK17的支持,不再支持JDK8。 如果要运行SpringBoot3的项目,根据使用的IDE,需要的配置不同。 配置说明 1. SpringToolSuite4 如果使用的是SpringToolSuite4(STS),比较简单&#xf…

接入网技术

接入网 接入网是指骨干网络到用户或企业之间的所有设备。其长度一般为几百米到几公里,因而形象地被称为“最后一公里”。接入网地接入方式包括铜线(普通电话线)接入、基于双绞线的ADSL技术、基于HFC网(光纤和同轴电缆(有线电视电缆)混合网)的Cable Modem技术、光纤接入…

「聊设计模式」之职责链模式(Chain of Responsibility)

🏆本文收录于《聊设计模式》专栏,专门攻坚指数级提升,助你一臂之力,带你早日登顶🚀,欢迎持续关注&&收藏&&订阅! 前言 设计模式是解决软件开发中常见问题的可复用解决方案。其中…

一篇文章教你Pytest快速入门和基础讲解,一定要看!

前言 目前有两种纯测试的测试框架,pytest和unittestunittest应该是广为人知,而且也是老框架了,很多人都用来做自动化,无论是UI还是接口pytest是基于unittest开发的另一款更高级更好用的单元测试框架出去面试也好,跟别…

爬虫工作者必备:使用爬虫ip轻松获得最强辅助

在进行网络数据爬取时,爬虫ip成为了爬虫工作者们的得力辅助。通过使用爬虫ip,可以实现IP地址的伪装和分布式请求,有效规避访问限制和提高爬取效率。本文将为爬虫工作者们分享关于使用爬虫ip的知识,帮助您轻松获取最强辅助&#xf…

【JavaEE】多线程案例-单例模式

文章目录 1. 前言2. 什么是单例模式3. 如何实现单例模式3.1 饿汉模式3.2 懒汉模式4. 解决单例模式中遇到的线程安全问题4.1 加锁4.2 加上一个判断解决频繁加锁问题4.2 解决因指令重排序造成的线程不安全问题 1. 前言 单例模式是我们面试中最常考到的设计模式。什么是设计模式呢…

Linux 用户注意!GNOME 45 将影响所有扩展!

GNOME 45 是一次重要的升级,但对扩展的影响并不令人满意! 每当 GNOME 升级,总会有一些扩展遭遇问题,这点并不新鲜。但如今,到了 GNOME 45,每个扩展都将面临问题! 那么,究竟是什么原…

Lua学习笔记:探究package

前言 本篇在讲什么 理解Lua的package 本篇需要什么 对Lua语法有简单认知 对C语法有简单认知 依赖Visual Studio工具 本篇的特色 具有全流程的图文教学 重实践,轻理论,快速上手 提供全流程的源码内容 ★提高阅读体验★ 👉 ♠ 一级…

怒刷LeetCode的第8天(Java版)

目录 第一题 题目来源 题目内容 解决方法 方法一:双指针和排序 ​编辑第二题 题目来源 题目内容 解决方法 方法一:双指针 方法二:递归 方法三:快慢指针 方法四:栈 第三题 题目来源 题目内容 解决方法…

Python实现查询一个文件中的pdf文件中的关键字

要求,查询一个文件中的pdf文件中的关键字,输出关键字所在PDF文件的文件名及对应的页数。 import os import PyPDF2def search_pdf_files(folder_path, keywords):# 初始化结果字典,以关键字为键,值为包含关键字的页面和文件名列表…

数据分析三剑客之一:Pandas详解

目录 1 Pandas介绍 2 Pandas的安装与导入 2.1 Pandas模块安装 2.2 Pandas模块导入 3 pandas数据结构及函数 3.1 Series结构 3.1.1 ndarray创建Series对象 3.1.2 dict创建Series对象 3.1.3 标量创建Series对象 3.1.4 位置索引访问Series数据 3.1.5 标签索引访问Series…

华为云HECS安装docker

1、运行安装指令 yum install docker都选择y,直到安装成功 2、查看是否安装成功 运行版本查看指令,显示docker版本,证明安装成功 docker --version 或者 docker -v 3、启用并运行docker 3.1启用docker 指令 systemctl enable docker …

【Linux基础】第七章:搜索查找-find查找文件或者目录

find命令是根据文件属性进行查找的,如文件名,文件大小,所有者,所有组,是否为空,访问时间,修改时间等。 基本格式: find path [options] 先定位到etc 目录下 cd /etc1.按照文件名查找…

成集云 | 金蝶EAS集成聚水潭ERP(金蝶EAS主管库存)| 解决方案

源系统成集云目标系统 方案介绍 金蝶EAS是一款全球首款融合TOGAF标准SOA架构的企业管理软件,专门为大中型企业设计,以“创造无边界信息流”为产品设计理念,支持云计算、SOA和动态流程管理的整合技术平台。 聚水潭是一款以SaaS ER…

IP地址定位的基本原理

IP地址定位是一种用于确定互联网上设备地理位置的技术,它是网络管理、安全监控和市场定位等领域的重要工具。本文将深入探讨IP地址定位的基本原理,以及它是如何工作的。 1. IP地址的结构 IP地址是互联网上的设备的唯一标识符,它由一系列数字…

深入理解算法的时间复杂度

文章目录 时间复杂度的定义时间复杂度的分类时间复杂度分析常见数据结构和算法的时间复杂度常见数据结构常见算法 常见排序算法说明冒泡排序(Bubble Sort)快速排序(Quick Sort)归并排序(Merge Sort)堆排序(Heap Sort) 时间复杂度的定义 时间复杂度就是一种用来描述算法在输入规…

centos搭建activemq5.16

下载jdk、activemq(我这里都放在在/usr/local)之后。。。 在/usr/local/activemq/bin/目录下有一个env文件添加JAVA_HOME 注意activemq.xml里面不能出现中文,注释也不行 接下来在/usr/lib/systemd/system/创建activemq.service文件 # 单元节…

天选之子C++是如何发展起来的?如何学习C++呢?

天选之子C是如何发展起来的?如何学习C呢? 一、什么是C二、C发展史三、C的重要性3.1 语言的使用广泛度3.2 在工作领域 四、如何学习C4.1 大佬怎么学?4.2 自己怎么学 一、什么是C C语言是结构化和模块化的语言,适合处理较小规模的程序。对于复…

【LeetCode-中等题】107. 二叉树的层序遍历 II

文章目录 题目方法一:队列层序迭代 题目 方法一:队列层序迭代 解题详情:【LeetCode-中等题】102. 二叉树的层序遍历 res.add(0,zres); //效果是将 zres 列表作为 res 的第一个子列表,并将其它原本在第一位置及之后的子列表向后移…