CV相关知识

news2026/2/12 21:43:26

在计算机科学和人工智能领域，"CV" 通常指的是 "Computer Vision"（计算机视觉）。计算机视觉是研究如何使计算机能够从图像或视频中获取、处理和理解视觉信息的科学和技术。计算机视觉的目标是使计算机能够自动执行人类视觉系统所能做的任务。

一、计算机视觉的主要任务

计算机视觉包括许多不同的任务和应用，以下是一些主要任务：

图像分类：将图像分配给一个或多个预定义的类别。例如，识别图像中的物体是猫还是狗。
目标检测：在图像中找到并标记出特定的物体。例如，在街景图像中检测出所有的汽车和行人。
实例分割：不仅检测出物体，还要为每个物体生成一个像素级的掩码。例如，在图像中分割出每个物体的轮廓。
语义分割：将图像中的每个像素分配给一个类别。例如，将图像中的每个像素分配给道路、建筑物、天空等类别。
姿态估计：检测图像或视频中人的身体姿态。例如，识别人类的关节位置和姿态。
图像生成和修复：生成新的图像或修复损坏的图像。例如，使用生成对抗网络（GAN）生成逼真的图像。
面部识别：识别和验证图像或视频中的人脸。例如，在安防系统中识别出特定的人。

部分详细解释理解：

（a）图像分类（目标检测）：一张图像中是否含某种物体
（b）物体定位（目标检测与目标识别）：确定目标位置和所属类别。
（c）语义分割（目标分割和目标分类）：对图像进行像素级分类，预测每个像素属于的类别，不区分个体；（所有的CUBE一个颜色）
（d）实例分割（目标分割和目标识别）：定位图中每个物体，并进行像素级标注，区分不同个体；（CUBE都是不同颜色）
其中：
目标检测（object detection）
除了要告诉输入图像中包含了哪类目前外，还要框出该目标的具体位置和大小（bounding boxes）
目标识别（objec recognition）
是指明一幅输入图像中包含的目标是谁。其输入为一幅图像在确定其类别的基础上，进一步确定这个目标是谁(比如:小明，短脚猫等)
目标分割（object segmentation）
目标分割是对目标进行像素级的目标检测，即不是用边框将目标框起来，而是需要知道哪个像素是不是属于目标的一部分
目标分类（object classification）
对于一幅图像(其中包含一个主要的对象)，确定该幅图像是哪一个类别(比如:海滩，楼房)