计算机视觉:使用计算机及相关设备对生物视觉的一种模拟。
主要包含6大任务,图像分类,目标检测,目标跟踪,语义分割,实例分割,影像重构。
图像分类:根据图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。基于色彩特征的索引技术、基于纹理的图像分类技术、基于形状的图像分类技术、基于空间关系的图像分类技术 。
目标检测:一种基于目标几何和统计特征的图像分割。它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。
目标跟踪:视频第一帧中目标的位置会以包围盒的形式给出,我们需要预测其他帧中该目标的包围盒。
语义分割:语义分割是对图像中的每一个像素进行分类,目前广泛应用于医学图像与无人驾驶等(同一类别不用实列不用区分,如不用区分羊1,羊2)。
实列分割:实例分割对所有不同的实例类进行分类,例如用十种不同的颜色标记十辆汽车(车1,车2要用不同颜色区分)。
全景分割(Panoramic)是语义分割(semantic)和实例分割(instance)的结合。跟实例分割不同的是:实例分割只对图像中的object进行检测,并对检测到的object进行分割,而全景分割是对图中的所有物体,包括背景都要进行检测和分割。
在这里插入图片描述
影像重建 : 通俗的来说就是你有一张旧照片,想要重建里面的被损毁的画面,就是图像重建。