前言
语义分割作为计算机视觉领域的关键任务,是实现完整场景理解的必经之路。为了让机器拥有视觉,要经过图像分类、物体检测再到图像分割的过程。其中,图像分割的技术难度最高。
越来越多的应用得益于图像分类分割技术,全场景理解在计算机视觉领域也至关重要。其中一些应用包括自动驾驶车辆、人机交互、AR-VR等。随着近年来深度学习的普及,很多语义分割问题都在使用深度架构来解决,其中最常见的是CNN(卷积神经网),它的精度和效率都大大超过了其他方法。
它的一些主要应用是在自动驾驶、人机交互、机器人和照片编辑/创意工具中。例如,语义分割在汽车自动驾驶和机器人技术中是至关重要的,因为对于一个模型来说,了解其所处环境中的语义信息是非常重要的。
什么是语义分割?
语义分割是从粗推理到精推理的自然步骤:
原点可以定位在分类,分类包括对整个输入进行预测。
下一步是本地化/检测,它不仅提供类,还提供关于这些类的空间位置的附加信息。
最后,语义分割通过对每个像素进行密集的预测、推断标签来实现细粒度的推理,从而使每个像素都被标记为其封闭对象矿石区域的类别。
更具体地说,语义图像分割的目标是给图像中的每个像素都贴上对应的一类所代表的内容的标签。因为我们要对图像中的每个像素进行预测,所以这个任务通常被称为密集预测。这里要注意的事,语义分割是为给定图像中的每个像素分配一个类的任务而并非为整个图像分配一个单一的类,语义分割是将图像中的每个像素都归入其中的一个类。
存在的问题瓶颈
使用图形卷积网络ÿ