原文链接:https://mp.weixin.qq.com/s/9EQNwXqCM6odwe5n9dOrmw
本文针对底层视觉给出了一个大致的定义,然后通过底层视觉与人工智能、计算机视觉、图像处理等相关概念的对比来对底层视觉做了进一步的界定。
1. 底层视觉是什么
- 以像素级图像为输入、处理和输出单元的计算机视觉问题
底层视觉是以像素级的图像为输入、处理和输出单元的计算机视觉,它将图像从原始信号或某种观测状态转换成人们想要看到的样子,通常是清晰的自然图像
- 底层视觉包含哪些任务?
底层视觉所包含的任务主要有图像和视频的去噪、增强、复原、压缩、HDR、超分辨率等,还有一些处于模糊地带的任务如图像风格化、图像生成等。这些任务之间也存在一些交叉和融合,比如去噪、去压缩和超分辨率可以同时进行,也可以合成一个任务来研究。
2. 底层视觉与计算机视觉
按照语义抽象程度,计算机视觉可以分为以下三类:
另外,图像生成任务是在上面三种任务之外的,他不是将图像进行理解或转换,而是根据抽象的信息(如文字或噪声)生成具体的图像。
3. 底层视觉与人工智能
以“老电影复原”这个底层视觉任务为例,分析是否符合人工智能的四个原则。
人工智能四个原则:
- 人工智能是一种解决复杂问题的算法。
- 人工智能可以实现复杂的目标。
- 人工智能具备从数据中学习的能力。
- 人工智能要与人类主观意识进行互通。
“老电影复原”任务中分别与上面四个原则对应的特点:
- 该任务“过程不可逆”、“解不唯一”,是一个复杂的问题;
- 老电影复原是一个复杂的目标,它包含多个子目标或子任务,如去噪、去模糊、去压缩伪影、超分辨率、插帧、上色、增强等。
- 需要大量数据进行训练
- 老电影复原的终极目标是要提升人眼的主观感受.
4. 底层视觉与图像处理
“底层视觉关注的是任务,而图像处理关注的是工具。”
“我们看到经典的图像处理教材会包含大量的工具性算法,是所有图像相关研究的基础。而底层视觉的教材会以任务为导向,讲述每个任务的定义、评价和方法。”
早期的底层视觉算法都是用的图像处理工具,比如边缘提取算子、奈奎斯特采样、统计直方图、傅里叶变换等。进入深度学习时代后,底层视觉全面采用深度学习方法,只保留了一些基本的图像处理操作(如图像拼接和色彩空间转换),而将绝大部分计算放到了网络模型当中。