目录
一、计算机视觉任务
二、计算机视觉的应用
三、计算机视觉的发展
四、OpenMMLab介绍
一、计算机视觉任务
计算机视觉三大基础任务:分类、检测、分割。
分割分为两种:语义分割(Semantic Segmentation)、实例分割(Instance Segmentation)
自从2012年AlexNet降世,深度学习技术广泛应用于计算机视觉任务中。
二、计算机视觉的应用
自动驾驶:
图像生成,风格迁移 :
视频理解与自动剪辑:
三、计算机视觉的发展
人工设计特征阶段:
为了从海量数据中去学习物体的特征,建立了ImagNet大型数据集
2012年,AlexNet提出后,开始进入深度学习时代
最后开发者欢迎的开发框架:Pytorch。OpenMMLab是基于Pytorch开发的开发工具。
四、OpenMMLab介绍
OpenMMLab官方网站:https://openmmlab.com/
OpenMMLab 浦视 | 是上海人工智能实验室的计算机视觉算法开源体系 OpenMMLab是深度学习时代全球领域最全面、最具影响力的视觉算法开源项目,全球最大最全的开源计算机视觉算法库,为学术和产业界提供一个可跨方向、结构精良、易复现的统一算法工具库。
OpenMMLab 已经累计开源了超过 30 个算法库,涵盖分类、检测、分割、视频理解等众多研究领域,拥有超过 300 种算法、2,400 多个预训练模型。
OpenMMLab总体构架:
MMDetection算法框架介绍:
MMClassfication算法框架介绍:
MMSegmentation算法框架介绍:
MMPose & MMHuman3D算法框架介绍:
MMTracking算法框架介绍:
MMAction2算法
MMOCR算法框架介绍:
MMEditing算法框架介绍: