OpenMMLab学习笔记（一）

news2025/4/17 15:49:45

OpenMMLab学习笔记（一）

day01 计算机视觉与OpenMMLab开源算法体系

1. 基本知识

计算机视觉的基础任务：分类、分类和定位、物体检测、分割（语义分割、实例分割），其中实例分割统一种类索引不同

注意语义分割和实例分割的区别

计算机视觉的应用：

无人驾驶中的感知
动漫特效
航拍
虚拟主播（小冰等）
视频理解与视频剪辑（找出跳水运动员的精彩瞬间）

计算机视觉的发展

早期萌芽（物体检测算法、三维视觉理论）
- 统计机器学习与模式识别（人脸识别，利用小波特征结合级联分类器）
- 传统的视觉特征：局部二值模式（Local Binary Pattern）、尺度不变特征转换（Scale Invariant Feature Transform）

、梯度方向直方图（Histogram of Oriented Gradients）

深度学习时代
- 李飞飞创立的ImageNet数据库具有重要意义
- 涌现出AlexNet、Fast R-CNN和深度对抗网络等模型
现有流行方向
- 文字生成图片
- 神经渲染三维重建CityNeRF

2. OpenMMLab总体框架概览

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0FkBcIGy-1675347245650)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215229660.png)]

OpenMMLab包含目标检测、实例分割和全景分割等模块，拥有众多的模型库：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xXbc7rtd-1675347245652)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215341258.png)]

3. OpenMMLab2.0

2.0在之前的基础上增加了很多算法框架和优化了相应的基础库：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v8s60ccp-1675347245652)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215519367.png)]

4. 机器学习基础

机器学习主要包括：监督学习、无监督学习和强化学习

机器学习中的分类问题：垃圾分类

机器学习的基本流程：
在这里插入图片描述

神经网络：
在这里插入图片描述

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wkEbqhMv-1675347245655)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215915291.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-D22oJfJD-1675347245655)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215930471.png)]
训练结果的评价指标：

过拟合的解决方案：早停

在这里插入图片描述

5. 卷积神经网络

在这里插入图片描述

卷积的过程：

在这里插入图片描述

激活层和激活函数

在这里插入图片描述

池化层和全连接层：
在这里插入图片描述

输出层：

在这里插入图片描述

6. pytorch相关

自动求导demo：

在这里插入图片描述

torch重要的函数都在nn.functional中：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CNoCRvFg-1675347245661)(/home/liuhao/.config/Typora/typora-user-images/image-20230202220704278.png)]

7. 小结

第一课算是通识课程，对各方面都做了概述，从计算机视觉的定义等基本概念到OpenMMLab再到Pytorch相关内容都认真的进行了讲解。这一课，我们对计算机视觉有了初步的认识，然后对OpenMMLab框架进行了讲解，OpenMMLab包含的众多算法框架和易于使用的接口能够极大缩短开发时间。对于OpenMMLab2.0，算法框架又进一步获得了完善和框架的整体性能也大幅提升，最后我们学习了机器学习和卷积神经网络的基本知识，了解了卷积、池化和全连接等基本概念，最后结合pytorch讲述了算法的训练和推理过程中的相关知识。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/194584.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！