OpenMMLab学习笔记(一)

news2024/12/27 11:53:13

OpenMMLab学习笔记(一)

day01 计算机视觉与OpenMMLab开源算法体系

1. 基本知识

计算机视觉的基础任务:分类、分类和定位、物体检测、分割(语义分割、实例分割),其中实例分割统一种类索引不同

注意语义分割和实例分割的区别

计算机视觉的应用:

  • 无人驾驶中的感知

  • 动漫特效

  • 航拍

  • 虚拟主播(小冰等)

  • 视频理解与视频剪辑(找出跳水运动员的精彩瞬间)

计算机视觉的发展

  • 早期萌芽(物体检测算法、三维视觉理论)
    • 统计机器学习与模式识别(人脸识别,利用小波特征结合级联分类器)
    • 传统的视觉特征:局部二值模式(Local Binary Pattern)、尺度不变特征转换(Scale Invariant Feature Transform)

​ 、梯度方向直方图(Histogram of Oriented Gradients)

  • 深度学习时代
    • 李飞飞创立的ImageNet数据库具有重要意义
    • 涌现出AlexNet、Fast R-CNN和深度对抗网络等模型
  • 现有流行方向
    • 文字生成图片
    • 神经渲染三维重建CityNeRF

2. OpenMMLab总体框架概览

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0FkBcIGy-1675347245650)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215229660.png)]

OpenMMLab包含目标检测、实例分割和全景分割等模块,拥有众多的模型库:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xXbc7rtd-1675347245652)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215341258.png)]

3. OpenMMLab2.0

2.0在之前的基础上增加了很多算法框架和优化了相应的基础库:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v8s60ccp-1675347245652)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215519367.png)]

4. 机器学习基础

机器学习主要包括:监督学习、无监督学习和强化学习

机器学习中的分类问题:垃圾分类

机器学习的基本流程:
在这里插入图片描述

神经网络:
在这里插入图片描述
在这里插入图片描述

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wkEbqhMv-1675347245655)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215915291.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-D22oJfJD-1675347245655)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215930471.png)]
训练结果的评价指标:

过拟合的解决方案:早停

在这里插入图片描述

5. 卷积神经网络

在这里插入图片描述

卷积的过程:

在这里插入图片描述

在这里插入图片描述

激活层和激活函数

在这里插入图片描述

池化层和全连接层:
在这里插入图片描述
在这里插入图片描述

输出层:

在这里插入图片描述

6. pytorch相关

自动求导demo:

在这里插入图片描述

torch重要的函数都在nn.functional中:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CNoCRvFg-1675347245661)(/home/liuhao/.config/Typora/typora-user-images/image-20230202220704278.png)]

7. 小结

第一课算是通识课程,对各方面都做了概述,从计算机视觉的定义等基本概念到OpenMMLab再到Pytorch相关内容都认真的进行了讲解。这一课,我们对计算机视觉有了初步的认识,然后对OpenMMLab框架进行了讲解,OpenMMLab包含的众多算法框架和易于使用的接口能够极大缩短开发时间。对于OpenMMLab2.0,算法框架又进一步获得了完善和框架的整体性能也大幅提升,最后我们学习了机器学习和卷积神经网络的基本知识,了解了卷积、池化和全连接等基本概念,最后结合pytorch讲述了算法的训练和推理过程中的相关知识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/194584.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

indexedDB存储

一、概述 随着浏览器的功能不断增强,越来越多的网站开始考虑,将大量数据储存在客户端,这样可以减少从服务器获取数据,直接从本地获取数据。 现有的浏览器数据储存方案,都不适合储存大量数据:Cookie 的大小…

rocketmq 笔记

cap理论 Consistency(一致性)Availability(可用性)Partition tolerance(分区容忍性) ①一致性:对于客户端的每次读操作,要么读到的是最新的数据,要么读取失败。换句话说…

ElasticSearch -- Prometheus+Grafana监控

向导介绍部署Prometheus配置Grafana下载仪表盘导入仪表盘报警核心指标集群健康和节点可用性主机级别的系统和网络指标JVM内存和垃圾回收搜索和索引性能资源饱和度注册自动重启介绍 Prometheus官方提供了ES的exporter:EsExporter Github地址:elasticsea…

【Vue】Vue不同版本的基本使用

一、Vue的版本 1. Vue1.x几乎被淘汰&#xff0c;不再建议学习与使用。2. Vue2.x<scriptsrc"" target"_blank">https://cdn.jsdelivr.net/npm/vue2.6.14"></script>3. Vue3.x<scriptsrc"" target"_blank">ht…

【IO异常】HTTP请求报错Error writing to server

报错信息如下&#xff1a; [2023-01-04 13:36:02.185]-ERROR-[biz:aplus-task-oms1060189862335877121][sys:aplus-cms-tran1060189866052390912][com.phfund.aplus.cms.tran.module.counter.service.impl.OcrServiceImpl-102][调用远程服务发送文件异常:] cn.hutool.http.Http…

一、HTML5

文章目录一、HTML5二、html5的基本结构三、基本标签四、HTML常用标记4.1 文本标题(h1-h6)4.2 段落文本p4.4 空格4.5 换行 br4.6 水平线4.7 加粗标记4.8 倾斜4.9 扩展4.10 列表4.10.1 ul 无序列表4.10.2 ol 有序列表4.10.3 dl 自定义列表五、块级标签、行级标签一、HTML5 H5是H…

洛谷 P1886 滑动窗口 /【模板】单调队列

滑动窗口 /【模板】单调队列 题目描述 有一个长为 nnn 的序列 aaa&#xff0c;以及一个大小为 kkk 的窗口。现在这个从左边开始向右滑动&#xff0c;每次滑动一个单位&#xff0c;求出每次滑动后窗口中的最大值和最小值。 例如&#xff1a; The array is [1,3,−1,−3,5,3,…

辨别三星内存条的真假

目录前言一、三星内存为什么水深&#xff1f;二、通过物理手段辨别1.包装2.日期3.是否透光4.颜色5.电阻颜色6.颗粒丝印&#xff08;重点&#xff09;7.其他标签或字迹结语前言 本文截止2023.2.2&#xff0c;针对笔记本内存条 省流&#xff1a;直接JD自营 最近随手在tb买了条三星…

快速掌握任意 Android 应用的抓包

抓包是流量分析的基础&#xff0c;也是安全研究重要的一环。抓包软件有很多种&#xff0c;如 Burpsuite、mitmproxy 以及 Fiddle&#xff0c;抓包方式常见的有设置系统代理、AP 热点抓包、透明代理等。不同方式有不同优缺点&#xff0c;也有不同的应用场景。相信很多安全研究者…

Google Analytics | 学习笔记

一.简介 1.什么是GA&#xff1f; 是谷歌开发的一款分析网页流量的工具&#xff0c;可以帮助网站解决数据分析与统计的问题&#xff0c;并且将这些数据可视化展现报告出来&#xff0c;帮助网站商家更好的分析受众&#xff0c;流量等&#xff0c;从而更好地进行运营网站营销等 …

UV统计的学习

12.1 、UV统计-HyperLogLog 首先我们搞懂两个概念&#xff1a; UV&#xff1a;全称Unique Visitor&#xff0c;也叫独立访客量&#xff0c;是指通过互联网访问、浏览这个网页的自然人。1天内同一个用户多次访问该网站&#xff0c;只记录1次。 PV&#xff1a;全称Page View&am…

大龄考生上岸浙大MPA的“曲线救国”策略

先来介绍一下我个人的背景把&#xff0c;我是通过参加浙大提前批面试获得A资格&#xff0c;笔试接近两百分上岸MPA项目的。说起来我的个人优势真的不多&#xff0c;只是一个普通一本&#xff0c;不是什么211/985的名校&#xff0c;所以就对浙大有一种向往&#xff0c;使得自己的…

【数据结构】1.4 算法和算法分析

文章目录1. 算法的定义及特性算法的特性算法设计的要求2. 算法的时间复杂度分析算法时间复杂度的基本方法算法时间复杂度分析例题算法时间复杂度的计算3. 算法的空间复杂度1. 算法的定义及特性 算法的定义 对特定问题求解方法和步骤的一种描述&#xff0c;它是指令的有限序列…

C++:String类应用

string对象的构造 //string() string(const string &s) string(const char *s) string(first,last) void TestString01() {string s1;string s2("hello");string s3(s2);const char* p "hello";string s4(p, p 2);cin >> s1;cout << …

微信小程序 Springboot旅游景点酒店预订管理系统 java

功能模块划分 &#xff08;1&#xff09;用户信息管理模块 用户管理模块主要是对用户信息进行管理。包括&#xff1a; 用户的注册&#xff1a;实现用户信息的注册&#xff0c;用户注册是的信息校验&#xff0c;用户信息的保存。 用户的登录&#xff1a;检验用户是否为该网站的合…

如何打造优秀高绩效的团队?Google亚里士多德计划揭开谜底!

研究人员通过亚里士多德计划开展研究&#xff0c;通过对大量团队效率进行定性&#xff08;360主观评估&#xff09;与定量&#xff08;产出成果度量&#xff09;结合的统计评估&#xff0c;筛选出左右着团队动态的五个关键支柱&#xff1a;心理安全、可靠性、结构和清晰度、意义…

Nginx与Upstream之间产生大量TIME_WAIT连接的解决办法

1. 现象 Nginx反向代理了一个Java服务&#xff0c;QPS大概是200&#xff0c;问题发生时的Nginx配置&#xff1a; location / {proxy_pass http://192.168.3.4:18600; }在上游Java服务器上可以观察到大量&#xff08;约2000个&#xff09;的TIME_WAIT状态的网络连接 从Nginx…

一位十年测试老前辈的修炼之路,希望能帮你点清现实

对于刚进入软件测试工作岗位的新人&#xff0c;如何快速、健康的在职业道路上成长&#xff0c;作者谈了几点自己看法&#xff1a; 1、兴趣是最好的老师 对于软件测试工作&#xff0c;通常是比较枯燥的&#xff0c;如果没有兴趣很难做到持久。 我最近参与了一个软件测试项目&a…

Plecs电力电子仿真专业教程-第一季 第三节 Plecs界面介绍

Plecs电力电子仿真专业教程-第一季 第三节 Plecs界面介绍 Plecs仿真软件主要包含两个部分&#xff1a;元件库窗口和电路图编辑窗口。元件库窗口主要用于选择仿真所用到的电子元器件&#xff0c;通过拖拽的方式可以将所需要的元器件放置在主电路图窗口中。 主界面窗口如下&…

网络类型、路由封装实验

实验1. 拓扑搭建2. 配置各路由器物理接口IP地址边界路由器到ISP通测试PAP认证CHAP认证R3与R5间使用HDLC封装R1与R4为GRE环境R1、R2、R3为MGRE环境私有网络基于RIP全网可达给PC配置IP地址测试ping通性环境&#xff1a;华为模拟器 实验要求 1. 拓扑搭建 2. 配置各路由器物理接口…