OpenMMLab-AI实战营第二期-课程笔记-Class 1:开营仪式OpenMMLab概述

news2024/11/29 4:29:15

Class 1:开营仪式&OpenMMLab概述

文章目录

  • Class 1:开营仪式&OpenMMLab概述
    • 开营仪式
      • OpenMMLab 简介
        • why?
        • when?
        • what?
        • for who?
        • OpenMMLab 总体框架
    • 二十分钟入门计算机视觉开源神器OpenMMLab
      • OpenMMLab概述
      • OpenMMLab各开源算法库详细介绍
        • 明星算法库:MMDetection
        • MMYOLO
      • MMOCR
        • MMDetection3D
        • MMRotate
        • MMSegmentation
        • MMpretrain
        • MMpose
        • MMHuman3D
        • MMAction2
        • MMagic
        • MMDeploy
        • Playground
      • OpenMMLab开源生态

开营仪式

OpenMMLab 简介

why?

随着深度学习、计算机视觉等学科的发展,各大研究机构和公司陆续开源自己的深度学习框架,论文发表同时开源代码也成了行业内的习惯。

when?

OpenMMLab诞生于2018年,是一个由中国开发者主导,有国际影响力的人工智能·计算机视觉开源算法体系。

image-20230601105943949

相比之下,OpenMMLab是开源社区的后起之秀。

官网:https://openmmlab.com

Github:https://github.com/open-mmlab

公众号:OpenMMLab

what?

那么OpenMMLab中都有些什么呢?

image-20230601110213824

OpenMMLab累计开源超过30个算法库、2400个预训练模型,涵盖图像识别分类、目标检测、图像分割、姿态估计、视频理解、OCR、3D目标检测、3D人体姿态估计、模型轻量化、自监督、少样本、光流、预训练、多模态、AIGC、推理部署等等计算机视觉任务,在Github上累计获得十万颗star,超过了Pytorch。

for who?

无论是巨头公司做商业产品,研究机构发顶会论文,各行各业做AI应用,大学生做毕业设计,中小学生参加科创竞赛,都可以站在OpenMMLab巨人肩膀上,开箱即用,开发自己的人工智能项目。 也许大家的下一个课程作业,下一场kaggle竞赛,下一篇毕业论文,下一家入职的公司,就能用到OpenMMLab。

image-20230601110809806

OpenMMLab 总体框架

万丈高楼平地起

image-20230601110515797

OpenMMLab所有算法库都在Github上免费开源,并且有专人维护,我们可以进入每个算法库的Github主页,点star或者提issue、提PR,下载所有的源代码和模型文件。

二十分钟入门计算机视觉开源神器OpenMMLab

课程回放链接:二十分钟入门计算机视觉开源神器OpenMMLab

By:同济子豪兄

OpenMMLab概述

无论身处什么领域,都可以站在OpenMMLab巨人肩膀上,使用开箱即用的模型开发自己的人工智能项目~

image-20230601112828096

OpenMMLab各开源算法库详细介绍

明星算法库:MMDetection

image-20230601113044896

首推的就是目标检测算法库MMDetection,它可以解决目标检测实例分割全景分割和目标追踪任务
这是OpenMMLab在业界最有影响力的算法库,在github上有2万多star~

image-20230601113309171

OpenMMLab是开源算法体系,它已经提供了各个计算机视觉方向的大量开箱即用的预训练模型和算法。也就是说
OpenMMLab的算法研究员已经帮我们把这些cv任务的常见算法都现好了!

MMDetection被广泛用于学术界和工业界,很多顶会论文,很多比赛的冠军,很多商业落地的产品都是基于MMDetection实现的!

image-20230601114208100

MMYOLO

还有一个做目标检测的算法库叫做MMYOLO,它是专门用来解决YOLO目标检测问题的,它的特点就是特别快!!!

image-20230601114326674

很多同学做毕业设计,其实就是标注一个自己的目标检测数据集,然后用MMYOLO去跑一下,训练一个模型,然后实时的去预测!

MMOCR

OpenMMLab还有一个文字检测识别的算法库,叫做MMOCR,那这也是计算机视觉很古老的一个经典问题了,它主要解决三类问题,文本检测就是把图像上的文本区域抠出来,或者说画出来,文本识别呢是把文字的内容识别出来,关键信息提取呢是对一些结构化的票据,证件牌照来进行信息的提取。

image-20230601144619650

MMDetection3D

MMDetection3D是专门做3D目标检测的算法库,这个在无人驾驶中用的特别多,要通过激光雷达和毫米波雷达,感知无人驾驶车周围的3d点云数据,来进行3d目标检测,很多无人驾驶的初创公司都使用MMDetection3D来实现自己的无人驾驶算法。

image-20230601144912996

MMRotate

MMRotate是专门做旋转目标检测算法库,在传统的目标检测框是横平竖直的,但是在旋转目标检测框有方向,比如说不同方向的车,不同方向的船,那这是一个比较小众的研究领域,如果你的研究领域恰恰是旋转框目标检测,那MMRotate将是你最佳的学习资料!

image-20230601145137796

MMSegmentation

MMSegmentation是专门做图像分割,特别是语义分割的算法库,在街景,在无人驾驶遥感图像医疗领域,语义分割都是非常重要的算法,任务本质上就是给每一个像素进行分类。可以用它来识别医疗影像中的病灶区域,肿瘤的区域,遥感图像中河流山地农田的面积,街景数据里边的马路牙,交通标志和其他车的位置以及车道线,所以语义分割是一个非常常用的计算机视觉任务,MMSegmentation提供了600多个预训练模型,复现了40多篇的经典和前沿的语义分割的论文,那如果你想入门语义分割领域,MMSegmentation将是你最佳的学习资料!

image-20230601145441798

MMpretrain

MMpretrain呢是做图像分类,预训练和多模态的算法库,那图像分类也是计算机视觉解决的,基础任务之一,用MMpretrain可以实现图像分类,图像描述,视觉问答,视觉定位和视觉检索。

image-20230601145601267

MMpose

MMPose 是一款基于 PyTorch 的姿态分析的开源工具箱,所谓的姿态估计其实就是关键点检测,比如说把这么一个人各个的关节骨架的点识别出来,然后串成一个火柴人,那这就叫做姿态估计,通过姿态估计,我们就能定量的去衡量这个人的行为动作,比如说健身的打分~

image-20230601150044300

MMHuman3D

MMHuman3D 是一款基于 PyTorch 的人体参数化模型的开源工具箱。

所谓的三维人体姿态估计就是要用一个3d的模型去包络出人体,我们就可以用一个3d的数字人去拟合一个真人,特别是在动作捕捉领域和虚拟现实领域,有了一个3d的人,就能跟真实世界的人进行对应了,比如说在足球运动里,在交通事故的模拟中,甚至在很多的竞技类运动中,都可以用到这个算法。

image-20230601150436313

MMAction2

MMAction2 是一款基于 PyTorch 的视频理解开源工具箱,MMAction2 支持多种视频理解任务,包括动作识别,时序动作检测,时空动作检测以及基于人体姿态的动作识别。

image-20230601150539867

MMagic

MMagic 是基于 PyTorch 的图像&视频编辑和生成开源工具箱,MMagic 支持了流行的图像修复、图文生成、3D生成、图像修补、抠图、超分辨率和生成等任务的应用。特别是 MMagic 支持了 Stable Diffusion 的微调和许多激动人心的 diffusion 应用,例如 ControlNet 动画生成。MMagic 也支持了 GANs 的插值,投影,编辑和其他流行的应用。

image-20230601150752720

MMDeploy

MMDeploy 提供了一系列工具,帮助我们更轻松的将 OpenMMLab 下的算法部署到各种设备与平台上。

image-20230601151409946

Playground

OpenMMLab还有一个趣味应用的游乐场,叫做playground,在playground里有很多有趣的项目,其中一些项目也很前沿,比如说结合最新的这个SAM视觉大模型,你可以用它来辅助你标注,用它来做视频实例分割。这样。就可以结合我们其他的算法库,来开发出你自己的有趣又有用的好玩应用!

image-20230601151610721

OpenMMLab开源生态

全球有超过1800个开发者参与了OpenMMLab开源算法库的代码贡献;OpenMMLab的使用者涵盖了科研院所,高校和各行各业的商业公司;同时有一些大家耳熟能详的,影响力非常大的开源项目,也是基于OpenMMLab开发的!

image-20230601152028692

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/597549.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SQL审核工具Yearning搭建及使用

一、背景 实际的业务场景中,我们难免会直接对生产库的数据进行修改。很多朋友都是发sql给运维,然后运维执行。过程不可控,出错几率很大。 而且没有审核,不知道提交的具体是什么sql,极有可能是删库跑路的sql&#xff0…

0基础学习VR全景平台篇第34篇:场景功能-沙盘功能

本期为大家带来蛙色VR平台,场景功能—沙盘功能的操作讲解。 功能位置示意 一、本功能将用在哪里? 沙盘功能,可将区域的平面图、卫星图、手绘图等上传或直接使用高德地图信息,嵌入在VR全景作品中呈现出来; 支持嵌入沙…

【OpenCV】OpenCV4.7.0 + Visual Studio 2019环境配置 + 运行opencv

本文目录 01、OpenCV的下载与安装02、Visual Studio 2019环境配置03、OpenCV接口测试 01、OpenCV的下载与安装 这里贴上网址: https://opencv.org/ 进入会看到主界面,跟着一步一步来下载就好: 当把上面这个下载下来之后,会得到一…

git merge和git rebase有什么区别?

git merge和git rebase有什么区别 git rebase和git merge是在日常开发中常用的用于分支合并的命令,也是非常容易误用的两个命令。本文将通过图文的方式去详解二者之间的区别。 git merge git merge会为本次的合并过程生成一条新的commit,并将该commit…

亚马逊云科技中国峰会带你玩转AIGC全攻略原

充满想象的AIGC时代,企业如何抓住机遇实现双效提升?要说2023年科技圈顶流话题,非AIGC(AI-generated Content,人工智能生成内容)莫属。当前,以GPT模型为代表的AIGC正在持续渗透各行各业&#xff…

LLVM for TVM

田海立CSDN 2023-06-01 本文简明列举LLVM作为target&#xff0c;如何集成到TVM里的。 {cmake/modules/LLVM.cmake} 0. 设置编译选项 -- USE_LLVM build option: - USE_LLVM: ON/OFF/<path to llvm-config> {set in cmake/config.cmake, and copy into build/} 1. 执行…

Linux系统上安装VScode且配置C/C++环境

Linux系统给人的印象一直是命令行的形式&#xff0c;今天终于长了见识&#xff0c;其实Linux系统也可以像Windows系统一样&#xff0c;安装、使用VScode软件 1 进入VScode官网下载VScode Linux安装版2 将下载到电脑上压缩包通过tcp指令传到Linux系统上3 在放置安装包的目录下通…

java实现文档部分预览与全预览功能

这里使用的是kkFileView插件&#xff0c;部署在服务器上&#xff0c;使用其生成预览内容&#xff0c;官网地址是&#xff1a;kkFileView - 在线文件预览 下载地址为&#xff1a;kkFileView 4.1.0 版本发布&#xff0c;开源在线文件预览解决方案 - OSCHINA - 中文开源技术交流社…

ANR日志分析全面解析

一、概述 解决ANR一直是Android 开发者需要掌握的重要技巧&#xff0c;一般从三个方面着手。 开发阶段&#xff1a;通过工具检查各个方法的耗时&#xff0c;卡顿情况&#xff0c;发现一处修改一处。 线上阶段&#xff1a;这个阶段主要依靠监控工具发现ANR并上报&#xff0c;比…

linux(system V标准)进程间通信2

目录&#xff1a; 1.回顾上一节的代码 2.shmat、shmdt的使用 3.共享内存的大小为什么最好设置成4096字节的整数倍呢&#xff1f; 4.操作系统如何管理共享内存的 ----------------------------------------------------------------------------------------------------------…

SpringMVC04:数据处理及跳转

目录 一、跳转方式ModelAndView 二、ServletAPI 三、SpringMVC 四、数据处理&#xff1a;处理提交数据 1、提交的域名称和处理方法的参数名一致 2、提交的域名称和处理方法的参数名不一致 3、提交的是一个对象 五、数据显示到前端 1、通过ModelAndView 2、通过ModelM…

Nginx的使用和有关配置

&#x1f331;Nginx的基础使用和有关配置。 &#x1f4eb;相关软件:链接地址 文章目录 Nginx目录结构Nginx基本运行原理Nginx的基本配置文件 Nginx目录结构 [rootlocalhost ~]# tree /usr/local/nginx /usr/local/nginx ├── client_body_temp # POST 大文件…

dstat 好用的可视化工具

大家好&#xff0c;我是早九晚十二&#xff0c;目前是做运维相关的工作。写博客是为了积累&#xff0c;希望大家一起进步&#xff01; 我的主页&#xff1a;早九晚十二 dstat 好用的终端工具 安装方法命令详解负载与CPU相关展示第一颗与第四颗cpu使用情况展示每秒的CPU时钟频率…

Elasticsearch:使用 Transformers 和 Elasticsearch 进行语义搜索

语义/矢量搜索是一种强大的技术&#xff0c;可以大大提高搜索结果的准确性和相关性。 与传统的基于关键字的搜索方法不同&#xff0c;语义搜索使用单词的含义和上下文来理解查询背后的意图并提供更准确的结果。 Elasticsearch 是实现语义搜索最流行的工具之一&#xff0c;它是一…

【运筹优化】元启发式算法详解:变邻域搜索算法(Variable Neighborhood Search,VNS)+ 案例讲解代码实现

文章目录 一、介绍二、基本方案三、一些扩展四、在VNS内改变配方4.1 基于变邻域的公式空间搜索4.2 变公式搜索 五、原始对偶VNS六、求解混合整数线性规划的VNS七、连续全局优化的可变邻域搜索八、可变邻域编程(VNP):自动编程的VNS九、Discovery Science十、总结十一、案例讲解&…

如何视频转语音?想知道视频转语音工具怎么用?

在教育、培训等领域中&#xff0c;有时候需要将讲解视频转化为文字来提供给学生反复阅读学习。那么&#xff0c;小伙伴们&#xff0c;你们知道怎样视频转语音吗&#xff1f;其实我们可以借助一些视频转语音的软件帮助我们实现视频转语音操作。这篇文章就给大家分享几个非常好用…

PHP学习笔记第二天

前言 作者简介&#xff1a;不知名白帽&#xff0c;网络安全学习者。 博客主页&#xff1a;不知名白帽的博客_CSDN博客-网络安全,CTF,内网渗透领域博主 网络安全交流社区&#xff1a;https://bbs.csdn.net/forums/angluoanquan 目录 PHP类型比较 和 PHP中比较0、false、null …

基于SSM的酒店管理系统代码数据库文件和LW

框架&#xff1a;SSM 数据库&#xff1a;MySQL 语言&#xff1a;Java 下载链接&#xff1a; https://download.csdn.net/download/yw1990128/87853243 B站演示链接&#xff1a; 基于SSM框架的酒店管理系统_哔哩哔哩_bilibili 1.1 课题研究背景及意义 随着我国改革开放的不…

hutool文件导出

hutool文件导出 需求&#xff1a;管理员设置会议&#xff0c;参加会议会根据管理员设置的会议要求&#xff0c;用户参加会议填写相关数据&#xff0c;并且生成一个动态的excel数据并导出 示例&#xff1a; 每场都可以自定义报名字段 根据需求与前端约定 字段名称&#xff08;n…

通用读写仲裁模块(FPGA实现)

当涉及多个模块向同一个模块进行读写操作、向一个半双工模块请求读写&#xff0c;甚至综合一下&#xff0c;多个模块向一个半双工模块发起读写请求&#xff0c;那就要涉及读写仲裁。因为最近做的项目中涉及的读写仲裁太多了&#xff0c;所以就想还是要写一个通用的读写仲裁模块…