是什么?
开源算法体系(非框架、有开源代码)
用pytorch实现
优势
开箱即用,复现了很多顶会论文中的算法。每个cv任务对应算法库,其中顺序即为学习路线。便于对比实验。
使用统一的框架、超参数,做对比实验时更公平、客观。
目标检测、实例分割通常是一块儿进行的。
含有很多小众方向算法库,好发论文。
含有丰富的主干网络、多种自监督学习策略,容易使用,从而涨分涨点
包含哪些开源的项目
-
MMYOLO
收录了基于yolo的目标检测算法,一站式复现。 -
MMOCR
包含文本检测、文本识别、关键信息(结构化信息)提取,支持中英文、数字 -
MMDetection3D
可以实现3D目标检测任务 -
MMRotate
实现旋转目标检测任务,例如:图中目标框的方向和船的方向一致。
与普通目标检测任务不同之处在于:普通目标检测任务中的目标框是竖直的矩形,不随目标物体姿态、方位的变化,但是旋转目标检测任务的目标框会随物体的姿态、方向而变化。 -
MMSegmentation
图像语义分割
图像分类+预训练+多模态算法库 -
MMPretrain
-
MMPose
姿态估计(支持动物、手、人、服装关键点检测) -
RTMPose
高精度姿态估计(有语义的点) -
MMHuman3D
三维人体姿态估计 -
MMAction2
视频动作识别算法库,视频上下帧关系、时序 (例如聋哑人的手语翻译应用) -
MMagic
图像去噪、重建、视频超分辨率、黑白照片上色、图像填充任务
里面含有生成模型+底层视觉+AIGC算法库。
例如Dreambooth算法库(广告:画秦始皇干杯时喝的我们品牌的酒) -
MMDeploy
模型终端本地部署(快速),实现跨平台、快速推理。
-
Playground
趣味应用游乐场,里面有很多好玩儿的demo
最后附上一张关于它能做啥的图