机器学习笔记 - GluonCV：基于MXNet/PyTorch + Kinetics400 + 各种先进网络的动作识别的预训练模型

机器学习笔记 - GluonCV：基于MXNet/PyTorch + Kinetics400 + 各种先进网络的动作识别的预训练模型

news2025/2/22 16:06:01

一、简述

GluonCV 提供计算机视觉领域最先进 (SOTA) 深度学习算法的实现。它旨在帮助工程师、研究人员和学生快速制作产品原型、验证新想法并学习计算机视觉。

同时支持 PyTorch 和 MXNet。

GluonCV 提供了分类、检测、分割、姿势估计、动作识别、深度预测这几类的预训练模型，我们这里主要关注动作识别这个分类。

缺少最近几年的，不过值得参考

提供了若干用于视频动作识别任务的预训练模型（在Kinetics400上训练）。

下面是MXNet和PyTorch上分别支持的网络的清单。

MXNet: TSN, C3D, I3D, I3D_slow, P3D, R3D, R2+1D, Non-local, SlowFast
PyTorch: TSN, I3D, I3D_slow, R2+1D, Non-local, CSN, SlowFast, TPN

所有模型均使用输入大小 224x224 进行训练，但R2+1D模型使用输入大小 112x112 进行训练和评估。

下面介绍的预训练模型，可以看到有几个关键参数

Segment是训练期间使用的段数。为了进行测试，我们按照惯例对

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1083094.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

腾讯云轻量2核4G5M可容纳多少人访问？

腾讯云轻量2核4G5M可容纳多少人访问？

腾讯云2核4G5M服务器支持多少人在线访问？卡不卡？腾讯云轻量2核4G5M带宽服务器支持多少人在线访问？5M带宽下载速度峰值可达640KB/秒，阿腾云以搭建网站为例，假设优化后平均大小为60KB，则5M带宽可支撑10个用户…

阅读更多...

UE5.3.1 无法创建C++ 工程问题解决方法

UE5.3.1 无法创建C++ 工程问题解决方法

UE5.3.1 创建C工程提示DONET问题，直接下载最新版本的NET8.0的SDK安装即可解决！ 下载地址：下载 .NET 8.0 SDK (v8.0.100-rc.2) - Windows x64 Installer

阅读更多...

软件工程与计算总结（八）软件设计基础

软件工程与计算总结（八）软件设计基础

一.设计思想的发展 1958：软件这个名词第一次在公开刊物上使用~60年代中后期and70年代前中期：结构化编程、逐步求精、自顶向下理念是程序设计主要方法70年代中后期and90年代：结构化设计方法、抽象数据类型、信息隐藏、封装、继承、多态等思想…

阅读更多...

LVGL-TLSF内存管理算法源码详解（1）-内存池初始化

LVGL-TLSF内存管理算法源码详解（1）-内存池初始化

LVGL-TLSF学前预备知识点 TLSF内存池管理结构示意图: TLSF控制器支持对多内存池的管理，但LVGL只使用一个内存池内存池存储结构示意图 ------------------- | lv_tlsf_t | - control_t TLSF分配器 ------------------- | Free Block 1 | ----------…

阅读更多...

第十一章文件操作

第十一章文件操作

文件名一个文件要有一个唯一的文件标识，以便用户识别和引用。文件标识包括3部分： (1)文件路径；(2)文件名主干；(3)文件后缀。文件分类根据数据的组织形式，数据文件可分为ASCI文件和二进制文件。数据在内存中是以…

阅读更多...

【opencv】windows10下opencv4.8.0-cuda C++版本源码编译教程

【opencv】windows10下opencv4.8.0-cuda C++版本源码编译教程

【opencv】windows10下opencv4.8.0-cuda C版本源码编译教程提示:博主取舍了很多大佬的博文并亲测有效,分享笔记邀大家共同学习讨论文章目录【opencv】windows10下opencv4.8.0-cuda C版本源码编译教程前言准备工具cuda/cudnncmakeopencv4.8.0opencv_contrib CMake编译VS2019编…

阅读更多...

速通RabbitMQ的五种常见消费模型

速通RabbitMQ的五种常见消费模型

目录引言1. 简单队列模型（Simple Queue Model）优缺点及适用场景代码示例 2. 工作队列模型（Work Queue Model）优缺点及适用场景代码示例 3. 发布/订阅模型（Publish/Subscribe Model）优缺点及适用场景代码示…

阅读更多...

Rockchip平台远程OTA服务搭建

Rockchip平台远程OTA服务搭建

Rockchip平台远程OTA服务搭建 1. 概述远程OTA升级服务是一种通过互联网远程更新Rockchip设备的固件和软件的方法。这种服务对于确保设备安全性、修复错误和添加新功能非常重要。本文档将引导您完成在Rockchip平台上搭建远程OTA升级服务的过程。在阅读本文的前&#xff…

阅读更多...

使用Cpolar内网穿透技术实现远程访问内网BUG管理系统

使用Cpolar内网穿透技术实现远程访问内网BUG管理系统

文章目录前言1. 本地安装配置BUG管理系统2. 内网穿透2.1 安装cpolar内网穿透2.2 创建隧道映射本地服务3. 测试公网远程访问4. 配置固定二级子域名4.1 保留一个二级子域名5.1 配置二级子域名6. 使用固定二级子域名远程前言 BUG管理软件,作为软件测试工程师的必备工具之一。在…

阅读更多...

利用人工智能做射击游戏辅助（二）AlphaPose环境配置

一、anaconda安装官网地址：Free Download | AnacondaAnacondas open-source Distribution is the easiest way to perform Python/R data science and machine learning on a single machine.https://www.anaconda.com/download 下载之后下一步就可以&#xff0c…

阅读更多...

BCDD-A03-21-L3、BCDD-A02-33-L1比例方向阀控制器

BCDD-A03-21-L3、BCDD-A02-33-L1比例方向阀控制器

BCDD-A02-31-L1、BCDD-A02-33-L3、BCDD-A02-21-S5、BCDD-A02-23-D5、BCDD-A03-31-L5、BCDD-A03-33-L1、BCDD-A03-21-L3、BCDD-A03-23-S5是直动式比例换向阀，通过比例电磁铁直接驱动阀芯工作。此类阀工作时是通过电子放大器提供比例电磁铁的驱动电流，比例…

阅读更多...

哈夫曼树及哈夫曼编码详解及代码实现[C/C++]

哈夫曼树及哈夫曼编码详解及代码实现[C/C++]

文章目录哈夫曼树及哈夫曼编码哈夫曼树的定义与原理引例路径长度定义带权路径长度哈夫曼树哈夫曼树的构造方法构造方法示例哈夫曼树的代码实现哈夫曼树的结点定义哈夫曼树的构造哈夫曼编码哈夫曼编码方式哈夫曼编码解码的准确性哈夫曼编码的代码实现运行示例哈夫曼树及哈…

阅读更多...

Android绑定式服务

Android绑定式服务

Github:https://github.com/MADMAX110/Odometer 启动式服务对于后台操作很合适，不过需要一个更有交互性的服务。接下来构建这样一个应用： 1、创建一个绑定式服务的基本版本，名为OdometerService 我们要为它增加一个方法getDistance()&#x…

阅读更多...

PDF编辑软件哪个好用？PDF文档怎么编辑修改内容

PDF编辑软件哪个好用？PDF文档怎么编辑修改内容

在生活中，为了方便文件传输，会将文件扫描或转换成PDF格式，但是如果需要编辑修改会比较麻烦，这时一款好用的PDF编辑器显得十分重要。今天就带大家了解下PDF编辑软件哪个好用，PDF文档怎么编辑修改内容。一、PDF编辑软件…

阅读更多...

【Android 从入门到出门】第一章：Android开发技能入门指南

【Android 从入门到出门】第一章：Android开发技能入门指南

🤵‍♂️ 个人主页：艾迦洼的个人主页 ✍🏻作者简介：后端程序猿 😄 希望大家多多支持，如果文章对你有帮助的话，欢迎 💬👍🏻📂 目录 👋第…

阅读更多...

C#(Csharp)我的基础教程(三)(我的菜鸟教程笔记)-控件对象与窗体容器集合（Control）的探究与学习

C#(Csharp)我的基础教程(三)(我的菜鸟教程笔记)-控件对象与窗体容器集合（Control）的探究与学习

目录 1、窗体类（主代码文件窗体设计器后台代码文件）2、控件对象与窗体容器集合（Control） 1、窗体类（主代码文件窗体设计器后台代码文件） 主窗体对象的创建：在Program类里面： Appli…

阅读更多...

Windows操作系统登录双因素认证解决方案安当加密

Windows操作系统登录双因素认证解决方案安当加密

实现Windows操作系统登录双因素认证，可以通过安当ASP身份认证平台进行设置。安当ASP身份认证平台提供了多种双因素认证方式，包括USB Key ID、OTP（动态口令）等，可以灵活选择和配置。以下是使用安当ASP身份认证平台的US…

阅读更多...

2023 家电行业品牌社媒营销洞察报告

2023 家电行业品牌社媒营销洞察报告

过去三年的疫情，给人们的生活和消费方式都带来了极大的改变。直播电商、社交电商的兴起，也带动了传统线下家电零售商向线上渠道发展，传统大家电“重获新生”，新兴小家电“冉冉升起”，成为了业绩增长的新引擎。 2023年&…

阅读更多...

c++视觉处理---拉普拉斯金字塔和高斯金字塔

c++视觉处理---拉普拉斯金字塔和高斯金字塔

拉普拉斯金字塔和高斯金字塔拉普拉斯金字塔（Laplacian Pyramid）和高斯金字塔（Gaussian Pyramid）是两种不同类型的图像金字塔，用于多尺度图像处理和特征提取。它们之间的主要区别在于它们所包含的信息和用途&#xff…

阅读更多...

ROS仿真软件Turtlebot-Gazebo的安装使用以及错误处理[机器人避障]

ROS仿真软件Turtlebot-Gazebo的安装使用以及错误处理[机器人避障]

很多时候由于机器人价格比较贵，而且会因为环境因素、操作失误或者摔坏等，所以我们可以先在仿真软件上做测试，也可以避免这些问题，虽然没有那么真实感，可毕竟是免费的嘛。我们可以在这些仿真的机器人身上去学习如何控制…

阅读更多...

推荐文章

最新文章