在深度学习中，如何统计模型的 FLOPs（浮点运算次数）和参数量（Params）

news2025/4/17 13:12:52

在深度学习中，统计模型的FLOPs（浮点运算次数）和参数量（Params）是评估模型复杂度和计算资源需求的重要步骤。

在这里插入图片描述

一、参数量（Params）计算

参数量指模型中所有可训练参数的总和，其计算与网络结构直接相关：

卷积层
• 公式：Params = out_channels × (in_channels × kernel_size²) + out_channels（含偏置项）
• 示例：输入通道为3，输出通道为64，卷积核3×3，则参数量为64×(3×3²)+64=1,792。
批归一化层（BatchNorm）
• 每通道包含可学习的γ和β参数，计算为：Params = 2 × out_channels。
全连接层
• 公式：Params = in_features × out_features + out_features（含偏置项）。
激活层（如ReLU）
• 无参数，参数量为0。

二、FLOPs（浮点运算次数）计算

FLOPs反映模型的计算复杂度，通常以乘加操作（MACs）为基础，1 MAC = 2 FLOPs：

卷积层
• 公式：
FLOPs = batch_size × in_channels × kernel_size² × out_channels × H_out × W_out × 2
• 示例：输入尺寸为224×224，卷积核3×3，输出通道64，则单样本FLOPs为3×3²×64×224×224×2≈5.2×10⁹。
全连接层
• 含偏置时：FLOPs = batch_size × in_features × out_features × 2。
批归一化层
• 推理阶段归一化操作约为每通道2 × H × W次运算。

三、常用工具库

1. 使用`thop`库（推荐）

import torch
from thop import profile

model = MyModel()  # 自定义模型
input = torch.randn(1, 3, 224, 224)  # 输入尺寸
flops, params = profile(model, inputs=(input,))
print(f"FLOPs: {flops/1e9:.2f} G, Params: {params/1e6:.2f} M")

2. 使用`ptflops`库（支持逐层分析）

from ptflops import get_model_complexity_info

flops, params = get_model_complexity_info(model, (3, 224, 224), 
                                         as_strings=True, 
                                         print_per_layer_stat=True)

3. 使用`torchstat`库（兼容旧版本PyTorch）

from torchstat import stat
stat(model, (3, 224, 224))

四、注意事项

FLOPs与FLOPS的区别
• FLOPs（复数）指总浮点运算次数，用于模型复杂度；FLOPS（全大写）指每秒浮点运算次数，衡量硬件性能。
工具计算的局限性
• 某些自定义层（如注意力机制）可能未被统计，需手动补充。
实际推理速度的影响因素
• FLOPs仅反映理论计算量，实际速度还受内存带宽、并行优化等因素影响。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2330736.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

在深度学习中，如何统计模型的 FLOPs（浮点运算次数）和参数量（Params）

一、参数量（Params）计算

二、FLOPs（浮点运算次数）计算

三、常用工具库

1. 使用`thop`库（推荐）

2. 使用`ptflops`库（支持逐层分析）

3. 使用`torchstat`库（兼容旧版本PyTorch）

四、注意事项

相关文章

Linux之Shell脚本--命令提示的写法

Day19 -实例：xcx逆向提取+微信开发者工具动态调试+bp动态抓包对小程序进行资产收集

鸿蒙Arkts开发飞机大战小游戏，包含无敌模式，自动射弹，暂停和继续

从基础算力协作到超智融合，超算互联网助力大语言模型研习

M1使用docker制作镜像xxl-job,供自己使用

第一个简易SSM框架项目

golang 计时器内存泄露问题与 pprof 性能分析工具

深度学习的下一个突破：从图像识别到情境理解

深入解析Spring Boot自动装配：原理、设计与最佳实践

【USRP】srsRAN 开源 4G 软件无线电套件

《从零搭建Vue3项目实战》（AI辅助搭建Vue3+ElemntPlus后台管理项目）零基础入门系列第二篇:项目创建和初始化

简单线程池实现

CentOS7 安装 LLaMA-Factory

最新扣子(Coze)案例教程：最新抖音视频文案提取方法替代方案，音频视频提取文案插件制作，手把手教学，完全免费教程

adb检测不到原来的设备List of devices attached解决办法

案例分享（七）：实现Apache-sharding-proxy的监控

docker 安装 awvs15

Flutter：Flutter SDK版本控制，fvm安装使用

碰一碰发视频源头开发技术服务商

Oracle 23ai Vector Search 系列之4 VECTOR数据类型和基本操作

在深度学习中，如何统计模型的 ​​FLOPs（浮点运算次数）​​ 和 ​​参数量（Params）

一、参数量（Params）计算

二、FLOPs（浮点运算次数）计算

三、常用工具库

1. 使用thop库（推荐）

2. 使用ptflops库（支持逐层分析）

3. 使用torchstat库（兼容旧版本PyTorch）

四、注意事项

相关文章

在深度学习中，如何统计模型的 FLOPs（浮点运算次数）和参数量（Params）

1. 使用`thop`库（推荐）

2. 使用`ptflops`库（支持逐层分析）

3. 使用`torchstat`库（兼容旧版本PyTorch）