使用timm库的一些知识点

news2025/2/21 6:17:50

timm（Torch Image Models）是一个在PyTorch上构建的图像模型库，它提供了一系列预训练的深度学习模型，使得研究人员和开发者可以方便地进行图像分类、目标检测等任务。
在这里插入图片描述

使用timm库创建模型时，如何确定模型的名字

使用timm.list_models方法，找到timm支持的模型

import timm

if __name__ == '__main__':
    all_pretrained_models_available = timm.list_models(pretrained=True)
    print(all_pretrained_models_available)
    for i in all_pretrained_models_available:
        print(i)

运行结果：
很多，这里只列出一部分啊！

resnet152
resnet152d
resnet200d
resnetblur50
resnetrs50
resnetrs101
resnetrs152
resnetrs200
resnetrs270
resnetrs350
resnetrs420
resnetv2_50
resnetv2_50x1_bit_distilled
resnetv2_50x1_bitm
resnetv2_50x1_bitm_in21k
resnetv2_50x3_bitm
resnetv2_50x3_bitm_in21k
resnetv2_101
resnetv2_101x1_bitm
resnetv2_101x1_bitm_in21k
resnetv2_101x3_bitm
resnetv2_101x3_bitm_in21k
resnetv2_152x2_bit_teacher
resnetv2_152x2_bit_teacher_384
resnetv2_152x2_bitm
resnetv2_152x2_bitm_in21k
resnetv2_152x4_bitm
resnetv2_152x4_bitm_in21k
resnext26ts

创建模型

执行代码

self.model = timm.create_model(
            'resnetv2_50', pretrained, num_classes=12, global_pool="avg"
        )

加载预训练权重

timm模型加载预训练权重，均改为从huggingface自动下载。由于众所周知的原因，我们不能下载。我们可以选择加载其他版本的预训练权重。代码：

model_path = '/Users/admin/Downloads/pytorch_model.bin'  # 替换为你的pytorch_model.bin文件路径

# 加载模型权重
state_dict = torch.load(model_path, map_location=torch.device('cpu'))

# 创建模型实例并加载权重
model = timm.create_model("eva_giant_patch14_336.clip_ft_in1k", pretrained=False)
model.load_state_dict(state_dict)

# 修改输出类别数
model.reset_classifier(num_classes)

特征提取

使用timm库进行特征提取是一个常见的任务，尤其是在处理图像数据时。timm（Torch Image Models）是一个基于PyTorch的库，它包含了一系列预训练的深度学习模型，这些模型可以很方便地用于特征提取、迁移学习等任务。

以下是一个使用timm进行特征提取的基本示例：

首先，确保你已经安装了timm库：

pip install timm

然后，你可以使用以下Python代码进行特征提取：

import torch
from timm import create_model, list_models
from torchvision import transforms
from PIL import Image

# 选择一个预训练模型
model_name = 'resnet50'
pretrained_model = create_model(model_name, pretrained=True)

# 切换到评估模式，关闭dropout和batch normalization层
pretrained_model.eval()

# 定义预处理变换
transform = transforms.Compose([
    transforms.Resize(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

# 加载图像
image_path = 'path_to_your_image.jpg'
image = Image.open(image_path).convert('RGB')

# 应用预处理变换
image_tensor = transform(image).unsqueeze(0)  # 添加batch维度

# 如果有GPU，将图像和数据模型转移到GPU
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
image_tensor = image_tensor.to(device)
pretrained_model = pretrained_model.to(device)

# 提取特征
with torch.no_grad():  # 不需要计算梯度，节省内存和计算资源
    features = pretrained_model.forward_features(image_tensor)  # 获取特征

# 将特征转移到CPU（如果需要）并展平
features = features.cpu().numpy().flatten()

print(features)