目录
1.pytorch_lightning对应版本安装
2.PyTorch Lightning介绍
PyTorch Lightning 的作用:
PyTorch Lightning 的基本用法:
报错:ModuleNotFoundError: No module named 'pytorch_lightning'
这种报错一看就是缺了pytorch_lightning包,想当然就pip install装了,没想到有坑,安装完直接把我的pytorch版本给我更细了,所以特意记录下这个问题,安装pytorch_lightning一定要与pytorch版本对应好再安装。
1.pytorch_lightning对应版本安装
参考官网版本对应:官网
如果直接使用 "pip install pytorch_lightning" 的话,安装的是最新的版本
pip install pytorch_lightning
所以,为了避免与pytorch版本冲突,需要对应版本安装,否则,就会更改你的pytorch版本。
pip install pytorch_lightning==X.X.X
比如我的pytorch=1.12.1版本,所以我就装了pytorch_lightning=1.8.6,安装完的结果如下。
至此就大功告成了,可以愉快的使用pytorch_lightning了。
2.PyTorch Lightning介绍
PyTorch Lightning 是一个基于 PyTorch 的轻量级库,旨在简化复杂模型的训练过程。它是由 William Falcon 创立的,旨在帮助研究人员和开发人员更高效地构建、训练和验证机器学习模型。
PyTorch Lightning 的作用:
- 简化训练流程:PyTorch Lightning 通过提供更高级的接口,简化了模型定义、训练、验证和测试的过程。
- 提高代码复用性:它鼓励使用面向对象的编程方法来构建模型,使得代码更加模块化,易于复用。
- 支持分布式训练:PyTorch Lightning 支持多GPU训练和分布式训练,使得模型训练可以扩展到多个设备。
- 丰富的回调函数:提供了多种回调函数,可以轻松实现模型的保存、加载、日志记录等功能。
- 易于调试和测试:由于代码结构清晰,调试和测试变得更加容易。
PyTorch Lightning 的基本用法:
PyTorch Lightning 是一个轻量级的 PyTorch 扩展库,旨在简化和规范深度学习模型的训练过程。它提供了一种更高层次的抽象,使用户能够以更简单的方式定义和训练模型。
下面是 PyTorch Lightning 的一些基本用法:
- 定义模型:通过继承
pytorch_lightning.core.LightningModule
类来定义模型。在模型类中,可以定义网络结构、损失函数、优化器等。例如:
import torch
import torch.nn as nn
import pytorch_lightning as pl
class MyModel(pl.LightningModule):
def __init__(self):
super().__init__()
self.linear = nn.Linear(10, 1)
def forward(self, x):
return self.linear(x)
- 定义训练器:通过继承
pytorch_lightning.core.LightningDataModule
类来定义训练器。在训练器类中,可以定义数据加载、预处理和划分等操作。例如:
import torchvision.transforms as transforms
from torch.utils.data import DataLoader
from pytorch_lightning import LightningDataModule
class MyDataModule(LightningDataModule):
def __init__(self):
super().__init__()
self.transform = transforms.Compose(...)
self.train_dataset = ...
self.val_dataset = ...
self.test_dataset = ...
def train_dataloader(self):
return DataLoader(self.train_dataset, batch_size=32, shuffle=True)
def val_dataloader(self):
return DataLoader(self.val_dataset, batch_size=32)
def test_dataloader(self):
return DataLoader(self.test_dataset, batch_size=32)
- 训练模型:通过创建
pytorch_lightning.trainer.Trainer
对象来训练模型。可以设置训练的轮数、学习率、设备等参数,并使用fit
方法进行训练。例如:
from pytorch_lightning import Trainer
model = MyModel()
datamodule = MyDataModule()
trainer = Trainer(gpus=1, max_epochs=10)
trainer.fit(model, datamodule)
- 预测和评估模型:通过
trainer.test
方法来对模型进行预测和评估。例如:
trainer.test(model, datamodule=datamodule)
通过以上步骤,可以使用 PyTorch Lightning 来更加简洁、规范地训练和评估深度学习模型。
PyTorch Lightning 通过提供这些高级功能,使得使用 PyTorch 构建和训练深度学习模型变得更加高效和简洁。