Pytorch深度学习与入门实战

news2025/3/1 3:36:05

Pytorch深度学习入门与实战

Pytorch简介
- Pytorch特点
- PyTorch安装环境要求
- PyTorch兼容的Python版本
- 搭建开发环境
- 下载Miniconda![下载miniconda](https://img-blog.csdnimg.cn/adace1a2f7ae476aa883b53203477c92.pn
- Pytorch官网地址
- GPU版本安装
- 检查显卡驱动
- 依赖库安装
机器学习基础与PyTorch实现简单线性回归
- 机器学习基础
- 损失函数
张量与基本数据类型
matmul 矩阵乘法

Pytorch简介

Pytorch是一个能在CPU和GPU上运行并解决各类深度学习问题的深度学习框架。可以将其看做是支持GPU计算和自动微分计算的Numpy库。
在PyTorch诞生之前，像caffe和torch这样的深度学习库是很受欢迎的深度学习库。随着深度学习快速发展，开发人员和研究人员希望有一个高效、易于使用的框架，并且以Python编程语言构建、训练和评估神经网络。
PyTorch简介
PyTorch是一个灵活容易学习python库，在学术和研究领域PyTorch是最受欢迎的深度学习库。
PyTorch是Tensorflow最强有力的竞争对手。
PyTorch框架的产生受到Torch和Chainer这两个框架的启发。
与Torch使用Lua语言相比，PyTOrch是一个python优先的框架，我们可以继承PyTorch类然后自定义。
与Chainer类型，PyTorch框架具有自动求导的动态图功能，也就是所谓define by run,即当python解释器运行到相应的行时，才创建计算图。

Pytorch特点

易于使用的API——它就像python一样简单。
python的支持——PyTorch可以顺利地与python数据科学集成。它非常类似于Numpy.
动态计算图——取代了具有特定优势的静态图，pytorch为我们提供了一个框架，以便可以在运行时构建计算图，甚至在运行时更改它们。
部署简单——pytorch提供了可用于大规模部署Pytorch模型的工具torchserve.TorchServe是pytorch开源项目的一部分，是一个易于使用的工具，用于大规模部署Pytorch模型。
支持分布式训练——pytorch可实现研究和生产中的分布式训练和性能优化。
支持移动端——Pytorch支持从python到IOS和安卓系统部署的端到端工作流程。
强大的生态系统——pytorch具有丰富的工具和库等生态系统，为计算机视觉、NLP等方面的开发提供便利。
内置开放神经网络交换协议（ONNX）——可以很方便与其他深度学习框架互操作。

PyTorch安装环境要求

PyTorch兼容的Python版本

windows上的Pytorch仅支持python 3.7-3.9,不支持python 2.x

搭建开发环境

推荐使用Miniconda搭建python环境
Miniconda是最小的conda安装环境，它提供了：
1.Conda包管理工具
2.python

下载Miniconda![下载miniconda](https://img-blog.csdnimg.cn/adace1a2f7ae476aa883b53203477c92.pn

GPU版本的python可以利用NVIDIA GPU强大的计算加速能力，使Python的运行更为高效，尤其是可以成倍提升模型训练的速度。

Pytorch官网地址

https://pytorch.org/get-started/locally/
快速下载CPU版本torch的网址：pip3 install torch torchvision torchaudio -i https://pypi.doubanio.com/simple

GPU版本安装

GPU版本安装
CUDA是一种由NVIDIA推出的通用并行计算架构，该架构使GPU能够解决复杂的计算问题。
为了使用CUDA，需要安装cudatolkit,在这里我们与pytorch一并都使用conda安装。

检查显卡驱动

检查显卡驱动
GPU版本安装
这样网站会给出我们具体的安装命令，我们在anaconda prompt(miniconda3)命令行中参考网站给出的安装命令执行安装即可。

依赖库安装

机器学习基础与PyTorch实现简单线性回归

机器学习基础

什么是机器学习呢？所谓机器学习，就是让计算机从数据中学习到规律，从而做出预测。很多时候，我们很难直接编写一个算法解决问题，比如一张图片，很难编写算法直接正确预测这张图片是猫还是狗。
为了解决这个问题，人们想到数据驱动方法，也就是让计算机从现有的大量的带标签图片中学习规律，一旦计算机学习到了其中的规律，当我们输入一张新的图片给计算机时，它就可以准确的预测出这张图片到底是猫还是狗。
这里有两个关键的因素，
一是大量的可学习数据，比如带标签的猫狗图片；
二是学习的主体，我们一般称之为模型。
如何理解模型呢？
你可以把模型认为是一个映射函数，它包含一些参数，这些参数可以与输入进行计算得到一个输出，我们一般称之为预测结果。
所谓模型学习的过程，就是模型修正其参数、改进映射关系的过程。
可以简单的把模型的学习过程总结如下，以预测图片是猫还是狗为例：
1.创建模型；
2.输入一张带标签的图片；
3.使用模型对此图片做出预测；
4.将预测结果与实际标签比较，产生的差距为损失；
5.以减小损失为优化目标，根绝损失优化模型参数；
6.循环重复上述第2-5步。

损失函数

损失函数：使用均方误差作为成本函数，也就是预测值和真实值之间差的平方取均值。
成本函数与损失函数：优化的目标（y代表实际的收入）：找到合适的W和b，使得（f(x)-y）的平方越小越好，也就是求解合适的参数w和b.`
模型的创建如下所示：

class EIModel(nn.Module):定义类继承自nn.Module
    def __init__(self):
        super(EIModel, self).__init__()
        self.linear = nn.Linear(in_features=1, out_features=1)
    def forward(self, inputs):
        logits = self.linear(inputs)
        return logits
	model = EIModel()模型实例化
	opt = torch.optim.SGD(model.parameters(), lr=0.0001)优化器

	for epoch in range(5000):训练5000次
    for x, y in zip(X, Y):
        y_pred = model(x)
        loss = loss_fn(y_pred, y)计算损失
        opt.zero_grad()梯度清零
        loss.backward()损失反向传播
        opt.step()优化参数
        list(model.parameters())返回优化后的模型参数
        list(model.named_parameters())
        
plt.scatter(data.Education, data.Income)绘制优化后的模型参数
plt.xlabel('Education')
plt.ylabel('Income')

plt.plot(X, model(X).detach().numpy(), c='r')

返回模型的权重和偏移参数
训练后的模型展示
*** 创建模型的总结：
1.输入数据处理
2.创建模型
3.训练
4.预测、评价

张量与基本数据类型

Tensor(张量)
Pytorch最基本的操作对象是Tensor（张量），它表示一个多维矩阵张量类似于NumPy的ndarrays,张量可以在GPU上使用以加速计算。
张量是基于向量和矩阵的推广，我们可以将标量视为零阶张量，向量视为一节张量，矩阵就是二阶张量。
张量是支持高效的科学计算的数组，它可以是一个数（标量）、一维数组（向量）、二维数组（矩阵）和更高维的数组（高阶数据）。
张量（tensor）和NumPy的数组ndarray通常可以共享相同的底层内存，无需复制数据。
import torch
import numpy as np

t = torch.FloatTensor([1, 2, 3]）创建float32类型的数据
t = torch.LongTensor([1, 2])创建int64位类型的数据

Tensor的最基本数据类型

torch.rand(2,3)       在0和1之间随机分布的随机数，创建一个两行三列的tensor数据
t = torch.randn(2, 3)      随机创建一个2*3的正态分布

shape返回tensor的形状 dtype返回tensor的类型
t.add_(t1) 代表t+t1的运算结果返回给t,就地改变t的值
torch.abs(t)代表求t的绝对值
t.T # 转置 shape ： (3, 2) 大写的T代表转置，表示将23的矩阵t，转换为32的矩阵T

matmul 矩阵乘法

t.matmul(t.T) 表示一个23的矩阵t，与一个32的矩阵T，进行矩阵乘法运算。
t@(t.T)等同于t.matmul(t.T)
t.sum().item()将tensor的数据类型转换为python的浮点型数据进行打印
t1 = torch.from_numpy(np.random.randn(3, 4)) 表示将numpy类型的数据，转换为array类型
t1.numpy() 表示将array类型的数据转换为numpy类型
view方法
squeeze方法去除维度为1的维度
requires_grad与grad_fn函数的运用