动手学深度学习PyTorch版

news2024/12/23 5:37:13

基本的数据操作 

import torch
# 创建一个行向量,默认为从0开始的12个整数
# n维数组也称为张量
x = torch.arange(12)
x
# 张量的形状
x.shape

# 张量的大小,张量所有元素的个数
x.numel()

#修改张量的形状
x = x.reshape(3,4)

#生成形状为3*4的两个向量,向量中数字全为0
torch.zeros(2,3,4)

#生成形状为3*4的两个向量,向量中数字全为1
torch.ones(2,3,4)

随机取样

# 创建一个形状为(3,4)的张量,其中每个元素为0,标准差为1的标准高斯分布(正态分布)中随机取样
torch.randn(3,4)

张量的运算操作 

x = torch.tensor([1.0, 2.0, 3.0, 4])
y = torch.tensor([2, 3, 5, 7])
x + y, x - y, x * y, x / y, x ** y

张量的拼接操作

x = torch.arange(12, dtype=torch.float32).reshape((3, 4))
y = torch.tensor([[2.0, 1, 3, 4],[1, 2, 5, 6],[5, 6, 2, 1]])
print(x)
# dim=0时y的每一行都添加到x的每一行下方
torch.cat((x, y),dim=0),torch.cat((x, y),dim=1)

广播机制

# 我们可以在形状不同的两个张量调用广播机制进行按元素操作
# 可以适当复制元素来扩展一个或两个数组
import torch
a = torch.arange(3).reshape(3,1)
b = torch.arange(2).reshape(1,2)
a, b

# 矩阵a将复制列,矩阵b将复制行,然后按元素相加
# 复制的都是原本的元素
a + b

索引和切片

# 索引和切片
x = torch.arange(12).reshape(3,4)
# 输出的是行
print(x[-1])
print(x[1:3])

# 第2行,第三列的元素改为9
x[1,2] = 9

#前两行的所有元素都变为12
x[0:2, : ] = 12

转换为其他python对象

# 转换为其他python对象
a = x.numpy()
b = torch.tensor(a)
type(a), type(b)
# numpy.ndarray

a = torch.tensor([3.5])
a, a.item(), float(a), int(a)
# (tensor([3.5000]), 3.5, 3.5, 3)

数据预处理

写入文件

# os模块提供了很多与操作系统交互的功能,如文件路径操作、文件读写
import os

# exist_ok=True 表示如果目录已存在,则不会抛出异常,而是继续执行
os.makedirs(os.path.join('..','data'), exist_ok=True)
data_file = os.path.join('..','data','house_tiny.csv')

with open(data_file, 'w') as f:
    f.write('NumRooms,Alley,Price\n')
    f.write('NA,PAVE,125700\n')
    f.write('2,NA,106000\n')
    f.write('4,NA,10000\n')
    f.write('NA,NA,120000\n')

加载原始数据集

# 要从创建的CSV文件中加载原始数据集,我们导入pandas包并调用read_csv函数
import pandas as pd

data = pd.read_csv(data_file)
data

处理缺失值

inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
# 将inputs中的所有NaN值替换为其非空值的平均值,并将结果重新赋值给inputs
inputs = inputs.fillna(inputs.mean())
print(inputs)
# 将分类变量(也称为因子或枚举类型)转换为一种称为独热编码(One-Hot Encoding)的格式
# 当 dummy_na=True 时,该函数还会为缺失值(NaN)创建额外的列
inputs = pd.get_dummies(inputs, dummy_na=True)
print(inputs)

转换为张量格式

# 转换为张量格式
import torch

x, y = torch.tensor(inputs.values), torch.tensor(outputs.values)
x, y

张量算法

import torch
x = torch.arange(4, dtype=torch.float32)
x,x.sum()
x = torch.arange(20, dtype=torch.float32).reshape(5, 4)
print(x)
# 张量的每列相加
x_sum_axis0 = x.sum(axis=0)
# 张量的每行相加
x_sum_axis1 = x.sum(axis=1)
print(x_sum_axis0)
print(x_sum_axis1)
print(x_sum_axis0.shape)
print(x_sum_axis1.shape)
x_sum = x.sum(axis=[0, 1])
print(x_sum)
print(x.mean())
print(x.sum() / x.numel())

非降维求和

sum_x = x.sum(axis=1, keepdims=True)
print(sum_x)
print(x / sum_x)
# 每一行的数都加上上面的数字
print(x.cumsum(axis=0))

向量的点积操作

x = torch.arange(4, dtype=torch.float32)
y = torch.ones(4, dtype=torch.float32)
x, y, torch.dot(x, y)
# 两个操作结果是一样的
torch.sum(x * y)


# 矩阵向量积
A = torch.arange(20, dtype=torch.float32).reshape(5, 4)
torch.mv(A, y)

# 矩阵-矩阵乘法
B = torch.ones(4, 3)
B, torch.mm(A, B)

范数

范数的性质

①:f(\alpha x) =\left | \alpha \right |f(x)

②:f(x+y)\leqslant f(x)+f(y)

③:f(x)\geqslant 0

# L2范数
u = torch.tensor([3.0, -4.0])
print(torch.norm(u))    # tensor(5.)
# L1范数
print(torch.abs(u).sum())    # tensor(7.)

# 弗罗贝尼乌斯范数:矩阵元素平方和的平方根
# 矩阵元素为4行9列的1
torch.norm(torch.ones((4,9)))    # tensor(6.)

微积分

导数和微分

# 使 Matplotlib 生成的图形在 Notebook 单元格中直接显示,而不是弹出一个新的窗口
%matplotlib inline
import numpy as np
# 在 Matplotlib 中,后端(backend)是指用于渲染图形和与用户界面交互的软件组件。不同的后端支持不同的输出格式和交互方式。
# 通常使用内联后端(inline backend)来在单元格中直接显示图形。
from matplotlib_inline import backend_inline
from d2l import torch as d2l

def f(x):
    return 3 * x ** 2 - 4 * x

def numerical_lim(f, x, h):
    return (f(x+h) - f(x)) / h

h = 0.1
for i in range(5):
    print(f'h={h:.5f}, numerical limit={numerical_lim(f, 1, h):.5f}')
    h *= 0.1

保存标记 #save

#@save 会将对应的函数,类或语句保存在d2l包中
# 以后无需重新定义就可以直接调用它们
def use_svg_display():  #@save
    # 使用svg格式在jupyter中显示绘图
    backend_inline.set_matplotlib_formats('svg')

def set_figsize(figsize=(3.5, 2.5)): #@save
    # 第一个元素是宽度,第二个元素是高度
    use_svg_display()
    # 设置图形的默认尺寸
    d2l.plt.rcParams['figure.figsize'] = figsize

 绘图函数及其切线

#@save
def set_axes(axes, xlabel, ylabel, xlim, ylim, xscale, yscale, legend):
    # 设置matplotlib的轴
    axes.set_xlabel(xlabel)
    axes.set_ylabel(ylabel)
    axes.set_xscale(xscale)
    axes.set_yscale(yscale)
    axes.set_xlim(xlim)
    axes.set_ylim(ylim)
    if legend:
        axes.legend(legend)
    axes.grid()
#@save
# 一个元组,用于设置X轴的显示范围。例如,xlim=(0, 10)会确保X轴只显示从0到10的值
# legend:一个标签列表,用于表示数据集中的每个系列

# fmts:一个字符串元组,用于定义数据系列的绘制格式。
# 例如,'-'表示实线,'m--'表示紫色的虚线,'g-.'表示绿色的点划线,'r:'表示红色的点状线。
# axes这个参数允许用户在一个已存在的图形上绘制,而不是创建一个新的图形。
def plot(X, Y=None, xlabel=None, ylabel=None, legend=None, xlim=None, ylim=None, xscale='linear',
         yscale='linear', fmts=('-', 'm--', 'g-.', 'r:'), figsize=(3.5, 2.5), axes=None):
    # 绘制数据点
    if legend is None:
        legend = []

    set_figsize(figsize)

    # d2l.plt.gca()表示当前的轴对象
    axes = axes if axes else d2l.plt.gca()

    # 如果X有一个轴,输出True
    def has_one_axis(X):
        return (hasattr(X, "ndim") and X.ndim == 1 or isinstance(X, list)
                and not hasattr(X[0], "__len__"))

    if has_one_axis(X):
        X = [X]
    if Y is None:
        X, Y = [[]] * len(X), X
    elif has_one_axis(Y):
        Y = [Y]
    if len(X) != len(Y):
        X = X * len(Y)
    axes.cla()
    for x, y, fmt in zip(X, Y, fmts):
        if len(x):
            axes.plot(x, y, fmt)
        else:
            axes.plot(y, fmt)
    
    set_axes(axes, xlabel, ylabel, xlim, ylim, xscale, yscale, legend)
x = np.arange(0, 3, 0.1)
plot(x, [f(x), 2 * x - 3], 'x', 'f(x)', legend=['f(x)', 'Tangent line (x=1)'])

偏导数和梯度

我们可以连接一个多元函数对其所有变量的偏导数,以得到该函数的梯度向量

函数f(x)相对于x的梯度是一个包含n个偏导数的向量

自动微分

# 自动微分使系统能够随后反向传播梯度
import torch
x = torch.arange(4.0)

# 一个标量函数关于向量x的梯度是向量,并且与x有相同的形状
# x.requires_grad 是 True,那么在 x 上进行的所有操作都会被跟踪,
# 这样当你调用 .backward() 方法时,PyTorch可以计算出 x 关于某个标量函数(通常是损失函数)的梯度
x.requires_grad_(True)
print(x.grad)   # 默认值为None
y = 2 * torch.dot(x, x)
print(y)

# x是一个长度为4的向量,计算x和x的点积,我们赋值给y的标量输出
# 通过调用反向传播函数来自动计算y关于x的每个分量的梯度  4x
y.backward()
x.grad
# 在默认情况下,PyTorch会累积梯度,我们需要清除之前的值
# 就地操作,直接修改原始张量
# .zero():非就地操作,返回一个新的零张量,原始张量保持不变
x.grad.zero_()
print(x)
print(x.grad)

y = x.sum()
print(y)

# 代码执行反向传播操作,计算y相对于x的梯度,并将结果存储在x.grad中
# 首先给网络输入一组训练数据,并计算输出结果;然后计算输出结果与实际结果的差异,得到网络的误差;
# 接着计算每个节点对误差的贡献,并将这些贡献反向传播到前一层;
# 最后根据贡献的大小调整每个节点的权重,使得误差减小
y.backward()

# 因为 y 是 x 的所有元素的和,所以 y 关于 x 的梯度是一个全为 1 的向量
print(x.grad)
x.grad.zero_()
y = x * x
# 等价于y.backward(torch.ones(len(x)))
y.sum().backward()
x.grad

张量的分离计算操作

x.grad.zero_()
y = x * x
print(y)
# 处理计算图和梯度反向传播时更加灵活地控制哪些张量需要参与梯度计算,哪些张量不需要参与梯度计算
# 从计算图中分离出来的新张量u,它的值与y相同,不再追踪计算历史
u = y.detach()
print(u)

# 通过反向传播函数计算z = u * x 关于x的偏导数,同时将u作为常数处理
z = u * x
print(z)

z.sum().backward()
x.grad == u

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1501400.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C#实现归并排序算法

C#实现归并排序算法 以下是 C# 中的归并排序算法实现示例: using System;class MergeSortAlgorithm {// 合并两个子数组static void Merge(int[] arr, int left, int mid, int right){// 计算左子数组和右子数组的长度int n1 mid - left 1;int n2 right - mid;/…

力扣--滑动窗口438.找到字符串中所有字母异位词

思路分析: 使用两个数组snum和pnum分别记录字符串s和p中各字符出现的次数。遍历字符串p,统计其中各字符的出现次数,存储在pnum数组中。初始化snum数组,统计s的前m-1个字符的出现次数。从第m个字符开始遍历s,通过滑动窗…

STM32(14)USART

USART:一种片上外设,用来实现串口通信,就是stm32内部的串口 USART简介 串并转换电路 串行通信和并行通信 串行:一根数据线,逐个比特位发送 为什么要串并转换 移位寄存器 USART的基本模型 通过查询SR(状态寄存器&…

w022郑州大学招新赛选拔赛

A-SW的与众不同数组_2022学年第一学期郑州大学ACM招新赛&选拔赛 (nowcoder.com) #include <bits/stdc.h> #define int long long using namespace std;void solve(){int n;cin >> n;vector<int> v;for(int i 1; i < n; i){int x;cin >> x;v.p…

Java集合面试题(day 02)

&#x1f4d1;前言 本文主要是【JAVA】——Java集合面试题的文章&#xff0c;如果有什么需要改进的地方还请大佬指出⛺️ &#x1f3ac;作者简介&#xff1a;大家好&#xff0c;我是听风与他&#x1f947; ☁️博客首页&#xff1a;CSDN主页听风与他 &#x1f304;每日一句&am…

一文扫荡,12个可视化图表js库,收藏备用。

hello&#xff0c;我是贝格前端工场&#xff0c;可视化图表在web前端开发中经常碰到&#xff0c;是不是很疑惑这些炫酷的图表是怎么实现的&#xff0c;其实是通过js库开发的&#xff0c;本文带来12个javascript库的介绍&#xff0c;欢迎关注我&#xff0c;阅读精彩内容。 一、什…

【新版Hi3521DV200处理器性能】

新版Hi3521DV200处理器性能 Hi3521DV200是针对多路高清/超高清&#xff08;1080p/4M/5M/4K&#xff09;DVR产品应用开发的新一代专业SoC芯片。Hi3521DV200集成了ARM Cortex-A7四核处理器和性能强大的神经网络推理引擎&#xff0c;支持多种智能算法应用。同时&#xff0c;Hi352…

Media Encoder 2024:未来媒体编码的新纪元 mac/win版

随着科技的飞速发展&#xff0c;媒体内容已成为我们日常生活中不可或缺的一部分。为了满足用户对高质量视频内容不断增长的需求&#xff0c;Media Encoder 2024应运而生&#xff0c;它凭借卓越的技术和创新的特性&#xff0c;重塑了媒体编码的未来。 Media Encoder 2024软件获…

绝赞春招拯救计划

huihut/interview: &#x1f4da; C/C 技术面试基础知识总结&#xff0c;包括语言、程序库、数据结构、算法、系统、网络、链接装载库等知识及面试经验、招聘、内推等信息。This repository is a summary of the basic knowledge of recruiting job seekers and beginners in t…

数据结构与算法-插值查找

引言 在计算机科学的广阔天地中&#xff0c;数据结构和算法扮演着至关重要的角色。它们优化了信息处理的方式&#xff0c;使得我们在面对海量数据时能够高效、准确地进行检索与分析。本文将聚焦于一种基于有序数组且利用元素分布规律的查找算法——插值查找&#xff08;Interpo…

活动预告|听云猿生数据创始人 CEO 曹伟分享云数据库行业十余年经验总结

3月16日&#xff0c;KubeBlocks 将携手 OceanBase 开源社区、AutoMQ 带来《LLMs 时代下的企业数据管理与降本增效之路》主题 meetup&#xff0c;扫描下方二维码&#xff0c;即刻报名&#x1f447;。 云猿生数据创始人 & CEO 曹伟将带来《KubeBlocks&#xff1a;把所有数据…

freeRTOS20240308

1.总结任务的调度算法&#xff0c;把实现代码再写一下 2.总结任务的状态以及是怎么样进行转换的

Flutter使用auto_updater实现windows/mac桌面应用版本升级功能

因为windows应用一般大家都是从网上下载的&#xff0c;后期版本肯定会更新&#xff0c;那用flutter开发windows应用&#xff0c;怎么实现应用内版本更新功能了&#xff1f;可以使用auto_updater库&#xff0c; 这个插件允许 Flutter 桌面 应用自动更新自己 (基于 sparkle 和 wi…

数字化转型导师坚鹏:人工智能在证券行业的应用与实践

人工智能在证券行业的应用与实践 课程背景&#xff1a; 证券公司数字化转型离不开人工智能&#xff0c;在证券公司数字化转型中&#xff0c;人工智能起到至关重要的作用&#xff0c;很多机构存在以下问题&#xff1a; 不清楚人工智能产业对我们有什么影响&#xff1f; 不知…

用python写一个自动进程守护,带UI

功能是指定程序关闭后自动重启&#xff0c;并点击1作为启动 原来的想法是群成员说的某软件打包后&#xff0c;软件进程被杀后&#xff0c;界面白屏。所以写了个计算器重启demo进行进程守护 import subprocess import time import pyautogui import psutil #用计算器做演示。 d…

【Linux基础(三)】信号

学习分享 1、信号的基本概念2、查看信号列表3、常见信号名称4、signal库函数5、发送信号kill6、kill - signal &#xff08;无参信号&#xff09;示例6.1、kill - signal (不可靠信号)示例6.2、kill - signal (可靠信号)示例 7、信号分类7.1、信号运行原理分类7.2、信号是否携带…

官网正在被哪些产品蚕食,定制网站又被哪些建站产品挤占。

2023-12-09 16:22贝格前端工场 官网建设是一个被大多数人看衰的市场&#xff0c;本文来理性分析下&#xff0c;谁在蚕食这个市场&#xff0c;谁又在挤占这个产品生存空间&#xff0c;欢迎大家评论&#xff0c;探讨。 网站正在被以下产品形式取代&#xff1a; 1. 移动应用&…

深入理解并发编程:解锁现代软件性能的关键

在当今快速发展的软件开发世界中&#xff0c;并发编程已经成为一种无法回避的重要议题。它涉及到如何在同一时间内处理多个任务&#xff0c;以此来提升应用程序的性能和响应速度。互联网服务的高并发需求以及多核处理器的普及使得并发编程成为了现代软件工程的一个核心组成部分…

09---蜂鸣器电路设计

视频链接 蜂鸣器硬件电路设计01_哔哩哔哩_bilibili 蜂鸣器电路设计 1、蜂鸣器的定义 蜂鸣器是一种一体化结构的电子讯响器&#xff0c;采用直流电压供电&#xff0c;广泛应用于计算机、打印机、复印机、报警器、电子玩具、汽车电子设备、电话机、定时器等电子产品中作发声器…

异常-Exception

文章目录 异常-Exception常见的运行时异常NullPointerException&#xff08;空指针异常&#xff09;ArithmeticException&#xff08;数学运算异常&#xff09;ArrayIndexOutOfBoundsException&#xff08;数组下标越界异常&#xff09;ClassCastException&#xff08;类型转换…