动手学深度学习(四)---多层感知机

news2026/2/14 19:51:05

文章目录

一、理论知识
- 1.感知机
- 2.XOR问题
- 3.多层感知机
- 4.多层感知机的从零开始实现
【相关总结】
- 1.torch.randn()
- 2.torch.zeros_like()

一、理论知识

1.感知机

给定输入x,权重w，和偏移b,感知机输出：
在这里插入图片描述

2.XOR问题

感知机不能拟合XOR问题，他只能产生线性分割面
在这里插入图片描述

3.多层感知机

多层感知机和softmax没有本质区别,只是多加了一层隐藏层没有隐藏层就是softmax回归,加上隐藏层就是多层感知机

4.多层感知机的从零开始实现

import torch
from torch import nn
from d2l import torch as d2l

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

2.实现一个具有单隐藏层的多层感知机，他包含256个隐藏单元

num_inputs, num_outputs, num_hiddens = 784, 10, 256
# 28 * 28

# 声明是torch的Parameter
W1 = nn.Parameter(
#     生成随机数字的tensor
    torch.randn(num_inputs, num_hiddens, requires_grad=True))
b1 = nn.Parameter(torch.zeros(num_hiddens, requires_grad = True))
W2 = nn.Parameter(
    torch.randn(num_hiddens, num_outputs, requires_grad=T rue))
b2 = nn.Parameter(torch.zeros(num_outputs, requires_grad=True))

params = [W1, b1, W2, b2]

【相关总结】

1.torch.randn()

生成随机数字的tensor
这些随机数字满足标准正态分布
torch.randn(size) size可以为一个数字或者一个元组

import torch
x = torch.randn(3)
y = torch.randn(2,3)
print(x)
print(y)

tensor([-0.1201, -1.0340, 0.7885])
tensor([[-0.5694, 0.0461, 1.0315],
[-1.0342, -0.9757, -0.1844]])

2.torch.zeros_like()

torch.zeros_like(input, dtype=None, layout=None, device=None, requires_grad=False)
返回一个与给定输入张量形状和数据类型相同，但所有元素都被设置为零的新张量。

import torch

x = torch.tensor([[1, 2, 3],
                [4, 5, 6],
                [7, 8, 9]])
y = torch.zeros_like(x)
print(y)

tensor([[0, 0, 0],
[0, 0, 0],
[0, 0, 0]])

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1252564.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

动手学深度学习(四)---多层感知机

文章目录

一、理论知识

1.感知机

2.XOR问题

3.多层感知机

4.多层感知机的从零开始实现

【相关总结】

1.torch.randn()

2.torch.zeros_like()

相关文章

Javaweb之Vue组件库Element的详细解析

辅助驾驶功能开发-系统方案篇-地平线超级驾驶解决方案介绍

【LeetCode】挑战100天 Day15（热题+面试经典150题）

基于python+Django+SVM算法模型的文本情感识别系统

2023年最新IntelliJ IDEA下载安装以及Java环境搭建教程（含Java入门教程）

【数据库】聊聊一颗B+树可以存储多少数据

C++初阶（十二）string的模拟实现

3.1 CPU内部结构与时钟与指令

java容器

x86 汇编语言介绍001

基于时隙的多重冗余流指纹模型

鸿蒙(HarmonyOS)应用开发——装饰器

FIB表与快速转发表工作原理

2.Linux系统及常用命令

[网鼎杯 2020 青龙组]singal

【C4D如何将多个选集设置为一个选集】

计算机中由于找不到vcruntime140.dll无法继续执行代码无法打开软件怎么解决分享

【拓扑排序】

电脑技巧：U盘运用小技巧，提升U盘运用寿命

基于vue+element-plus+echarts编写动态绘图页面