3.神经网络-深度学习入门

news2024/10/7 7:26:20

3.神经网络

深度学习入门
本文的文件和代码链接:github地址

1.激活函数

  1. sigmoid
    h ( x ) = 1 1 + e − x h(x) = \frac{1}{1 + e^{-x}} h(x)=1+ex1
def sigmod(x):
    return 1 / (1 + np.exp(-1 * x))
  1. ReLU

h ( x ) = { x : x > 0 0 : x ≤ 0 h(x) = \left\{ \begin{array}{lr} x & : x > 0\\ 0 & : x \le 0 \end{array} \right. h(x)={x0:x>0:x0

  1. softmax 函数(常用来分类)
    y k = e a k ∑ i = 1 n e a i y_k = \frac{e^{a_k}}{\sum_{i=1}^n e^{a_i}} yk=i=1neaieak
    需要关注:softmax需要进行指数运算,因此容易溢出
    解决方法:
    y k = e a k ∑ i = 1 n e a i = C ∗ e a k C ∗ ∑ i = 1 n e a i = e x p ( a k + l o g C ) ∗ ∑ i = 1 n e x p ( a i + l o g C ) = e x p ( a k + C ′ ) ∗ ∑ i = 1 n e x p ( a i + C ′ ) y_k = \frac{e^{a_k}}{\sum_{i=1}^n e^{a_i}} = \frac{C *e^{a_k}}{C * \sum_{i= 1}^n e^{a_i}} = \frac{exp(a_k + logC)}{* \sum_{i= 1}^n exp(a_i + logC)} = \frac{exp(a_k + C')}{* \sum_{i= 1}^n exp(a_i + C')} yk=i=1neaieak=Ci=1neaiCeak=i=1nexp(ai+logC)exp(ak+logC)=i=1nexp(ai+C)exp(ak+C)
    即在进行softmax指数运算的时候,加上或减去某个数,结果不变,因此可以减去输入信号中的最大值

softmax代码实现:

def softmax(a):
    c = np.max(a)
    return np.exp(a - c) / np.sum(np.exp(a - c))  # 利用了数组的广播机制

2. 使用mnist数据集进行推理

数据集导入

import sys, os
import numpy as np
# 为了导入父目录中的文件, 即将父目录加入到 sys.path(Python的搜索模块)的路径集中
sys.path.append(os.pardir)
# 其中 dataset.mnist 为dataset文件夹下的python文件,用来进行数据集的预处理
from dataset.mnist import load_mnist
# 下载数据集
(x_train, t_train), (x_test, t_test) =  load_mnist(normalize=True, flatten=True, one_hot_label=True)

显示mnist图像

img = x_train[0]
label = t_train[0]
# 将图像形状转为(1, 28, 28)
img = img.reshape(28, 28)
# 使用 matplotlib.pyplot 进行查看
import matplotlib.pyplot as plt
plt.imshow(img)

显示结果:
在这里插入图片描述

前向推理过程

函数定义:

import pickle
# 因为只是进行测试,所以只需要获取测试集的数据
def get_data():
    (x_train, t_train), (x_test, t_test) =  load_mnist(normalize=True, flatten=True, one_hot_label=True)
    return x_test, t_test
# 初始化网络,从文件中读取之前保存好的权重(因为此时还没有学习如何进行训练,只是进行推理,因此使用给定的参数进行推理)
def init_network(file_path):
    with open(file_path, 'rb') as f:
        network = pickle.load(f)
    return network

# 进行推理预测
def predict(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']

    a1 = np.dot(x, W1) + b1
    z1 = sigmod(a1)

    a2 = np.dot(z1, W2) + b2
    z2 = sigmod(a2)

    a3 = np.dot(z2, W3) + b3
    z3 = softmax(a3)

    return z3

进行推理:

# 进行推理
x, t = get_data()
network = init_network("sample_weight.pkl")

# cnt 统计预测正确的个数
cnt = 0
# 遍历每一个样本
for i in range(x.shape[0]):
    y = predict(network, x[i])
    h = np.argmax(y)    # 获取y中最大值的索引
    if h == np.argmax(t[i]):
        cnt += 1

# cnt 最终输出为 9352

3. 批处理

之前预测的过程中一次处理一个样本,现在考虑一次处理多个样本的情况,即批处理。
一次打包输入多张图片(一张图片是一个样本,多张图片就是多个样本),这种打包式的输入就被称为批。

# 进行推理
x, t = get_data()
network = init_network("sample_weight.pkl")

# batch_size 定义一批处理的样本数
batch_size = 100
# cnt 统计预测正确的个数
cnt = 0
# 遍历每一个样本
for i in range(0, x.shape[0], batch_size):
    y = predict(network, x[i:i+batch_size])
    h = np.argmax(y, axis = 1)    # 按照列, 获取y中每一行中最大值的索引(行不变,在列上计算, 因此axis=1)
    cnt += np.sum(h == np.argmax(t[i:i+batch_size], axis = 1))
# cnt仍然为 9352

4. 补充说明

dataset目录下 mnist.py 文件内容:

# coding: utf-8
try:
    import urllib.request
except ImportError:
    raise ImportError('You should use Python 3.x')
import os.path
import gzip
import pickle
import os
import numpy as np


url_base = 'http://yann.lecun.com/exdb/mnist/'
key_file = {
    'train_img':'train-images-idx3-ubyte.gz',
    'train_label':'train-labels-idx1-ubyte.gz',
    'test_img':'t10k-images-idx3-ubyte.gz',
    'test_label':'t10k-labels-idx1-ubyte.gz'
}

dataset_dir = os.path.dirname(os.path.abspath(__file__))
save_file = dataset_dir + "/mnist.pkl"

train_num = 60000
test_num = 10000
img_dim = (1, 28, 28)
img_size = 784


def _download(file_name):
    file_path = dataset_dir + "/" + file_name
    
    if os.path.exists(file_path):
        return

    print("Downloading " + file_name + " ... ")
    urllib.request.urlretrieve(url_base + file_name, file_path)
    print("Done")
    
def download_mnist():
    for v in key_file.values():
       #  其中 v 是 key_file 中的值, 不是key
       _download(v)    # 下载后文件名为 /train-images-idx3-ubyte.gz 等
        
def _load_label(file_name):
    file_path = dataset_dir + "/" + file_name
    
    print("Converting " + file_name + " to NumPy Array ...")
    with gzip.open(file_path, 'rb') as f:
            labels = np.frombuffer(f.read(), np.uint8, offset=8)
    print("Done")
    
    return labels

def _load_img(file_name):
    # 此时 file_path 为 /train-images-idx3-ubyte.gz等
    file_path = dataset_dir + "/" + file_name
    
    print("Converting " + file_name + " to NumPy Array ...")    
    with gzip.open(file_path, 'rb') as f:
            # np.frombuffer 将缓冲区解释为一维数组, 即将 /train-images-idx3-ubyte.gz 解释为一维数组
            data = np.frombuffer(f.read(), np.uint8, offset=16)
    data = data.reshape(-1, img_size)
    print("Done")
    
    return data

# 将下载后的对象转为 numpy
def _convert_numpy():
    dataset = {}
    dataset['train_img'] =  _load_img(key_file['train_img'])
    dataset['train_label'] = _load_label(key_file['train_label'])    
    dataset['test_img'] = _load_img(key_file['test_img'])
    dataset['test_label'] = _load_label(key_file['test_label'])
    
    return dataset

def init_mnist():
    download_mnist()
    dataset = _convert_numpy()
    print("Creating pickle file ...")
    with open(save_file, 'wb') as f:
        # 序列化操作,将对象dataset保存到 f 文件中,其中 f为 dataset_dir + "/mnist.pkl"
        pickle.dump(dataset, f, -1)
    print("Done!")

def _change_one_hot_label(X):
    T = np.zeros((X.size, 10))
    for idx, row in enumerate(T):
        row[X[idx]] = 1
        
    return T
    

def load_mnist(normalize=True, flatten=True, one_hot_label=False):
    """读入MNIST数据集
    
    Parameters
    ----------
    normalize : 将图像的像素值正规化为0.0~1.0
    one_hot_label : 
        one_hot_label为True的情况下,标签作为one-hot数组返回
        one-hot数组是指[0,0,1,0,0,0,0,0,0,0]这样的数组
    flatten : 是否将图像展开为一维数组
    
    Returns
    -------
    (训练图像, 训练标签), (测试图像, 测试标签)
    """
    if not os.path.exists(save_file):
        init_mnist()
        
    with open(save_file, 'rb') as f:
        dataset = pickle.load(f)
    
    if normalize:
        for key in ('train_img', 'test_img'):
            dataset[key] = dataset[key].astype(np.float32)
            dataset[key] /= 255.0
            
    if one_hot_label:
        dataset['train_label'] = _change_one_hot_label(dataset['train_label'])
        dataset['test_label'] = _change_one_hot_label(dataset['test_label'])
    
    if not flatten:
         for key in ('train_img', 'test_img'):
            dataset[key] = dataset[key].reshape(-1, 1, 28, 28)

    return (dataset['train_img'], dataset['train_label']), (dataset['test_img'], dataset['test_label']) 


if __name__ == '__main__':
    init_mnist()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/80696.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CMake静态库和动态库构建实例

任务 建⽴⼀个静态库和动态库,提供 HelloFunc 函数供其他程序编程使⽤,HelloFunc 向终端输出 Hello World 字 符串。安装头⽂件与共享库。 构建过程 构建动态库 目录结构 jyhlinuxubuntu:~/share/makefile_cmake/cmake01$ tree . ├── build #在…

m基于多用户MIMO系统的分布式可重构注水算法的matlab仿真

目录 1.算法描述 2.仿真效果预览 3.MATLAB核心程序 4.完整MATLAB 1.算法描述 在单用户MIMO场景中,空间复用技术能够带来高数据速率的传输,但是也需要一些前提条件,比如发射端的预编码或者接收端的信道估计与信号检测。然而,在…

java项目-第169期ssm二手交易平台网站-ssm毕业设计_计算机毕业设计

java项目-第169期ssm二手交易平台网站-ssm毕业设计 【源码请到下载专栏下载】 《ssm二手交易平台网站》 该项目分为3个角色,管理员、用户、商家。 用户可以浏览前台商品并且进行购买。在个人后台可以看到自己的商品。 商家可以对商品进行商品分类管理、商品信息管理…

React 学习笔记:组件通信

组件通信 组件为什么需要通信呢?这是因为组件是独立且封闭的单元,默认情况下,组件只能使用自己的数据,但是多个组件之间不可避免的要共享某些数据,为了实现这些功能,就需要打破组件的独立封闭性&#xff0…

深度学习入门(五十九)循环神经网络——通过时间反向传播

深度学习入门(五十九)循环神经网络——通过时间反向传播前言循环神经网络——通过时间反向传播教材1 循环神经网络的梯度分析1.1 完全计算1.2 截断时间步1.3 随机截断1.4 比较策略2 通过时间反向传播的细节3 小结前言 核心内容来自博客链接1博客连接2希…

基于java+springboot+vue+mysql的甜品蛋糕销售商城网站

项目介绍 随着社会的快速发展,计算机的影响是全面且深入的。人们生活水平的不断提高,日常生活中用户对网上蛋糕商城方面的要求也在不断提高,网上蛋糕商城得到广大用户的青睐,使得网上蛋糕商城的开发成为必需而且紧迫的事情。本系…

Docker笔记--使用数据卷实现容器与宿主机的数据交互

1--数据卷的介绍和作用 在 Docker 架构中,宿主机系统和容器之间不能直接传递数据,同时当容器被删除时,容器所有的数据都会被清除; 数据卷能够在宿主机与容器、容器与容器之间搭建数据传输和共享的通道,当容器内的目录与…

C++ 快速复习-数据类型

内置数据类型 int、unsigned int 、long、unsigned long 、short、char、signed char、bool、 long long float、double、long double 等 无符号的数据类型 主要在于 不在区分 -,数据波动范围变大。另外,值得注意的是 unsigned 类型的数据 不建议在输出…

玩以太坊链上项目的必备技能(变量作用域-Solidity之旅五)

在前文我们讲过 Solidity 是一种静态类型的语言,这就意味着在声明变量前需先指定类型。 而 Solidity 对变量划分了以下三种作用域范围: 状态变量(State Variable): ​ 该变量的值被永久地存放在合约存储中&#xff…

JS新年倒计时

✅作者简介:热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏:前端案例分…

Java---线程详解

目录 一、线程的介绍 二、线程的使用 (1)多线程的实现 1:继承Thread类 2:实现Runnable接口 (2)设置和获取线程名称 1:继承Thread类 2:实现Runnable接口 (3)线程…

Java学习—多线程Thread

多线程1. 线程简介1.1 普通方法和多线程1.2 程序、进程、线程2. 线程创建2.1 Thread类案例:下载图片2.2 Runnable接口案例:龟兔赛跑2.3 Callable接口3. 静态代理4. Lamda表达式5. 线程状态5.1 线程方法5.2 停止线程5.3 线程休眠5.4 线程礼让-yield5.5 Jo…

揭秘SpringMVC-DispatcherServlet之九大组件(二)

前言 上回聊到了HandlerAdapter,今天继续聊后面的组件。今天的主角是HandlerMapping,这篇文章全为他服务了。 HandlerMapping 上回说的Handler,我们说是处理特定请求的。也就是说,不是所有的请求都能处理。那么问题来了&#x…

gateway初始化与配置

1、排除依赖 spring-boot-starter-webflux 2、添加依赖 <dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-gateway</artifactId> </dependency> <dependency><groupId>org.springf…

基于GDAL的JAVA生成GDB文件实战

前言 在之前博客中&#xff0c;陆续的介绍了关于gdb文件的读取&#xff0c;gis利器之Gdal&#xff08;三&#xff09;gdb数据读取&#xff0c;玩转GDAL一文带你深入Windows下FileGDB驱动支持&#xff0c;这些文章主要都是介绍gdal的读取gdb以及简单的gdb文件读写。在实际工作中…

VJ个人周赛

A:模拟 题意&#xff1a;给定了N个任务&#xff0c;每个任务都有一个优先级&#xff08;1~9&#xff09;&#xff0c;数字越大&#xff0c;优先级越高。将这些任务放入队列中&#xff0c;如果出队的元素&#xff08;x&#xff09;&#xff0c;x的优先级不是最高的&#xff0c;那…

从高级测试到测试开发有什么感悟

最近加入了新的团队&#xff0c;角色发生较大的转变&#xff0c;在这里分享一下自己的感受。 测试的划分 如果我们把产品的生产看成一个流水线的话&#xff0c;那么测试就是流水线上的一个重要岗位&#xff0c;把控着产品的质量。 当然&#xff0c;产品类型的不同&#xff0…

信息系统安全管理

信息系统安全是一个绕不开的话题。从事IT行业&#xff0c;不论何种角色&#xff0c;哪个工种&#xff0c;都需要有所了解。 一、信息系统安全策略 1、概述 信息系统安全策略是指对&#xff08;本单位&#xff09;信息系统的安全风险&#xff08;安全威胁&#xff09;进行有效…

小白学编程(js):通过按钮变换背景颜色

《JavaScript从入门到精通》【例9.1】 代码演示&#xff1a; <body><form class"form1" action"" name"form1" method"psot"><p><input type"button" name"Submit" value"变换背景&qu…

[附源码]计算机毕业设计基于Java的图书购物商城Springboot程序

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…