深度学习之“线性代数”

news2025/2/3 21:40:24

线性代数在深度学习中是解决多维数学对象计算问题的核心工具。这些数学对象包括标量、向量、矩阵和张量,借助它们可以高效地对数据进行操作和建模。以下将详细介绍这些数学对象及其在深度学习中的典型用途。

数学对象概述

标量

标量是最简单的数学对象,通常表示单个数值变量,是构成高阶数据结构的基础。例如:

import numpy as np
x = 42  # 标量
print(x)

向量

向量由标量组成,表示为一维数组。根据表示方式不同,可以分为行向量和列向量。在深度学习中,向量常用于描述样本的多个特征。例如:

import numpy as np
x = np.array([1,2,3])
print(x)
print(x.shape)
print(x.reshape((3,1)))

在这里插入图片描述

在深度学习和机器学习中,向量的各个成员之间通常用于描述样本不同的特征。模型可以通过输入的这些特征量得到有用的输出,如分类标签或者是回归值。

矩阵

矩阵是由数字构成的二维数组。在矩阵中,各个元素所处的行数和列数为元素的下标。在python语言中,数组的下标是从0开始的,而在matlab语言中,数组的下标从1开始,不同语言的特点不同,需要注意。此外,在矩阵中,元素的位置由行和列索引确定。

import numpy as np
A = np.arange(12).reshape((3,4))
print(A)
print(A[1,2])
print(A[0,0])

在这里插入图片描述

此外,我们可以看到除开头可结尾的[]外,每一行的数据都由一组[]包括着,这说明numpy将二维数组当作行向量来对待,其中每一个元素也为一个行向量。

张量

张量是更高维的数组,超越矩阵的二维结构。例如,在计算机视觉中,RGB图像可以表示为形状为chw的三维张量,其中c表示通道数,h和w分别表示图像的高度和宽度。加上批量(batch size)维度后,形成四维张量。然而,不同框架可能对张量的维度顺序有不同约定,例如 ONNX 通常使用hwc。示例代码如下:

import numpy as np
t = np.arange(36).reshape(3,3,4)
print(t)

在这里插入图片描述

在计算机视觉模型推理阶段,尽管我们通常输入的是一张三维图片,但模型的输入通常还需要一个最高维度的批量大小(通常默认为1)。那么,如何对输入进行转换,将其扩展为四维数据呢?以下介绍两种方法,通过增加一个大小为1的维度来实现这一转换。

t = np.arange(36).reshape(3,3,4)
w = t[np.newaxis,:,:,:]
w2 = np.expand_dims(t,axis=0)
print(w.shape)
print(w2.shape)
print(w)
print(w2)

在这里插入图片描述

代数运算

本节主要设计向量和矩阵的计算

数组运算

标量运算中的加减乘除,以及指数等初等运算都适用于数组运算。当两个运算数组形状相同时,可以简单理解为对应位置上的元素进行运算。

import numpy as np
a = np.array([[1,2,3],[4,5,6]])
b = np.array([[7,8,9],[10,11,12]])
print(a+b)
print(a-b)
print(a*b)
print(a/b)

在这里插入图片描述

当两个数组形状不匹配时,就会涉及到NumPy的广播机制。举个例子,假设有三个人,第一个人分别拥有1个梨、2个苹果、3个香蕉和4个橘子;第二个人各类水果的数量是第一个人的两倍,第三个人则是第一个人的三倍。我们可以利用NumPy的广播机制,轻松地表示出每个人每种水果的拥有量。

import numpy as np
a = np.array([1,2,3,4])
b = np.array([[1],[2],[3]])
print(a*b)

在这里插入图片描述

其中行为4种水果,列为3个人。

向量运算

单位向量

将一个向量中的各个元素除以向量的模长,我们就能得到一个方向不变且模值为1的单位向量。

import numpy as np
v = np.array([2,-4,3])
print(v / np.sqrt((v*v).sum()))
print(v / np.sqrt(np.dot(v,v)))

在这里插入图片描述

我们既可以使用各元素平方求和开根号的方式来求得向量的模长,也可以使用内积的方式来得到。

内积

向量内积是最基础的向量运算,其计算方法如下
在这里插入图片描述

在这里插入图片描述

向量内积的结果是一个标量。向量内积满足交换律和分配律,但是不满足结合律。且内积为0的两个向量相互正交,它们之间的夹角为90°。

外积

与向量内积不同,两个向量的外积得到的是一个矩阵。个人理解,可以用前面的广播机制来理解它。向量的外积不要求两个向量具有相同数量的元素

a = np.array([1,2,3,4])
b = np.array([5,6,7])
print(np.outer(a,b))

在这里插入图片描述

叉积

叉积是定义在三维空间中的,两个向量叉积的结果是一个新的向量,这个向量垂直于这两个向量构成的平面。新向量的方向服从右手法则。
在这里插入图片描述

import numpy as np
a = np.array([1,0,0])
b = np.array([0,1,0])
c = np.array([1,1,0])
print(np.cross(a,b))
print(np.cross(a,c))

在这里插入图片描述

总结

线性代数是深度学习的基础,其数学对象和运算在数据表示和模型计算中无处不在。掌握这些基本概念和操作,将为理解和优化深度学习模型提供有力支持。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2291456.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot的配置(配置文件、加载顺序、配置原理)

文章目录 SpringBoot的配置(配置文件、加载顺序、配置原理)一、引言二、配置文件1、配置文件的类型1.1、配置文件的使用 2、多环境配置 三、加载顺序四、配置原理五、使用示例1、配置文件2、配置类3、控制器 六、总结 SpringBoot的配置(配置文件、加载顺序、配置原理) 一、引言…

CVE-2023-38831 漏洞复现:win10 压缩包挂马攻击剖析

目录 前言 漏洞介绍 漏洞原理 产生条件 影响范围 防御措施 复现步骤 环境准备 具体操作 前言 在网络安全这片没有硝烟的战场上,新型漏洞如同隐匿的暗箭,时刻威胁着我们的数字生活。其中,CVE - 2023 - 38831 这个关联 Win10 压缩包挂…

Clion开发STM32时使用stlink下载程序与Debug调试

一、下载程序 先创建一个文件夹: 命名:stlink.cfg 写入以下代码: # choose st-link/j-link/dap-link etc. #adapter driver cmsis-dap #transport select swdsource [find interface/stlink.cfg]transport select hla_swdsource [find target/stm32f4x.…

无人机图传模块 wfb-ng openipc-fpv,4G

openipc 的定位是为各种模块提供底层的驱动和linux最小系统,openipc 是采用buildroot系统编译而成,因此二次开发能力有点麻烦。为啥openipc 会用于无人机图传呢?因为openipc可以将现有的网络摄像头ip-camera模块直接利用起来,从而…

C语言 --- 分支

C语言 --- 分支 语句分支语句含义if...else语句单分支if语句语法形式 双分支 if-else 语句语法形式 悬空else含义问题描述 多分支 if-else 语句语法形式 switch...case语句含义语法形式 总结 💻作者简介:曾与你一样迷茫,现以经验助你入门 C 语…

低代码系统-产品架构案例介绍、炎黄盈动-易鲸云(十二)

易鲸云作为炎黄盈动新推出的产品,在定位上为低零代码产品。 开发层 表单引擎 表单设计器,包括设计和渲染 流程引擎 流程设计,包括设计和渲染,需要说明的是:采用国际标准BPMN2.0,可以全球通用 视图引擎 视图…

自制虚拟机(C/C++)(三、做成标准GUI Windows软件,扩展指令集,直接支持img软盘)

开源地址:VMwork 要使终端不弹出&#xff0c; #pragma comment(linker, "/subsystem:windows /ENTRY:mainCRTStartup") 还要实现jmp near 0x01类似的 本次的main.cpp #include <graphics.h> #include <conio.h> #include <windows.h> #includ…

[c语言日寄]C语言类型转换规则详解

【作者主页】siy2333 【专栏介绍】⌈c语言日寄⌋&#xff1a;这是一个专注于C语言刷题的专栏&#xff0c;精选题目&#xff0c;搭配详细题解、拓展算法。从基础语法到复杂算法&#xff0c;题目涉及的知识点全面覆盖&#xff0c;助力你系统提升。无论你是初学者&#xff0c;还是…

利用Spring Batch简化企业级批处理应用开发

1. 引言 1.1 批处理的重要性 在现代企业系统中,批处理任务用于处理大量数据,如报表生成、数据迁移、日终结算等。这些任务通常不需要实时响应,但需要高效、可靠地完成。批处理可以显著提高系统性能,减少实时系统的负载,并确保数据的完整性和一致性。 1.2 Spring Batch简…

三、js笔记

(一)JavaScript概述 1、发展历史 ScriptEase.(客户端执行的语言):1992年Nombas开发出C-minus-minus(C--)的嵌入式脚本语言(最初绑定在CEnvi软件中).后将其改名ScriptEase.(客户端执行的语言)Javascript:Netscape(网景)接收Nombas的理念,(Brendan Eich)在其Netscape Navigat…

基于SpringBoot的青年公寓服务平台的设计与实现(源码+SQL脚本+LW+部署讲解等)

专注于大学生项目实战开发,讲解,毕业答疑辅导&#xff0c;欢迎高校老师/同行前辈交流合作✌。 技术范围&#xff1a;SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容&#xff1a;…

使用LLaMA-Factory对AI进行认知的微调

使用LLaMA-Factory对AI进行认知的微调 引言1. 安装LLaMA-Factory1.1. 克隆仓库1.2. 创建虚拟环境1.3. 安装LLaMA-Factory1.4. 验证 2. 准备数据2.1. 创建数据集2.2. 更新数据集信息 3. 启动LLaMA-Factory4. 进行微调4.1. 设置模型4.2. 预览数据集4.3. 设置学习率等参数4.4. 预览…

在无sudo权限Linux上安装 Ollama 并使用 DeepSeek-R1 模型

本教程将指导你如何在 Linux 系统上安装 Ollama&#xff08;一个本地运行大型语言模型的工具&#xff09;&#xff0c;并加载 DeepSeek-R1 模型。DeepSeek-R1 是一个高性能的开源语言模型&#xff0c;适用于多种自然语言处理任务。 DeepSeek-R1 简介 DeepSeek-R1 是 DeepSeek …

蓝桥杯思维训练营(一)

文章目录 题目总览题目详解翻之一起做很甜的梦 蓝桥杯的前几题用到的算法较少&#xff0c;大部分考察的都是思维能力&#xff0c;方法比较巧妙&#xff0c;所以我们要积累对应的题目&#xff0c;多训练 题目总览 翻之 一起做很甜的梦 题目详解 翻之 思维分析&#xff1a;一开…

纯后训练做出benchmark超过DeepseekV3的模型?

论文地址 https://arxiv.org/pdf/2411.15124 模型是AI2的&#xff0c;他们家也是玩开源的 先看benchmark&#xff0c;几乎是纯用llama3 405B后训练去硬刚出一个gpt4o等级的LLamA405 我们先看之前的机遇Lllama3.1 405B进行全量微调的模型 Hermes 3&#xff0c;看着还没缘模型…

OpenAI深夜反击:o3-mini免费上线,能否撼动DeepSeek的地位?

还在为寻找合适的 AI 模型而烦恼吗&#xff1f;chatTools 平台为您精选 o1、GPT4o、Claude、Gemini 等顶尖 AI 模型&#xff0c;满足您不同的 AI 应用需求。立即体验强大的 AI 能力&#xff01; 深夜反击&#xff0c;OpenAI祭出o3-mini 在DeepSeek异军突起&#xff0c;搅动AI行…

【Linux-网络】初识计算机网络 Socket套接字 TCP/UDP协议(包含Socket编程实战)

&#x1f3ac; 个人主页&#xff1a;谁在夜里看海. &#x1f4d6; 个人专栏&#xff1a;《C系列》《Linux系列》《算法系列》 ⛰️ 道阻且长&#xff0c;行则将至 目录 &#x1f4da;一、初识计算机网络 &#x1f4d6; 背景 &#x1f4d6; 网络协议 &#x1f516;OSI七层…

使用ollama在本地部署一个deepseek大模型

文章目录 为什么选择本地化部署需要用到什么作者使用的什么环境如何根据自己的电脑或服务器配置选择自己能部署的大模型 一、Ollama1、下载Ollama2、安装Ollama 二、DeepSeek R11、下载DeepSeek R12、安装DeepSeek R1 三、ChatBox AI1、下载ChatBox AI2、安装ChatBox AI3、连接…

10 Flink CDC

10 Flink CDC 1. CDC是什么2. CDC 的种类3. 传统CDC与Flink CDC对比4. Flink-CDC 案例5. Flink SQL 方式的案例 1. CDC是什么 CDC 是 Change Data Capture&#xff08;变更数据获取&#xff09;的简称。核心思想是&#xff0c;监测并捕获数据库的变动&#xff08;包括数据或数…

【含文档+PPT+源码】基于微信小程序连锁药店商城

项目介绍 本课程演示的是一款基于微信小程序连锁药店商城&#xff0c;主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的 Java 学习者。 1.包含&#xff1a;项目源码、项目文档、数据库脚本、软件工具等所有资料 2.带你从零开始部署运行本套系统 3.该项目附带的…