Tensorflow 入门基础——向LLM靠近一小步

news2024/11/26 12:13:08

进入tensflow的系统学习,向LLM靠拢。

目录

  • 1. tensflow的数据类型
    • 1.1 数值类型
    • 1.2 字符串类型
    • 1.3 布尔类型的数据
  • 2. 数值精度
  • 3. 类型转换
    • 3.1 待优化的张量
  • 4 创建张量
    • 4.1 从数组、列表对象创建
    • 4.2 创建全0或者1张量
    • 4.3 创建自定义数值张量
  • 5. 创建已知分布的张量(正态和均匀分布)
  • 6 创建序列
  • 参考资料

1. tensflow的数据类型

1.1 数值类型

数值类型的张量是tensorflow主要的数据载体,根据维度数来区分,可分为:

  • 标量Scalar:单个实数,如1,2,3,4等,维度数为0,shape为[]
  • 向量Vector:n个实数的有序集合,如[1,2,5,62,21]等,维度为1,长度不定,shape为[n]
  • 矩阵Matrix:n行m列实数的有序集合,如[[1,23],[2,32],[5,23]]的矩阵,维度数为2,每个维度上长度不定,shape为[n,m]
  • 张量Tensor:所有维度数dim >2的数据统称为张量。张量的每个维度也作为轴Axis,一般维度代表了具体的业务含义,例如shape的张量[2,32,32,3]的张量共有4维,如果表图片数据,每个维度分别代表图片数量、图片高度、图片宽度、图片通道数,其中2代表了2张图片,32代表了高,宽均为32,3代表了RGB的3个通道。

在tensorflow中,一般将标量、向量、矩阵也都统称为张量,不作区分需要根据张量的维度数和形状自行判断。

  1. 创建一个标量,并查看数据类型
a=1.1 ##python的普通常量
type(a)
import tensorflow as tf
b=tf.constant(2.2) #tf的张量
type(b)

结果:(张量只能通过tf的函数去创建,不能使用python的普通语法创建)
在这里插入图片描述
2. 创建一个向量并展示向量信息

c=tf.constant([1,23,4,5,56])
c

结果:(id是tensorflow中内部索引的对象编号,shape表示张量的形状,dtype代表张量数职的精度值,张量numpy()方法可以返回Numpy.array类型的数据,方便到处数据到系统其他模块)
在这里插入图片描述

#将数据导出为numpy的array类型
c.numpy()

在这里插入图片描述
3. 与标量不同,向量的定义碧玺通过list传给tf.constant() 函数,例如创建一个和多个元素的向量:

##将一个元素的list转换为张量
d=tf.constant([1.2])

在这里插入图片描述

##多个元素的list转换为张量
e=tf.constant([1.2,13,14,151,15,15])

在这里插入图片描述
4. 创建矩阵张量原理同list

#创建矩阵张量
f=tf.constant([[1,2,3,4],[5,6,7,8]])
f

在这里插入图片描述

1.2 字符串类型

TF除了支持数值类型的张量之外,还支持字符串类型的数据,例如在表示图片数据时,可以先记录图片的路径字符串,再通过预处理函数根据路径读取图片张量。

  1. 创建字符串张量
a=tf.constant('hello,DEEP learning!')
a

在这里插入图片描述

  1. tf还提供了一些2字符串类型的工具函数,如小写化lower()、拼接join()、长度length()、切分split()等。
tf.strings.lower(a) #小写化字符串

在这里插入图片描述
但是在tf中最常用的还是数字类型的数据,因此字符类型的数据的函数不做过多赘述。

1.3 布尔类型的数据

为了方便表达比较运算操作的结果,tf还支持布尔类型的张量,布尔类型张量只需要传入python语言的布尔类型数据,转换成为内部布尔类型即可。

  1. 创建布尔类型的张量
a=tf.constant(True)
a

在这里插入图片描述
2. 创建布尔类型的向量

b=tf.constant([True,False])
b

在这里插入图片描述
3. tf的布尔类型和python的布尔类型并不等价,不能通用

a=tf.constant(True)
a is True

在这里插入图片描述

2. 数值精度

对于数值类型的张量,可以保存为不同字节长度的精度,如浮点数3.14即可以保存为16位(bit)长度,也可以保存为32位甚至64位的精度。位越长,精度越高,同时占用的空间也就越大,常用的精度类型有tf.int16、tf.int32、tf.int64、tf.int64、tf.float16、tf.float32、tf.float64等,其中tf.float64即为tf.double。

tf.constant(123456789,dtype=tf.int16)
tf.constant(123456789,dtype=tf.int32)

在这里插入图片描述
可以看到,保存精度过低,数据123456789发生了溢出,得到了错位的结果,一般使用tf.int32、tf.int64精度,对于浮点数,高精度的张量可以表示更精准的数据,例如:采用tf.float32精度2保存’pai’ 时,实际保存为的数据位3.1415927.

import numpy as np
np.pi
tf.constant(np.pi,dtype=tf.float32)

在这里插入图片描述
如果采用tf.float64精度保存,则能够获得更高的精度,实现如下:

tf.constant(np.pi,dtype=tf.float64)

在这里插入图片描述

3. 类型转换

系统的每个模块使用数据类型,数值类型可能各不相同,对于不符合要要求的张量的类型及精度,需要通过tf.cast函数进行转换,例如:

a=tf.constant(np.pi,dtype=tf.float16)
tf.cast(a,tf.double)

在这里插入图片描述
进行类型转换时,需要保证转换操作的合法性,例如将高精度的张量转换为低精度的张量时,可能发生数据溢出隐患:

a=tf.constant(123456789,dtype=tf.int32)
tf.cast(a,tf.int16)

在这里插入图片描述
布尔类型与整型之间互信转型是合法的,是比较常见的操作:

a=tf.constant([True,False])
tf.cast(a,tf.int32)

在这里插入图片描述
一般末日0表示false,1表示True,在tf中,将非0数字,都视为True,例如:

a=tf.constant([-1,0,1,2])
tf.cast(a,tf.bool)

在这里插入图片描述

3.1 待优化的张量

为了区分需要计算梯度信息的张量与不需要计算梯度信息的张量,TF增加了一种专门的数据类型来支持梯度信息的记录:tf.Variable。tf.Variable类型在普通的张量类型的基础上增加了name、trainable等属性来支持计算图的构建。由于梯度运算会消耗大量的计算资源,而且会自动更新相关参数,对于不需要优化的张量,如何神经网络的输入X,不需要通过tf.Variable封装;相反,对于需要计算梯度优化的张量,如神经网络层的W和b,需要通过tf.Variable包裹以便TF跟踪梯度信息。
例如tf.Variable() 函数可以将普通张量转换为待优化的张量:

d=tf.constant([-1,0,1,2])#创建tf张量
b=tf.Variable(d)#转换为variable类型

在这里插入图片描述
其中name和trainable是variable特有的属性,name属性用于命名计算图中的变量,这趟命名体系是TF内部维护的,一般不需要用户关注name属性,trainable属性表示当前张量是否被优化,创建variable对象时是默认启用优化标志,可以设置trainable=false来设置张量不需要优化。
除了通过普通的方式创建variable,就可以之间创建,例如:

a=tf.Variable([1,2],[3,4])#直接创建variable张量
a

在这里插入图片描述

4 创建张量

创建tf中,可以通过多种方式创建张量,如从python列表对象创建,从numpy数组创建,或者创建采样自某种已知分布的张量等。

4.1 从数组、列表对象创建

Numpy array 数据和python list 列表是python程序中间非常重要的数据载体,很多数据通过python语言将数据加载至array 或者 list,再转化为Tensor类型,通过TF运算处理后导入到array或者list。方便其他模块调用。
通过tf.convert_to_tensor函数可以创建新Tensor,并保存在python list 对象或者numpy array 对象中的数据导入到Tensor:

tf.convert_to_tensor([1,2.])

在这里插入图片描述

import numpy as np
tf.convert_to_tensor(np.array([[1,2],[3,4]]))

在这里插入图片描述
注意,numpy 浮点数数组默认使用64位精度保存数组,转换到tensor类型时精度位tf.float64,可以在需要时将其转换为tf.float32类型。
实际上,tf.constant() 和tf.convert_to_tensor() 都能够自动地把numpy 数组或者python列表数据类型转化为Tensor类型。

4.2 创建全0或者1张量

将张量创建为全0或者全1数据是非常常见的张量初始化手段。考虑线性变换y=wx+b,将权值权值矩阵w初始化为全1矩阵,偏置b初始化为全0的向量,此时线性变化层输出y=x,因此是一种比较好的层初始化状态,通过tf.zero() 和 tf.ones() 即可创建任意形状,且内容全0或者全1的张量。创建全0和1的标量:

tf.zeros([]) #创建全0的标量
tf.ones([]) #创建全1的标量

在这里插入图片描述
创建全0和全1的向量:

tf.zeros([1]) #创建全0的向量
tf.ones([1]) #创建全1的向量

在这里插入图片描述
通过tf.zeros_like,tf.ones_like 可以方便地新建与某个张量shape 一致,且内容为全0或全1的张量。例如创建一张张量A形状一样的全0张量:

a=tf.ones([2,3])
tf.zeros_like(a)

在这里插入图片描述

a=tf.zeros([3,2])
tf.ones_like(a)

在这里插入图片描述
tf. *_like 是一系列的便捷函数,可以通过tf.zero(a.shape)等方式实现。

4.3 创建自定义数值张量

除了初始化为全0,或者全1的张量之外,有时也需要全部初始化为某个自定义数值的张量,例如将张量的数值全量初始化为-1等。
通过tf.fill(shape,value),可以创建全自定义数值value的张量,形状有shape参数制定。例如:

  • 创建所有元素为-1的标量:
tf.fill([],-1) #创建-1的标量

在这里插入图片描述

  • 创建所有元素为-1的向量
tf.fill([1],-1)#创建-1的向量

在这里插入图片描述

  • 创建所有元素为99的向量
tf.fill([2,2],99)#创建2行2列,元素全为99的矩阵

在这里插入图片描述

5. 创建已知分布的张量(正态和均匀分布)

正态分布和均匀分布是常见的分布之一,通过tf.random.normal(shape,mean=0.0,stddev=1.0) 可以创建形状为shape,均值mean,标准差为stddev的正态分布N(mean,stddev^3)。例如,创建均值为0,标准差1的正态分布:

tf.random.normal([2,2])

在这里插入图片描述
创建均值为1,标准差为2的正态分布

tf.random.normal([2,2],mean=1,stddev=2)

在这里插入图片描述
通过tf.random.uniform(shape,minval=0,maxval=none,dtype=tf.float32)可以创建采样自[minval,maxval]区间的均匀分布的张量。例如:

tf.random.uniform([2,2])#创建采样自区间[0,1],shape=[2,2]的矩阵:

在这里插入图片描述
创建采样区间在[0.10],shape为[2,2]的矩阵:

tf.random.uniform([2,2])

在这里插入图片描述
如果需要均匀采样整型类型的数据,就必须指定采样区间最大值maxval参数,同时指定数据类型为tf.int*类型:

tf.random.uniform([2,2],maxval=100,dtype=tf.int32)#创建采样自[0.100]均匀缝补的整形矩阵

在这里插入图片描述

6 创建序列

如果需要快速创建序列,可以使用range( x,delta=1)函数,创建[0,x),步长为delta的整型序列

tf.range(10)#创建步长为1,0-10的数据序列

在这里插入图片描述

tf.range(10,delta=2)#创建步长为2,0-10的数据序列

在这里插入图片描述
创建[2,10),步长为2的序列:

tf.range(2,10,delta=2)

在这里插入图片描述

参考资料

  • TensorFlow深度学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1399939.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用Scrapy 爬取“http://tuijian.hao123.com/”网页中左上角“娱乐”、“体育”、“财经”、“科技”、历史等名称和URL

一、网页信息 二、检查网页,找出目标内容 三、根据网页格式写正常爬虫代码 from bs4 import BeautifulSoup import requestsheaders {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/53…

react中数据不可变

先看官网 一、不可变数据的概念 不可变数据意味着数据一旦创建,就不能被更改。在React中,每次对数据的修改都会返回一个新的数据副本,而不会改变原始数据。这种方式确保了数据的稳定性和一致性。 二、Props中的不可变数据 在React中&#xf…

04 思维导图的方式回顾ospf

思维导图的方式回顾OSPF 1 ospf 领行学习思维导图 1.1 ospf 的工作过程 建立领据表同步数据库计算路由表1.2 ospf 的状态 1.3 ospf的报文 1.4 ospf的L

maven 基本知识/1.17

maven ●maven是一个基于项目对象模型(pom)的项目管理工具,帮助管理人员自动化构建、测试和部署项目 ●pom是一个xml文件,包含项目的元数据,如项目的坐标(GroupId,artifactId,version )、项目的依赖关系、构建过程 ●生命周期&…

若依微服务框架,富文本加入图片保存时出现JSON parse error: Unexpected character (‘/‘ (code 47)):...

若依微服务框架,富文本加入图片保存时出现JSON parse error: Unexpected character 一、问题二、解决1.修改网关配置2、对数据进行加密解密2.1安装插件2.2vue页面加密使用2.3后台解密存储 一、问题 若依微服务项目在使用富文本框的时候,富文本加入图片进…

谈判(贪心算法)

题目 import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Scanner;public class Main {public static void main(String[] args) { Scanner sc new Scanner(System.in);int n sc.nextInt();sc.nextLine();List<Integ…

Linux——进程等待

&#x1f4d8;北尘_&#xff1a;个人主页 &#x1f30e;个人专栏:《Linux操作系统》《经典算法试题 》《C》 《数据结构与算法》 ☀️走在路上&#xff0c;不忘来时的初心 文章目录 一、为什么要进程等待二、进程等待的方法1、wait方法2、waitpid方法 三、获取子进程status 一…

RT-Thread experimental 代码学习(1)thread_sample

RTOS的最基础功能是线程。 线程的调度是如何工作的&#xff1f;RT-thread官方的实验文档是最好的参考。 老规矩&#xff0c;先放法国人doxygen。 thread_sample 代码的调用关系图 有意思的是&#xff0c;RT有两种创建线程的方式 - 静态和动态&#xff0c;粗略的理解是&…

读元宇宙改变一切笔记11_区块链

1. 区块链 1.1. 由一个去中心化的“验证者”网络所管理的数据库 1.2. 一些观察者认为区块链是在结构上实现元宇宙的必要条件&#xff0c;而其他人则认为这种说法是荒谬的 1.3. 与集中式数据库不同&#xff0c;区块链记录不存储在单个位置&#xff0c;也不由单方管理 1.3.1.…

手把手教你购买阿里云服务器以及Ubuntu环境下宝塔搭建网站

阿里云服务器Ubuntu通过宝塔搭建网站详细教程 前言一、阿里云服务器的购买二、进入控制面板2.1 修改密码2.2 开放端口号 三、 测试服务器是否可以连接四、 安装nginx搭建网站(选做)五、安装宝塔5.1 登录宝塔官网5.2 卸载预装的mysql和nginx5.3 安装宝塔5.4 访问宝塔控制台5.5 修…

【数据结构】 顺序表的基本操作 (C语言版)

一、顺序表 1、顺序表的定义&#xff1a; 线性表的顺序存储结构&#xff0c;即将表中的结点按逻辑顺序依次存放在一组地址连续的存储单元里。这种存储方式使得在逻辑结构上相邻的数据元素在物理存储上也是相邻的&#xff0c;可以通过数据元素的物理存储位置来反映其逻辑关系。…

【Go面试向】实现map稳定的有序遍历的方式

问题 大家好 我是寸铁&#x1f44a; 总结了一篇实现map稳定的有序遍历的方式探讨的文章✨ 喜欢的小伙伴可以点点关注 &#x1f49d; 你对 map 了解多少&#xff1f;如果要实现第一个稳定的有序遍历有哪些方式&#xff1f; 回答 你对 map 了解多少&#xff1f; 我对map有一定的…

20234.1.20 使用idea进行Java的helloworld程序开发

20234.1.20 使用idea进行Java的helloworld程序开发 idea毕竟是jtbrain的产品&#xff0c;整体和pycharm相同&#xff0c;初步使用感受比eclipse更亲切 一、程序结构 project&#xff08;项目&#xff0c;工程&#xff09; module&#xff08;模块&#xff09; package&…

Halcon基于描述符的模板匹配

Halcon基于描述符的模板匹配 与基于透视形变的模板匹配类似&#xff0c;基于描述符的模板匹配能够在物体处于透视形变的状态下进行匹配&#xff0c;并且已标定和未标定的相机图像都适用。与透视形变不同的是&#xff0c;它的模板不是根据边缘轮廊创建的&#xff0c;而是根据特…

【每日一题】1. 牛客网——合并两个有序数组

&#x1f4da;博客主页&#xff1a;爱敲代码的小杨. ✨专栏&#xff1a;《Java SE语法》 ❤️感谢大家点赞&#x1f44d;&#x1f3fb;收藏⭐评论✍&#x1f3fb;&#xff0c;您的三连就是我持续更新的动力❤️ &#x1f64f;小杨水平有限&#xff0c;欢迎各位大佬指点&…

hot100:06三数之和

题目链接&#xff1a; 力扣&#xff08;LeetCode&#xff09;官网 - 全球极客挚爱的技术成长平台 算法思想&#xff1a; 使用双指针的思想&#xff0c;首先需要先对数组进行排序&#xff0c;让数组满足单调性&#xff0c;这样在相加的时候更加方便更新条件&#xff1b;再遍历…

代码随想录二刷 | 二叉树 | 修剪二叉搜索树

代码随想录二刷 | 二叉树 | 修剪二叉搜索树 题目描述解题思路代码实现 题目描述 669.修剪二叉搜索树 给定一个二叉搜索树&#xff0c;同时给定最小边界 L 和最大边界 R。通过修剪二叉搜索树&#xff0c;使得所有节点的值在[L, R]中 (R>L) 。你可能需要改变树的根节点&…

Spring RabbitMQ那些事(3-消息可靠传输和订阅)

目录 一、序言二、生产者确保消息发送成功1、为什么需要Publisher Confirms2、哪些消息会被确认处理成功 三、消费者保证消息被处理四、Spring RabbitMQ支持代码示例1、 application.yml2、RabbigtMQ配置3、可靠生产者配置4、可靠消费者配置5、测试用例 一、序言 在有些业务场…

安装MySQL8.0

安装MySQL8.0 第一步我们先把MySQL8.0的镜像拉一下&#xff08;建议在网络好的情况下 下拉镜像&#xff09; 之后我们在创造一个容器 conf目录 必须提前上传my.cnf文件到/data/conf目录 并且它与window中的配置文件my.ini后缀名是不一样 data目录 数据保存到宿主机中&#x…

Laya3.0 相机使用

摄像机&#xff0c;是3D场景里边最经常使用的对象了。 官方文档&#xff1a;点击这里学习 1.投影 Projection 透视&#xff1a; 模拟人眼的视觉效果&#xff0c;近大远小。模拟物理世界的规律&#xff0c;将眼睛或相机抽象成一个点&#xff0c;此时视锥体内的物体投影到视平…