【北京理工大学-Python 数据分析-1.2-NumPy数据存储与函数】

news2024/9/24 7:17:59

一、数据CSV文件的存取

  • CSV文件(Comma-Separated Value,逗号分隔值)
  • 是一种常见的文件格式,用来存储批量数据。
    如常见的数据存储为CSV后
    在这里插入图片描述
    NumPy中有两个函数可以写入CSV格式,并从CSV文件中读取数据。

CSV文件的存储

  • np.savetxt(),原则上可以存储任意格式的文件。
np.savetxt(frame,array,fmt='%.18e',delimiter=None
  • frame:文件、字符串或产生器,可以是.gz或者bz2的压缩文件。
  • array:存入文件的数组。
  • fmt:写入文件的格式,例如:%d;%.2f;%.18e。
  • delimiter:分割字符串,默认是任何空格。
a=np.arange(100).reshape(5,20)
np.avetxt('a.csv',a,fmt='%d',delimiter=',')
np.avetxt('a.csv',a,fmt='%.2f',delimiter=',')

CSV文件的读取

  • np.loadtxt()
np.loadtxt(frame,dtype=np.float,delimiter=None,unpack=False)
  • frame:文件、字符串或产生器,可以是.gz或者bz2的压缩文件。
  • dtype:数据类型,可选。
  • delimiter:分割字符串,默认是任何空格。
  • unpack:如果是False,则将读入的数据写入同一个数组,否则如果是True,读入属性将分别写入不同变量。
b=np.loadtxt('a.csv',delimiter=',')
b
b=np.loadtxt('a.csv',dtype=np.int,delimiter=',')
b

CSV文件可以很好的进行数据的存储与读取,但是CSV只能有效存储一维和二维数组,np.savetxt()和np.loadtxt()只能有效存取一维和二维数据

二、多维数据的存取
数据的储存

a.tofile(frame,sep='',format='%s')
  • frame:文件、字符串。
  • sep:数据分隔字符串,如果是空串,写入文件为二进制格式。
  • format:写入数据的格式。
a=np.arange(100).reshape(5,10,2)
a.tofile("b.dat",sep=",",format='%d')
a.tofile("b.dat",format='%d')###去掉分隔符后,存储的为二进制的文件,比商议中更节省空间。

数据的读取

np.fromfile(frame,dtype=float,count=-1,sep='')
  • frame:文件、字符串。
  • dtype:读取的数据类型。
  • count:读入元素个数,-1表示读入整个文件。
  • sep:数据分隔字符串,如果是空串,写入文件为二进制。
a=np.arange(100).reshape(5,10,2)
a.tofile("b.dat",sep=",",format='%d')
c=np.fromfile("b.dat",dtype=np.int,sep=",")##读出的是一个一维文件,使得原文件的维度丢失
c=np.fromfile("b.dat",dtype=np.int,sep=",").reshape(5,10,2)##在知道原数据的维度信息和元素类型的时候,使用reshape()函数,可以还原原数据的数据维度和元素,但是前提需要提前知道数据的维度信息

numpy的便捷文件存取

np.save(fname,array)或者np.savez(fname,array)
np.load(fname)
np.save(fname,array)
  • frame:文件名,以.npy为扩展名,压缩扩展名为.npz。
  • array:数组变量。
np.load(fname)
  • fname:文件名,以.npy为扩展名,压缩扩展名为.npz。
 a=np.arange(100).reshape(5,10,2)
 np.save("a.npy",a)
 b=np.load("a.npy")
 b

为什么np.save()函数能这么神奇的还原数据的维度和元素信息呢?
使用二进制的方式读取np.save()保存的数据,可以看到存储的数据是以二进制的形式储存的,且在储存的文件的第一行中记录了原文件的维度和数据类型,因此在使用np.load()函数读取的时候,直接将原来存储的二进制文件按原格式进行读取了,因此很便捷还原原文件的信息。

介绍多种数据读取和存储的方法的原因是:

  • 程序间需要使用数据文件缓存,可以便捷的使用save和load函数进行文件读取
  • 如果需要与其他的程序间进行数据交互和对接,需要采用通用的数据格式如CSV进行程序间的数据交换,此时就需要使用tofile()和fromfile()函数进行读取和存储。

NumPy库的随机函数子库random
四个基本函数

函数说明
rand(d0,d1,…,dn)根据d0-dn创建随机数数组,浮点数,[0,1),均匀分布
randn(d0,d1,…,dn)根据d0-dn创建随机数数组,标准正态分布
randint(low[,high,shape])根据shape创建随机整数或整数数组,范围是[low,high)
seed(s)随机种子数,s是给定的种子值
import numpy as np
a=np.random.rand(3,4,5)##随机生成0-1之间的随机数组
a

sn=np.random.randn(3,4,5)##随机生成一组正态分布的随机数(包括负数)
sn

b=np.random.randint(100,200,(3,4))##根据shape生成整数型的随机数组
b

c=np.random.seed(10)##使用随机数种子可以保证每次生成的随机数组相同,当后续如果需要再次使用该随机数组,调用相同的种子序列,可获得相同的随机序列数组用于后续测试。

较高级的随机序列函数

函数说明
shuffle(a)根据数组a的第一轴进行随机排序,改变数组X,是一个混淆函数
permutation(a)根据数组a的第一轴产生一个新的乱序数组,不改变数组X
choice(a[,size,replace,p])从一维数组a中依概率p抽取元素,形成size形状新数组,replace表示是否可以重用元素,默认为False
import numpy as np
a=np.random.randint(100,200,(3,4))
np.random.shuffle(a)##根据数组a的第一轴进行随机排序,改变数组X
np.random.permutation(a)##根据数组a的第一轴产生一个新的乱序数组不改变数组X
a
import numpy as np
b=np.random.randint(100,200,(8,))
b
np.random.choice(b,(3,2))##随机放回抽取,可以抽到重复的数字
np.random.choice(b,(3,2),replace=False)##replace=Flase表示,随机不放回的抽取,因此抽取的结果是不重复的数据
np.random.choice(b,(3,2),p=b/np.sum(b))##这里的p是抽取的概率,这里设置的概率是元素的值越大,抽取的概率越大

np.random的随机函数

函数说明
uniform(low,high,size)产生具有均匀分布的数组,low起始值,high结束值,size是形状
normal(loc,scale,size)产生具有正态分布的数组,loc均值,scale标准差,size形状
poisson(lam,size)产生具有泊松分布的数据,lam随机事件发生率,size形状
import numpy as np
u=np.random.uniform(0,10,(3,4))
u
n=np.random.normal(10,5,(3,4))
n
p=np.random.poisson(10,(2,5))
p

NumPy的统计函数
np.random的统计函数(1)

函数说明
sum(a,axis=None)根据给定轴axis计算数组a相关元素之和,axis整数或元组
mean(a,axis=None)根据给定轴axis计算数组a线管元素的期望,axis整数或元组
average(a,axis=None,weights=None)根据给定轴axis计算数组a相关元素的加权平均值
std(a,axis=None)根据给定轴axis计算数组a相关元素的标准差
var(a.axis=None)根据给定轴axis计算数组a相关元素的方差

说明:axis=None是统计函数的标配参数

import numpy as np
a=np.arange(15).reshape(3,5)
a
np.sum(a)
np.mean(a,axis=1)
np.mean(a,axis=0)
np.average(a,axis=0,weights=[10,5,1])
np.std(a)
np.var(a)

np.random的统计函数(2)

函数说明
min(a);max(a)计算数组a中元素的最小值、最大值
argmin(a);argmax(a)计算数组a中元素最小值、最大值的降一维后的下标
unravel_index(index,shappe)根据shape将一维下标index转换成多为下标
ptp(a)计算数组中元素最大值与最小值的差
median(a)计算数组a中元素的中位数(中值)
import numpy as np
b=np.arange(15,0,-1).reshape(3,5)##这里的-1表示倒序生成数组
np.max(b)
np.argmax(b)##扁平化后的下标
np.unravel_index(np.argmax(b),b.shape)##重塑成多维下标
np.ptp(b)
np.median(b)

Numpy的梯度函数

函数说明
np.gradient(f)计算数组f中元素的梯度,当f为多维时,返回每个维度梯度

梯度:连续值之间的变化率,即斜率。

举个例子:在XY坐标轴连续三个X坐标对应的Y轴值是:a,b,c,其中b的梯度是:(c-a)/2

import numpy as np
a=np.random.randint(0,10,(5))
##:array([9, 1, 6, 9, 0])##对于起始端点的值,梯度为后一个值减去自身然后除以距离,终点值是其自身,减去上一个值,然后除以距离(为1)。
np.gradient(a)
##:array([-8. , -1.5,  4. , -3. , -9. ])##-1.5为两侧值,为该点的后一个值和前一个值的差除以距离(距离为2)。
b=np.random.randint(0,20,(5))
##:array([11,  6,  7, 11, 13])
np.gradient(b)
##:array([-5. , -2. ,  2.5,  3. ,  2. ])

多维数组

import numpy as np
c=np.random.randint(0,50,(3,5))
np.gradient(c)

在这里插入图片描述
单元小结:
数据的存取与函数

CSV文件

  • np.loadtxt()

  • np.savetxt()
    多维数据存取

  • a.tofile()

  • np.fromfile()

  • np.save()

  • np.savez()

  • np.load()
    随机函数

  • np.random.rand()

  • np.random.randn()

  • np.random.randint()

  • np.random.seed()

  • np.random,choice()

  • np.random.permutation()
    NumPy的统计函数

  • np.sum()

  • np.mean()

  • np.average()

  • np.std()

  • np.var()

  • np.median()

  • np.min()

  • np.max()

  • np.argmin()

  • np.argmax()

  • np.unravel_index()

  • np.ptp()
    NumPy的梯度函数

  • np.gradient() 用于分析数据的变化速率,可用于图象、声音等数据的分析。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/140815.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mysql中的rand()函数简介以及和其他函数组合使用实践

一、本文结构简介 本文首先介绍rand()的基本使用 其次分别介绍round与rand的合用、ceiling与rand的合用、floor与rand的合用、md5与rand的合用 二、rand()的基本使用 rand()是系统自带的获取随机数的函数 (1)无参数:产生获取[0,1)之间的float型的数字 (2)有参数&a…

【jQuery】写一个电梯导航

今天大概是跟着pink老师学习JS的第八天&#xff0c;看了有410章了。 视频教程&#xff1a;pink JS 今天早上跟着老师做了一个电梯导航&#xff1a; 还是那个熟悉的品优购项目。。。 之后我打算自己练习一下&#xff0c;然后就出现bug了。 <div class"tuijian"&…

CO13 订单取消确认报错:“在为订单XXXX 确定实际成本中出错”处理分析

用户再操作CO13时报了一个错误&#xff1a;在为订单XXXX 确定实际成本中出错。 看到这个错误以为是财务同时没有发布成本导致的。然后我也操作了一下发现了一些过账中的错误。 原来是冲销这个工单的账期是在前几个月&#xff0c;而那个月已经关账期了&#xff0c;所以报错。 …

ORB-SLAM3代码和算法学习—浅谈代码中的纯定位模式

0总述 在Tracking线程中&#xff0c;当系统初始化完成后就会正式进入跟踪环节。在ORB-SLAM3算法代码中提供了两种模式&#xff0c;一种是纯定位模式&#xff0c;一种是定位建图的SLAM模式。 对于纯定位模式&#xff0c;在源码中由成员变量mbOnlyTracking控制&#xff0c;这个…

django 利用Form上传文件到 media 文件夹

背景&#xff1a;利用 Form 收集用户提交的信息&#xff0c;包括字符串和文件对象&#xff0c;文件保存在项目的 media 文件夹&#xff0c;因为 static 文件一般是用来存静态文件 css 或者项目所需要的图片&#xff0c;用户上传的文件应该保存在其他文件夹; 1、 启用 media&am…

实战演练 | 使用 SQL 别名简化查询并自定义结果

别名能够在不影响基础表或视图的情况下临时重命名表或列。作为大多数甚至所有关系数据库管理系统都支持的 SQL 功能&#xff0c;别名是简化查询和/或自定义结果集中列标题的好方法。在这篇文章中&#xff0c;我们将使用 Navicat Premium 16 来完成这两项工作。重命名列许多数据…

十级NLPer才能笑出声的算法梗!

文&#xff5c;付奶茶近期小编整理出了一些非常好笑的梗图&#xff0c;与各位NLPer共赏&#xff0c;希望与大家一起评选出本期最好笑的梗图选手&#xff01;【1号选手&#xff1a;非常擅长讲笑话的NLM】前排评论区&#xff1a;&#xff08;1&#xff09;I enjoyed your joke ab…

Android 深入系统完全讲解(一)

因为很多朋友还是会咨询 Android 相关的内容&#xff0c;于是便花费了一些时间&#xff0c;把我总结的方法&#xff0c;一些系统代码的跟踪流程&#xff0c;做一个完整的梳理&#xff0c; 算是给自己职业生涯画个完美的句号。 虽然说后续写代码会相对少一些&#xff0c;但是还…

P1044 [NOIP2003 普及组] 栈

P1044 [NOIP2003 普及组] 栈 方法一&#xff1a;递推dp 思路&#xff1a; 求n的总数&#xff0c;我们可以分解成n在第i&#xff08;1<i<n)位置输出讨论。 我们用a[i][j]表示数i在第j位置输出的情况总数&#xff0c;ans[i][j]表示数i在第1--j位置输出总数和 1&#x…

ROS地图栅格信息

一.地图栅格消息nav_msgs/OccupancyGrid // 栅格地图消息 std_msgs/Header header nav_msgs/MapMetaData info time map_load_time float32 resolution // 分辨率 geometry_msgs/Pose origin // 原点坐标 geometry_msgs/Quaternion orientati…

元数据管理Datahub基于Docker进行部署

目录1. 服务器要求2. 安装Docker3. 安装jq4. 安装python35. 安装docker-compose v1(deprecated&#xff0c;为了兼容性)5.1 安装virtualenv5.2 安装docker-compose6. 安装datahub(在docker-compose-v1-py虚拟环境下)7. 访问Web页面&#xff0c;然后导入测试元数据8. 删除datahu…

数字孪生的概念是什么【深度】

数字孪生技术最早提出是用于航空航天领域&#xff0c;美国 NASA 指出“一个数字孪生&#xff0c;是一种集成化了的多种物理量、多种空间尺度的运载工具或系统的仿真&#xff0c;该仿真使用了当前最为有效的物理模型、传感器数据的更新、飞行的历史等等&#xff0c;来镜像出其对…

C语言C++中与接收、输出字符相关的问题

C语言中&#xff0c;在使用scanf("%c",&data);读取一个字符时&#xff0c;有时会遇到scanf吞回车符的情况。 这里搜到几种常用的解决方法&#xff1a; 1.在scanf()中使用’\n’屏蔽回车符号。 scanf("\n%c",&c);2.在scanf()格式串最前面添加空格&…

【Linux】缓冲区的理解

文章目录什么是缓冲区&#xff1f;为什么要有缓冲区&#xff1f;缓冲区刷新策略请看下面代码&#xff1a;接着上篇【Linux】文件操作|文件描述符|重定向 什么是缓冲区&#xff1f; 我们口中说的缓冲区&#xff0c;一般指的是用户级语言层面给我们提供的缓冲区。本质就是一段…

nRF24L01芯片(模块)介绍

nRF24L01芯片&#xff08;模块&#xff09;简介nRF24L01是由NORDIC生产的工作在2.4GHz~2.5GHz的ISM 频段的单片无线收发器芯片。无线收发器包括&#xff1a;频率发生器、增强型“SchockBurst”模式控制器、功率放大器、晶体振荡器、调制器和解调器。输出功率频道选择和协议的设…

使用 K8S 部署 RSS 全套自托管解决方案- RssHub + Tiny Tiny Rss

前言 什么是 RSS? RSS 是一种描述和同步网站内容的格式&#xff0c;是使用最广泛的 XML 应用。RSS 搭建了信息迅速传播的一个技术平台&#xff0c;使得每个人都成为潜在的信息提供者。发布一个 RSS 文件后&#xff0c;这个 RSS Feed 中包含的信息就能直接被其他站点调用&…

【MySQL】SQL查询语句在MySQL中的执行过程

文章目录1.MYSQL基础架构2.连接器3.查询缓存4.解析SQL5.执行SQL5.1 预处理器5.2 优化器5.3 执行器6.总结1.MYSQL基础架构 连接器&#xff1a;建立连接、管理链接、校验用户身份查询缓存&#xff1a; 查询语句如果命中查询缓存则直接返回&#xff0c;否则继续往下执行。&#xf…

基于Java+SpringBoot+vue+element疫情物资捐赠分配系统设计和实现

基于JavaSpringBootvueelement疫情物资捐赠分配系统设计和实现 &#x1f345; 作者主页 超级帅帅吴 &#x1f345; 欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; &#x1f345; 文末获取源码联系方式 &#x1f4dd; 文章目录基于JavaSpringBootvueelement疫情物资捐赠分配…

不能你说对不起,别人就一定要说没关系——与九迁沟通他的冲动和错误

今天的事情是最近三天九迁与他奶奶之间发生的事情。先说前面在谈事件&#xff0c;这个事情的发生&#xff0c;首先说明我母亲的身体还可以&#xff0c;没有被感染&#xff0c;因为还能和孩子生气&#xff0c;说明熊胆粉确实是在起作用&#xff0c;关于熊胆粉的文章请看&#xf…

FGH40N60SMD 600V 80A 349W 逆变器高频IGBT单管

FGH40N60SMD 600V 80A 349W 逆变器高频IGBT单管 &#xff0c;为光伏逆变器、UPS、焊机、通讯、ESS 和 PFC 等低导通和开关损耗至关重要的应用提供最佳性能。IGBT单管系列&#xff1a;FGH40N60SMDFGH60N60SMDFGH75T65SHD-F155 NGTB40N120FL2WG特性&#xff1a;1.最大结温 T[siz…