python学习——NumPy数值计算基础

news2024/9/28 7:28:01

目录

  • NumPy数值计算基础
  • 1.array创建数组及其属性
  • 2.其他创建方式
  • 3.数据类型及其转换
  • 4.生成随机数
  • 5.数组的索引和切片
  • 6.改变数组形态
    • 【案例】两个国家的数据方法一起来研究分析,同时保留国家的信息(每条数据的国家来源),应该怎么办
  • 7.创建numpy矩阵
  • 8.矩阵运算
  • 9.ufunc函数
  • 10.利用numpy进行统计分析
    • (1) 二进制数据存储
    • (2) 统计分析
    • 1) 排序Sort,Argsort,lexsort
    • 2) 去重unique与重复数据
    • 3) 统计函数


NumPy数值计算基础

nan:不是一个数,0除0,属于float类型
inf:无限,3除0

nan(NAN,Nan): not a number表示不是一个数字
什么时候numpy中会出现nan:
  当我们读取本地的文件为float的时候,如果有缺失,就会出现nan
  当做了一个不合适的计算的时候(比如无穷大(inf)减去无穷大)

inf(-inf,inf):infinity,inf表示正无穷,-inf表示负无穷
什么时候回出现inf包括(-inf,+inf)
  比如一个数字除以0,(python中直接会报错,numpy中是一个inf或者-inf)

  1. a=b 完全不复制,a和b相互影响
  2. a = b[:],视图的操作,一种切片,会创建新的对象a,但是a的数据完全由b保管,他们两个的数据变化是一致的,
  3. a = b.copy(),复制,a和b互不影响

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

1.array创建数组及其属性

import numpy as np 
ar=np.array([[1.2,8,5,8],[1,3,5,2],[5,24,7,7]])
print(ar)
print(ar.shape)    #数组结构
print(ar.dtype)    #数组类型
print(ar.size)     #数组元素个数
print(ar.itemsize) #数组每个元素大小

2.其他创建方式

np.arange(0,1,0.1)     # 0到1,不包括1,间隔为0.1
np.linspace(0, 1, 12)  #0到1生成12个数
np.logspace(0, 2, 20)) #1(102)到100(102)之间,20个等比数列
np.zeros((2,3)         #2x3零矩阵
np.eye(3)              #单位矩阵
np.diag([1,2,3,4]))    #对角阵
np.ones((5,3)))        #所有元素都为1

3.数据类型及其转换

np.float64(42)  #整型转换为浮点型
np.int8(42.0)   #浮点型转换为整型
np.bool(42)     #整型转换为布尔型
np.bool(0)      #整型转换为布尔型
np.float(True)  #布尔型转换为浮点型
np.float(False) #布尔型转换为浮点型
#创建一个餐饮数据库
import numpy as np
df = np.dtype([("name", np.str_, 40), ("numitems", np.int64),
    ("price",np.float64)])#创建数据类型
its=np.array([("tomato",42,5.4),("potato",50,6.6)])#定义数组数据
print('数据类型为:',df["name"])
print('数据类型为:',np.dtype(df["name"]))
print('自定义数据为:',its)

4.生成随机数

在这里插入图片描述

np.random.random(100) 
np.random.rand(10,5)                  #均匀分布的随机数
np.random.randn(10,5))                #正态分布的随机数
np.random.randint(2,10,size =[2,5]))#不小于2,不大于10的2行5列数组

5.数组的索引和切片

import numpy as np
a=np.arange(12).reshape(3,4)
print(a[[0,2],[1,3]])#取相应位置的四个元素
print(a[0:2,1:3])#取行和列的元素
a[a<4]=2 #布尔运算
a[a>5]=0
np.where(a<5,0,1) #三元运算符
b=a.clip(2,3)#小于1的替换为10,大于1的替换为了18
print(a)
print(b)

一维数组

arr[5]      #用整数作为下标可以获取数组中的某个元素
arr[3:5]    #用范围作为下标获取数组的一个切片,包括arr[3]不包括arr[5]
arr[:5]     #省略开始下标,表示从arr[0]开始
arr[-1]     #下标可以使用负数,-1表示从数组后往前数的第一个元素
arr[1:-1:2] #第三个参数表示步长,2表示隔一个元素取一个元素,第2,4,…后1

数组值修改

arr[2:4] = 100,101 #下标还可以用来修改元素的值

多维数组3X5

arr[0,3:5]      #索引第0行中第3和第4列的元素
arr[2:]         #取第3行之后的所有行
arr[[0,2,3]]    #取第0,2,3行数据
arr[1:,2:]      #索引第2和第3行中第3列、第4列和第5列的元素
arr[:,2]        #索引第2列的元素
print(a[[0,2],[1,3]])
print(a[0:2,1:3])
arr[1:,(0,2,3)] #索引第2、3行中第0、2、3列的元素
#mask是一个布尔数组,它索引第1、3行中第2列的元素
mask = np.array([1,0,1],dtype = np.bool)
print('索引结果为:',arr[mask,2])

6.改变数组形态

arr.reshape(3,4)           #设置数组的形状
arr.reshape(3,4).ndim)     #查看数组维度
np.arange(12).reshape(3,4) #改变一维数组的形状
arr.ravel()     #数组展平
arr.flatten()         #横向展平    a=np.arange(12).reshape(12,)
arr.flatten('F') #纵向展平
np.hstack((arr1,arr2))               #hstack函数横向组合
np.vstack((arr1,arr2))               #vstack函数纵向组合
np.concatenate((arr1,arr2),axis = 1) #concatenate函数横向组合
np.concatenate((arr1,arr2),axis = 0) #concatenate函数纵向组合
np.hsplit(arr, 2)       #hsplit函数横向分割
np.vsplit(arr, 2)       #vsplit函数纵向分割
np.split(arr, 2, axis=1) #split函数横向分割
np.split(arr, 2, axis=0) #split函数纵向分割
t[[1,2],:]=t[[2,1],:]    #行交换
t[:,[0,2]]=t[:,[2,0]]    #列交换

【案例】两个国家的数据方法一起来研究分析,同时保留国家的信息(每条数据的国家来源),应该怎么办

#两个国家的数据方法一起来研究分析,同时保留国家的信息(每条数据的国家来源),应该怎么办
import numpy as np  #导入NumPy库
import matplotlib.pyplot as plt
us_file_path="./US_video_data_numbers.csv"
gb_file_path="./GB_video_data_numbers.csv"
#加载国家数据
us_data=np.loadtxt(us_file_path,dtype=int,delimiter=",",skiprows=0,usecols=None,unpack=False)
gb_data=np.loadtxt(gb_file_path,dtype=int,delimiter=",",skiprows=0,usecols=None,unpack=False)
#添加国家信息
#构造全为0的数据
zeros_data=np.zeros((us_data.shape[0],1)).astype(int)
ones_data=np.ones((gb_data.shape[0],1)).astype(int)
#拼接两组数据
us=np.hstack((us_data,zeros_data))
gb=np.hstack((gb_data,ones_data))
data=np.vstack((us,gb))
print(data)

7.创建numpy矩阵

M1=np.mat("1 2 3;4 5 6;7 8 9")          #使用分号隔开数据
M2=np.matrix([[1,2,3],[4,5,6],[7,8,9]]) #使用matrix创建矩阵
M3=np.bmat("M1,M2")                     #使用bmat创建矩阵

8.矩阵运算

matr1+matr2  #矩阵相加
matr1-matr2  #矩阵相减
matr1*matr2  #矩阵相乘
np.multiply(matr1,matr2)) #对应元素相乘

matr1.T  #转置
matr1.H  #共轭转置(实数的共轭就是其本身)
matr1.I  #逆矩阵
matr1.A  #返回二维数组的视图

9.ufunc函数

不同形状的数组之间执行算术运算具有广播机制:
在这里插入图片描述

x = np.array([1,2,3])
y = np.array([4,2,6])
x + y   #数组相加
x - y   #数组相减
x * y   #数组相乘
x / y   #数组相除
x ** y  #数组幂运算:1,4,729

x < y   #[ True False False]
x > y;x == y;x >= y;x <= y;x != y

np.all(x == y))  #np.all()表示逻辑and:True
np.any(x == y))  #np.any()表示逻辑or :False

10.利用numpy进行统计分析

(1) 二进制数据存储

np.loadtxt(fname,dtype=np.float,delimiter=None,skiprows=0,usecols=None,unpack=False)

在这里插入图片描述

import numpy as np  #导入NumPy库
arr = np.arange(100).reshape(10,10)  #创建一个数组
np.save("F:/python/save_arr",arr)  #保存数组np.save("save_arr.npy",arr)
print('保存的数组为:\n',arr)

二进制文件

np.save("F:/python/save_arr",arr)  #单个数组存储
np.savez('../savez_arr',arr1,arr2) #多个数组存储
np.load("../tmp/save_arr.npy")     #读取含有单个数组的文件
np.load("../tmp/savez_arr.npz")    #读取含有多个数组的文件
print('读取的数组1为:',loaded_data1['arr_0'])
print('读取的数组2为:',loaded_data1['arr_1'])

文本文件

arr = np.arange(0,12,0.5).reshape(4,-1)
print('创建的数组为:',arr)
#fmt ="%d"为指定保存为整数
np.savetxt("../tmp/arr.txt", arr, fmt="%d", delimiter=",")
#读入的时候也需要指定逗号分隔
loaded_data = np.loadtxt("../tmp/arr.txt",delimiter=",")
print('读取的数组为:',loaded_data)
loaded_data = np.genfromtxt("../tmp/arr.txt", delimiter = ",")
print('读取的数组为:',loaded_data)

(2) 统计分析

1) 排序Sort,Argsort,lexsort

Sort

np.random.seed(42)  #设置随机种子
arr = np.random.randint(1,10,size = 10)  #生成随机数
arr.sort()  #直接排序

arr = np.random.randint(1,10,size = (3,3))  #生成3行3列的随机数
arr.sort(axis = 1)  #沿着横轴排序
arr.sort(axis = 0)  #沿着纵轴排序

Argsort

print('排序后数组为:',arr.argsort())  #返回值为重新排序值的下标

lexsort

a = np.array([3,2,6,4,5])
b = np.array([50,30,40,20,10])
c = np.array([400,300,600,100,200])
d = np.lexsort((a,b,c))  #lexsort函数只接受一个参数,即(a,b,c)
#多个键值排序是按照最后一个传入数据计算的
print('排序后数组为:',list(zip(a[d],b[d],c[d])))

2) 去重unique与重复数据

去重

names = np.array(['小明', '小黄', '小花', '小明', 
    '小花', '小兰', '小白'])
print('创建的数组为:',names)
print('去重后的数组为:',np.unique(names))

重复

np.tile(arr,3)           #对数组进行重复
arr.repeat(2, axis = 0)  #按行进行元素重复
arr.repeat(2, axis = 1)  #按列进行元素重复

3) 统计函数

np.sum(arr)        #计算数组的和
arr.sum(axis = 0)  #沿着横轴计算求和
arr.sum(axis = 1)  #沿着纵轴计算求和
np.mean(arr)       #计算数组均值
arr.mean(axis = 0) #沿着横轴计算数组均值
arr.mean(axis = 1) #沿着纵轴计算数组均值
np.std(arr)  #计算数组标准差
np.var(arr)  #计算数组方差
np.min(arr)  #计算数组最小值
np.max(arr)  #计算数组最大值
np.ptp(arr)  #极值,最大减去最小
np.argmin(arr)  #返回数组最小元素的索引
np.argmax(arr)  #返回数组最大元素的索引
np.cumsum(arr)  #计算所有元素的累计和
np.cumprod(arr) #计算所有元素的累计积

默认返回多维数组的全部的统计结果,如果指定axis则返回一个当前轴上的结果;

获取最大值最小值的位置

np.argmax(t,axis=0)
np.argmin(t,axis=1)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/671310.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《网络安全0-100》单钥加密体制

单钥加密体制 DES算法 DES属于对称密码算法中的分组加密(块加密)&#xff0c;和流密码相对应。DES算法将明文分为若干个64位块(不足补充)&#xff0c;秘钥为56位(8位校验位)。DES算法流程图如下 接下来&#xff0c;进行DES算法关键步骤的逐步解析&#xff1a; IP置换 IP置换…

Python学习——数据分组统计、分组运算及透视

目录 1 数据分组统计 groupby1.1 按照单列进行分组统计df.groupby(列名).count()1.2 按照多列进行分组统计 df.groupby([列名1,列名2]).count()1.3 分组填充缺失值 df.groupby(需填充列名).apply(lambda x:x.fillna(x.mean())) 2 分组运算 agg2.1 传入标准函数 df.groupby(班级…

机器学习之KNN(K近邻)算法

1 KNN算法介绍 KNN算法又叫做K近邻算法&#xff0c;是众多机器学习算法里面最基础入门的算法。KNN算法是最简单的分类算法之一&#xff0c;同时&#xff0c;它也是最常用的分类算法之一。KNN算法是有监督学习中的分类算法&#xff0c;它看起来和Kmeans相似&#xff08;Kmeans是…

乱七八糟知识点

知识点汇总 看一个文件的前n行、指定行、末n行idea 创建快捷测试文件Mac版 pycharm 快捷键ideaMac 终端MySQL 安装完&#xff0c;初始密码一般存在vim操作搜索引擎 看一个文件的前n行、指定行、末n行 # 先准备一个文件 ➜ tmp cat a.txt 001 002 003 004 005 006# 查看前2行…

不变的是需求,变化的是解决方法和工具:探讨iPaaS与ESB的差异

在企业数字化转型过程中&#xff0c;企业需要面临日益复杂的业务和数据集成挑战。为了应对这些挑战&#xff0c;需要借助适当的解决方法和工具来实现系统间的通信和数据传输。在这方面&#xff0c;iPaaS&#xff08;Integration Platform as a Service&#xff09;和ESB&#x…

STM32外设系列—OLED

文章目录 一、OLED简介二、数据手册分析2.1 供电电压2.2 引脚定义2.3 原理图介绍2.4 数据手册程序 三、IIC通信3.1 什么是IIC3.2 IIC通信协议3.3 IIC主从通信过程3.3.1 写入数据3.3.2 读取数据 四、OLED程序设计4.1 OLED初始化4.2 OLED控制函数编写4.2.1 OLED显示开/关程序4.2.…

ECCV2022 多目标跟踪(MOT)汇总

一、《Towards Grand Unification of Object Tracking》 作者: Bin Yan1⋆, Yi Jiang2,†, Peize Sun3, Dong Wang1,†,Zehuan Yuan2, Ping Luo3, and Huchuan Lu School of Information and Communication Engineering, Dalian University of Technology, China 2 ByteDance …

企业级开发环境配置(JDK、tomcat、Maven、Git、IDEA个性化界面的设定)

企业级开发环境配置&#xff08;JDK、tomcat、Maven、Git、IDEA个性化界面的设定&#xff09; 一、JRE,JDK8安装和环境变量配置1. 进入Oracle官网进行jdk8安装包的下载2. 选择安装路径&#xff0c;安装路径不要出现中文以及空格3. 环境变量的配置4. 安装验证 二、Tomcat 安装和…

性能测试面试题:如何测试App性能?(面试必问)

为什么要做App性能测试&#xff1f; 如果APP总是出现卡顿或网络延迟的情况&#xff0c;降低了用户的好感&#xff0c;用户可能会抛弃该App&#xff0c;换同类型的其他应用。如果APP的性能较好&#xff0c;用户体验高&#xff0c;使用起来丝滑顺畅&#xff0c;那该应用的用户粘…

Nginx入门?看这一篇就够了

Nginx&#xff1f;看这一篇就够了 前言Nginx介绍没有好用的&#xff1f;那就自己做一个&#xff01;Nginx的发展历程Nginx的特性&#xff08;为什么要用Nginx&#xff09; 异步事件驱动同步事件驱动同步事件驱动的问题 异步事件驱动异步非阻塞与同步非阻塞并发和并行I/O多路复用…

【数据关联】基于Patch的对应特征关联,关联当前帧->参考帧,帧间追踪

帧间追踪与数据关联 1. WarpPixelWise(求当前帧特征点位置)1.1 函数功能1.2 函数输入输出1.3 算法步骤 2. GetWarpMatrixAffine(计算 当前帧->参考帧 仿射变换矩阵)2.1 函数功能2.2 函数输入输出2.3 算法步骤 3. GetWarpMatrixAffine(计算 当前帧->参考帧 仿射变换矩阵)3…

modbus TCP协议讲解及实操

具体讲解 前言正文modbus tcp主机请求数据基本讲解Modbus Poll工具简单使用讲解 modbus tcp从机响应数据Modbus Slave工具简单使用讲解 前言 关于modbus tcp从0到1的讲解&#xff0c;案例结合讲解&#xff0c;详细了解整个modbus的可以参考这个&#xff1a;详解Modbus通信协议…

【吃透网络安全】2023软考网络管理员考点网络安全(一)安全基础篇

涉及知识点 软考网络管理员&#xff0c;软考网络管理员常考知识点&#xff0c;软考网络管理员网络安全&#xff0c;网络管理员考点汇总。 后面还有更多续篇希望大家能给个赞哈&#xff0c;这边提供个快捷入口&#xff01; 第一节 网络管理员考点网络安全&#xff08;1&#…

【广州华锐互动】钢厂轧钢事故3D虚拟体验还原真实事故场景

由于钢厂生产过程中涉及到高温、高压、高负荷等危险因素&#xff0c;一旦出现操作不当、设备故障等问题&#xff0c;就可能导致严重的事故。因此&#xff0c;对于钢厂员工来说&#xff0c;接受事故教育、了解安全知识非常重要&#xff0c;可以提高他们的安全意识&#xff0c;避…

大数据行业对学历要求高么

《2020中国大数据产业发展白皮书》显示&#xff0c;2019年中国大数据产业规模达5397亿元&#xff0c;同比增长23.1%&#xff0c;随后稳定增长&#xff0c;预计到2022年将突破万亿元。 根据LinkedIn、赛迪智库、拉勾网等机构的统计结果&#xff0c;大数据时代下的数据人才总体缺…

【软考程序员学习笔记】——程序设计语言

目录 &#x1f34a;一、常见的程序设计语言 &#x1f34a;二、程序设计语言组成 &#x1f34a;三、后缀表达式 &#x1f34a;四、传值调用和传址调用 &#x1f34a;五、语言处理程序 &#x1f34a;六、解释程序 &#x1f34a;七、链接程序 &#x1f34a;八、编译程序 &…

国产替代FT232RL-USB到UART桥接控制器 GP232RNL

GP232RNL是一款高度集成的USB到UART桥接控制器&#xff0c;提供了一种简单的解决方案&#xff0c;可以使用最少的元器件和PCB空间&#xff0c;将RS232接口转换为USB接口。GP232RNL包括一个USB 2.0全速功能控制器、USB收发器、振荡器、EEPROM和带有完整的调制解调器控制信号的异…

Java GUI开发的几个小工具:apk/aab签名,验证签名,aab转apk

平时经常给apk/aab签名&#xff0c;验证签名&#xff0c;aab转apk等操作&#xff0c;每次输入命令行十分繁琐。于是利用JAVA GUI简单开发了几个jar包界面化工具&#xff0c;提供给大家一起使用。 工具功能JarSignerTool.jar为apk/aab签名ApkSignerTool.jar为apk签名AppSignVer…

Cloud Studio 浏览器插件来啦

当谈到Cloud Studio浏览器插件的优势时&#xff0c;最显著的就是它的便捷性。通过安装Cloud Studio浏览器插件&#xff0c;用户可以在浏览器中直接打开Cloud Studio的开发环境&#xff0c;无需切换到其他应用程序&#xff0c;从而提高了开发效率。 另一个优势是插件对于Github…

Logstash入门简介

目录 Logstash简介介绍用途部署安装测试配置详解输入过滤输出 读取自定义日志日志结构编写配置文件输出到Elasticsearch Logstash简介 介绍 Logstash是一个开源的服务器端数据处理管道&#xff0c;能够同时从多个来源采集数据&#xff0c;转换数据&#xff0c;然后将数据发送到…