NumPy(Numerical Python)是Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,同时也针对数组运算提供大量的数学函数库。
NumPy 的前身 Numeric 最早由 Jim Hugunin 与其他协作者共同开发,2005 年,Travis Oliphant 在 Numeric 中结合了另一个同性质的程序库 Numarray 的特色,并加入了其他扩展而开发了 NumPy。同时,NumPy 作为开放源代码由许多协作者共同维护开发。
NumPy 是一个运行速度非常快的数学函数库,主要用于数组计算,包括以下几部分。
(1)一个强大的 N 维数组对象 ndarray。
(2)广播功能函数。
(3)整合 C/C++/Fortran 代码的工具。
(4)线性代数、傅里叶变换、随机数生成。
1.NumPy 安装
在学习 NumPy 之前需要先安装,安装 NumPy 最简单的方法就是使用 pip 工具。pip 安装命令如下。
python -m pip install --user numpy scipy matplotlib ipython jupyter pandas sympy nose
安装完成后,还要测试是否安装成功。可以在Pycharm中新建一个 py 文件并输入以下代码并运行,如果出现如图 1 所示的运行结果,则证明安装成功。
from numpy import *
print(eye(4))
图1
2.NumPy ndarray 对象
NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,并以 0 下标为开始进行集合中元素的索引。ndarray 内部由以下内容组成。
(1)一个指向数据(内存或内存映射文件中的一块数据)的指针。
(2)数据类型或 dtype,描述在数组中固定大小值的格子。
(3)一个表示数组形状(shape)的元组,即表示各维度大小的元组。
(4)一个跨度元组(stride),其中的整数指的是为了前进到当前维度下一个元素需要“跨过” 的字节数。
ndarray 的内部结构如图 2 所示,跨度可以是负数,这样会使数组在内存中后向移动,切片中 obj[::-1] 或 obj[:,::-1] 就是如此。创建一个 ndarray,只需调用 NumPy 的 array 函数即可。
图2
相关语法格式如下。
numpy.array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0)
参数说明如下:
(1)object:数组或嵌套的数列。
(2)dtype:数组元素的数据类型,可选参数。
(3)copy:对象是否需要复制,可选参数。
(4)order:创建数组的样式,C 为行方向,F 为列方向,A 为任意方向(默认)。
(5)subok:默认返回一个与基类类型一致的数组。
(6)ndmin:指定生成数组的最小维度。 接下来通过以下实例帮助读者更好地理解相关内容。
首先来看一下如何创建一维数组,示例代码如下:
import numpy as np
a = np.array([1, 2, 3])
print(a)
运行代码输出结果:
[1 2 3]
这里在调用array方法的时候,传递的object参数为一个list,其中list中的值可以不是同一个数据类型,例如下面的代码:
import numpy as np
a = np.array(["1", "2", 3])
print(a)
运行代码输出结果:
['1' '2' '3']
接着再看下二维数组怎么创建,示例代码如下:
import numpy as np
a = np.array([[1, 2], [3, 4]])
print(a)
运行代码输出结果:
[[1 2]
[3 4]]
除此之外,还可以通过 ndmin 参数来控制,生成一个指定维度的数组,例如要生成一个5 维度的数组,示例代码如下:
import numpy as np
a = np.array([1, 2, 3, 4, 5], ndmin=5)
print(a)
运行代码输出结果:
[[[[[1 2 3 4 5]]]]]
3.NumPy数据类型
NumPy 支持的数据类型比 Python 内置的类型要多,基本上可以和 C 语言的数据类型对应上, 其中部分类型对应为 Python 内置的类型。如下表格 列举了常用 NumPy 的基本类型。
名称 | 描述 |
bool_ | 布尔型数据类型(True或False) |
int_ | 默认的整数类型(类似于 C 语言中的 long,一般是int32 或 int64) |
intc | 与C语言的 int 类型一样,一般是 int32 或 int 64 |
intp | 用于索引的整数类型(类似于 C语言的ssize_t,一般是 int32 或 int64) |
int8 | 字节(-128~127) |
int16 | 整数(-32768~32767) |
int32 | 整数(-2147483648~2147483647) |
int64 | 整数(-9223372036854775808~9223372036854775807) |
uint8 | 无符号整数(0~255) |
uint16 | 无符号整数(0~65535) |
uint32 | 无符号整数(0~4294967295) |
uint64 | 无符号整数(0~18446744073709551615) |
float__ | float64 类型的简写 |
float16_ | 半精度浮点数,包括1 个符号位、5 个指数位、10 个尾数位 |
float32 | 单精度浮点数,包括1 个符号位、8 个指数位、23 个尾数位 |
float64 | 双精度浮点数,包括1 个符号位、11 个指数位、52 个尾数位 |
complex_ | complex128 类型的简写,即 128 位复数 |
complex64 | 复数,表示双 32 位浮点数(实数部分和虚数部分) |
complex128 | 复数,表示双 64 位浮点数(实数部分和虚数部分) |
NumPy 的数值类型实际上是 dtype 对象的实例,并对应唯一的字符,包括 np.bool_、np.int32、 np.float32 等。
数据类型对象(dtype)用来描述与数组对应的内存区域是如何使用的,主要表现在以下几个方面。
(1)数据的类型(整数,浮点数或 Python 对象)。
(2)数据的大小(例如, 整数使用多少个字节存储)。
(3)数据的字节顺序(小端法或大端法)。
(4)在结构化类型的情况下,字段的名称、每个字段的数据类型和每个字段所取内存块的部分。
(5)如果数据类型是子数组,则为它的形状和数据类型。
1.使用标量类型
示例代码如下:
import numpy as np
dt = np.dtype(np.int32)
print(dt)
运行输出结果:
int32
2.int8, int16, int32, int64 4 种数据类型可以使用字符串 'i1', 'i2','i4','i8' 代替
示例代码如下:
import numpy as np
dt = np.dtype('i4')
print(dt)
int32
3.字节顺序标注
示例代码如下:
import numpy as np
dt = np.dtype('>i4')
print(dt)
运行输出结果:
>i4
4.创建结构化数据类型
示例代码如下:
import numpy as np
dt = np.dtype([('age',np.int8)])
print(dt)
运行输出结果:
[('age', 'i1')]
5.将数据类型应用于 ndarray 对象
示例代码如下:
import numpy as np
dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype=dt)
print(a)
运行输出结果:
[(10,) (20,) (30,)]
6.类型字段名可用于存取实际的 age 列
示例代码如下:
import numpy as np
student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')])
print(student)
运行输出结果:
[('name', 'S20'), ('age', 'i1'), ('marks', '<f4')