数组的运算
使⽤
NumPy
最为⽅便的是当需要对数组元素进⾏运算时,不⽤编写循环代码遍历每个元素,所有的运算都会⾃动的⽮量化
(使⽤⾼效的、提前编译的底层代码来对数据序列进⾏数学操作)。简单的说就是,
NumPy
中的数学运算和数学函数会⾃动作⽤于数组中的每个成员。
数组跟标量的运算
代码:
array35 = np.arange(1, 10)
print(array35 + 10)
print(array35 * 10)
输出:
[11 12 13 14 15 16 17 18 19]
[10 20 30 40 50 60 70 80 90]
数组跟数组的运算
代码:
array36 = np.array([1, 1, 1, 2, 2, 2, 3, 3, 3])
print(array35 + array36)
print(array35 * array36)
print(array35 ** array36)
输出:
[ 2 3 4 6 7 8 10 11 12]
[ 1 2 3 8 10 12 21 24 27]
[ 1 2 3 16 25 36 343 512 729]
通⽤⼀元函数
通⽤函数是对
ndarray
中的数据执⾏元素级运算的函数。你可以将其看做普通函数(接收⼀个标量值作为参数,返回⼀个标量值)的⽮量化包装器,如下所示。
代码:
print(np.sqrt(array35))
print(np.log2(array35))
输出:
[1. 1.41421356 1.73205081 2. 2.23606798 2.44948974
2.64575131 2.82842712 3. ]
[0. 1. 1.5849625 2. 2.32192809 2.5849625
2.80735492 3. 3.169925 ]
表
1
:通⽤⼀元函数
通⽤⼆元函数
代码:
array37 = np.array([[4, 5, 6], [7, 8, 9]])
array38 = np.array([[1, 2, 3], [3, 2, 1]])
print(array37 ** array38)
print(np.power(array37, array38))
输出:
[[ 4 25 216]
[343 64 9]]
[[ 4 25 216]
[343 64 9]]
表
2
:通⽤⼆元函数
⼴播机制
上⾯的例⼦中,两个⼆元运算的数组形状是完全相同的,我们再来研究⼀下,两个形状不同的数组是否可以直接做⼆元运算或使⽤⼆元函数进⾏运算,请看下⾯的例⼦。
代码:
array39 = np.array([[0, 0, 0], [1, 1, 1], [2, 2, 2], [3, 3, 3]])
array40 = np.array([1, 2, 3])
array39 + array40
输出:
array([[1, 2, 3],
[2, 3, 4],
[3, 4, 5],
[4, 5, 6]])
代码:
array41 = np.array([[1], [2], [3], [4]])
array39 + array41
输出:
array([[1, 1, 1],
[3, 3, 3],
[5, 5, 5],
[7, 7, 7]])
通过上⾯的例⼦,我们发现形状不同的数组仍然有机会进⾏⼆元运算,但也绝对不是任意的数组都可以进⾏⼆元运算。简单的说,只有两个数组后缘维度相同或者其中⼀个数组后缘维度为1
时,⼴播机制会被触发,⽽通过⼴播机制如果能够使两个数组的形状⼀致,才能进⾏⼆元运算。所谓后缘维度,指的是数组 shape
属性对应的元组中最后⼀个元素的值(从后往前数最后⼀个维度的值),例如,我们之前打开的图像对应的数组后缘维度为3
,
3
⾏
4
列的⼆维数组后缘维度为4
,⽽有
5
个元素的⼀维数组后缘维度为
5
。简单的说就是,后缘维度相同或者其中⼀个数组的后缘维度为1
,就可以应⽤⼴播机制,沿着缺失或⼤⼩为
1
的维度重复数组元素;当两个数组的形状⼀致时,就满⾜了两个数组对应元素做运算的需求,如下图所示。
其他常⽤函数
除了上⾯讲到的函数外,
NumPy
中还提供了很多⽤于处理数组的函数,
ndarray
对象的很多⽅法也可以通过直接调⽤函数来实现,下表给出了⼀些常⽤的函数。
表
3
:
NumPy
其他常⽤函数
提示
:上⾯的
resize
函数和
ndarray
对象的
resize
⽅法是有区别的,
resize
函数在调整数组⼤⼩时会重复数组中的元素作为填补多出来的元素的值,⽽ ndarry
对象的
resize
⽅法是⽤
0
来填补多出来的元素。这些⼩细节不清楚暂时也不要紧,但是如果⽤到对应的功能了就要引起注意。
代码:
array42 = np.array([[1, 1, 1], [2, 2, 2], [3, 3, 3]])
array43 = np.array([[4, 4, 4], [5, 5, 5], [6, 6, 6]])
np.hstack((array42, array43))
输出:
array([[1, 1, 1, 4, 4, 4],
[2, 2, 2, 5, 5, 5],
[3, 3, 3, 6, 6, 6]])