学习参考:
菜鸟教程
numpy入门博客
numpy入门视频
NumPy安装
默认情况使用国外线路,国外太慢,我们使用清华的镜像
pip3 install numpy scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple
一、创建数组
numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)
- 一维数组
import numpy as np
arr1 = [1, 2, 3, 4, 5]
arr2 = [10, 20, 30, 40, 50]
print(arr1 + arr2)
arr3 = np.array(arr1)
arr4 = np.array(arr2)
print(arr3 + arr4)
print(arr4 / arr3)
print(arr3.shape) # (行,列)
print(arr3.max(), arr3.argmax()) # 最大值,最大值索引(从0开始)
print(arr3.ndim) # 维度
- 二维数组
import numpy as np
arr1 = np.array([[1, 2, 3],[4, 5, 6]])
print(arr1)
print(arr1.ndim)
print(arr1.shape)
- 创建默认值数组
- 创建全零数组的用途是初始化一个具有特定形状和大小的数组,其中所有元素都设置为0。在处理图像或其他数据时,全零数组可以用作初始值或占位符。例如,假设我们要读取一个尺寸为(255,255,255)的图片,我们可以创建一个相同维度的全零数组,然后将图片读入该数组进行填充。这样做的好处是,我们可以直接将原始图像数据存储在全零数组中,而无需担心数据溢出或其他问题。
- 全1数组同理
- 全空数组创建出来的全空数组中的数据都是无限小的、无限接近于0但不是0,这方便我们数学上的一些操作
import numpy as np
data = np.zeros(shape=(3, 4))
print(data)
data1 = np.ones(shape=(3, 4))
print(data1)
data2 = np.empty(shape=(3, 4))
print(data2)
import numpy as np
sevens = np.full((3, 4), 7)
print(sevens)
import numpy as np
sevens = np.full((3, 4), 7, dtype=float)
print(sevens)
- 有连续序列的数组 arange(从数值范围创建数组)
import numpy as np
data = np.arange(1, 10, 3) # arange(a, b, l)范围[a, b),步长l
print(data)
- 有连续间隔的数组 linspace
也称线性等分向量(linear space),在一个指定区间内按照指定的步长,将区间均等分,生成的是一个线段类型的数组。生成的线性间隔数据中,是有把区间的两端加进去的
import numpy as np
data = np.linspace(1, 10, 20)# 开始端1,结束端10,且分割成20个数据,生成线段
print(data)
print(data.ndim)
- 随机数组
创建随机数组的用途是初始化一个具有特定形状和大小的数组,其中所有元素都是随机生成的。在处理一些需要模拟随机数据的情况时,随机数组可以用作占位符或测试数据。
import numpy as np
data = np.random.rand(3, 4) # 3行4列
data1 = np.random.randint(1, 6, size=(3, 4)) # 数值在[1, 6)之间的随机整数,3行4列
print(data)
print(data1)
import numpy as np
random_arr = np.random.random((3, 4)) # [0.0, 1)
print(random_arr)
- 改变数组形状
因为数组中元素是没有改变的,所以重塑数组指定的尺寸大小是否和原本的尺寸大小一样,大一点和小一点都会报错,2行3列的数组,你可以把它改成为3行2列的数组 ,或者1行6列,改后尺寸必须一样,reshape本质就是原本数组中的元素按顺序展开来,然后依次填入新定义的尺寸中去.注意 reshape后面填的是元组数据类型
import numpy as np
arr1 = [1, 2, 3, 4]
arr2 = [5, 6, 7, 8]
arr3 = np.array([arr1, arr2])
print(arr3)
arr3 = arr3.reshape((4, 2))
print(arr3)
- 数组转置
import numpy as np
arr1 = [1, 2, 3, 4]
arr2 = [5, 6, 7, 8]
arr3 = np.array([arr1, arr2])
print(arr3)
print(arr3.T)
其中改变数组形状arr.reshape((c, r))是重新安装规格填入元素,数组转置arr.T类似于矩阵转置
二、数组显示
- 数组维度 ndim
- 数组形状shape
- 数组中元素个数
- 数组的数据类型 dtype
import numpy as np
arr1 = [1, 2, 3, 4]
arr2 = [5, 6, 7, 8]
arr3 = np.array([arr1, arr2])
print(arr3)
print(arr3.ndim)
print(arr3.shape)
print(arr3.size)
print(arr3.dtype)
三、数组运算
import numpy as np
arr1 = [1, 2, 3, 4]
arr2 = [5, 6, 7, 8]
arr3 = np.array(arr1)
arr4 = np.array(arr2)
print(arr3 + arr4)
print(arr4 - arr3)
print(arr3 * arr4)
print(arr4 / arr3)
四、数据统计
axis = 0 代表对横轴操作,也就是第0轴
axis = 1 代表对纵轴操作,也就是第1轴
- 数组的中位数
numpy.median(a, axis=None, out=None, overwrite_input=False, keepdims=<no value>)
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(np.median(arr))
print(np.median(arr, axis=0))
print(np.median(arr, axis=1))
- 计算数组中的元素沿指定轴的最值
numpy.amin(a, axis=None, out=None, keepdims=<no value>, initial=<no value>, where=<no value>)
numpy.amax(a, axis=None, out=None, keepdims=<no value>, initial=<no value>, where=<no value>)
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(np.amin(arr))
print(np.amin(arr, axis=0))
print(np.amin(arr, axis=1))
- 数组的平均值
numpy.mean(a, axis=None, dtype=None, out=None, keepdims=<no value>)
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(np.mean(arr))
print(np.mean(arr, axis=0))
print(np.mean(arr, axis=1))
- 数组中元素最大值与最小值的差(最大值 - 最小值)
numpy.ptp(a, axis=None, out=None, keepdims=<no value>, initial=<no value>, where=<no value>)
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(np.ptp(arr))
print(np.ptp(arr, axis=0))
print(np.ptp(arr, axis=1))
- 小于特定值的观察值的百分比
numpy.percentile(a, q, axis)
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(np.percentile(arr, 50))
print(np.percentile(arr, 50, axis=0))
print(np.percentile(arr, 50, axis=1))
五、保存&加载
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
# 把arr数组保存到helloNumpy.npy文件中
np.save('helloNumpy.npy', arr)
# 加载helloNumpy.npy的内容到arr1中
arr1 = np.load('helloNumpy.npy')
print(arr1)