目录
- numpy基础介绍
- 示例
- 分析及总结:
- itemsize、nbytes函数
numpy基础介绍
Numpy 补充了Python语言所欠缺的数值计算能力,是其它数据分析及机器学习库的底层库。因其完全标准C语言实现,运行效率充分优化。最重要一点是开源免费。numpy的核心是矩阵(即多维数组)。
示例
import numpy as np
arr =np.array([[1,2,3],
[4,5,6]])
print(arr)
print(type(arr))
print(arr.ndim)
print(arr.shape)
print(arr.size)
print(arr.dtype)
print(arr.astype('float32'))
结果如下:
[[1 2 3]
[4 5 6]]
<class 'numpy.ndarray'>
2
(2, 3)
6
int32
[[1. 2. 3.]
[4. 5. 6.]]
分析及总结:
- Python中有list(即数组)数据类型和numpy中的numpy.ndarray是两种不同的数据结构,区别可以看每个小中括号之间是否有逗号分割,
有则是list,没有则是numpy.ndarray; - type()和dtype是两个不同的方法,一个是看数据结构,一个单个字符的类型(数据类型)
- ndim函数是看维数,几维的。方法是看连着几个中括号。比如
import numpy as np
arr1 =np.array([1,4,4,1])
arr2 =np.array([[1],
[4],
[4],
[1]
])
arr3 =np.array([[[1,2,3],
[4,5,6]],[[8,9,3],
[4,2,1]]])
print(arr1.ndim,arr2.ndim,arr3.ndim)
1 2 3
- shape:表示各位维度大小的元组。返回的是一个元组。对于一维数组:有疑问的是为什么不是(1,4),因为arr1.ndim维度为1,元组内只返回一个数。对于二维数组:前面的是行,后面的是列,他的ndim为2,所以返回两个数。对于三维数组,返回三个数。比如
import numpy as np
arr1 =np.array([1,4,4,1])
arr2 =np.array([[1],
[4],
[4],
[1]
])
arr3 =np.array([[[1,2,3],
[4,5,6]],[[8,9,3],
[4,2,1]]])
print(arr1.shape)
print(arr2.shape)
print(arr3.shape)
(4,)
(4, 1)
(2, 2, 3)
- dtype和astype,一个可以指定数组的数据类型,一个可以改变数组的数据类型
numpy的数据类型主要包括整数、浮点数、复数、布尔值、字符串、python对象类型,如下图所示
1、使用dtype指定创建数组的数据类型,可以创建数组时直接指定
#默认是浮点数是float64
arr9 = np.array([1.,2.,3.],dtype=np.float32)
print(arr9.dtype)
#float32
#通过类型代码指定
arr9 = np.array([1.,2.,3.],dtype="f4")
print(arr9.dtype)
#float32
2、使用astype来改变数组的数据类型
import numpy as np
arr1 =np.array([1,4,4,1])
print(arr1)
print(arr1.dtype)
arr2 = arr1.astype('float64')
print(arr2)
print(arr2.dtype)
print(arr1)
[1 4 4 1]
int32
[1. 4. 4. 1.]
float64
[1 4 4 1]
- size 函数计算当前数组元素的个数
import numpy as np
arr1 =np.array([1,4,4,1])
arr2 =np.array([[1],
[4],
[4],
[1]
])
arr3 =np.array([[[1,2,3],
[4,5,6]],[[8,9,3],
[4,2,1]]])
print(arr1.size)
print(np.size(arr1))
print(arr2.size)
print(arr3.size)
4
4
4
12
备注:比较前两个4,其实在numpy中同一个函数有不同的表达方式,可以arr1.size,也可以np.size(arr1)
itemsize、nbytes函数
itemsize:数组每个元素字节大小 (itemsize)
nbytes:数组总字节大小 (nbytes)
import numpy as np
arr1 =np.array([1,4,4,1])
print("Item size:", arr1.itemsize) # 输出: 4 (表示每个元素占用4个字节)
print("Total bytes:", arr1.nbytes) # 输出: 16 (表示整个数组占用的总字节数)