锋哥原创的Pandas2 Python数据处理与分析 视频教程:
2025版 Pandas2 Python数据处理与分析 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili
NumPy 提供了丰富的数据类型(dtypes),主要用于高效数值计算。以下是 NumPy 的主要数据类型分类及说明:
-
数值类型(Numeric Types)
(1) 整数类型(Integer)
类型 | 说明 | 范围(有符号) | 范围(无符号) |
---|---|---|---|
int8 | 8位整数 | -128 到 127 | - |
int16 | 16位整数 | -32768 到 32767 | - |
int32 | 32位整数 | -2³¹ 到 2³¹-1 | - |
int64 | 64位整数 | -2⁶³ 到 2⁶³-1 | - |
uint8 | 8位无符号整数 | - | 0 到 255 |
uint16 | 16位无符号整数 | - | 0 到 65535 |
uint32 | 32位无符号整数 | - | 0 到 2³²-1 |
uint64 | 64位无符号整数 | - | 0 到 2⁶⁴-1 |
示例:
import numpy as np
a = np.array([1, 2, 3], dtype=np.int32) # 32位整数
b = np.array([255, 0], dtype=np.uint8) # 8位无符号整数
(2) 浮点类型(Float)
类型 | 说明 | 精度(位数) |
---|---|---|
float16 | 半精度浮点(16位) | 5位指数 + 10位尾数 |
float32 | 单精度浮点(32位) | 8位指数 + 23位尾数 |
float64 | 双精度浮点(64位,默认) | 11位指数 + 52位尾数 |
float128 | 扩展精度浮点(128位) | 更高精度(部分系统支持) |
示例:
c = np.array([1.0, 2.5], dtype=np.float32) # 单精度浮点
d = np.array([3.1415926535], dtype=np.float64) # 双精度浮点
(3) 复数类型(Complex)
类型 | 说明 |
---|---|
complex64 | 实部和虚部均为 float32 |
complex128 | 实部和虚部均为 float64 (默认) |
complex256 | 更高精度的复数(部分系统支持) |
示例:
e = np.array([1 + 2j, 3 + 4j], dtype=np.complex64)
-
其他类型
(1) 布尔类型(Boolean)
类型 | 说明 |
---|---|
bool_ | 布尔值(True/False) |
示例:
f = np.array([True, False], dtype=np.bool_)
(2) 字符串类型(String)
类型 | 说明 |
---|---|
str_ | Unicode 字符串(默认) |
bytes_ | 字节字符串(ASCII) |
示例:
g = np.array(["hello", "numpy"], dtype=np.str_) # Unicode
h = np.array([b"abc", b"123"], dtype=np.bytes_) # 字节字符串
(3) 日期时间类型(Datetime)
类型 | 说明 |
---|---|
datetime64 | 日期时间(年、月、日、秒等) |
timedelta64 | 时间间隔(差值) |
示例:
i = np.array(["2023-01-01", "2024-12-31"], dtype="datetime64[D]") # 天精度
j = np.array([1, 7], dtype="timedelta64[D]") # 时间差(天)
3. 结构化数据类型(Structured Arrays)
用于存储类似表格的数据(多个字段):
dt = np.dtype([("name", "U10"), ("age", "i4"), ("height", "f4")])
people = np.array([("Alice", 25, 1.65), ("Bob", 30, 1.80)], dtype=dt)
print(people["age"]) # 访问字段
完整代码:
import numpy as np
a = np.array([1, 2, 3], dtype=np.int32) # 32位整数
b = np.array([255, 0], dtype=np.uint8) # 8位无符号整数
print(a, b)
c = np.array([1.0, 2.5], dtype=np.float32) # 单精度浮点
d = np.array([3.1415926535], dtype=np.float64) # 双精度浮点
print(c, d)
e = np.array([1 + 2j, 3 + 4j], dtype=np.complex64)
print(e)
f = np.array([True, False], dtype=np.bool_)
print(f)
g = np.array(["hello", "numpy"], dtype=np.str_) # Unicode
h = np.array([b"abc", b"123"], dtype=np.bytes_) # 字节字符串
print(g, h)
i = np.array(["2023-01-01", "2024-12-31"], dtype="datetime64[D]") # 天精度
j = np.array([1, 7], dtype="timedelta64[D]") # 时间差(天)
print(i, j)
dt = np.dtype([("name", "U10"), ("age", "i4"), ("height", "f4")])
people = np.array([("Alice", 25, 1.65), ("Bob", 30, 1.80)], dtype=dt)
print(people)
print(people["age"]) # 访问字段
运行输出:
[1 2 3] [255 0]
[1. 2.5] [3.14159265]
[1.+2.j 3.+4.j]
[ True False]
['hello' 'numpy'] [b'abc' b'123']
['2023-01-01' '2024-12-31'] [1 7]
[('Alice', 25, 1.65) ('Bob', 30, 1.8 )]
[25 30]
NumPy 的数据类型比 Python 原生类型更精细,适合科学计算。选择合适的数据类型可以:
-
节省内存(如用
int8
代替int64
) -
提高计算效率(如
float32
比float64
更快) -
确保精度(如避免整数溢出)。