memoryview() Python 的一个内置class,可直接使用。它返回给定参数的“内存视图”对象。内存视图对象是一个对支持缓冲区协议(如 bytes 或 bytearray)的数据的“窗口”或“视图”,它允许你在不复制数据的情况下操作内存中的数据。
1.缓冲区协议
buffer protocol是一种允许对象以二进制数据形式共享内存的机制。这个协议对于实现低层次的、高效的数据访问和操作非常有用,特别是在涉及大量数据处理时。支持缓冲区协议的对象可以直接进行内存操作,而不需要通过中间复制,这样可以大幅提高性能。
下面列出了一些主要的Python对象,支持缓冲区协议:
- bytes
bytes对象允许访问其中的原始数据,但是不支持修改 - bytearray
字节数组与bytes类似,但是bytearray是可变的,可修改。 - 其他的如array模块的array.array对象,第三方模块numpy的numpy.ndarray,还有某些实现了相应的__buffer__接口的对象等。
2 使用方法
memoryview基本语法如下:
memoryview(obj)
其中,obj 是一个支持缓冲协议的对象。
memoryview() 函数返回的是一个内存视图对象,而不是原始对象的副本。这意味着,对内存视图所做的任何修改都会反映到原始对象上。比如修改了内存视图中的某个字节,原始内容也会被改变。
属性
- format: 返回一个表示数据的格式的字符串(例如 'B' 代表无符号字节)。注意这个属性并不总是可用的,取决于原始对象是否提供了这样的信息。
- itemsize: 返回单个元素的字节大小。
- ndim: 返回数据的维度数(总是 1,因为 memoryview 总是表示一维数组)。
- shape: 返回一个元组,表示数据的形状(对于 memoryview 总是 (len(obj),))。
- strides: 返回一个元组,表示跨步(strides),即为了从当前元素移动到下一个元素需要在内存中前进的字节数。对于连续的内存块,这个值通常是 itemsize。
- tobytes(): 返回一个包含数据的字节对象(bytes)。
- tolist(): 返回一个包含数据的列表。
方法
- cast(format, shape=None): 创建一个新的 memoryview,具有不同的格式和/或形状。注意这不会更改原始数据,只是更改了如何解释它。
- __getitem__(index): 使用索引访问单个元素或切片。
- __setitem__(index, value): 使用索引设置单个元素的值(如果原始对象是可变的)。
- __len__(): 返回数据的长度(元素数量)。
切片
memoryview 对象支持切片操作,允许你访问原始数据的一部分。切片返回一个新的 memoryview 对象,它引用原始数据的一个子集。
3 示例介绍
字节bytes转为内存对象
#定义bytes内存试图
byte_s = b"Hello,World!"
mview = memoryview(byte_s)
print(mview)
<memory at 0x10b217400>
- 切片操作
切片后将内存视图对象通过tobyte()s转为字节或者tolist()转为列表查看
print(mview[0:4].tobytes())
b'Hell'
print(mview[0:4].tolist())
[72, 101, 108, 108]
- 查看单个元素值
通过__getitem__()查看单个元素的值,查出来的是字符在编码中对应的数字,通过chr()转为字符
print(f'访问单个元素值 {mview.__getitem__(2)} 转为字符:{chr(mview.__getitem__(2))}')
访问单个元素值 108 转为字符:l
- 查看元素个数
print(f'元素个数 {len(mview)}')
元素个数 12
- 字节的内存对象不支持修改
比如修改元素值会报错:
mview[0]=100
TypeError: cannot modify read-only memory
字节数组bytearray转为内存对象
bytearray()函数传入字节数据,转为数组,类似于列表,数组本身支持切片/修改等操作。
byte_s = b"Hello,World!"
s_array = bytearray(byte_s)
mview = memoryview(s_array)
字节数组内存对象的操作与上述字节内存对象大多一致,但是字节数组支持修改:
比如将第一位代表的ASCII数字改为100
mview[0]=100
print(mview.tobytes())
b'dello,World!'
结果显示原来字符h被改为了字符d
检查原始数据是否被修改
print(s_array)
bytearray(b'dello,World!')
结果显示原始数据也同样被修改了。
共勉: 东汉·班固《汉书·枚乘传》:“泰山之管穿石,单极之绠断干。水非石之钻,索非木之锯,渐靡使之然也。”
-----指水滴不断地滴,可以滴穿石头;
-----比喻坚持不懈,集细微的力量也能成就难能的功劳。
----感谢读者的阅读和学习和关注,谢谢大家。