今天发现了python中一个比较有意思的小设计。
如果要通过中括号[]访问元素,需要重写__get__item()函数,这个应该没什么疑问,测试代码如下:
class Classroom:
def __init__(self, students):
self.students = students
def __getitem__(self, sid):
for s in self.students:
if s.sid == sid:
return s
def __len__(self):
return len(self.students)
class Student:
def __init__(self, sid, name):
self.sid = sid
self.name = name
def __repr__(self):
return str.format("sid: {}, name: {}", self.sid, self.name)
if __name__ == '__main__':
class_room = Classroom([Student(12, "小明"), Student(13, "小华")])
print(class_room[12])
通过中括号加学号的方式,可以获得对应学号的学生,代码顺利执行,没问题。
在我想要用for...in迭代时
if __name__ == '__main__':
class_room = Classroom([Student(12, "小明"), Student(13, "小华")])
for student in class_room:
print(student)
出现了问题,进入了死循环,控制台打印出迭代到的值一直是None
当我换一种写法时,就可以遍历成功了
但这么做有个问题,sid就不是学号了,而是students数组的下标,这和业务的语义是不相符的。但是我们先不忽略这一点,研究下for in到底是怎么实现的。
以Java为例,需要通过迭代器来迭代集合元素,集合元素通过next()方法获取元素,通过hasNext()方法探测迭代的终点。
那么python是如何只通过一个函数就能实现迭代的呢?
先说结论:从下标0开始迭代,直到__getitem__函数抛出IndexError异常。
for in刚开始迭代时,固定给getitem函数传了0,随后从0开始递增。
如果判断正确,students[sid],在迭代三次后,应该会抛出数组越界的异常IndexError,所以我怀疑可能是解释器把捕捉到IndexError异常作为了迭代终止的条件。(经过测试,只有IndexError会正常退出循环,其他类型的异常会直接显示报错)
修改代码,在第10次循环时,抛出异常
果然循环停止了,控制台打印结果:
再补充一点,通过iter函数以及next函数来迭代时,最终也是调用了getitem方法,下标也是从0开始。
if __name__ == '__main__':
class_room = Classroom([Student(12, "小明"), Student(13, "小华")])
# for student in class_room:
# print(student)
stu_iter = iter(class_room)
print(next(stu_iter))
print(next(stu_iter))
print(next(stu_iter))
如有错误,欢迎指正。