推出继承的初衷是让新手顺利使用只有专家才能设计出来的框架!
子类化内置类型的问题
在Python2.2之前,内置类型不能子类化,如list、dict等。
在Python2.2之后,内置类型可以子类化了,但是要注意的是:内置类型(使用C语言编写)不会调用用户定义的类覆盖特殊方法。
至于内置类型的子类覆盖覆盖的方法会不会隐式调用,CPython没有制定官方规则。基本上,内置类型的方法不会调用子类覆盖的方法。
例如,dict的子类覆盖了__getitem__()方法 但不会被内置类型的get()方法调用,只能应用在[]运算符 dict[key]形式中。(感觉这也是理所当然)
示例,dict的__init__和__upate__方法会忽略掉子类覆盖的__setitem__方法
class DoubleDict(dict):
def __setitem__(self, key, value):
super().__setitem__(key, [value] * 2)
dd = DoubleDict(one=1)
print(dd)
dd['two'] = 2
print(dd)
dd.update(three=3)
print(dd)
打印
{'one': 1}
{'one': 1, 'two': [2, 2]}
{'one': 1, 'two': [2, 2], 'three': 3}
知识点:
字典的init和update方法,都可以使用key=value的形式传入
__setitem__方法,没有影响到init和update方法的功能
super().__setitem__可以委托给超类处理,这里不需要传入self了
原生类型这种行为违背了面向对象编程的一个基本原则:始终应该从实例(self)所属的类开始搜索方法,即使在超类实现的类中调用也是如此。在上面的糟糕的局面中,__missing__方法却能按照预期工作,不过这这是个例。
不过只有实例内部的调用有这个问题,内置类型的方法调用其他类的方法,如果被覆盖了,也不会被调用。
ps:self.get()不会调用self.__getitem__()
示例,dict.update方法会忽略AnswerDict.__getitem__方法
class AnswerDict(dict):
def __getitem__(self, item):
return 42
ad = AnswerDict(a=1)
print(ad['a'])
d = {}
d.update(ad)
print(d['a'])
以上可以看到,dict.update方法忽略了AnswerDict.__getitem__()
综上所述:
直接子类化内置类型(list、dict、str等)容易出错,因为内置类型的方法通常会忽略用户覆盖的方法。
不要子类化内置类型,应该继承collection模块中的类,如UserDict、UserList、UserString,这写类都做了特殊设计,因此易于扩展
示例,改为继承UserDict类,上面出现的问题都解决了
import collections
class DoubleDict(collections.UserDict):
def __setitem__(self, key, value):
super().__setitem__(key, [value] * 2)
dd = DoubleDict(one=1)
print(dd)
dd['two'] = 2
print(dd)
dd.update(three=3)
print(dd)
class AnswerDict(collections.UserDict):
def __getitem__(self, item):
return 42
ad = AnswerDict(a=1)
print(ad['a'])
d = {}
d.update(ad)
print(d['a'])
打印
{'one': [1, 1]}
{'one': [1, 1], 'two': [2, 2]}
{'one': [1, 1], 'two': [2, 2], 'three': [3, 3]}
42
42
多重继承和方法解析顺序-MRO
任何实现多重继承的语言都要处理潜在的命令冲突,这种冲突由不相关的祖先类同名方法引起的,这种冲突称为“菱形问题”
示例,ABCD四个类的继承
class A:
def ping(self):
print('ping', self)
class B(A):
def pong(self):
print('pong B', self)
class C(A):
def pong(self):
print('pong C', self)
class D(B, C):
def ping(self):
super().ping() # supper函通过mro委托给了A类,由A.ping()
print('post-ping', self)
def pingpong(self):
self.ping() # 调用自己的ping方法
super().ping() # 调用超类的ping方法,跳过D类的ping方法,找到A类的ping方法
self.pong() # 根据mro顺序,找到B类的pong方法
super().pong() # 也根据mro顺序,找到B类的pong方法
C.pong(self) # 指定调用C.pong方法,忽略mro顺序,找到C类的pong方法
d = D()
d.pong()
C.pong(d) # 调用超类中的方法
print(D.__mro__)
打印
pong B <__main__.D object at 0x034461B0>
pong C <__main__.D object at 0x034461B0>
(<class '__main__.D'>, <class '__main__.B'>, <class '__main__.C'>, <class '__main__.A'>, <class 'object'>)
知识点:
超类中的方法都可以直接调用,此时要把示例作为显式参数传入
Python能区分d.pong调用的哪个方法,是因为Python会按照特定的顺序遍历继承图,这个顺序叫做方法解析顺序(Method Resolution Order)。类都有一个叫做__mro__的属性,他的值是一个元组,按照方法解析顺序列出各个超类,从当前类一直向上,知道object类。 比如这里就是D→B→C→A→object。方法继承顺序不仅考虑继承图,还要考虑子类声明中超类的顺序,也就是说改成Class D(C, B),那么D类的__mro__属性就不一样了,变为先搜索C,在搜索B。
想把方法调用委托给超类,推荐的方式是使用supper()函数。
如果想要绕过方法解析顺序,直接调用超类的方法,可以这样实现
def ping(self):
A.ping(self) # 而不是supper().ping()
print('post-ping', self)
注意,这样直接在类上调用实例方法时,比需显式的传入self,因为这样访问的是未绑定方法(unbound method)
然而,如果不是特殊需要,还是使用supper()最安全。
示例,查看一些类的__mro__属性
>>> bool.__mro__
(<class 'bool'>, <class 'int'>, <class 'object'>)
验证了bool是int的子类
>>> import numbers
>>> numbers.Integral.__mro__
(<class 'numbers.Integral'>, <class 'numbers.Rational'>, <class 'numbers.Real'>, <class 'numbers.Complex'>, <class 'numbers.Number'>, <class 'object'>)
验证了numbers模块的“数字塔”
>>> import io
>>> io.BytesIO.__mro__
(<class '_io.BytesIO'>, <class '_io._BufferedIOBase'>, <class '_io._IOBase'>, <class 'object'>)
io模块中有抽象基类(以Base后缀结尾的是抽象基类)和具体类,
方法解析顺序使用C3算法。 C3算法不用了解,对于开发者来说。
多重继承的真实应用--Tkinter
在Python标准库中,最常使用的多重继承的是collection.abc包。这没什么问题,毕竟连Java都支持接口的多重继承,而抽象基类就是接口说明,只不过是他可以提供具体方法的实现。
ps: Java8也允许提供方法实现,这个新功能在Java中叫默认方法
标准库中,GUI工具包Tkinter把多重继承用到了极致。
下面是Tkinter GUI类层次接口的UML图,使用<<mixin>>标记的类通过多重继承为其他类提供服务。 mixin(混合类型)
Toplevel:表示Tkinter应用程序中顶层窗口的类。
Widget:窗口中所有可见对象的超类。
Button:普通的按钮小组件。
Entry:单行可编辑文本字段。
Text:多行可编辑文本字段。
>>> import tkinter
>>> tkinter.Toplevel.__mro__
(<class 'tkinter.Toplevel'>, <class 'tkinter.BaseWidget'>, <class 'tkinter.Misc'>, <class 'tkinter.Wm'>, <class 'object'>)
>>> tkinter.Text.__mro__
(<class 'tkinter.Text'>, <class 'tkinter.Widget'>, <class 'tkinter.BaseWidget'>, <class 'tkinter.Misc'>, <class 'tkinter.Pack'>, <class 'tkinter.Place'>, <class 'tkinter.Grid'>, <class 'tkinter.XView'>, <class 'tkinter.YView'>, <class 'object'>)
>>>
Toplevel是所有图形类中唯一没有继承Widget的,因为他是顶层窗口,行为不像小组件,例如不能依附到窗口或者窗体上。Toplevel继承自Wm,后者提供了直接访问宿主窗口管理器的函数,例如设置窗口标题和窗口边框。
Widget直接继承自BaseWidget,还继承了Pack、Place、Grid。后面三个类是几何管理器,负责在窗口或者窗体中排列小组件。各个类封装了不同的布局策略和小组件位置API。
Button与多数小组件一样,只是Widget的子代,也间接继承Misc,后者为各个小组件提供了大量方法。
Entry是Widget和XView的子类,实现了横向滚动
Text是Widget和XView、YView的子类,实现了横向、纵向滚动。
多重继承的8点建议
继承有很多用途,而多重继承增加了可选方案和复杂度。使用多重继承容易得出令人费解和脆弱的设计。
把接口继承和实现继承区分开
使用多重继承,一定要明确一开始为什么创建子类。主要原因有两个:
继承接口,创建子类型,实现“是什么”关系
继承实现,通过重用避免代码重复
以上两条可能同时出现,但是一定要明确意图。通过继承重用代码是实现细节,通常可以换用组合和委托模式。而接口继承是框架的支柱。
使用抽象基类显式表示接口
如果类的定义是接口,应该明确把它定义为抽象基类。在Python3.4及以上的版本,抽象基类是通过abc.ABC或者其他抽象基类的继承实现。
通过混入(mixin)重用代码
如果一个类的作用是是为了多个不相关的子类提供方法,从而实现重用,但不体现“是什么”关系,应该把这个类明确定义为混入类(mixin class)
混入不定义新类型,只是打包方法,便于重用。混入类绝对不能实例化,而且具体类不能只继承混入类。混入类应该提供某方面的特定行为,只实现少量关系非常紧密的方法。
在名称中明确指明混入
在Python中没有把类声明为混入的正规方式,所以建议在名称中加入Mixin后缀。Tkinter没有采纳这个建议,XView应该变成XviewMixin。
抽象基类可以作为混入,反过来不成立
抽象基类可以实现具体方法,因此可以作为混入使用。不过抽象基类会定义类型,而混入做不到。抽象基类可以作为其他类的唯一继承,但是混入类不能作为唯一的超类。
抽象基类有个局限是混入没有的,抽象基类中实现的具体方法只能与抽象基类及其超类中的方法协作。
不要子类化多个具体类
具体类可以没有,或者最多只有一个具体超类。就是说,一个具体类的超类中除了有一个具体超类之外,其他的都是抽象类或混入类。
比如下面的示例,Alpha是具体类,那么Beta和Gamma都必须是抽象基类或者混入:
class MyClass(Alpha, Beta, Gamma):
"""一个具体类"""
为用户提供聚合类
如果抽象基类或者混入的组合对客户代码非常有用,那就提供一个类,使用易于理解的方式把他们结合起来,这种类称为聚合类(aggregate class).
这种类的定义体是空的,重点是把多个超类结合起来,这样用户只需要继承结合后的一个超类。
比如Tkinter中的Widget类就是结合了四个超类。
优先使用对象组合,而不是类继承
优先使用组合能让设计更加灵活,组合和委托可以代替混入,把行为提供给不同的类,但是不能取代接口继承去定义类型层次结构。