通过数据集可以创建树,但是字典的表示形式非常不易于理解,而且直接绘制图形也比较困难。但是通过Matplotlib库可以绘制树形图。
决策树的主要优点就是直观、易于理解,如果不能将其直观的显示出来,就无法发挥其优势。
Matplotlib提供了一个非常有用的注解工具annotations,它可以在数据图形上添加文本注解,注解通常用于解释数据的内容。由于数据上面直接存在文本描述非常丑陋,因此工具内嵌支持带箭头的划线工具,使我们可以在其他恰当的地方指向数据位置,并在此处添加描述信息,解释数据内容。
def plotNode(nodeTxt,centerPt,parentPt,nodeType):
createPlot.axl.annotate(nodeTxt,
xy=parentPt,
xycoords='axes fraction',
xytext=centerPt,
textcoords='axes fraction',
va='center',
ha='center',
bbox=nodeType,
arrowprops=arrow_args)
def createPlot():
fig=plt.figure(1,facecolor='white')
fig.clf()
createPlot.axl=plt.subplot(111,frameon=False)
plotNode('决策节点',(0.5,0.1),(0.1,0.5),decisionNode)
plotNode('叶结点',(0.8,0.1),(0.3,0.8),leafNode)
plt.show()
这是第一版的createPlot()函数,代码定义了描述树节点格式的常量。然后定义plotNode()函数执行了实际的绘图功能,该函数需要一个绘图区,该区域由全局变量createPlot.axl定义。最后定义createPlot()函数,它是这段代码的核心。createPlot()函数首先创建了一个新图形并清空绘图区,然后在绘图区上绘制两个代表不同类型的树节点,后面将用这两个节点绘制树形图。
createPlot()