《机器学习by周志华》学习笔记-决策树-04多变量决策树
1、概念
多变量决策树,亦称「斜决策树(obliquedecision tree)」
上文中的决策树节点属性都是单一,单一变量节点的决策树枝杈较多,而多变量的决策树枝杈较少,计算资源也会随之减少。
我们将每个样本的属性作为坐标轴,则n个属性的描述值的样本就对应了n维空间中的一个数据点。对样本分类就意味着我们将在这个空间中寻找不同类样本之间的分类边界。
即决策树的分类边界由若干与属性轴平行的分段组成。
2、背景
由于属性较多的时候,空间想象能力弱,所以我们本次以2维空间(2个属性)为例进行研究,如下表:
表1:西瓜数据集_2个属性A7/A8
编号 密度(A7) 含糖率(A8) 是否好瓜(Y) x1 0.697 0.460 是Y1 x2 0.774 0.376 是Y1 x3 0.634 0.264 是Y1 x4 0.608