三、 算法用例
以天气-打球数据集为例,在中用决策树算法构造的流程图如图2-1-4所示:
图2-1-4 Orange中决策树构造流程图
打开Tree的窗口,如图2-1--5所示。
图2-1--5 Orange中Tree参数窗口
里面有几个重要的指标:
Induce binary tree 创建一个二叉树;
Min. number of instances in leaves 每个节点最小实例限制;
Do not split subsets smaller than 子集实例小于x的时候不再进行拆分;
Limit the maximal tree depth to 树的最大深度不深于x。
对于分类:
Stop when majority reaches [%] 当纯度大于x时不再进行拆分。
通过Tree模型插件后数据就分好类了,然后我们再使用Tree viewer可视化插件看下分类情况,如下图(图3-6)。可以看到Tree viewer很形象地展示了决策树,与我们的手动计算结果一致,也表示出了每个特征分类值。
图3-6 Orange中Tree viewer决策树
以上所有内容均在百度网盘提供下载,下载网址: