五、Orange 算例

该数据集来自 UCI 机器学习库,它与葡萄牙银行机构的直接营销活动(电话)有关。分类目标是预测客户是否将购买定期存款。数据下载Toolbar Image,属于开源的机器学习数据库网站。 一般来讲,下载数据采用的是 txt 文件,而 txt 是一种纯文本文档,里面不会有任何字体格式,直观性较差,同时也不便于 Orange 平台操作,需要进行转换并预处理。 为便于比较,Orange 中将数据集(共 411 88 条记录)拆分为两个子集,一个为训练集(39 999 条记录),一个为测试集(1 189 条记录),其在 Orange 中的流程如图 2-6-18 所示。

 图 2-6-18 银行业务数据逻辑回归 Orange 算法流程

三种算法的评估参数如图 2-6-19 所示。 图 2-6-19 银行业务数据逻辑回归 Orange 算法评测指标 以上配套资源下载Toolbar Image