五、Orange 算例
该数据集来自 UCI 机器学习库,它与葡萄牙银行机构的直接营销活动(电话)有关。分类目标是预测客户是否将购买定期存款。数据下载
,属于开源的机器学习数据库网站。
一般来讲,下载数据采用的是 txt 文件,而 txt 是一种纯文本文档,里面不会有任何字体格式,直观性较差,同时也不便于 Orange 平台操作,需要进行转换并预处理。
为便于比较,Orange 中将数据集(共 411 88 条记录)拆分为两个子集,一个为训练集(39 999 条记录),一个为测试集(1 189 条记录),其在 Orange 中的流程如图 2-6-18 所示。

图 2-6-18 银行业务数据逻辑回归 Orange 算法流程
三种算法的评估参数如图 2-6-19 所示。
图 2-6-19 银行业务数据逻辑回归 Orange 算法评测指标
以上配套资源下载
。
