二、模型构建

客户价值分析模型主要由两个部分构成:第一部分根据航空公司客户 5 个指标的数据,对客户进行聚类分群;第二部分结合业务对每个客户群进行特征分析,分析其客户价值,并对每个客户群进行排名。 (一)客户聚类 采用 K-Means 聚类算法对客户数据进行客户分群,聚成 5 类(需要结合业务的理解与分析来确定客户的类别数量)。K-Means 聚类算法位于 Scikit-Learn 库下的聚类子库(sklearn),代码清单如下,输入数据集为 input file,聚类类别数为 k = 5。 # K-Means 聚类算法 import pandas as pd from sklearn.cluster import KMeans #导入均值聚类算法 inputfile = ' . . /tmp/zscoreddata .xls #待聚类的数据文件 k = 5 #需要进行的聚类类别数 #读取数据并进行聚类分析 data = pd. read_excel (inputf ile) #读取数据 #调用 k-means 算法,进行聚类分析 kmodel = KMeans (n_clusters = k,n_jobs = 4) kmodel .fit (data) #训练模型 kmodel.cluster_centers_ #查看聚类中心 kmodel. labels_ #查看各样本对应的类别
对数据进行聚类分群的结果如表 5-1-6 所示。 表 5-1-6 客户聚类结果
(二)客户价值分析 针对聚类结果进行特征分析,如图 5-1-3 所示。其中,客户群 1 在 F、M 属性上最大,在 R 属性上最小;客户群 2 在 L 属性上最大;客户群 3 在 R 属性上最大,在 F、M 属性上最小;客户群 4 在 L、C 属性上最小;客户群 5 在 C 属性上最大。结合业务分析,通过比较各个指标在群间的大小对某一个群的特征进行评价分析。例如,客户群 1 在 F、M 属性最大,在 R 指标最小,因此可以说 F、M、R 在客户群 1 是优势特征。依此类推,F、M、R 在客户群 3 上是劣势特征。从而总结出每个群的优势和弱势特征,具体结果如表 5-1-7 所示。 图 5-1-3 客户群特征分析图
表 5-1-7 客户群特征描述表
由上述特征分析图表说明每个客户群都有显著不同的表现特征,基于该特征描述,本案例定义五个等级的客户类别:重要保持客户、重要发展客户、重要挽留客户、一般客户、低价值客户。他们之间的区别如图 5-1-1 所示,其中每种客户类别的特征如下: (1)重要保持客户:这类客户的平均折扣率(C)较高(一般所乘航班的舱位等级较高),最近乘坐过本公司航班(R 低),乘坐的次数(F)或里程(M)较高。他们是航空公司的高价值客户,是最为理想的客户类型,对航空公司的贡献最大,所占比例却较小。航空公司应该优先将资源投放到他们身上,对他们进行差异化管理和一对一营销,提高这类客户的忠诚度与满意度,尽可能延长这类客户的高水平消费。 (2)重要发展客户:这类客户的平均折扣率(C)较高,最近乘坐过本公司航班(R 低),但乘坐次数(F)或乘坐里程(M)较低。这类客户入会时长(L)短,他们是航空公司的潜在价值客户。虽然这类客户的当前价值并不是很高,但却有很大的发展潜力。航空公司要努力促使这类客户增加在本公司的乘机消费和合作伙伴处的消费,也就是增加客户的钱包份额。通过客户价值的提升,加强这类客户的满意度,提高他们转向竞争对手的转移成本,使他们逐渐成为公司的忠诚客户。 (3)重要挽留客户:这类客户过去所乘航班的平均折扣率(C)、乘坐次数(F)或者里程(M)较高,但是较长时间已经没有乘坐本公司的航班(R 高)或是乘坐频率变小。他们的客户价值变化不确定性很高。由于这些客户衰退的原因各不相同,所以掌握客户的最新信息、维持与客户的互动就显得尤为重要。航空公司应该根据这些客户的最近消费时间、消费次数的变化情况,推测客户消费的异动状况,并列出客户名单,对其重点联系,采取一定的营销手段,延长客户的生命周期。 (4)一般与低价值客户:这类客户所乘航班的平均折扣率(C)很低,较长时间没有乘坐过本公司航班(R 高),乘坐的次数(F)或里程(M)较低,入会时长(L)短。他们是航空公司的一般用户与低价值客户,可能是在航空公司机票打折促销时,才会乘坐本公司航班。其中,重要发展客户、重要保持客户、重要挽留客户这三类重要客户分别可以归入客户生命周期管理的发展期、稳定期、衰退期三个阶段。 根据每种客户类型的特征,对各类客户群进行客户价值排名,其结果如表 5-1-8 所示。针对不同类型的客户群提供不同的产品和服务,提升重要发展客户的价值、稳定和延长重要保持客户的高水平消费、防范重要挽留客户的流失并积极进行关系恢复。 表 5-1-8 客户群价值排名 本模型采用历史数据进行建模,随着时间的变化,分析数据的观测窗口也在变换。因此,对于新增客户详细信息,考虑业务的实际情况,该模型建议每月运行一次,对其新增客户信息通过聚类中心进行判断,同时对本次新增客户的特征进行分析。如果增量数据的实际情况与判断结果差异大,需要业务部门重点关注,查看变化大的原因以及确认模型的稳定性。如果模型稳定性变化大,需要重新训练模型进行调整。目前,模型进行重新训练的时间没有统一标准,大部分情况都是根据经验来决定。根据经验建议:每隔半年训练一次模型比较合适。