运用数据分析的方法深度解析企业客户流失问题
来源:CPDA数据分析师网 / 时间:2020-04-08
社会的快速发展导致社会上竞争日益激烈,怎样能保证自身的客户流失问题
我们都知道在的竞争是很激烈的,各行业中每天都存在崭新的挑战,各个行业都在想尽办法开拓市场,寻找各种新的办法来吸引客户,优化产品、提高服务质量、甚至有些产品打起了价格战等等,在这种竞争环境下怎样才能保证自己的客户不会流失,数据分析在这方面又起到了一个怎样的作用,今天就教给大家一个简单的数据分析客户流失的方案
数据分析师怎样可以快速的识别流失的电信客户类别
其实在这点中在所有探索性数据挖掘中一样,事先不知道哪种集群数合适,因此工作流允许用户指定不同数量的集群以供K均值计算,CPDA数据分析中每组聚类都有其聚类中心和方差,并组合成报表和自动显示在明细表中,以便可以解释聚类。
K-means算法是无监督学习中为经典的算法之一,使用起来较为简单,同时可以得到较优的聚类效果。本期数据说将与你一同在Datahoop平台上体验K-means算法的应用价值,让我们一起将它用对、用好!
用K-Means算法让你的工作效率爆表视频教程地址:
https://www.chinacpda.com/videocenter/detail/?id=547
数据分析师可以在Datahoop平台中使用和流程变量来提供运行时灵活性,一个可重复使用的元节点,用于组合群集信息,生成报告以及与Microsoft Office产品集成。
Datahoop平台集成了数据分析领域的经典算法:
https://www.chinacpda.com/datahoop/
数据分析师要对客户流失预测通过大数据来找到答案
对于企业来说有关客户的可用典型信息涉及人口统计,行为数据和收入信息,在续签合同时,有些客户会这样做,有些则不会:他们流失了。事先知道哪些客户有搅动风险,这对于防止这种情况非常有用-特别是在高收入客户的情况下。
这是一个预测问题。从一个小的培训集开始,在这里我们可以看到谁流失了谁,过去没有,我们要预测哪个客户流失(流失= 1)和哪个客户流失(流失= 0)。
像往常一样,在选择用于训练的机器学习算法时,我们会选择很多
对于用例,我们经常部署决策树,因为决策树具有很好的可视化和突出显示属性。但是,请注意,只要可以产生名义上的类预测,您就可以使用任何其他可用的机器学习算法。例如,随机森林(aka Ensemble Trees)是目前常用的机器学习算法。
无论选择哪种机器学习算法,都始终需要对其进行训练和评估。因此,需要“分区”节点对大部分数据进行分区(80%)进行训练,而对少量剩余数据(20%)进行评估。
要训练决策树(Decision Tree Learner节点),您需要使用要学习的类值(Churn),信息(质量)度量,修剪策略(如果有),通过树的深度来指定列。每个节点的记录数(数量更多–树更短),以及名义值和数字值的拆分策略。在培训阶段结束时,节点上下文菜单中的“查看”选项显示决策树通过树的决策路径,可以搅动而不是搅动客户。之后,将PMML模型保存到文件中。
因此,我们训练了一个模型。但是,如果模型没有学到任何有用的信息怎么办?我们需要先对其进行评估,然后再对实际数据进行实际运行。为了进行评估,我们使用保留的20%的数据(在训练阶段未使用)来填充“决策树预测器”节点。该节点将模型一个接一个地应用于所有数据行,并根据客户的合同和运营数据(P(Churn = 0/1))产生客户搅动的可能性。根据这种概率的值,会将预测的类别分配给数据行(预测(波动)= 0/1)。
预测类与原始流失类重合的次数是对模型质量进行任何度量的基础,因为它是由Scorer节点计算得出的。
请注意,流失= 0的客户希望比流失= 1的客户更多。如果要考虑到这一事实,并更多地考虑在类Churn = 1上产生的错误,则可以在测试集上引入“相等大小采样”节点以对更多类Churn = 0进行欠采样。
还要注意,记分器节点‒或任何其他计分节点‒允许您评估和比较不同的模型。后续的Sorter节点将允许您仅选择和保留性能的模型。
返回列表