《大数据精准挖掘》电信行业应用--客户流失预测
2016-06-09 22:31
302 查看
一、背景介绍
国内电信市场日趋饱和,企业竞争日趋激烈,获取新客户的成本远远高于留住现有客户的花费。
发展一位新客户的成本是留住老客户的6倍;客户加入时间越长,价值越高。
二、商业理解
用户:业务分析员+决策人员
客户流失可能性预测:对每一位客户流失倾向的大小进行预测。
流失原因:主要流失原因的预测和分析。
客户流失影响:预测、分析。
客户保留措施:根据客户不同的特点,差异化挽留措施。
三、数据理解
流失情况和之前一段时间的通话、短信、上网情况相关,数据可由电信公司数据库获得。
行为数据+个人信息
四、数据准备
用户计费信息数据集original_data,包含2011.4.1-2011.9.30的消费信息和未来三个月的流失信息,共99720条。
数据集中有825个流失者+98895个未流失者,保留所有的流失者和1/10的未流失者作为随机样本,加入全中变量weight。
数据字段:用户ID,是否流失用户,年龄,入网时间、产品名称、套餐品牌、计费时长、通话次数、开帐金额、短信条数、开帐欠费、上网流量、计费时长、上网金额
五、建立打分模型
设置建模的自变量、因变量和权重变量。
六、分析建模结果
八个变量进入模型,建模效果理想。
将客户按分数平均分成十组,第一组得分最低的9990人中,真正流失229人,占流失总人数(825)的27.8%,前六组流失人数占总流失人数高达90.5%。
结果显示,最近几个月的通话次数和开帐金额与未来4个月的流失有紧密关系。
七、结果运用
预测出较大流失可能性的客户后,评估保留客户后的收益和成本。高价值用户保留,低价值用户任其流失。
国内电信市场日趋饱和,企业竞争日趋激烈,获取新客户的成本远远高于留住现有客户的花费。
发展一位新客户的成本是留住老客户的6倍;客户加入时间越长,价值越高。
二、商业理解
用户:业务分析员+决策人员
客户流失可能性预测:对每一位客户流失倾向的大小进行预测。
流失原因:主要流失原因的预测和分析。
客户流失影响:预测、分析。
客户保留措施:根据客户不同的特点,差异化挽留措施。
三、数据理解
流失情况和之前一段时间的通话、短信、上网情况相关,数据可由电信公司数据库获得。
行为数据+个人信息
四、数据准备
用户计费信息数据集original_data,包含2011.4.1-2011.9.30的消费信息和未来三个月的流失信息,共99720条。
数据集中有825个流失者+98895个未流失者,保留所有的流失者和1/10的未流失者作为随机样本,加入全中变量weight。
数据字段:用户ID,是否流失用户,年龄,入网时间、产品名称、套餐品牌、计费时长、通话次数、开帐金额、短信条数、开帐欠费、上网流量、计费时长、上网金额
五、建立打分模型
设置建模的自变量、因变量和权重变量。
六、分析建模结果
八个变量进入模型,建模效果理想。
将客户按分数平均分成十组,第一组得分最低的9990人中,真正流失229人,占流失总人数(825)的27.8%,前六组流失人数占总流失人数高达90.5%。
结果显示,最近几个月的通话次数和开帐金额与未来4个月的流失有紧密关系。
七、结果运用
预测出较大流失可能性的客户后,评估保留客户后的收益和成本。高价值用户保留,低价值用户任其流失。
相关文章推荐
- 康诺云推出三款智能硬件产品,为健康管理业务搭建数据池
- MySQL中使用innobackupex、xtrabackup进行大数据的备份和还原教程
- 数据挖掘之Apriori算法详解和Python实现代码分享
- php+ajax导入大数据时产生的问题处理
- C# 大数据导出word的假死报错的处理方法
- 用Python实现协同过滤的教程
- Python利用多进程将大量数据放入有限内存的教程
- mongodb常遇到的错误。
- 详解BI/数据分析/数据挖掘/业务分析概念 7fe0
- Stack数据结构的特点后进先出的应用:大数据运算
- Spark机器学习(一) -- Machine Learning Library (MLlib)
- Spark机器学习(二) 局部向量 Local-- Data Types - MLlib
- Spark机器学习(三) Labeled point-- Data Types
- YARN或将成为Hadoop新发力点
- Hadoop 1.x版本伪单机配置
- Sedgewick之巨著《算法》,与高德纳TAOCP一脉相承
- 普通最小二乘法的推导证明
- Glusterfs的编译选项 #pragma GCC poison system popen
- Python 大数据思维导图
- Spark HA部署方案