当前位置:文档之家› 数据挖掘技术在电信行业客户流失分析中的应用研究

数据挖掘技术在电信行业客户流失分析中的应用研究

数据挖掘技术在电信行业客户流失分析中的应用研究
数据挖掘技术在电信行业客户流失分析中的应用研究

三峡大学

硕士学位论文

数据挖掘技术在电信行业客户流失分析中的应用研究

姓名:田瑞

申请学位级别:硕士

专业:计算机应用技术

指导教师:周学君

20090401

内容摘要

当今数据挖掘技术快速发展,数据挖掘在很多领域中所起的重要作用己被越来越多的人认可,随着电信体制改革的深化,我国电信运营业的竞争日趋激烈,因此如何维持现有的客户不流失已经是电信运营商急需解决的一个课题。要保持现有的客户,电信运营商需提前预知某些客户是否有流失的可能性,进而才能采取有效的市场策略对客户加以挽留。我将基于数据挖掘的思想,通过建立客户流失预测模型对客户进行分析,得出流失客户的特征信息,从而起到指导企业决策的作用。

针对电信行业的客户流失预测,国内外的专家学者已进行了大量的研究工作。主要有采用决策树方法、神经网络方法、线性回归等方法来分析电信行业影响客户流失的一些重要因素。但现有方法存在如训练结构单一等等的问题,本文将针对现有方法的不足,对客户流失预测模型进行改进。

本文所做的工作包括以下几部分:

首先,介绍了数据挖掘的理论及其相关算法,总结分析了决策树算法和人工神经网络算法以及这两种算法性能的比较,并对数据挖掘工具SPSS Clementine软件做了详细的介绍。

其次,将山西省电信行业的无线市话小灵通历史数据为对象,从小灵通本身业务的实际情况出发,分析探讨了小灵通业务在做流失预测分析时所可能用到的数据基础和属性基础。根据其实际需求,给出数据挖掘的过程模型。

再次,针对现行大部分数据挖掘模型的单一性缺点,为了充分利用决策树和神经网络算法的优点,提出并建立了一种基于这两种算法的客户流失预测混合模型,并且通过实际的数据对该模型进行了评估,结果表明使用混合客户流失预测模型对客户流失做出了准确的预测,其模型的预报精度好于传统的单一的客户流失预测模型。

最后,利用之前建立的客户预测混合模型对山西电信L分公司做了实例分析,初步得出影响客户流失的一些重要因素,并且结合该公司的实际情况提出了客户挽留措施。

研究结果表明所建立的预测模型是科学的、基本上符合实际情况,能够给决策人员提供必要的预测信息并给出解决方案,因此,研究成果对于指导电信运营商的经营决策工作将起到重要作用。

关键词:数据挖掘客户流失预测混合模型决策树神经网络

Abstract

With the reform of Chinese telecommunication system and the progress of data mining technology, the competition in mobile telecommunication operation is becoming increasingly fiercer and the importance of the data mining is approved by more and more people. Therefore, the telecommunication operation companies are urgent to figure out how to maintain the existing customer. In order to do it, the telecommunication operation companies need to predict the possibility of the client-draining before clients give up their services. The investigation into present predictive system of telecom churn based on Data Mining is introduced in this paper and a method analysis is to find the implied operation regulations according to the model which is based on the known data, and then to make the prediction with the rules mentioned above to guide the decision-making.

According to the forecast for the loss of customers in the telecommunications industry, the experts and scholars at home and abroad have carried out a great deal of research work. However, there is much less than the existing methods, and the article will address the inadequacy of existing methods for the loss of customers to improve the prediction model.

In this paper, the work includes some parts:

First of all, the theories of data mining technology are introduced and the decision tree’s arithmetic and artificial nerve network’s arithmetic are analyzed.

Secondly, based on the practical situation of telecom corporations, the importance of application of DM is analyzed, and the basic description of predictive system is given according to the practical requirement. For most of existing data, mining models of single are in disadvantage. In order to take full advantage of decision tree, the advantages of neural network algorithm are proposed and two algorithms based on this prediction of the hybrid model for the loss of customers are set up.

Thirdly, this chapter describes the process of establishing the predication model of PHS customer churning in details and from the evaluation model with actual data, it demonstrates that such a predictive model can provide a comparatively accurate prediction of clients churn.

Finally, we do a Case Study with the use of the mixed model for prediction L branch of Shanxi Telecom, and come to the preliminary impact of the loss of a number of important factors, so we combine with the actual situation of the company's proposed

measures to retain customers.

The result indicates that the forecasting model is scientific and practical, and can provide the predictive information and the solution project for decision-maker. It can be believed that with the progress of data mining technology, more valuable information of customers will be discovered to direct the company.

Key words: Data Mining Custom Churn Prediction Mixed Model Decision Tree Neural Network

三峡大学学位论文原创性声明

本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果,除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明,本人完全意识到本声明的法律后果由本人承担。

学位论文作者签名:

日期:

引言

在当前竞争日益激烈的电信市场竞争下,客户己经成为关系到企业成败最重要的资源,理解不同消费者群体的购物态度、偏好、价格观念是市场营销成功的关键。明智的商家和营销人员会根据不同城市的不同消费群体,以及不同的产品的不同阶段,有效地规划市场策略。如何保有客户、吸引客户、充分发掘客户的消费潜力已经成为电信运营商们广泛关注的焦点。

由于客户选择的余地大大增加,迫使各电信运营商围绕着客户尤其是大客户的争夺也愈演愈烈,使得电信运营商们面临着前所未有的竞争压力。也就是说,对客户的争夺,已经成为当前各大电信运营商竞争的焦点。客户数量一直都是电信运营商最关心的问题,因此客户数量流失预测就显得很有必要,它是电信运营商进行工程设计和编制网络发展规划的基本依据,客户的流失预测分析可以为运营商制定业务发展计划、改善经营管理、做出经营决策提供决策支持。

在美国,电信行业在20世界90年代解除管制,便携式电话极大的改变了发展前景,虽然早些时候这股热浪已经袭击了欧洲和亚洲的一些小国家。在这个竞争极其激烈的市场背景下,许多公司争相寻找了了解他们客户的方法。如何保持客户和获得客户已经成为市场营销中最优先考虑的事项。电信公司相互竞争着设计、提供最好的产品从而吸引客户。由此,竞争的压力将电信公司引向了数据挖掘。所有的主要电信行业公司已经采用了这项技术,并获得了很大的收益。几个数据挖掘供应商和咨询公司专门研究该行业的问题。

客户的流失有着重大的利害关系。在现今竞争激烈的市场中,客户一遇到问题,就很容易受到诱惑而流失或者转网到其他竞争对手中,在这样的环境下很难挽留住原有的客户。一些数据挖掘供应商专门研究适合电信行业的数据可视化产品。这些方法可以使用户面对别的竞争者的诱人条件时挽留住客户;通过客户流失分析将来使用是否会有所增加;发现有利可图的服务项目;最有可能吸引客户的套餐;向现有的客户推销某些附加的产品和服务;找出影响客户使用电话的因素等等。

1 绪论

1.1 选题的背景和意义

在社会经济高速发展、科技进步的影响下,我国的电信市场逐渐扩大,电信业务的需求量也不断增长。由此大大吸引了电信市场新运营商的加入,激发了新的市场进入者的竞争积极性。从经济学的角度分析,随着电信市场垄断局面的打破,市场上的利润由垄断时期的高额利润降至市场平均利润水平。在这种情况下,保持和发展客户的重要性就在竞争中凸现出来。从电信企业自身的角度来说,客户是企业生存发展的根本。预计在近五年中,这种战略转移将成为潮流。

随着国内三大电信运营商的战略重组,三大电信运营商分别都拥有了自己的固话业务和移动通讯业务,导致国内电信运营商间的竞争也越来越激烈,而网络服务质量等方面的差别也在逐渐减少,单纯的价格战对竞争的双方甚至三方都造成损失。因此,电信企业都在寻求改善服务质量、提高市场竞争力的方法。面对这样越来越激烈的市场竞争,电信企业迫切地需要通过某种手段来提高企业自身的科学决策能力,增强在市场经营等方面的正确判断能力,因此,电信运营商需要数据仓库和数据挖掘技术[1]。

由于电信运营商积累了大量的业务运营数据,并且电信行业有较为成熟的联机事务处理系统,为数据仓库和数据挖掘提供了数据的电子化的客观条件。另外,电信行业面临激烈的市场竞争的压力,为数据仓库和数据挖掘的建立提供外在的动力。目前,国内的电信行业已经具备了上述这两个基本条件,因此,数据仓库技术以及在数据仓库的基础上进行的数据挖掘操作技术将在国内的电信领域发挥重要的作用。

面对电信市场激烈的竞争,电信运营企业都在不断地降低成本,开发新业务,保留已有的客户,争取新的市场份额,对市场变化做出快速反应。业务数据是电信运营商最宝贵的资产之一,最大限度的利用好这些数据可以为企业带来高额回报,从而提高企业的竞争力。

由于电信市场日趋饱和,所以获取新客户的成本比留住现有客户群要昂贵得多,并且竞争对手、技术以及法律法规等动态市场变化更容易使客户流失到其他公司。因此,在开发新用户的同时,尽量减少老用户的流失(降低用户流失率)问题,就摆到了电信运营企业面前[2]。

对电信运营商来说,客户流失管理是企业生存发展的需要。有关数据显示[3]:1)发展一位新客户的成本是挽留一个老客户的4倍;

2)客户忠诚度下降5%,则企业利润下降25%;

3)向新客户推销产品的成功率是15%,然而,向现有客户推销产品的成功率是50%;

4)如果将每年的客户关系保持率增加5个百分点,可能使利润增长85%;

5)向新客户进行推销的花费是向现有客户推销花费的6倍;

6)如果公司对服务过失给予快速关注,70%对服务不满的客户还会继续与其进行商业合作;

7)60%的新客户来自现有客户的推荐;

8)一个对服务不满的客户会将他的不满经历告诉其他8-10个人,而一位满意的客户则会将他的满意经历告诉2-3人。

9)电信市场的二次性决定于这样的特点:客户加入的时间越长,对电信运营商的价值越高。

由此可见用户流失对业绩的巨大影响。客户离网给电信运营商带来的主要问题包括:

1)客户群的大进大出,对营销成本造成很大损失。

2)是业务收入增长缓慢的主要原因之一。目前,新增用户是带动收入增长的主要因素,而离网用户造成的收入损失占新增用户收入的很大一部分,大大降低了收入增幅。

数据仓库和数据挖掘的出现在客户流失分析作为企业经营分析系统中具有重要的意义。它不仅提高了电信企业数据的存储及处理数据的能力,而且也提高了分析问题的能力,数据挖掘能够让人们发现很多从来就没有意识到的知识,并给企业带来相应的效益。提高企业的竞争力,而数据中心的实施,即建立企业级的数据仓库和进行数据挖掘将在其中起到关键的作用。

目前,国内的电信企业已建有大量成熟的数据库业务系统,如计费系统、管理信息系统、网管系统等。通过这些系统,积累了大量的原始数据和各种业务处理数据,这些数据真实的反应了电信企业各种业务环境的经济动态。然而,这些宝贵的数据未得到企业充分的利用,没有为企业决策提供很好的支持,其主要原因如下:1)已建成的业务系统都是联机事务处理系统,强调的是密集的数据更新性能和系统的可靠性,而数据挖掘可能需要运行几个小时,从而消耗大量的系统资源。

2)由于缺乏集中存储和管理,所以业务数据相对分散于异构的数据环境中,同时这些独立的业务系统缺乏标准的接口。

3)业务系统和数据挖掘所需要的数据不同。

1.2 研究现状及发展趋势

世界各地很多电信运营商正经历着不同程度的客户流失,仅以1999年为例[4],欧洲的客户流失率为25%,美国为30%,亚洲则达到48%。对于世界各地已经建立真正竞争机制的市场而言,电信业的客户流失现象由于若干原因而不可避免。在我国,

电信业的发展刚刚起步,技术研究主要是业务支持系统(BSS)的更新换代[5]。近几年来,一些电信企业也意识到挽留高价值客户的必要性,开始逐步着手对历史数据进行分析、挖掘。但是,大部分都只是试探性的建立简单的模型,有的还处于调研与可行性分析阶段,并没有实际可用的成熟产品投入使用[6]。

1.2.1流失影响因素的相关研究

为了发现导致电信业客户流失的原因,国内外有多位学者对此进行了研究,主要集中在客户满意度、客户忠诚度以及客户转换成本对客户流失的影响。

在国外,Madden et al研究了澳大利亚ISP市场[7],认为客户流失与月消费正相关,与家庭收入负相关;Lee and Feick研究了法国移动通信市场[8],利用回归的方法探讨满意度对客户忠诚度与转换成本对客户忠诚度的主要作用与中介作用。结果表明在相同的满意度水平下,高的转换成本会导致高的客户忠诚度,低的转换成本会带来较低的客户忠诚度;Kim and Kwon研究了韩国电信市场[9],认为网络规模的选择与客户保持有密切关系;Gerpott et al研究了德国电信市场[10],认为号码可移植性的开放对客户保持有影响等等。

在国内,周支立提出基于数据挖掘的客户流失分析方法[11],通过分析流失客户之间的关系以及客户的消费行为,给出了客户流失的规律;吴丽娜等将流失客户分为三类[12],并从客户流失本身的特征和流失客户消费行为特征两方面进行了分析,发现女性客户容易流失,年轻的客户相对不稳定,拨打客户服务电话频率,可作为客户流失预警的重要指标。李竞明从客户价值和客户满意的角度,分析了主动放弃、主动离开、被挖角、被吸引和被迫离开等导致客户流失的主要原因[13]。孔昳等将客户流失分为竞争性客户流失和非竞争性客户流失,并分析了导致这两种流失的原因[14]。

1.2.2挖掘技术的相关研究

数据挖掘领域方法众多,往往是根据所挖掘的知识的不同而采取不同的方法。一般来说,分类是把数据项映射到其中一个事先定义好的类中的这样一个过程[15]。分类可用于预测,预测的目的是从历史数据记录中自动推倒出对给定数据的推广描述,从而能对未来数据进行预测。

分类技术已经在很多领域得到了成功的应用,如医疗诊断,客户流失预测,信用度分析等等。常见的分类方法有决策树、神经网络、贝叶斯分类、遗传算法、支持向量基和逻辑回归等[16]。

目前,在电信行业预测客户流失中前人做了大量的工作,也采用了不同的挖掘方法。其中采用决策树作为挖掘算法的有邱义堂[17]、郭明[18];采用神经网络的有Mozer[19];采用逻辑回归的有KIM[20]、石永华[21];采用支持向量基的有夏国恩[22]等等。

利用数据挖掘方法对企业客户流失进行预测,前人已经做了大量的研究。根据现

有文献的研究结果,决策树和神经网络在客户流失预测方面有比较好的效果。然而这些方法在客户流失预测方面仍有一些不足:

1)大部分研究都采用单个的数据挖掘方法进行预测,这样往往会训练出相似的模式,应用到新的数据时,没有稳定的预测效果。

2)未能很好的对流失特点进行分析。研究都只得出模型预测的准确率,没有利用预测结果对企业进行流失原因分析。

1.3 本文的主要研究内容

基于国内电信行业小灵通业务管理系统数据以及其在客户流失预测方法的不足,结合前人的研究成果,本文拟利用决策树和神经网络算法相结合的模型对客户流失预测行为进行预测。文章主要内容包括:

1)我国电信行业的发展现状、客户流失现状以及对客户流失管理的必要性。概括阐述了数据挖掘的定义、技术分类、算法分类和应用中面临的问题;详细介绍了数据挖掘中的决策树算法和人工神经网络算法。

2)客户流失模型的建模过程。这一部分主要是对决策树和神经网络挖掘算法进行比较,并将两种算法相结合进行建模。混合预测模型如图1.1:

3)在数据仓库基础之上进行的数据挖掘技术研究。并且对所得模型进行充分的验证,直到得出最终满意的模型。

4)模型的验证与评估。提出一种客户流失分析的解决方案,并通过对实际案例的应用,对其有效性和实际操作性进行了验证,取得了良好的效果

1.3.1要重点解决的关键问题

1)建立基础数据集的过程中异构数据的问题。主要是从原文件或原数据库中获取数据,并经过集成、清洁、转换、优化后,将其加载到基础数据集的过程[23]。

2)选取适合电信客户流失模型的分类算法。在决策树分类、贝叶斯分类、神经网络、遗传算法等几种分类方法中选择决策树和神经网络相结合做为分类算法。

3)在决策树算法建树过程中高信息增益结点的判断,此问题基于决策树结点所含信息熵来判断。

1.3.2本课题所要达到的目的

1)提高客户流失预测的精度。本文结合两种数据挖掘算法来建立混合模型,从而提高模型预测的精度。

2)用测试集数据对建立好的模型进行合理化的评估。

3)利用预测结果来指导企业的实践,为企业提供有价值的信息,从而帮助企业制定客户挽留策略,进行客户流失预警。

数据挖掘的算法比较多,在面对具体应用时,挖掘算法跟具体的业务相结合。一个数据挖掘应用可能会同时使用到几个数据挖掘方法,在一个挖掘过程中,不同的步骤可能要用到不同的算法,某个算法可能要利用另一个算法的结果,其输出也可能是另一个算法的输入。因此,在一个挖掘应用中,要经过评价之后,选择效果最好的算法。

1.4 本文的组织结构

本文首先对当前我国电信企业在客户流失分析中应用的技术进行了分析,针对客户流失管理的问题进行了研究,结合所学的数据挖掘方法和技术建立了一个预测模型,并对该方法的可行性进行检验。

本论文共分为五章:

第一章主要阐述了我国电信行业的发展现状、客户流失现状及对客户流失进行管理的必要性,明确论文的研究目的、研究对象和研究重点。

第二章主要介绍了论文所涉及的相关理论知识,概括阐述了数据挖掘的定义、技术分类、算法分类以及业务建模和数据挖掘的相关理论;介绍了CRISP-DM数据挖掘过程参考模型以及基于此标准的Clementine数据挖掘软件。

第三章详细叙述了面向具体小灵通业务的主题分析,包括商业目标、客户流失的表现形式、客户流失的定义、流失因素的分析以及对业务的理解;。

第四章建立客户流失模型并对该模型进行评估,以测试数据为对象,用建立的预测模型进行挖掘,最后给出数据挖掘的结果,并对多种模型挖掘的结果进行了比较。

第五章对山西电信L分公司进行了实例分析,并给出客户挽留意见。

第六章给出了全文的总结、后续工作及展望。

2 数据挖掘理论基础与技术

2.1 数据挖掘理论

2.1.1数据挖掘概述

数据挖掘,顾名思义就是从大量的数据中挖掘出有用的东西,即从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现隐含的、规律的、人们事先未知的,但又是潜在有用的并且最终可理解的信息和知识的非平凡过程[24]。非平凡通常是指数据挖掘过程不是线性的,在挖掘过程中有反复、有循环,所挖掘的知识往往不易通过简单的分析就能得到,这些知识可能隐含在表面现象的内部,需要经过大量的数据的比较分析,应用一些专门处理大数据量的数据挖掘工具。

当然,数据挖掘并没有一个完全精确的定义,在不同的文献或应用领域也有一些其他的定义[24],如Zekulin定义数据挖掘是一个从大型数据库中提取以前未知的、可理解的、可执行的信息,并用它来进行关键的商业决策的过程;数据挖掘以数据仓库和多维数据库中的大量数据为基础,分别利用不同的方法和技术,从不同的角度去发现知识[23];Ferruzza定义数据挖掘是用在知识发现过程中,来辨识存在于数据中的未知模式的一些方法;Jonn则定义数据挖掘是发现数据中有益模式的过程;Parsay 则认为数据挖掘是我们为那些未知的信息模式而研究大型数据集的一个决策支持过程。这些定义主要从数据挖掘的商业应用出发,从此角度看,数据挖掘的主要特点是对商业数据库中的大量事物数据进行抽取、转化、分析和模式化处理,从中提取商业决策的关键知识,也就是说从数据库中自动发现相关商业模式。

我们设法在一个商业环境中理解这项技术。就像所有其他决策支持系统一样,数据挖掘传递信息,图2.1显示了决策支持系统的演进。注意最早的方法就是决策支持系统的原始类型。下一个方法是数据库,它提供了更多有用的决策支持信息。在20世纪90年代,用户通过数据仓库联通查询和报表工具来获得他们需要的决策支持信息,这些数据仓库开始成为决策信息主要的、有价值的来源。更复杂的分析可以使用OLAP工具。到此为止,获取信息的方法是由用户驱动的。但数据的透明性使得任何人都无法使用分析和查询工具来辨别有用的模式。例如,在市场分析中,几乎不可能通过查询和下钻数据仓库的方法来考虑所有可能的联系并了解其内在的关系。这时就需要一项技术,它能学习过去的联系和结果并预测客户的行为,并由自己完成知识发现,且是一个数据驱动的方法而不是用户驱动的方法。这就是数据挖掘需要插手并从用户那里接管过来的地方。

数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程,并且使用这些模型和关系可以进行预测,它帮助决策者寻找数据见潜在的关联,发现被忽略的因素,因而是解决当数据爆炸而信息贫乏问题的一种有效方法。数据挖

掘通常也被称为KDD ——数据库中的知识发现。也就是说,在KDD (Knowledge Discovery in Database )中进行知识学习的阶段称为数据挖掘[24]。数据挖掘是KDD 中的一个非常重要的环节。

数据挖掘是一门交叉学科,融合了人工智能、数据库、统计学、机器学习等多

个领域的理论和技术。数据库、人工智能和数理统计是数据挖掘研究的三根强大的技术支柱。数据挖掘的方法和数学工具包括统计学、决策树、神经网络、模糊逻辑、线性规划等。

2.1.2数据挖掘的作用

基本的核

算资料 选择和抽取数据 析的数据用于决策支持的数据操作型系统数据 原始的决策支持 图2.1 数据挖掘的决策支持过程 ||--------------------------------由用户驱动------------------------------||----由数据驱动--|||知识发现 复杂的分析和计算早期基于文件系统 OLAP 系统真正的决策支持没有决策支持

数据库系统经过数十年的发展,已经保存了大量的日常业务数据。随着数据库和各类信息系统应用的不断深入,数据量的日益积累,每年都要积累大量的数据,并呈增量发现趋势。大量的信息是当今信息社会的特征,是我们的宝贵财富,然而面对海量数据,我们往往无所适从,无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。导致了“我们淹没在数据的海洋中,但却缺少知识”的现象。如何才能不被信息淹没,而是在信息中及时的发现有用的知识,提高信息的利用率?我们希望运用数据挖掘技术从这些数据当中挖掘出知识来。大量数据的背后隐藏了很多具有决策意义的信息,通过对海量数据的分析,发现数据之间的潜在联系,为人们提供自动的决策支持[24]。

数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。数据库技术最初用于联机事务处理,即实现对大量数据的统一存储,并提供对数据的查询、插入、删除等事物性操作随着大量数据的积累,人们不满足只是简单地查询和修改数据,而是希望能够发现数据之间的潜在的关系,因此,对数据库技术提出了新的要求,随着一些相关学科和研究领域的日渐成熟,以及现实世界中商业竞争的压力日渐残酷,企业急切地希望通过怪色处理这些数据获得有利于企业进一步发展的决策依据,而是否能够最大限度的使用信息资源来管理和影响企业决策流程,将决定企业是否能够拥有最大程度的竞争优势,数据挖掘技术于是出现了,并得到快速的应用[24]。

数据挖掘可以应用在各个不同的领域。数据挖掘工具能够对将来的趋势和行为进行预测,从而很好的支持人们的决策,如银行可以使用数据挖掘发现有价值的客户,保险公司和证券公司可以使用数据挖掘来检测欺诈行为等等。数据挖掘自动在大量数据中寻找预测性信息,因此,以往需要领域专家和分析人员进行大量人工分析的问题,如今可以直接由数据本身迅速得出基于知识的决策[24]。

2.1.3数据挖掘的流程

数据挖掘是一个反复的过程,通常包含多个相互联系的步骤,如定义和分析主题、数据预处理、选取算法、提取规则、评价和解释结果、将模式构成知识,最后是应用。并且随着应用需求和数据基础的不同,数据挖掘处理的步骤可能也会有所不同。通常,数据挖掘的基本步骤包括:

1)问题定义与主题分析

进行数据挖掘,首先必须分析应用的领域,包括应用中的各种知识和应用目标[24]。问题定义了解相关领域的有关情况,熟悉背景知识,弄清用户要求。清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。开始真正的数据挖掘之前最先也是最重要的就是了解用户的数据和业务问题。精确定义所要解决的问题是数据挖掘成功的关键要素之一。要想充分发挥数据挖掘的价值,必须对用户的目标有一个

清晰明确的定义,有效的问题定义还应该包含一个对数据挖掘的结果进行衡量的标准。在确定用户的需求后,应对现有的资源如已有的历史数据进行评估,确定是否能够通过数据挖掘技术来解决用户的需求,然后进一步确定数据挖掘的目的和制定数据挖掘计划。

数据是数据挖掘工作成败的基础,因此,分析主题的任务包括对数据进行进一步的理解,如确定数据挖掘所需要的具体数据,对数据进行描述,检查数据的质量等等。

数据挖掘永远不会代替有经验的商业分析师或管理人员所起的作用。数据挖掘需要有一个明确的主题目标,该主题目标决定了此后数据挖掘的各种操作。数据挖掘的主题目标在数据挖掘过程中是可修正的,但其基本原则内容要保持稳定。在数据挖掘过程中,面对不同的用户要制定不同的主题。

2)数据准备

数据挖掘所处理的数据集通常不仅具有海量的数据,而且可能存在大量的噪声数据、冗余数据、稀疏数据或不完全数据等等。解决数据的应用质量问题,充分利用有用的数据清除虚假无用的数据是数据挖掘的基础[24]。

数据准备包含两方面:一是从多个数据源去整合数据挖掘所需要的数据,保证数据的综合性、易用性、数据的质量和数据的时效性,这有可能要用到数据仓库的思想和技术;另一方面就是如何从现有数据中衍生所需要的指标,这主要取决于数据挖掘者的分析经验和工具的方便性。

数据准备包括数据抽取、清洗、转换和加载,具体包含数据的清洗、集成、选择、变换、规约,以及数据的质量分析等步骤。

数据挖掘是由可以获取的数据驱动的,数据挖掘的成败在很大程度上取决于数据的数量和质量。从大量的企业客户数据中找到与分析问题有关的样本数据子集,这样可以减少处理的数据量,但需要保证子集具有典型的代表性。明确要使用的数据并定义所需数据模型。具有代表性的数据模型将定义所用的数据类型、数据来源、数据描述、数据内容等。然后对数据进行预处理、分析,尽可能的对问题解决的要求进一步明确、进一步量化。按问题要求对数据进行修改或组合生成新的数据,以体现对问题状态的有效描述。数据预处理包括对的数据清理、集成和变换、归约、数据离散化以及概念分层。

3)使用算法建立模型

在问题进一步明确的基础上,就可以形成知识的模型,对训练数据集建立一个预测模型,然后再用测试数据集对这个模型进行测试。这一步是数据挖掘的核心环节,一个好的模型不可能做到与已有数据百分之百的相符,但模型对将要预测的数据应有

较好的预测。建立模型是一个反复训练的过程,需要仔细考察不同的模型以判断哪个模型对所需要解决的问题最优化。

数据挖掘中的建模实际上就是利用已知的数据和知识建立一种模型,这种模型可以有效的描述已知的数据和知识,希望该模型能有效的应用到未知的数据或相似情况中。也就是说,建模把一些专业经验、一般规律或普遍情况抽象成一种分析模型。一旦模型建好之后,就可以把它用到那些情形相似而结果未知的判断中[24]。

数据挖掘算法执行阶段首先根据对问题的定义明确挖掘的任务或目的,如分类、聚类、关联规则发现或序列模式发现等。确定了挖掘任务之后,就要决定使用什么算法。在选择好数据挖掘的技术和方法后,下面就要对其建立模型,这是数据挖掘的核心环节。数据挖掘还包括针对特定业务需求而选择最合适的挖掘算法的关键步骤,不仅包括对要使用的适当技术或技术合成定义,还包括技术的应用方式。不同的技术方案产生的结果模型有很大不同,而且模型结果的可理解,也存在较大差异。例如,用决策树方法产生模型结果就比用神经网络技术的结果易于理解。另外,对结果的分析和描述即进行知识发现也很关键,不恰当的描述会造成误导。

可以根据客户的需求,为不同行业的用户建立各种行业的业务分析模型,如电信行业的呼叫行为分析模型、欺诈模型;金融行业的客户信用模型;证券行业的客户资产模型、交易行为模型;零售行业的客户消费习惯模型等等。

挖掘数据的过程就是按照人们设计的模型对数据进行处理、分析、预测的过程它是人的经验、分析过程在计算机中的实现。

4)对模型的评估

模型评估将发现的知识以用户能了解的方式呈现,根据需要对数据挖掘过程中的某些处理阶段进行优化,知道满足要求为止。

评估的方法一种是直接使用原先建立的挖掘数据库中的数据来进行检验,也可以另找新的测试数据对其进行检验,另一种方法是使用实际运行环境中的当前数据进行检验。检测的目的是对整个数据挖掘过程的前面几个步骤进行评估,确定下一步的该怎么做,是发布模型,还是对数据挖掘过程进行进一步的调整,如重新选择数据、采用新的数据挖掘算法等等。

5)知识的应用

数据挖掘的目的是为了应用,因此我们需要将数据挖掘中发现的规则整合到业务系统当中。在采取任何行动之前一定要经过分析,否则可能得不到预期的效果。在确认数据挖掘的结果后,必须将所得到的知识集成到业务信息系统的组织结构中去,并在业务系统中进一步验证,在知识集成过程中可以采用预先、可信的知识检查和解决知识中可能的矛盾。

将知识集成到业务系统后,还需要对这些知识进行日常的检测和维护。企业可获得的知识是多方位的,但并不是所有的知识都能够或应该获取。由于知识的时效性和不确定性,许多时候更多的知识并不能带来竞争优势。知识的应用需要根据企业的要求提供对知识及其使用的测量和评价,鉴定哪些是企业所需要的知识,建立从应用到知识的反馈。

2.1.4数据挖掘技术分类

预测的目的是从历史数据记录中自动推导出给定数据的一般性描述,从而能对未来数据进行预测。分类技术作为数据挖掘用于预测的有效手段之一,其目的是学会一个分类函数或分类模型,该模型能把数据库中的数据项映射到给定类别中的某一个,可以利用历史数据记录并从中自动推导出对给定数据的一般性描述,从而能对未来事物进行判断。因此,要建立电信客户流失预测模型,需要对数据挖掘分类技术进行选择[25]。目前,针对分类问题已有了许多不同领域方法的算法,例如统计学、机器学习、神经网络和粗糙集理论等等[26]。

1)统计分析方法

在数据库字段项之间存在两种关系函数关系能用函数公式表示的确定性关系和相关关系不能用函数公式表示,但仍是相关确定性关系,对它们的分析可采用统计学方法,即利用统计学原理对数据库中的信息进行分析。可进行常用统计、回归分析、相关分析、差异分析等[27]。

2)决策树方法

决策树作为一种常用的机器学习方法,主要用于建立预测模型,它通过将大量数据有目的分类,从中找到一些有价值的、潜在的信息。它的主要优点是描述简单,分类速度快,特别适合大规模的数据处理。最有影响和最早的决策树方法是由Quinlan提出的著名的基于信息熵的ID3算法[28]。该算法存在的主要问题是ID3是非递增学习算法;ID3决策树是单变量决策树,复杂概念的表达困难;同性间的相互关系强调不够;抗噪性差。针对上述问题,出现了许多较好的改进算法,如Schlimmer 和Fisher设计了ID4递增式学习算法[29];钟鸣、陈文伟等提出了IBLE算法等。

3)神经网络方法

神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性,非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类:以感知机、BP反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型[30];以Hopfiled的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以ART 模型、Koholon模型为代表的,用于聚类的自组织映射方法。神经网络方法的缺点是

“黑箱”性,人们难以理解网络的学习和决策过程。

4)关联规则方法

基于关联规则的分类方法是一种新的数据挖掘分类方法,该方法是将数据挖掘中使用最广泛的关联规则挖掘理论引入到分类问题中而提出的以Apriori算法为核心的分类方法[31]。该方法对布尔型数据的分类有较强的处理能力,通过离散化处理后也可以处理连续型数据。数据实验发现基于关联规则的分类方法在处理包含孤立点的非连续模型时就有比C4.5更强的精确性。

5)基于粗糙集的分类

粗糙集理论(Rough Set)由波兰数学家Pawlak于1982年首先提出[32]。目前,粗糙集理论己经成为知识发现领域的一种重要的数学工具。粗糙集理论利用等价类、上近似集、下近似集等概念对数据进行分类,可以发现不精确数据及噪声数据的内在结构关系。粗糙集分类方法主要用于具有离散属性值的数据进行分类,而对连续属性值数据分类则需要进行离散化处理。

以上算法中,大部分都不是专为解决某个问题而特制的,算法之间也并不互相排斥,不能说一个问题一定要采用某种算法,其他的就不行。一般来说,并不存在所谓最好的算法,在最终决定选取哪种模型或算法之前,需要评测各种不同的算法,然后再选取一种挖掘结果较好的,不同算法在不同的数据环境中,优劣会有所不同。如神经网络为解决大复杂度问题上提供了一种有效的简单方法,可以很容易地解决具有上百个参数的问题,但挖出的结果却很难解释,并且所耗的资源也是最大的,而决策树相对来说,其结构和规则推理的过程是开放的、清楚的,可浏览的。

数据挖掘的应用中,最终的目标都是发现有价值的知识和信息,有共同的解决方法和步骤,但也存在很大的差异和区别。由于各种方法都有自身的功能特点以及不同的应用领域,数据挖掘技术的选择将影响最后结果的质量和效果,通常是将多种技术结合使用,形成优势互补[33][34]。

2.2 采用的数据挖掘技术与工具

2.2.1决策树技术

决策树是一个类似于流程图的树结构,其中每个内部节点表示在一个属性上的测试,每个分支代表一个测试输出,而每个叶节点代表类或类分布[35]。它的基本思想是使用有属性描述的训练数据,根据属性构造决策树。它是能够被看作一棵树的预测模型。树的每个分支都是一个分类问题[36],树叶是带有分类的数据分割。从根节点到叶节点为一条生成规则。整棵树就代表着决策集的树形结构。用这棵树(或由这棵树形成的规则集)就可以对测试样本进行分类预测。

决策树算法通常分为两个阶段:决策树构建(Building)阶段和决策树修剪

(Pruning )阶段[37]。在决策树构建阶段,对属性的选择也就是依据什么技术对记录进行分割是关键的一步,目前决策树算法从这点来分可分为两类:基于信息论(Information Theory )的方法和最小GINI 指标(Lowest GINI index )方法。基于前者的算法有ID3、C4.5,后者有CART 、SLIQ 和SPRINT 。在决策树的修剪阶段,目前有三种修剪策略:基于代价复杂度的修剪(Cost ——Complexity Pruning )、悲观修剪(Pessimistic Pruning )和MDL (Minimum Description Length )修剪。不同的算法采用的修剪策略也不尽相同。

C4.5算法是Quilan 在1993年提出的。它在建树阶段采用了信息增益的方法,修剪阶段采用了悲观修剪。在应用于单机的决策树算法中,C4.5算法不仅分类准确而且是速度最快的。下面就详细的介绍一下C4.5算法

[38]。

1)建树阶段

在建树阶段该算法从树的根节点处的所有训练样本开始,选取一个属性值用于区分这些样本。对属性的每一个值产生一个分支,分支属性值的相应样本子集被移到新生成的子节点上,这个算法递归地应用于每个子节点上,直到节点的所有样本都分区到某个类中,到达决策树的叶节点的每条路径表示一个分类规则。这种自顶向下的决策树的生成算法的关键性决策就是对节点属性值的选择。选择不同的属性值会使划分出来的记录子集不同,影响决策树生长的快慢以及决策树结构的好坏,从而导致找到的规则信息的优劣。此算法对属性选择的基础是基于使生成的决策树中节点所含的信息熵最小。

所谓熵在系统学上是表示事物的无序度。熵越小那么记录集合的无序性越小,也就是说记录集合内的属性越有顺序有规律,这也正是我所追求的目标。集合的熵的计算公式2.1如下[38]:

2()(((,)/||)log ((,)/||))k

i i Info S freq C S S freq C S S =?×∑ (2.1)

其中(,)i freq C S 代表集合S 中属于类i C (k 个可能类中的一个)的样本数量。||S 表

示集合S 中的样本数量。上面的公式仅仅给出了一个子集的熵的计算,如果按照某个属性进行分区后就涉及到若干个子集,需要对这些子集进行熵的加权和的计算,公式2.2如下所示:

()((||/||)())x i i Info T T T Info T =?×∑ (2.2)

其中T 是按照属性x 进行分区的集合。为了更加明显的比较不同集合的熵的大小,计算分区前的集合的熵和分区后的集合的熵的差(也称作增益),增益大的就是我们要

选取的节点。公式2.3如下:

()()()x Gain X Info T Info T =? (2.3)

以下是一个简单的电信客户资料集合来说明决策树的建立。给出数据集,其中有9个样本,通过三个输入属性描述并且全部属于两个类(流失、不流失)之一。以表格的形式给出数据集合如表2.1所示: 表2.1 电信客户资料表

性别 男 女 女 女 男 男 女 女 男 年龄 24 45 23 48 46 51 30 35 43 入网

优惠

不优 惠 不优 惠 优 惠 不优 惠 不优 惠 优 惠 不优 惠 优 惠 不优 惠 是否

流失 流 失 流 失 不流失 不流失 不流失 流 失 不流失 不流失 不流失

我们需要研究得出的就是三个属性中分别属于流失和不流失的共性的值。分区前的熵为:

22()339660.9184Info T =??=比特

首先,分别根据客户性别和优惠情况对样本进行分类,所得到的信息增益如下所示:

12222()49(12log 1212log 12)511440.9x Info T =??+??=比

1()0.91840.90.0184Gain x =?=比特

32222()313log 1323log 23)69(113220.9183x Info T =??+??=比特

3()0.91840.91830.0001Gain x =?=比特

其中1x ,3x 分别表示客户性别属性和是否优惠,现在客户年龄属性还没有计算,

因为客户年龄属性是个连续变量,我们必须把它离散化处理。这里的离散化是把连续的样本排成顺序,然后找出它的中间某个值(称作阀值),使得根据阀值计算出来的信息增益达到最大。我的例子中客户年龄的阀值是{23,24,30,35,43,45,46,48,51},从这几个值中选取最优阀值(最高信息增益),对于我的例子来讲阀值选定为48。

22222()29(12log 1212log 12)79(2log 275log 57)0.721x Info T =??+??=比特

2()0.91840.7210.1974Gain x =?=比特

现在比较一下三个属性的信息增益,可以看出客户年龄具有最高信息增益率0.1974比特,所以选择客户年龄对决策树进行首次分区。如图2.2:

客户端客户流失情况分析报告

客户端客户流失情况分析报告 针对客户端近期出现幅度较大的客户流失现象,我方在各应用平台(包括360手机助手、豌豆荚、百度手机助手、应用宝、APP Store等)从手机系统、评价类别、问题类别等多个维度进行了信息采集及整理、分析,得出以下结论: 一、整体情况(Android和IOS) 从整体情况来看,Android和IOS系统均为差评量大于好评量,且导致差评的问题均体现在用户体验方面,如无法进入、无法升级、卡屏、闪退、登录失败等。 二、Android系统情况 1、360手机助手(手机端+PC端) 从360手机助手渠道的下载情况及用户评价情况来看,360手机助手手机端+PC端的总下载量为79万,共计344条用户评论。我们在双渠道各挑选了

前50名用户(即100名)评论作为数据样本进行分析,共有25条好评,75条差评,差评占比达75%。 导致差评的原因主要为无法进入、登录失败、卡屏、无法升级等方面。 2、豌豆荚(手机端+PC端) 从豌豆荚渠道的下载情况及用户评价情况来看,豌豆荚手机端+PC端的总下载量为84万,共计42条用户评论。从整体评论情况来看,差评数量仍明显大于好评数量,好评数量为6条,差评数量为36条,差评占比达86%。导致用户差评的原因均体现在客户端无法进入方面。

3、百度手机助手 从百度手机助手渠道的下载情况及用户评价情况来看,百度手机助手的总下载量为234万,共计34条用户评论。从整体评论情况来看,差评数量仍明显大于好评数量,好评数量为5条,差评数量为29条,差评占比达85%。导致用户差评的原因也均体现在客户端无法进入方面。 4、应用宝 从应用宝渠道的下载情况及用户评价情况来看,应用宝的总下载量为106万,共计246条用户评论。从筛选的前50条用户评论情况来看,差评数量仍明显大于好评数量,好评数量为15条,差评数量为35条,差评占比达70%。

数据清洗数据分析数据挖掘

数据清洗 1.基本概念 数据清洗从名字上也看的出就是把"脏"的"洗掉",指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。因为数据仓库中的数据是面向某一主题的数据的集合,这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是我们不想要的,称为"脏数据"。我们要按照一定的规则把"脏数据""洗掉",这就是数据清洗。而数据清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。数据清洗是与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。 主要类型 残缺数据 这一类数据主要是一些应该有的信息缺失,如供应商的名称、分公司的名称、客户的区域信息缺失、业务系统中主表与明细表不能匹配等。对于这一类数据过滤出来,按缺失的内容分别写入不同Excel文件向客户提交,要求在规定的时间内补全。补全后才写入数据仓库。 折叠错误数据

这一类错误产生的原因是业务系统不够健全,在接收输入后没有进行判断直接写入后台数据库造成的,比如数值数据输成全角数字字符、字符串数据后面有一个回车操作、日期格式不正确、日期越界等。这一类数据也要分类,对于类似于全角字符、数据前后有不可见字符的问题,只能通过写SQL语句的方式找出来,然后要求客户在业务系统修正之后抽取。日期格式不正确的或者是日期越界的这一类错误会导致ETL运行失败,这一类错误需要去业务系统数据库用SQL 的方式挑出来,交给业务主管部门要求限期修正,修正之后再抽取。 折叠重复数据 对于这一类数据--特别是维表中会出现这种情况--将重复数据记录的所有字段导出来,让客户确认并整理。 数据清洗是一个反复的过程,不可能在几天内完成,只有不断的发现问题,解决问题。对于是否过滤,是否修正一般要求客户确认,对于过滤掉的数据,写入Excel文件或者将过滤数据写入数据表,在ETL开发的初期可以每天向业务单位发送过滤数据的邮件,促使他们尽快地修正错误,同时也可以做为将来验证数据的依据。数据清洗需要注意的是不要将有用的数据过滤掉,对于每个过滤规则认真进行验证,并要用户确认。 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。

移动通信行业客户流失分析

思达商智(北京)软件技术有限公司 | 机密 移动通信行业客户流失分析 Inetsoft 对待客户流失的观点 在进行客户流失分析之前,有必要先阐述一下Inetsoft 对于客户流失这个现象的一些观点: 1. 流失在所难免,我们需要做的不是消除客户流失,而是确保流失率控制在较低水平。 2. 移动通信行业公司的运营支撑等系统已经积累了丰富的信息,使得我们可以通过内 部信息系统,定期分析客户流失情况。 3. 通过仔细分析客户流失原因,有利于我们采取相应策略来降低有价值客户的流失率, 真正的提高成本收益比。 4. 我们认为许多客户是可以挽回的,准确的分析可以提供正确的挽回措施。 5. 对于不值得挽回的客户,彻底放弃。这些客户包括低价值客户(挽回成本超过所能 获得的收益的客户)和声望太差的客户(恶意欠费的客户等)。 这些观点是Inetsoft 在进行客户流失分析时的指导思想,也代表了在这类CRM 分析中的基本世界观。 为什么要关注客户流失? 移动通信行业的现有企业中,一般情况下客户月流失率在3%左右,如果静态计算,则所有客户会在 2 - 3 年内全部流失。 在降低客户流失率方面,哪怕仅仅降低 1 %就意味着你至少可以有百万元的收入增长!客户是一个公司最宝贵的财富,因此保持客户并增长客户就是头等重要的事情,同是又是很困难的一项任务。 在2011年底,中国的人口已达1347350000,同时手机量达到1006923000,也就是说中国的手机普及率差不多达到了75%,现有的用户数几乎已经接近人口总数。在一个如此成熟和饱和的市场中,开拓新用户的难度可想而知。根据美国市场营销学会顾客满意手册的统计数据表明,吸引一个新顾客所耗费的成本大概相当于保持一个现有客户的5倍,而且从传统意义上来讲,移动通信行业保留旧客户利润率为开发一位新客户之16 倍,尤其对于剩余客户市场日渐稀疏的移动通信市场来说,减少客户流失就意味着用更少的成本减少利润的流失,这点已经为运营商所广为接受。 由此可见客户保持的重要性,也就是说保留旧客户比开发、吸收新客户更重要。在成熟期的产品市场中,要开拓新客户很不容易。客户的忠诚度应该是一个企业能够生存发展的最大资产之一,拥有忠诚度的客户,会因客户有学习的效果,而使企业可以花费较少的成本来服务客户,降低了公司在服务成本上的支出,而且忠诚的客户也会宣传正面的口碑效应以作为他人的参考,进而替企业创造新的交易。一旦企业无法留住客户,将因客户的

流失客户原因分析修订稿

流失客户原因分析公司标准化编码 [QQX96QT-XQQB89Q8-NQQJ6Q8-MQM9N]

流失客户原因分析 1、公司人员流动导致客户流失 这是现今客户流失的重要原因之一,特别是公司的高级营销管理人员的离职变动,很容易带来相应客户群的流失。因为职业特点,如今,营销人员是每个公司最大最不稳定的“流动大军”,如果控制不当,在他们流失的背后,往往是伴随着客户的大量流失。 2、竞争对手夺走客户。 任何一个行业,客户毕竟是有限的,特别是优秀的客户,更是弥足珍稀的,所以往往优秀的客户自然会成为各大厂家争夺的对象。小心,也许你的主要竞争对手现在正在对你的大客户动之以情,晓之以理、诱之以利,以引诱他放弃你而另栖高枝。任何一个品牌或者产品肯定都有软肋,而商战中的竞争对手往往最容易抓到你的软肋,一有机会,就会乘虚而入。 3、市场波动导致失去客户 企业的波动期往往是客户流失的高频段位,任何企业在发展中都会遭受震荡,比如高层出现矛盾,比如企业资金出现暂时的紧张、比如出现意外的灾害等等,都会让市场出现波动,这时候,嗅觉灵敏的客户们也许就会出现倒戈。其实,在商业场中,以利为先的绝大多数商人多会是墙头草,那边有钱可赚就会倒向哪边。 4、细节的疏忽使客户离去 客户与厂家是利益关系纽带牵在一起的,但情感也是一条很重要的纽带,一些细节部门的疏忽,往往也会导致客户的流失。 某企业老板比较吝啬,其一代理商上午汇款50万并亲自来进货,中午企业却没安排人接待,只叫他去食堂吃了一个盒饭。代理商觉得很委屈,回去后就调整经营策略做起了别的品牌。 5、诚信问题让客户失去 厂家的诚信出现问题,有些业务经理喜欢向客户随意承诺条件,结果又不能兑现,或者返利、奖励等不能及时兑现给客户,客户最担心和没有诚信的企业合作。 一旦有诚信问题出现,客户往往会选择离开。 6、店大欺客,客户不堪承受压力 店大欺客是营销中的普遍现象,一些着名厂家的苛刻的市场政策常常会使一些中小客户不堪重负而离去。 或者是心在曹营心在汉,抱着一定抵触情绪来推广产品。一遇到合适时机,就会甩手而去。 7、企业管理不平衡,令中小客户离去 营销人士都知道“80%的销量来自20%的客户”,很多企业都设立了大客户管理中心,对小客户则采取不闻不问的态度。广告促销政策也都向大客户倾斜,使得很多小客户产生心理不平衡而离去。其实不要小看小客户20%的销售量,比如一个年销售额10个亿的公司,照推算其小客户产生的销售额也有2个亿,且从小客户身上所赚取的纯利润率往往比大客户高,算下来绝对是一笔不菲的数目。

客户流失分析实验报告

客户流失分析实验报告 所谓客户流失是由于企业各种营销手段的实施而导致客户和企业中止合作的现象就是客户流失。而现在客户流失的现状:在营销手段日益成熟的今天,我们的客户仍然是一个很不稳定的群体,因为他们的市场利益驱动杠杆还是偏向于人、情、理的。如何来提高客户的忠诚度是现代企业营销人一直在研讨的问题。客户的变动,往往意味着一个市场的变更和调整,一不小心甚至会对局部(区域)市场带来致命的打击。这个现象在医药企业的处方产品中突显,一个医院由一个代表做到一定的销售量,但是这个医药代表离开后,那么销量的下滑是很明显的。如果你是公司的管理者,请务必在关键时刻擦亮你的眼睛,以免你的客户在不经意间流失,给公司的市场运作带来不利影响。当然,这其中的因素和地区的主管、经理也有很大的直接关系。 下面介绍淘宝和凡客优缺点: 淘宝 优势 首先,东西真的多,涉及我们生活中所有需求方面的物品几乎应有尽有。在琳琅满目中,只要稍稍花点心思,选择一下,总能找到自己喜欢的,需要的物品。 然后,性价比高,这主要是由于,淘宝经营商家成本相对实体店要低得多,除掉了店面租金,店员工资,各种税费等等开销。淘店家所要付出的成本就是进货价加运费,以及自己的时间。淘宝店铺租金甚少,普通店铺是不收费用的,旺铺一年下来不到一千块钱,算到每件物品上就是极小的数字了。因此,店家所售之物成本自然大大降低,价钱自然也会比实体店便宜的多。网络上大部分商品都是低价售出的,店家基本是基于薄利多销,量多为盈的原则。 劣势 首先,买一件东西,看图片和实物多少是有误差的。诸如服装类,关于颜色,尺码等等,只是按照自己平时所穿,喜好来挑选。 然后就是关于退换货问题了。还是拿衣服来做说明,有些人拿到货品后,确实与自己平时所穿尺寸不符,那可能就是由于各个厂家所出货品尺寸方面确实不是完全一致,诸如款式之类,南北方所出的货品就有偏大,偏小之说。 凡客 优势 客服,是用随时监听、电话录音、现场指导来提高客服质量的。 反馈真实,每次购物结束都会有一个反馈单子,充分让客户体会到自由,而且无论是好是坏都会被如实的反映,这样让客户感觉真实,提高了信誉度。 物流,货物的物流信息会在货物流通的同时发到手机上,拥有自己的物流子公司,快速、安全。 劣势 客户通话洽谈只有第一次是免费的,之后都得自己付费。 交易过程中,客户只能通过评论和图片来了解物品,没有直接的沟通方式。以上各方面都会造成一定的客户流失,而其主要原因有以下几点: 1、公司人员流动导致客户流失:这是现今客户流失的重要原因之一,特别是公司的高级营销管理人员的离职变动,很容易带来相应客户群的流失。因为职业特

数据挖掘与分析心得体会

正如柏拉图所说:需要是发明之母。随着信息时代的步伐不断迈进,大量数据日积月累。我们迫切需要一种工具来满足从数据中发现知识的需求!而数据挖掘便应运而生了。正如书中所说:数据挖掘已经并且将继续在我们从数据时代大步跨入信息时代的历程中做出贡献。 1、数据挖掘 数据挖掘应当更正确的命名为:“从数据中挖掘知识”,不过后者显得过长了些。而“挖掘”一词确是生动形象的!人们把数据挖掘视为“数据中的知识发现(KDD)”的同义词,而另一些人只是把数据挖掘视为知识发现过程的一个基本步骤! 由此而产生数据挖掘的定义:从大量数据中挖掘有趣模式和知识的过程!数据源包括数据库、数据仓库、Web、其他信息存储库或动态地流入系统的数据。作为知识发现过程,它通常包括数据清理、数据集成、数据变换、模式发现、模式评估和知识表示六个步骤。 数据挖掘处理数据之多,挖掘模式之有趣,使用技术之大量,应用范围之广泛都将会是前所未有的;而数据挖掘任务之重也一直并存。这些问题将继续激励数据挖掘的进一步研究与改进! 2、数据分析 数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 数据分析有极广泛的应用范围。典型的数据分析可能包含以下三个步: 1、探索性数据分析:当数据刚取得时,可能杂乱无章,看不出规律,通过作图、造表、用各种形式的方程拟合,计算某些特征量等手段探索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性。 2、模型选定分析,在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。 3、推断分析:通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。 数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。这一过程是质量管理体系的支持过程。在产品的整个寿命周期,包括从市场调研到售后服务和最终处置的各

回访客户分析报告

回访客户分析报告标准化管理部编码-[99968T-6889628-J68568-1689N]

电话回访总结 为加强我公司与顾客之间的沟通,了解我们服务上的不足和缺陷,我们对停奶的用户进 行了电话回访,更好的了解我们公司整体存在的一些问题。 一调查总结 此次确定回访人数 653人其中回访人数515人无法回访人数138人回访率为78.86% 其中21.13%的人为电话关机停机未接等等!从通过电话回访的效果来看,缩短了我公司和顾客之间的距离,加强了我们与顾客之间的情感沟通。在回访中,受访顾客表示感到我公司对顾客的关心以及人性化管理模式,表示很赞同以及以后有需要优先选择我公司的意向! 二情况分析 1. 在此次回访中,重新开始喝奶的为16户(其中3户为以前的顾客,业务出去开户重新填写了资料)占据回访到的顾客比例是3.10% 这一部分顾客表示对公司还是很认可的,其中出现了一些误会,通过解释沟通表示可以理解! 2. 在此次回访中,感觉咱们公司配送服务这一块服务不到位的有10户占据回访到顾客比例是1.94% 这一部分顾客敢于实话实说强烈的表达了对公司服务人员的不满(奶按时送不到,说话不礼貌,乱记账等等...)虽已解释道歉但以后会订购的机会微乎其微! 3.在此次回访中,对奶的口感不太满意的人有24人占据回访顾客比例是 4.66% 这一部分顾客表示对奶的口感很不习惯,对咱们这个奶的日期觉得不新鲜!虽已解释,但是以后会订购的机会微乎其微! 4. 在此次回访中,不在榆次的和搬家了的有73人占据回访到顾客的比例是14.17% 这部分顾客对产品和服务没有什么意见,觉得都挺好的,等回来榆次会继续订购的概率还是相对来说有百分之三十到五十的几率! 5. 在此次回访中,觉得咱们奶的价格比较贵的有20人占据顾客比例是 3.88% 这部分顾客基本已订购古城或者榆次本地的散户奶,再次订购我们的奶的机会很低! 6. 在此次回访中,天气冷了.孩子不想喝的人有161人占据顾客比例的31.26% 这部分顾客大多数是应为天凉了酸奶不愿意喝,鲜奶又不爱喝!还有部分是孩子喝的时间长了,有点腻了,孩子去外地上学了等...这一部分人来年开春了订购的机率在百分之五十及其以上! 7. 在此次回访中,应为个人原因喝不惯或者以后都不需要的以及从来没有订购过!这样的顾客有210 占据顾客比例占据 40.77% 这部分顾客很明确的已表态不需要了,再次订购也不是没有可能,但是目前是不需要了! 三改进措施 通过此次电话回访的情况分析,提出如下建议: 1. 员工上岗要统一培训,多进行沟通,使他们思想稳定,加强对我公司的认同感,避免人员流失造成的损失!

数据清洗数据分析数据挖掘

数据清洗1.基本概念 数据清洗从名字上也看的出就是把"脏"的"洗掉",指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。因为中的数据是面向某一主题的数据的集合,这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是我们不想要的,称为""。我们要按照一定的规则把"""洗掉",这就是数据清洗。而数据清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。数据清洗是与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。 主要类型 残缺数据 这一类数据主要是一些应该有的信息缺失,如的名称、分公司的名称、客户的区域信息缺失、业务系统中主表与明细表不能匹配等。对于这一类数据过滤出来,按缺失的内容分别写入不同Excel文件向客户提交,要求在规定的时间内补全。补全后才写入。 错误数据 这一类错误产生的原因是业务系统不够健全,在接收输入后没有进行判断直接写入造成的,比如数值数据输成全角数字、字符串数据后面有一个回车操作、日期格式不正确、日期越界等。这一类数据也要分类,对于类似于、数据前后有

不可见字符的问题,只能通过写语句的方式找出来,然后要求客户在业务系统修正之后抽取。日期格式不正确的或者是日期越界的这一类错误会导致ETL运行失败,这一类错误需要去业务用SQL的方式挑出来,交给业务主管部门要求限期修正,修正之后再抽取。 重复数据 对于这一类数据--特别是维表中会出现这种情况--将重复数据记录的所有字段导出来,让客户确认并整理。 数据清洗是一个反复的过程,不可能在几天内完成,只有不断的发现问题,解决问题。对于是否过滤,是否修正一般要求客户确认,对于过滤掉的数据,写入Excel文件或者将过滤数据写入数据表,在ETL开发的初期可以每天向业务单位发送过滤数据的邮件,促使他们尽快地修正错误,同时也可以做为将来验证数据的依据。数据清洗需要注意的是不要将有用的数据过滤掉,对于每个过滤规则认真进行验证,并要用户确认。 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。 类型 在统计学领域,有些人将数据分析划分为描述性统计分析、探索性数据分析以及验证性数据分析;其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。 探索性数据分析是指为了形成值得假设的检验而对数据进行分析的一种方法,是对传统统计学假设检验手段的补充。该方法由美国着名统计学家约翰·图基(John Tukey)命名。

如何做好客户流失原因分析

如何做好客户流失原因分析 课程描述: 你的客户为什么逐渐不见了?为什么产品销量日渐下滑了?这时你就需要对客户流失原因进行分析,只有做好分析才能更加深入的了解到,流失客户的分布特征、流失的原因,进而做好客户挽留,减少客户的流失。 本课程将从实务角度出发,透过情景案例的形式,深入浅出地为您阐述如何做好客户流失原因分析,并为您提供有效的方法与流程。 解决方案: 他山之石,可以攻玉! 你的客户为什么逐渐不见了?为什么产品销量日渐下滑了?这时你就需要对客户流失原因进行分析,只有做好分析才能更加深入的了解到,流失客户的分布特征、流失的原因,进而做好客户挽留,减少客户的流失。下面我们从实战经验中总结一些方法流程,以便大家参考,少走弯路! 做好客户流失原因分析,需要做好工作安排,然后进行数据收集,最后综合分析形成报告即可,但是,每一项工作都需要注意一些细节问题,否则事倍功半。

做好客户流失原因分析准备工作可以从以下方面着手: 1)制定时间进度计划。为保证分析工作按时完成,可以根据分析工作主要步骤,包括分析准备工作、数据收集、数据统计分类、具体分析、完成分析报告等制定时间进度计划。 2)明确分析维度。从这些分析维度展开需要哪些数据,具体数据字段定义。比如客户流失原因分析,可以考虑从客户流失具体原因,客户类型,客户所属区域、客户流失时间,客户合作时间等。 3)确定所需数据。具体来说包括: a、数据收集范围即数据源; b、数据字段信息; c、数据要求等。 4)明确数据收集方式和时间,比如本案例中需要收集客户流失原因、客户类型等信息,可以采用调查法进行,对于客户区域、开始合作和流失时间可以从系统进行统计收集。 做好客户流失原因分析数据收集工作。 首先,需要对数据收集工作做好安排,特别在需要其他人员配合提供数据时。如果能够得到领导支持推动,数据收集可以起到事半功

数据挖掘系统设计技术分析

数据挖掘系统设计技术分析 【摘要】数据挖掘技术则是商业智能(Business Intelligence)中最高端的,最具商业价值的技术。数据挖掘是统计学、机器学习、数据库、模式识别、人工智能等学科的交叉,随着海量数据搜集、强大的多处理器计算机和数据挖掘算法等基础技术的成熟,数据挖掘技术高速发展,成为21世纪商业领域最核心竞争力之一。本文从设计思路、系统架构、模块规划等方面分析了数据挖掘系统设计技术。 【关键词】数据挖掘;商业智能;技术分析 引言 数据挖掘是适应信息社会从海量的数据库中提取信息的需要而产生的新学科。它可广泛应用于电信、金融、银行、零售与批发、制造、保险、公共设施、政府、教育、远程通讯、软件开发、运输等各个企事业单位及国防科研上。数据挖掘应用的领域非常广阔,广阔的应用领域使用数据挖掘的应用前景相当光明。我们相信,随着数据挖掘技术的不断改进和日益成熟,它必将被更多的用户采用,使企业管理者得到更多的商务智能。 1、参考标准 1.1挖掘过程标准:CRISP-DM CRISP-DM全称是跨行业数据挖掘过程标准。它由SPSS、NCR、以及DaimlerChrysler三个公司在1996开始提出,是数据挖掘公司和使用数据挖掘软件的企业一起制定的数据挖掘过程的标准。这套标准被各个数据挖掘软件商用来指导其开发数据挖掘软件,同时也是开发数据挖掘项目的过程的标准方法。挖掘系统应符合CRISP-DM的概念和过程。 1.2ole for dm ole for dm是微软于2000年提出的数据挖掘标准,主要是在微软的SQL SERVER软件中实现。这个标准主要是定义了一种SQL扩展语言:DMX。也就是挖掘系统使用的语言。标准定义了许多重要的数据挖掘模型定义和使用的操作原语。相当于为软件提供商和开发人员之间提供了一个接口,使得数据挖掘系统能与现有的技术和商业应用有效的集成。我们在实现过程中发现这个标准有很多很好的概念,但也有一些是勉为其难的,原因主要是挖掘系统的整体概念并不是非常单纯,而是像一个发掘信息的方法集,所以任何概念并不一定符合所有的情况,也有一些需要不断完善和发展中的东西。 1.3PMML

流失客户原因分析

流失客户原因分析 1、公司人员流动导致客户流失 这是现今客户流失的重要原因之一,特别是公司的高级营销管理人员的离职变动,很容易带来相应客户群的流失。因为职业特点,如今,营销人员是每个公司最大最不稳定的“流动大军”,如果控制不当,在他们流失的背后,往往是伴随着客户的大量流失。 2、竞争对手夺走客户。 任何一个行业,客户毕竟是有限的,特别是优秀的客户,更是弥足珍稀的,所以往往优秀的客户自然会成为各大厂家争夺的对象。小心,也许你的主要竞争对手现在正在对你的大客户动之以情,晓之以理、诱之以利,以引诱他放弃你而另栖高枝。任何一个品牌或者产品肯定都有软肋,而商战中的竞争对手往往最容易抓到你的软肋,一有机会,就会乘虚而入。 3、市场波动导致失去客户 企业的波动期往往是客户流失的高频段位,任何企业在发展中都会遭受震荡,比如高层出现矛盾,比如企业资金出现暂时的紧张、比如出现意外的灾害等等,都会让市场出现波动,这时候,嗅觉灵敏的客户们也许就会出现倒戈。其实,在商业场中,以利为先的绝大多数商人多会是墙头草,那边有钱可赚就会倒向哪边。 4、细节的疏忽使客户离去 客户与厂家是利益关系纽带牵在一起的,但情感也是一条很重要的纽带,一些细节部门的疏忽,往往也会导致客户的流失。 某企业老板比较吝啬,其一代理商上午汇款50万并亲自来进货,中午企业却没安排人接待,只叫他去食堂吃了一个盒饭。代理商觉得很委屈,回去后就调整经营策略做起了别的品牌。 5、诚信问题让客户失去 厂家的诚信出现问题,有些业务经理喜欢向客户随意承诺条件,结果又不能兑现,或者返利、奖励等不能及时兑现给客户,客户最担心和没有诚信的企业合作。一旦有诚信问题出现,客户往往会选择离开。 6、店大欺客,客户不堪承受压力 店大欺客是营销中的普遍现象,一些着名厂家的苛刻的市场政策常常会使一些中小客户不堪重负而离去。 或者是心在曹营心在汉,抱着一定抵触情绪来推广产品。一遇到合适时机,就会甩手而去。 7、企业管理不平衡,令中小客户离去 营销人士都知道“80%的销量来自20%的客户”,很多企业都设立了大客户管理中心,对小客户则采取不闻不问的态度。广告促销政策也都向大客户倾斜,使得很多小客户产生心理不平衡而离去。其实不要小看小客户20%的销售量,比如一个年销售额10个亿的公司,照推算其小客户产生的销售额也有2个亿,且从小客户身上所赚取的纯利润率往往比大客户高,算下来绝对是一笔不菲的数目。

什么叫数据挖掘_数据挖掘技术解析

什么叫数据挖掘_数据挖掘技术解析 数据挖掘(data mining)是指从大量的资料中自动搜索隐藏于其中的有着特殊关联性的信息的过程。在全世界的计算机存储中,存在未使用的海量数据并且它们还在快速增长,这些数据就像待挖掘的金矿,而进行数据分析的科学家、工程师、分析员的数量变化一直相对较小,这种差距称为数据挖掘产生的主要原因。数据挖掘是一个多学科交叉领域,涉及神经网络、遗传算法、回归、统计分析、机器学习、聚类分析、特异群分析等,开发挖掘大型海量和多维数据集的算法和系统,开发合适的隐私和安全模式,提高数据系统的使用简便性。 数据挖掘与传统意义上的统计学不同。统计学推断是假设驱动的,即形成假设并在数据基础上验证他;数据挖掘是数据驱动的,即自动地从数据中提取模式和假设。数据挖掘的目标是提取可以容易转换成逻辑规则或可视化表示的定性模型,与传统的统计学相比,更加以人为本。 数据挖掘技术简述数据挖掘的技术有很多种,按照不同的分类有不同的分类法。下面着重讨论一下数据挖掘中常用的一些技术:统计技术,关联规则,基于历史的分析,遗传算法,聚集检测,连接分析,决策树,神经网络,粗糙集,模糊集,回归分析,差别分析,概念描述等十三种常用的数据挖掘的技术。 1、统计技术数据挖掘涉及的科学领域和技术很多,如统计技术。统计技术对数据集进行挖掘的主要思想是:统计的方法对给定的数据集合假设了一个分布或者概率模型(例如一个正态分布)然后根据模型采用相应的方法来进行挖掘。 2、关联规则数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之I司存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。 3、基于历史的MBR(Memory-based Reasoning)分析先根据经验知识寻找相似的情况,

【最全最详细】数据分析与挖掘实验报告

《数据挖掘》实验报告 目录 1.关联规则的基本概念和方法 (2) 1.1数据挖掘 (2) 1.1.1数据挖掘的概念 (2) 1.1.2数据挖掘的方法与技术 (2) 1.2关联规则 (3) 1.2.1关联规则的概念 (3) 1.2.2关联规则的实现——Apriori算法 (4) 2.用Matlab实现关联规则 (6) 2.1Matlab概述 (6) 2.2基于Matlab的Apriori算法 (7) 3.用java实现关联规则 (11) 3.1java界面描述 (11) 3.2java关键代码描述 (14) 4、实验总结 (19) 4.1实验的不足和改进 (19) 4.2实验心得 (20)

1.关联规则的基本概念和方法 1.1数据挖掘 1.1.1数据挖掘的概念 计算机技术和通信技术的迅猛发展将人类社会带入到了信息时代。在最近十几年里,数据库中存储的数据急剧增大。数据挖掘就是信息技术自然进化的结果。数据挖掘可以从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的,人们事先不知道的但又是潜在有用的信息和知识的过程。 许多人将数据挖掘视为另一个流行词汇数据中的知识发现(KDD)的同义词,而另一些人只是把数据挖掘视为知识发现过程的一个基本步骤。知识发现过程如下:·数据清理(消除噪声和删除不一致的数据) ·数据集成(多种数据源可以组合在一起) ·数据转换(从数据库中提取和分析任务相关的数据) ·数据变换(从汇总或聚集操作,把数据变换和统一成适合挖掘的形式) ·数据挖掘(基本步骤,使用智能方法提取数据模式) ·模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式) ·知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。 1.1.2数据挖掘的方法与技术 数据挖掘吸纳了诸如数据库和数据仓库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像和信号处理以及空间数据分析技术的集成等许多应用领域的大量技术。数据挖掘主要包括以下方法。 神经网络方法:神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类:以感知机、bp反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以hopfield的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以art模型、koholon模型为代表的,用于聚类的自组织映射方法。神经网络方法的缺点是"黑箱"性,人们难以理解网络的学习和决策过程。 遗传算法:遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法,是一种仿生全局优化方法。遗传算法具有的隐含并行性、易于和其它模型结合等性质使得它在数据挖掘中被加以应用。sunil已成功地开发了一个基于遗传算法的数据挖掘工具,利用该工具对两个飞机失事的真实数据库进行了数据挖掘实验,结果表明遗传算法是进行数据挖掘的有效方法之一。遗传算法的应用还体现在与神经网络、粗糙集等技术的结合上。如利用遗传算法优化神经网络结构,在不增加错误率的前提下,删除多余的连接和隐层单元;用遗传算法和bp算法结合训练神经网络,然后从网络提取规则等。但遗传算法的算法较复杂,收敛于局部极小的较早收敛问题尚未解决。 决策树方法:决策树是一种常用于预测模型的算法,它通过将大量数据有目的分类,从

浅析企业员工流失原因以与对策

浅析企业员工流失原因以及对策 /h1 一、人才环境的内涵 (一)人才环境的定义和作用 人才环境是指人才赖以生存、得以发展的社会和物质条件的综合体,包括影响人才成长的各种外部要素的总和。具体说来,人才环境包括硬环境和软环境,其中硬环境指的是影响人才发展的有形的硬件条件,包括经济环境工作环境、生活环境等;软环境指的是影响人才发展的无形的软件条件,包括体制环境、法律环境、制度环境、政策环境、人文环境、人际环境等。 人才资源开发活动任何时候都不能孤立进行,它受制于各种外部环境的影响和制约。纵观古今中外,环境优则人才聚,事业兴;环境劣则人才散,事业衰。事实雄辩证明:环境是生产力,环境是凝聚力,环境是吸引力,环境是竞争力。当今社会人才的竞争,从某种意义上讲,是人才环境的竞争。抓住了人才环境建设,就抓住了人才资源开发的关键点和制高点。 环境与人才,犹如鱼与水、鸟与木的关系。“欲致鱼者,先通谷;欲求鸟者,先树木。水积而鱼聚,木茂而鸟集。”环境与人才,相互促进,彼此推动,协调发展。

(二)勒温关于人才环境的理论 美国着名心理学家勒温(K·Lewin)认为:个人能力与条件及其所处的环境直接影响个人的工作绩效,个人的绩效B是个人的能力和条件p与所处环境e的函数:B=f(p,e)。 勒温的人才环境理论指出,一个人所能创造的绩效,不仅与他的能力和素质有关,而且与其所处的环境有密切的关系。如果一个人处于一个不利的环境之中,比如专业不对口,工资待遇不公平,心情不舒畅,人际关系紧张,领导作风专断,不尊重知志和人才,则很难发挥其聪明才智,也很难取得应有的成绩,而且一般而言,个人对环境的改变往往无能为力,要改变的方法就是:三十六计,走为上策——离开这个环境,转到一个更适合的环境中去工作,这就是人员流失的理论依据。 二、我国众多企业当前面临的内外人才环境现状 (一)内部人才环境分析 1.企业自身体制、机制和观念的问题,致使内部人才环境堪忧 (1)在人才理念上:陈腐、落后。在不少国有企业领导人眼里,人力资源并非第一资源,而经济资源则成了第一资源。在这种意志的支配下,国有企业领导者把主要精力放在如何获得更多的资金或项目上。诚然,资金对企业的生存和发展来说是重要的,但殊不知资金的获得和使用都离不开人才的支持。

公司客户流失原因分析

客户流失原因分析 经过对车源和货源小组反馈的收集下面将从平台因素、服务因素、市场因素几个方面进行总结分析。 一、平台缺陷导致的客户流失 1.客户依然对公司定位很模糊,使得公司平台不易被接受导致客户流失。 建议解决办法:淡化本身物流性质的概念,用一种容易贴近顾客的姿态去推销产品,例如:把自己定位于一个类似信息部性质的企业。这种推销的方法既通俗易懂又能 拉近公司业务人员和顾客之间的距离,只有真正能经得起市场考研的产品才是好的 产品。 2.车源信息陈旧,很多信息失真实使得客户对平台的信任度大幅降低导致客户的流 失 解决方法:车源信息资料属于一种有偿的信息资源。公司可以通过不同的渠道获取 最新的车辆信息,要保持车辆信息的真实性。使部门同事在今后的工作开展中效率 更高。 3.价格过高,平台降价功能没有实现,过高的价格导致许多的客户无法接受。 解决方法:公司平台一大功能特色就是车辆询价,目前这个功能并没有实际的效果 一方面是车源信息的稀少,领一方面平台并未把这一特色功能作为主推项目。提请 领导重视。 4.许多客户反应信息上线很久但没有车丧失了需求客户 解决方法:由于是前期的试运营阶段,有些线路必定会出现车辆不足的情况。建议 公司增加车辆信息来源的获取渠道,只有增加车辆和线路才能吸收跟多的资源来聚 集到我们的物流平台上来。 5.客户反映公司联系车辆到达装货地点后发现货不好拉拒绝装车。平台缺乏约束功 能模块导致客户失信。 解决方法:属于流程缺失,没有核实好发货人的货物信息,和司机在沟通过程中没 有反应客户货源情况。导致车主货主双方对公司的服务产生了质疑,影响了公司的 声誉和形象。建议增加货物鉴定的流程,在收到货源信息的第一时间了解货物属于 抛货还是重货。并及时告知车主规避此类事件的发生。

从客户生命周期角度分析数据挖掘技术的应用

3.2、从客户生命周期角度分析数据挖掘技术的应用 3.2 Analysis of the application of data mining technology from the perspective of the customer lifecycle 在对CRM的广泛理解中,最简单的含义就是:管理所有与客户的交互行为。在实践中,这需要在客户关系的各个阶段使用与客户相关的信息来预测与客户的交互行为。客户关系的各个阶段定义为客户生命周期。客户生命周期包括三个阶段:获得客户;提高客户的价值;保持效益客户。如果将数据挖掘结合在CRM中或者作为一个独立的应用程序来实施,数据挖掘可以在每一个阶段都提高企业的收益(8。 The simplest meaning of the extensive understanding of CRM: manage all interactions with the customer. In practical use, it needs to be used in different stages of the customer relationship and cust omers’ related information to predict interaction with customers. The different stages of the customer relationship are defined as the customer lifecycle. There are three stages of customer life cycle: customer acquisition; customer value improvement; maintaining of beneficial customers. If data mining could be combined in in CRM or applied as a standalone application, it can improve enterprise profits in every phase(8. (1)通过数据挖掘获取新客户:在CRM中的第一步是识别潜在客户然后将他们转变成真正的客户,数据挖掘可以辅助进行客户细分,识别潜在客户(33。(2)提高客户价值:1、数据挖掘支持客户盈利能力分析,预测客户盈利能力变动以增强客户盈利能力;2、支持客户购买行为模式分析,进行客户细分,从而提供更具针对性的个性化服务(1;3、有效进行交叉营销,向现有的客户提供新的产品和服务,实现购买推荐和升级销售(18。 (3)客户保持:包括客户忠诚度分析和客户流失警示分析。通过数据挖掘,对客户历史交易行为的分析,警示客户异常行为,并提出相应的对策建议。 (1) Acquire new customers through data mining: the first step in CRM is to identify potential customers and then develop them into true customers, and data mining is able to assist customer segmentation, identifying potential customers (33. (2) Improve customer value: 1. data mining support customer profitability analysis, predicting customer’s profitability changes to enhance his profitability; 2. support customer purchasing behavior pattern analysis to make customer segmentation, thus, higher personalized service could be provided (1; 3. making effective cross-selling, providing new products and services to existing customers, realizing purchasing recommend and upgraded sales (18. (3) Customer retention: including customer loyalty analysis and customer churn warning analysis. Data mining could analyze the customer historical trade, warning the analysis of historical customer transactions, and putting forward corresponding countermeasures and suggestions. 3.3、从行业角度分析数据挖掘技术的应用 3.3 Analyzing the application of data mining technology from professinal perspective CRM中数据挖掘应用的深度和广度针对行业的不同而有所不同,特别是针对与客户交流频繁、客户支持要求高的行业,如银行、证券、保险、电信、税务、零

电子商务网站的客户流失分析报告

电子商务网站的客户流失分析报告 随着科技的不断发展和信息化的日益进步,互联网技术成为我们生活中不可或缺的一部分。作为一种新型的商务模式——电子商务迅速被人们接受,电子商务凭借其快捷、新颖的购物体验,越来越成为年轻消费群体的重要购物方式。作为电子商务的载体,电子商务网站在为顾客提供光顾场所的同时,也存在的一定的问题,电子商务网站不稳定,客户流失率较高,因此如何解决网站的客户流失率,对降低网站客户的风险,保证电子商务的可持续发展有着重要的意义。下面主要从两个电子商务网站的购物模式和本身对其的购物经历来进行分析客户流失的原因。 众所周知淘宝网已经成为人们购物首选的网站,尤其是服装。淘宝网上的服装多样,价格差异很大,重要的它能提供的服务和产品是其他网站所不及的,比如虚拟产品,充值。彩票的购买等等。淘宝的优点也是特点是它所提供的客户服务。这对于我们不能看到真正的实物不能试穿是很重要的,客服的解释可以在某种程度上消除我们的疑虑。例如我们会问他这件衣服是否褪色,多大的码适合等等,也可以在售后收到东西后说出自己的意见,这样可以使卖家改善他们的质量,获取更大的收益和更好的评价。 卓越上就没有客户服务这样的版块,上次买书的时候想问问这书的一些具体信息都不能,只能看评价或者买到才可知晓。这点也是很多客户最后会选择淘宝买东西的原因,虽然卓越的书基本都是正版书,价格也实惠。但是很多客户仍然希望可以在和卖家沟通了解的情况下进行交易。卓越上提供的产品相对淘宝来说较少,主要是图书音像。两家的购物流程基本一致,注册,选择自己要购买的物品,提交订单,填写地址和联系方式,付款,最后确认收货。但是淘宝中我才曾经受到卖家打来的电话希望我修改评价,这样的行为让我很反感,他们应该接受客户的客观评价,并认识到自己的不足。 电子商务网站客户流失的原因主要有以下几种: 1、竞争流失: 任何一个行业,客户毕竟是有限的,特别是忠诚的客户,更是弥足珍稀的,20%的优质客户能够给网店带来80%的销售业绩,这是个恒定的法则。所以往往优秀的客户自然会成为各大网店争夺的对象。现在的商务网站数量多,竞争更加激烈。我们可选择的也就自然不再单一,尤其是特殊的节日各个网站也都借机进行促销活动来提高销量,增加收入。

相关主题
文本预览
相关文档 最新文档