[摘要] 国内外电子商务类网站日益兴起。许多电子商务类网站都提供了一定程度的个性化服务,最明显的就是提供商品推荐服务。而构成这些个性化服务的基础主要就是数据挖掘技术。本文研究了数据挖掘技术及其在电子商务中客户细分的应用,提出了数据挖掘在电子商务营销服务各方面的具体应用内容。
[关键词] 数据挖掘 客户细分 聚类算法
一、数据挖掘在电子商务中的引入与应用
数据挖掘(data mining),又称数据库中的知识发现(knowledge discovery in database,kdd),是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式,它是数据库研究中的一个很有应用价值的新领域。数据挖掘技术在电子商务领域中得到了比较普遍的应用,它是以市场营销学的市场细分原理为基础,其基本假定是“消费者过去的行为是其今后消费倾向的最好说明”。对所识别出来的消费群体进行特定内容的定向营销,这与传统的不区分消费者对象特征的大规模营销手段相比,大大节省了营销成本,提高了营销效果,从而为企业带来更多的利润。
数据挖掘是进行数据查询,它能够找出过去数据之间的潜在联系,从而促进信息的传递。数据挖掘工具能够对将来的趋势和行为进行预测,从而很好地支持人们的决策。将其运用到客户关系管理中,就能在数据量庞大的客户数据库中,将看似无关联的数据进行筛选,净化,提取出有价值的客户关系,对客户需求作出恰当的回应,并预测需求趋势。
二、聚类算法用于电子商务客户细分
聚类是数据挖掘中的一种主要技术,是把一组个体按照相似性归成若干类别,即“物以类聚”。WWW.133229.cOm它的目的是使得属于同一类别的个体之间的距离尽可能地小,而不同类别上的个体间的距离尽可能地大。聚类和分类根本不同的是:分类问题中我们知道训练例的分类属性,而在聚类中,就需要我们在训练例中找到这个分类属性值。聚类分析问题可描述为:给m维空间rm中的n个向量,把每个向量归属到s聚类中的某一个,使得每个向量与其聚类中心的“距离”最小。聚类分析问题的实质是一个全局最优问题。在这里m可认为是样本参与聚类的属性个数,n是样本的个数,s是由用户预先设定的分类数目。本文采用层次方法实现聚类分析。
层次方法就是对给定的数据对象集进行层次的分解。根据层次的分解如何形成,层次聚类分析算法分为“分解算法”和“凝聚算法”,分别体现了“自顶向下”和“自底向上”两种互逆的思想。分解算法从整个样本集开始,把它分成几个子集,然后把每个子集分成更小的集合,逐步分区,最终,分区算法生成一个由粗到细的分区系列。凝聚算法首先把每个单独的对象当作一个初始类。然后把这些特征相近的合并成一个更粗略的分区,反复合并直至得到最后一个分区,所有的对象都在一个大类内。这种聚类过程是一个自底向上的过程,分区是从细到粗。在凝聚或者分裂层次聚类方法中,通常以用户定义希望得到的类的数目作为结束条件。在类的合并或分裂过程中,需要考察类间的距离。分解算法和凝聚算法的过程示意如图所示:
利用以上规则可以发现对公司营销十分有用的模式。给出分类模型后,要用测试集评估模型的预测正确率,测试集中的数据是从样本集中随机取出并独立于训练样本的。模型的准确率可以用被模型正确分类的测试样本的百分比表示,若模型的准确率是可以接受的,公司就可以依据模型将客户群分类,针对不同的客户群展开有针对性的业务。
至此,已经初步完成了一个聚类算法的分类技术用于客户分类的简单示例。但实际应用中大多数决策树分类过程要复杂得多,计算量也要大很多,这主要是因为用于分类的样本数据量往往很大,属性字段也很多,而且决策树的生成算法也有很多,选择何种算法也是一个反复综合评估的过程。
三、结论
随着电子商务的日益兴起,对电子商务进行数据挖掘,让电子商务网站可以提供更具个性化的服务,可以提高电子商务网站的竞争力,以实现更大的商业价值。本文在探讨了电子商务中引入数据挖掘技术,详细阐述了该技术在客户关系管理的客户细分中的重要应用及其实现。
参考文献:
[1]帕翠珊·b·希波尔德:客户关系管理理念与实例[m].北京:机械工业出版社,2002
[2]周良等.客户关系管理系统设计与研究.计算机研究与应用,2002.9(108~131)
[3]威廉·g·齐克蒙德等:客户关系管理.北京:中国人民大学出版社,2005
[4]崔杰张颖:数据挖掘技术在crm中的应用.辽宁工学院学报,2006