摘 要:阐述了电子商务EC中数据挖掘DM的数据资源和基本方法,并给出其在客户关系管理CRM系统中的应用。
关键词:电子商务;数据挖掘;客户关系管理;聚类;关联规则
计算机及其网络技术的快速发展和广泛应用改变了人类生活的各个方面,也催生出了电子商务(Electronic Commerce,EC)的蓬勃发展,并进而成为近年来Internet应用领域的新热点和新经济增长点。但如何才能在企业竞争激烈、经营风险加剧和客户需求不确定性增加情况下,追踪市场变化、把握客户动态、实施精准营销,主动获知客户喜好并开发其购买潜力,增加客户忠诚度并提高客户满意度,这是电子商务目前急待解决的一个问题。数据挖掘的出现为这一问题提供了很好的解决方案。
1.数据挖掘的定义及本质
数据挖掘(Date Mining,DM)又称为数据库中的知识发现,是上世纪末产生的一门信息处理技术,是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡且最终可理解的及有潜在应用价值的信息或模式的过程。在商业领域,数据挖掘是一种新的商业信息处理模式,也是一种透过数理模式来分析企业内存储的大量资料,以找出不同客户或市场划分,分析客户喜好和行为的工具。
数据挖掘是一门交叉学科,是现代科学技术相互渗透与融合的必然结果,其集中了数据库、人工智能、数理统计、高性能计算等领域的理论和技术,为解决大量有益信息未充分利用带来了曙光。但从本质上来说,它强调对大量观测到的数据库的处理,即通过计算机对大量的复杂数据集的自动探索性分析,揭示存在于数据里的模式及数据间的关系的学科。数据挖掘技术为电子商务的更好应用开辟了一个广阔前景。
2.电子商务中数据挖掘的数据资源
通常的电子商务系统都是基于Internet的客户机/服务器模型。因此,可用作数据挖掘的数据资源主要是电子商务网站中服务器端或代理服务器端和客户端的商务活动数据。
2.1 服务器端数据
在Internet电子商务中,当客户访问电子商务服务器时,其浏览信息会被服务器自动收集并保存在访问日志、引用日志或代理日志中。这些数据动态产生、数额巨大。对这些日志数据进行分析加工,可帮助企业了解和掌握客户,并从中得到商家用于向特定消费群体或个体进行精准营销的决策信息。同时对这些日志数据进行定量分析,揭示其中的关联、时序、页面类属、客户类属等关系,以及频繁访问路径、页面等,不但可为优化电子商务站点拓扑结构提供参考,而且还可为企业更有效地确认目标市场、改进商务决策,以便获得更有利的竞争优势提供帮助。
2.2 客户端数据
客户端可作挖掘的数据资源主要是客户登陆信息。通常的电子商务网站都会要求客户在使用时,必须通过电子商务网页进行注册和登录,即在屏幕上输入并提交给服务器一定数量的相关信息,有的网站甚至还要求认证。因此,这类信息非常重要,更是数据挖掘的主要对象和重要数据来源。对此类信息进行数据挖掘,或与浏览信息集成后进行数据挖掘,可极大地提高数据挖掘的准确度,更好的了解客户喜好,以便企业做出更准确的判断。
3.电子商务中数据挖掘的基本过程和方法
3.1 基本过程
数据挖掘在电子商务中的一个简单应用是基于客户过去的行为预测未来消费的倾向。由于网站的客户访问日志数据量巨大,且来源不同、重要程度不同、格式不统一等原因,因此电子商务数据挖掘,首先要做的就是对来自数据源的原始数据进行预处理,通常包括数据清理、数据集成、数据选择和数据转换等,把无关的或不重要的数据处理掉,消除噪声和重复的观测值,或从中抽取感兴趣的数据;接着根据电子商务的具体应用或具体的挖掘目标或挖掘需求,选择合适的数据挖掘技术和方法,如路径分析、统计分析、关联分析、分类分析和聚类分析等,对预处理过的数据进行事务划分;然后是选择模式识别技术,建立模型和知识发现;最后通过模式分析,找到有用的信息,再通过联机分析(On-Line Analytical Processing,OLAP)进行验证。其挖掘过程如图1所示。
3.2挖掘方法
有关数据挖掘的方法很多,针对上述在电子商务中的一个简单应用主要介绍四种:
3.2.1 路径分析
路径分析可用于发现电子商务站点中最经常被访问的路径,从而帮助企业调整站点结构,优化页面布局。另外,还有一些其它的有关路径信息也可通过路径分析得到。如从/company开始访问/company/product的客户为80%;从/company/products开始访问这个站点的客户为70%;浏览4个或更少的页面后就离开的客户为65%。通过路径分析,可以改进网站页面结构的设计,增强客户针对性。
3.2.2 关联分析
关联分析是通过关联规则挖掘出隐藏在数据之间的相互关系,从而找出客户对网站各文件访问的相互联系。如用关联规则可以发现:在一次购买活动中同时购买A商品和B商品的客户为70%,或在一次访问行为中,访问页面/company/product1,同时也会访问页面/company/product2的客户为50%等。显然,电子商务中利用关联分析,可更好地组织站点,或向用户推荐产品,减轻用户过滤信息负担。
3.2.3 分类分析
分类分析就是通过分析示例数据库或训练集中的数据,为每个类别建立分析模型或作出准确描述或挖掘出分类规则,再用此规则对其他数据库中的记录进行分类,挖掘客户的某些共通特征。如可发现生活在大中城市的20~30岁青年中通过/company/products进行过在线订购的客户为70%等。据此,企业就可以知道客户特点喜好,并针对这类客户的特点,提供人性化的信息服务,或开展有针对性的商务活动。
3.2.4聚类分析
聚类分析也称为无指导学习,通常是根据一定的规则,合理地划分记录集合,并用显式或隐式描述。其输入通常是一组未标记、且应分为几类事先未知的记录。电子商务数据挖掘中的聚类又可细分为页聚类和客户聚类。如可将某段时间经常浏览“电子设备”和“家具”的客户聚类为一个“即将结婚客户组”,从而为他们定制页面内容或浏览建议,以便客户访问和促进网上销售,也有利于客户忠诚度的提高。
4.数据挖掘在电子商务CRM中的应用
4.1 CRM概述
客户关系管理(Customer Relationship Management,CRM)源于以“客户为中心”的新型商业模式,是一种旨在改善企业与客户之间关系的新型管理机制,但通常是指企业与客户
之间建立的管理双方接触活动的信息系统。特别是在电子商务时代的CRM应该是利用现代信息技术,在企业与客户之间建立的一种数字的、实时的和互动的管理交流系统。电子商务CRM的实施有利于企业建立与客户的沟通渠道,以便降低销售成本,并为客户创造更高价值;有利于企业开发新的产品、制定生产策略和发展规划,并提高客户满意度和忠诚度,从而实现更高利润。
4.2 电子商务中的DM在CRM中的应用
电子商务中的数据挖掘在客户关系管理系统中的应用主要表现为以下几个方面。
4.2.1 发现潜在客户
对电子商务网站新访问者客户的访问信息利用分类技术进行挖掘,识别其与已经分类老客户的一些公共描述,从而判断其是否为有利可图客户,再决定是否要将其作为潜在客户来对待,可以发现未来的潜在客户。
4.2.2驻留浏览客户
在Internet上,每一个销售商对客户来说都是一样的。以客户关系管理数据库为基础,通过对客户访问信息的挖掘,了解客户的浏览行为、兴趣及需要,并据此动态的调整Web页面,以满足客户的需要,可增强客户继续保持对访问站点的兴趣,延长客户在自己网站的驻留时间。
4.2.3 分析客户价值
通过分析客户的消费心理、消费习惯、偏好程度、购买频率和购买能力等,计算客户对企业的价值度,再根据价值度利用数据挖掘中的分类或聚类方法对客户进行分群,以便对不同客户群实施有差别化的服务,或者进行个性化的市场营销。
4.2.4 分析客户信用
采用数据挖掘技术可从电子商务客户关系管理的大量历史数据中,分析出具体客户的信用或商业价值等级,以便对不同等级的客户,采取不同的赊销或推销方案。这样可以降低企业营销风险,避免一些不必要的损失,加快企业的资金周转过程。
4.2.5 分析客户满意度
在电子商务客户关系管理系统中,利用数据挖掘可从零星分散的客户反馈信息中,分析出客户对企业产品、商品或各种服务的满意程度,可帮助企业更好地了解自己的产品质量和客户需求,改进生产工艺,变通营销策略,提高服务水平,从而增加客户的忠诚度。
5.结束语
作为解决目前企业信息系统中普遍面临的“数据爆炸”而“信息缺乏”状况的最有效手段之一,数据挖掘技术近年来已越来越受到学者和商界的广泛关注,而电子商务由于很容易满足数据挖掘所必需的因素和条件,如丰富的数据类型、自动收集可靠的数据并可将挖掘的结果转变为商业行为等,自然而然地成为数据挖掘的重要应用领域,以此为基础将其应用于CRM中,由于目前处于起始阶段,所以还存在着许多困难有待于进一步的研究和解决。
参考文献:
. 湖南文理学院学报(自然科学版),2010.6
郑全第(1962-),男,陕西户县人,副教授,主要研究方向为智能信息处理、网络安全。