一、引言
电子商务是利用计算机技术、网络技术和远程通信技术,实现整个商务(买卖)过程中的电子化、数字化和网络化。在全球范围内,基于internet的电子商务迅猛发展,促使各企业经营者必须及时搜集大量的数据,并且将这些数据转换成有用的信息,为企业创造更多潜在的利润。利用web数据挖掘技术可以有效地帮助企业分析从网上获取的大量数据,提取出有效信息,进而指导企业调整营销策略,给客户提供动态的个性化的高效率服务。
二、web数据挖掘
1.web数据挖掘的概念
数据挖掘是指从数据库中的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的过程。web数据挖掘是数据挖掘技术在web环境下的应用,是从web文档和web活动中发现潜在的、有用的模式或信息。它是一项综合技术,涉及到internet、人工智能、计算机语言学、信息学、统计学等多个领域。
2.web数据挖掘的类型
电子商务中web信息的多样性决定了挖掘任务的多样性。按照web处理对象的不同,web数据挖掘可以分为以下三种类型:
(1)web内容挖掘(web content mining):可分为web页面内容挖掘和搜索结果挖掘。前者指的是对web页面上的数据进行挖掘。而后者指的是以某一搜索引擎为基础,对已搜索结果的挖掘,以得到更精确有用的信息。web内容挖掘常用的方法有weboql和ahoy。
(2)web结构挖掘(web structure mining):可分为超链接挖掘、内容挖掘和url挖掘。整个web空间里,有用的知识不仅包含在web页面的内容之中,而且包含在页面的结构之中。web结构挖掘是挖掘web潜在的链接结构模式,是对web页面超链接关系、文档内部结构、文档url中的目录途径结构的挖掘。page2rank方法就是利用文档间链接信息来查找相关的web页。
(3)web使用挖掘(web usage mining):可分为一般访问模式挖掘和个性化服务模式挖掘。它是从web的访问记录中抽取感兴趣的模式。/dianzijixie/">电子商务中,关联规则的发现也就是找到客户对网站上各种文件之间访问的相互联系。联系的问题就是得到如下形式的规则:“”, 其中与均为在数据库中相关数据特征属性值的集合。例如,用关联规则技术,我们可以发现:如果客户在一次访问行为中,访问了页面/page1时,一般也会访问页面/page2。进行web上的数据挖掘,构建关联模型,我们可以更好地组织站点,减少用户过滤信息的负担,实施有效的市场策略,增加交叉销售量。
4.序列模式(sequential pattern)
序列模式分析的目的是为了挖掘出数据间的前后或因果关系,就是在时间戳有序的事务集中,找到那些“一些项跟随另一个项”的内部事务模式。例如,在/page1上进行过在线订购的顾客,有60%的人在过去10天内也在/page2上下过定单。通过序列模式的发现,能够便于电子商务的经营者预测客户的访问模式,在服务器方选取有针对性的页面,以满足访问者的特定要求;网站的管理员可将访问者按浏览模式分类,在页面上只展示具有该浏览模式的访问者经常访问的链接,而用一个“更多内容”指向其他未被展示的内容。当访问者浏览到某页面时,检查他的浏览所符合的序列模式,并在显眼的位置提示“访问该页面的人通常接着访问”的若干页面。
5.分类规则(classification regulation)
分类要解决的问题是为一个事件或对象归类。设有一个数据库和一组具有不同特征的类别(标记),该数据库中的每一个记录都赋予一个类别的标记,这样的数据库称为示例数据库或训练集。分类分析就是通过分析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其它数据库中的记录进行分类。例如,经过web挖掘发现,在/page1进行过在线订购的客户中有60%是20岁~30岁生活在大中城市的年轻人。得到分类后,就可以针对这一类客户的特点展开商务活动,提供有针对性的个性化的信息服务。用于分类分析的方法有统计方法的贝叶斯分类、机器学习的判定树归纳分类、神经网络的后向传播分类、k-最临近分类、mbr、遗传法、粗糙集和模糊集等。
6.聚类分析(clustering analysis)
聚类分析不同于分类规则,其输入集是一组未标定的记录,也就是说,此时输入的记录还没有进行任何分类。其目的是根据一定的规则,合理地划分记录集合,并用显式或隐式的方法描述不同的类别。在电子商务中,通过聚类具有相似浏览行为的客户,可使经营者更多地了解客户,为客户提供更好的服务。例如,一些客户在一个时间段内经常浏览“wedding celebration”,经过分析可将这些客户聚类为一组,并可进一步得知这是一组即将结婚的客户,对他们的服务就应该有别于其他的聚类客户,如“经理人员阶层组”、“学生阶层组”。这样,web可自动给这个特定的顾客聚类发送新产品信息邮件,为这个顾客聚类动态地改变一个特殊的站点。在一定程度上满足客户的要求,这对客户和销售商来说更有意义。
四、web数据挖掘技术在电子商务中的应用
1.挽留老顾客,挖掘潜在客户
通过web挖掘,电子商务的经营者可以获知每位访问者的个人爱好,充分地了解客户的需要,根据每一类顾客的独特需求提供定制化的产品,并根据需求动态地向客户做页面推荐,调整web页面,提高客户满意度,延长客户驻留的时间,最终达到留住客户的目的。通过挖掘web日志记录,可以先对已经存在的访问者进行分类,然后从它的分类判断出某个新客户是否是潜在的客户。
2.制定产品营销策略,优化促销活动
通过对商品访问情况和销售情况进行挖掘,企业能够获取客户的访问规律,确定顾客消费的生命周期,根据市场的变化,针对不同的产品制定相应的营销策略。
3.降低运营成本,提高企业竞争力
电子商务的经营者通过web数据挖掘,可以得到可靠的市场反馈信息,认真分析顾客的将来行为,进行有针对性的电子商务营销活动;可以根据关心某产品的访问者的浏览模式来决定广告的位置,增加广告针对性,提高广告的投资回报率,从而降低运营成本,提高企业竞争力。
4.提高站点点击率,完善电子商务网站设计
通过挖掘客户的行为记录和反馈情况为站点设计者提供改进的依据,进一步优化网站组织结构以提高网站的点击率。比如利用关联规则的发现,可以针对不同客户动态调整站点结构,使客户访问的有关联的文件间的链接更直接,让客户容易地访问到想要的页面,就能给客户留下好的印象,增加下次访问的机率。
同时对网站上各种数据的统计分析有助于改进系统性能,增强系统安全性,并提供决策支持。
五、结束语
当今时代,电子商务的发展势头越来越强劲,面向电子商务的数据挖掘将是一个非常有前景的领域。但是,不可否认,在面向电子商务的数据挖掘中还存在很多急需解决的问题, 比如:怎样将服务器的日志数据转化成适合某种数据挖掘技术的数据格式;怎样解决分布性、异构性数据源的挖掘问题;如何控制整个web上的知识发现过程等。
参考文献:
[1]jiawei han,micheline kamber著,范明孟小峰译:数据挖掘概念与技术.机械工业出版社,2001,8
[2]凌传繁:web挖掘技术在电子商务中的应用[j].情报杂志,2006,(1)
[3]柳:web挖掘技术与电子商务[j].商场现代化,2007,(03x)