摘 要:摘要:“校园一卡通系统”是“数字化校园”中重要组成部分,其内存储了大量学生消费、考勤、图书借阅等信息。校园一卡通系统本身没有分析处理数据的能力,需要运用数据挖掘技术对着数据进行分析处理,找到其中隐藏的、不为人知的、有价值的信息,从而帮助学校的管理层更加合理的优化资源配置。
关键词:关键字:一卡通; 数据挖掘 ;信息
中图分类号:TP399 文献标识码:A 文章编号:
1.引言
随着计算机技术和网络技术的快速发展,国内的高校基本上都已建设了校园网,在此基础上,为了实现对各种资源的有效集成、整合和优化,实现资源的有效配置和充分利用,各个高校又纷纷开始了“数字化校园”的建设。“校园一卡通系统”作为“数字化校园”重要的有机组成部分真正实现了“一卡在手,走遍校园”。在一卡通中心内存储了大量的数据信息,而这些信息除了进行简单的查询外,再无他用,本文结合本校的实践经验,整合一卡通数据,并使用数据仓库和数据挖掘技术构建一卡通决策支持系统。
2. 一卡通介绍
“校园一卡通系统”采取银行卡金融功能与校园卡校务管理功能相整合的方式,由银行与学校联合发行银行—校园卡,师生们可以自助终端实现消费、转账等金融支付;可以代替学生和教职员工在校内的所有个人证件(如学生证、工作证、图书证、医疗证等),应用于需要身份识别的各种MIS系统;可以通过设在非接触式IC芯片内的电子钱包实现餐饮、校内购物、上机上网、医疗等校内消费。“校园一卡通系统”主要有综合业务子系统、水控子系统、电控子系统、图书管理子系统、门禁考勤子系统等,可以说一卡通系统涵盖了学生在校园里边的各个环节,每天都会产生许许多多的与学生学习和生活息息相关的数据,这些数据对学院来说是非常宝贵的资源,如果能够通过有效的数据挖掘,这些信息能够给学院的管理者带来很好的决策支持。
3.数据挖掘技术
3.1数据挖掘概念
数据挖掘,顾名思义就是从大量的数据中挖掘出有用的信息,即从大量的,不完全的,有噪声的、模糊的、随机的实际应用数据中发现隐含的,规律性的,人们事先未知的,但又是潜在有用的并且最终可理解的信息和知识的非平凡过程。
3.2数据挖掘主要技术
3.2.1关联规则
若两个或多个变量的取值之间存在某种规律性,就称为关联。关联规则是寻找在同一个实践中出现的不同项的相关性,比如在一次购买活动中所购买不同商品的相关性。关联分析,即利用关联 规则进行数据挖掘,比较常用的算法有APRIORI、FP-增长算法等。关联分析的目的是挖掘隐藏在数据间的相互关系,自动探测以前未发现的隐藏着的模式。
3.2.2决策树
决策树也称为判定树。在决策树方法中,首先从实例集中构造决策树,这是一种有指导的学习方法。该方法先根据训练集数据形成决策树。如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到训练集数据中,重复该过程一直到形成正确的决策集。决策树代表着决策集的树形结构。最终结果是一棵树,其叶节点是类名,中间节点是带有分支的属性,该分支对应该属性的某一可能值。
3.2.3神经网络方法
神经网络出于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类:用于分类、预测和模式识别的前馈式神经网络模型;用于联想记忆和优化计算的反馈式神经网络模型;用于聚类的自组织映射方法。神经网络方法的缺点是“黑箱”性,人们难以理解网络的学习和决策过程。
3.2.4遗传算法
遗传算法是一种基于生物自然选择与遗传机理的随即搜索算法,是一种仿生全局优化方法。遗传算法具有的隐含并行性、易于和其它模型结合等性质是的它在数据挖掘中被加以应用。
3.2.5临近算法
将数据集合中每一个记录进行分类的方法。
3.2.6规则推导
从统计意义上对数据中的“如果——那么”规则进行寻找和推导。
3.3数据挖掘过程
数据挖掘是一个反复的过程,通常包含多个相互联系的步骤,如定义和分析主题、数据预处理、选取算法、提取规则、评价和解释结果、将模式构成知识,最后是应用。通常数据挖掘的基本步骤包括:1.问题定义;2建立数据挖掘模型;3分析数据;4准备数据;5评价模型;7实施。
由于一卡通系统内的数据可能存贮在多个数据源,首先要整合数据挖掘所需要的数据,另外数据库内不仅具有海量数据,还存在大量的噪声数据、冗余数据、稀疏数据或不完全数据等,所以数据准备包括数据抽取、清洗、转换和加载(ECTL),具体包含数据的清洗、集成、选择、变换、规约、以及数据的质量分析等步骤。
4.数据挖掘技术在校园一卡通中的几个典型应用
4.1对校园一卡通系统中与学生的日常消费情况相关的数据进行挖掘分析
首先,我们可以在校园一卡通系统的消费管理子系统中找到与学生日常消费情况相关的数据,然后通过数据挖掘的办法所需数据放入学生日常消费数据库中,而且我们可以运用决策树的方法将学生的消费日期、消费类别、消费金额进行分类整合。这样的话我们就可以知道学校每一位学生在校期间的消费情况,并根据学生的消费情况发现学生的消费习惯和潜在的消费规律,并由此了解每一位学生的家庭经济状况,从而对学生的家庭经济情况进行分类。分类出来的视图就能够知道学校助学贷款和贫困补助的发放了。这样的话,从消费管理子系统中挖掘出来的数据就能够体现它的价值了。
4.2对校园一卡通系统中与学生借书情况相关的数据进行挖掘分析
校园一卡通系统与图书馆管理系统是存在关联的,学生的借书情况(例如,借书日期,所借书籍,还书日期等)就是通过校园卡记录在校园一卡通系统中的。那么我们可以通过建立新的学生借书情况数据库来对图书馆管理系统中的数据进行挖掘了,然后通过决策树和统计分析的方法对学生的借书情况进行分析。我们根据数据挖掘所得到的视图,就可以发现图书馆里那类书籍比较受学生的欢迎,然后根据图书馆总共书籍信息进行比对,就可以发现图书馆那类书籍不是很受欢迎。那么图书馆管理员和图书采购员就可以根据这些信息适当采购多些比较受学生欢迎的书,并针对全体学生进行这类书籍的展览活动。
4.3对校园一卡通系统中与学生出入校门的情况相关的数据进行挖掘分析
在校园一卡通的门禁管理子系统中记录着与学生
在校期间出入校门的情况相关的数据,我们可以通过数据挖掘的方法把这部分数据放入新的学生出入校门情况数据库中。因为学生在校期间都会出入校门,所以对于这些数据,我们首先要根据挖掘的目的进行清理。如果是为了了解学生晚归的情况,我们就应当将没有出现晚归情况的学生的数据清除;如果是为了了解哪些学生存在逃课外出的情况,我们就应当选择在白天正常上课期间出入校门的学生的数据,然后通过决策树方法和统计分析方法对数据进行分析研究并建立结构化的视图。这样,我们就可以根据挖掘出来的学生出入校门情况的数据,得到我们所需要的结论了。
5. 结束语
通过上文对校园一卡通系统和数据挖掘技术的分析,我们可以发现数据挖掘技术在校园一卡通系统应用中的作用。它在一定程度上辅助了管理人员进行决策,能够帮助校园管理者更科学的、更加方便的管理校园,加快推进了信息化校园的步伐。数据挖掘技术在校园一卡通系统中的应用,是数据挖掘系统与其他应用系统间进行有机结合的一个典范。这对数据挖掘技术的发展来说具有深远的意义。
参考文献:
[1] 张升平.数字化校园之校园一卡通的建设[J].重庆工商大学报,2008(25):56-59.
[2] 何利平.数据仓库与数据挖掘技术在高校决策中的应用[J].系统工程,2006,24(6):123-126.