摘 要:本文针对高职院校学生管理系统中海量学生信息只能做简单处理,没有深入挖掘有价值信息的现状,结合高职院校学生的特点设计出高职院校学生管理系统数据仓库,为学校教育决策者或管理者的科学决策提供重要的依据。
关键词:高职院校;学生管理系统;数据仓库
前言
随着高职院校招生规模不断扩大,学生人数不断上升,高职院校学生管理系统越显重要,而系统中的学生数据信息尤其重要,也就是说,建立好的学生信息数据仓库具有重要的价值。传统的学生数据库设计具有大量数据不一致性、数据冗余度高、数据更新速度慢、数据组织形式复杂且不同等缺点,已经无法满足高校学生管理信息化要求。利用数据仓库技术,建立统一的学生管理系统数据平台,从大量的学生信息中获取有效的信息,为高职院校不同管理层提供丰富的报表和决策依据。
1、数据仓库定义
数据仓库的概念提出于 20 世纪 80 年代中期,近年来,随着数据库技术的应用和发展,人们尝试对数据库中的数据进行再加工,形成一个综合的,面向分析的环境,以便更好地支持管理层决策分析,从而形成了数据仓库技术(Data Warehousing,简称 DW)。
2、 高职院校学生管理系统数据仓库的主要功能
在高职院校学生管理系统中,学生数据仓库应当具有如下功能:
(1)能够动态更新、整合的学生数据信息管理、查询、报表显示、删除等功能。
(2)能够分析每一个学生、每一门课程、不同年级、学生课程年级数据相关性等。如对学生的平均成绩、课程的平均成绩、班级成绩方差、年级成绩标准差等进行分析。
(3)能够通过学生的信息分析教师的行为。
(4)基于网络化数据仓库信息共享功能。
(5)能够对数据的分析作出预测。
3、 数据仓库的设计过程
本文研究的是高职院校学生管理系统数据仓库的设计,结合高职院校学生信息的特点,数据仓库的设计过程采用如下步骤:
第一步:选取待建模的事务处理,例如,学生、课程、时间、考试成绩、奖罚等。
第二步:选取事务处理的粒度。该粒度是基本的,在事实表中是数据的原子级,如果,一门课程成绩、一个学生信息、考试时间等。
第三步:选取用于每个事实表记录的维。典型的维是时间、学生、课程等。
第四步:选取事实表中的度量。
4、 学生管理系统数据仓库的设计
模型设计是构建学生数据仓库中重要的一环,面向学生主题的管理系统数据仓库的模型设计分为概念模型设计、逻辑模型设计和物理模型设计三个重要阶段。
4.1 概念模型设计
本文设计采用信息包图,信息包图能够解决数据采集和表示的困难,它提供了一个多维空间建立学生信息模型的方法。创建信息包图包括定义维度、类别、度量指标等几个方面。结合高职院校学生信息数据的实际情况,可以发现学生数据信息中我们主要关心的是学生成绩分析,通过对学生信息中的课程、专业、时间、任课教师进行分析,我们可以发现很多有价值的规律。我们以学生综合测评作为一个主题进行研究,将学生成绩信息进行信息打包,如图4-1所示:
(1)确定关键度量指标:实际成绩、预测成绩、预测偏差。
(2)定义维度:课程维、时间维、专业维、任课教师
(3)定义类别:类别提供一个指定维的详细信息。
维度
粒
度
课程时间专业任课教师核心大一文科教授主干大二理科副教授支撑大三讲师选修助教度量指标:实际成绩、预测测评、预测偏差
图4-1 信息包图
4.2 逻辑模型设计-星型图
星型结构是构建数据仓库中最常用的一种结构,它能够清晰反映概念模型中各实体间的逻辑关系,设计简单,检索查询方便,使设计者能够完整地掌握系统的数据流程。因此,利用星型图建模技术设计完善的数据仓库逻辑模型。
星型结构由两类基本表组成:事实表和维度表。根据高职院校学生管理系统所涉及的工作和决策分析需求,学生综合测评表作为基础事实表,课程、教师、学生、时间可以做为维度表。如图4-2所示:
4.3 ETL设计
ETL(Extract Transform Load)即数据抽取、转换、装载的过程,是从源文件或源数据库中获取数据,并经过清洗、转换、集成后,将其加载到数据仓库中去。主要完成高职院校学生管理信息数据仓库的分析处理的设计。后台数据库采用Microsoft SQL Server 2005,Microsoft SQL Server的数据转换服务(Data Transmission System)设计器具有扩展性好、编程效率高、支持多种数据源的特点,
下面以学生综合测评事实表分析为例,具体讨论ETL设计过程。执行ETL过程时,第一次处理采用完全处理方式,以后的ETL过程采用增量更新的方式。用SQL Server 2005企业管理器的DTS包设计器完成的部分表的DTS转换包图。每一个任务用SQL语句选择数据源和所需要的属性,如果数据不能直接装载到数据仓库中,则可以使用ActiveX Script创建脚本完成特定的转换功能。
4.4多维数据模型设计
MDX ( Multi-dimensional Express)支持对多维数据集的操作,在学生管理系统中,对多维数据进行时,可以通过ADO/MD对象模型和PivotTable Semite提供的服务,同时,SQL为多维数据仓库提供了DSO编程接口。因此,高职学院决策层或管理层可以根据学生的维度和度量值,构造MDX查询语句进行多维查询分析,利用ADO/ MD对象模型的Cellset对象存储多维分析结果,最后显示多维数据。
5、 学生管理系统OLAP数据分析结果
OLAP技术技术的核心是维度这个概念,通过OLAP技术对数据仓库中的数据进行多维分析、汇总,形成图标等形式,使决策者或管理者能够直观清晰的看到分析结果。本文基于学生综合测评建立起的学生数据仓库,对其进行多维度、聚集度的OLAP分析后,其结果如下:
(1)担任学生干部、农村来的的学生综合测评普遍好。
(2)核心课程、任课教师是教授的课程总体成绩好。
(3)德育成绩、实践成绩好的学生,综合测评成绩也好。
(4)各门课程成绩好的学生德育成绩、实践成绩和综合测试成绩也好
(5)各门课程成绩好的学生德育成绩、实践成绩和综合测试成绩也好
(6)大一学生的总体成绩比大二学生的总结成绩好。
结束语
高职院校学生管理系统数据仓库的建立是一个复杂的工程,在目前高职院校生源等各个方面激烈竞争环境下,有效的采用数据仓库技术和联机分析技术,能够为决策者或管理者提供快捷、准确、有效的信息,从而根据信息制定相应的对策,提高高职院校的知名度。
参考文献:
[1]肖华. 浅议数据仓库在学生成绩数据库中的应用[J].电脑知识与技术,2010(10):8424-8426
[2]林雯. 网络化制造业CRM系统数据仓库的设计与实现[J].计算机与数字工程,2008(7):100-102
[3]李颖,郝克刚.基于电信数据仓库系统的ETL研究与设计[J].计算机应用与软件, 2009(1): 178-179.