摘 要:本文将关联规则应用于学生成绩数据中,对学生成绩数据进行深入分析,以期得出相关趋势,并结合数据挖掘结果,对成绩进行分析和预测,为教学管理和学生管理工作中提供相应的决策依据。
关键词:关联规则;稀有项;多最小支持度
务表。
表2.1 学生成绩表
Table2.1 grade table
对成绩的离散化:成绩的筛选条件为大于等于85分,大于等于85分的转化成布尔型数值”1”,而成绩小于85分的转化成布尔型数值”0”。
课程编码:将表2.1 学生成绩表中的课程名分别以K1,K2,…编码,如“英语”的编码为K1。
从学生成绩数据库中提取相关属性,为整个数据挖掘模块提供了数据挖掘对象。由于Apriori算法适用于事务库的数据挖掘,所以需要将关系表转换为相应的事务库。
本文将关系表中的除学号外的每个属性视为一个事务。每条记录中每个事物发生的标志为离散化后值为“1”。
例如,表2.1中的第二条记录,转化为事务:
{K7,K10,K11}
3、功能实现
3.1利用经典的Apriori 北京 北京大学出版社 2008.11 98-187.