【论文关键词】教学知识;本体;知识库系统
【论文摘要】教学知识的共享和重用是影响教学效率的重要因素,文章将本体技术引入到教学知识管理中,通过使用现有的本体编辑工具、描述语言和开发方法,构建并实现基于本体的教学知识库系统,为网络教学系统以及其他用户提供教学领域知识的共享模型,从而实现教学知识的共享和重用。
一、本体概述
本体是指对领域知识的共享概念模型和明确的形式化规范说明,它涵盖了领域中的基本术语与关系,并利用这些术语和关系构成知识的外延规则和复杂定义,是一种能够提供对领域知识的共同理解和共享的知识表示模型。
本体的定义很多都具有高级的普遍性,但从数学的角度对本体进行精确描述的形式化定义却很少,因为形式化定义很难包括所有不同类型的本体。本体的形式化定义是概念化术语映射到逻辑世界的桥梁,李文杰对三种应用较为普遍的本体形式化定义进行了详细介绍。
(一)本体的描述语言与开发工具
目前构建本体的工具很多,以protege使用最为广泛。protege是斯坦福大学医学院医学信息研究组(stanfordmedicalinformatics,smi)开发的一个免费、开源的本体工具,它为知识工作者提供了一个可以构建领域本体的环境,协助知识工程师和领域专家完成知识管理任务。www.133229.CoM
本体的实现依赖于本体标记语言的表示功能,owl(ontologyweblanguage)是w3c推荐标准,能够清晰表达概念以及这些概念之间的关系。本文使用protege3.3.1做为开发工具,从形式化表达能力和推理能力两方面考虑采用owl,dl本体描述语言。
(二)本体知识库及其优点
张立等对本体与传统知识库的相似点和不同点进行了阐述,使用本体建模的方法和相关知识表示的标准建立知识库,便于广大研究者间的交流和协作。对计算机而言,可以实现不同领域、不同模型之间的跨平台的互操作、共享和重用。使用本体作为知识库的基础的优点主要有:
1.可重用性。本体作为某个领域概念、关系以及概念间内在关系的形式化表达,这种表达可以被共享和重用。
2.智能检索。基于知识的、语义上的匹配,在查准率和查全率上有更好的保证,克服了全文检索查准率比较低和数据检索对用户要求较高的缺点。
3.可靠性好。领域知识和模型的形式化表达便于正确性检测,一些已有的本体建模工具已经提供了一些相应的功能模块。
4.良好知识表达、解析能力。本体能良好地表达规范的任务和知识,有助于领域知识的分解和解析,利用本体对领域知识进行建模,可以使相互独立的层次有机地组成一个完整的系统,可以实现领域知识的共享和重用,领域知识条理清楚的形式化便于正确性的检查,使知识库的结构更加清晰,有利于知识库系统的维护。
二、教学知识本体库的构建
常用的本体构建方法体系有骨架法、评估法、bernaras法和sensus法等,冯志勇等对几种本体构建方法优势与不足进行了详细的比较和说明,本文在参考这几种方法的基础上,遵循gruber提出的5条原则,提出保障知识本体的构建步骤。
(一)教学领域知识描述
本文以教学知识作为研究对象,该领域本体覆盖范围包括教学内容的知识点、课件、例题、实验、习题练习、相关学习资源和常见问题解答等,昊煌煌对教学领域知识的描述,形成了教学领域知识内概念的体系结构划分。
根据课程进行分类,分成小学综合课程、初中分科与综合相结合课程、高中分科课程、本科课程等具体的学习阶段,不同阶段中包含具体的课程实例,如高中阶段有语文、数学、政治、英语、地理等课程。知识点是教学知识组成的基本粒子。在课程标准的指导下,具体分析学生的学情,选择合适的教学策略,包括教学活动程序、教学方法、教学组织形式和教学媒体等。知识点与课程可以按照教学策略组合成为新的课程。
通过对教学领域的分析和描述,参考已有的三种本体形式化定义,我们提出了教学知识本体的形式化定义:
教学知识本体,其中表示基本概念的集合,包括基本术语和原理等教学领域的概念集合,其中有表示教学领域中的概念;表示基本概念属性的集合,例如学时的数量、知识点难易程度等等;表示基本概念之间以及不同层次的概念之间存在的关系集合,表示多个基本概念通过规则合并后而产生的较大粒度的概念,而表示基本概念与概念之间存在的关系,如因果关系、伴随关系等等;表示关系的属性集合,如关系的类型、对象和运算性质等;表示公理集,即教学内容中课程之间的关系,以及科目内部知识点之间的关系。
(二)教学知识本体的实现
按照前面分析的本体构建方法分别使用protege3.3.1的各相关控件完成五元组的概念和关系是本体的基本结构,其中概念是核心。因为关系是用来描述领域概念间的关系,它本身也可以作为概念来实现;属性、公理和实例是依赖于某一概念的,所本体的构建应以概念为中心,从教学领域中的顶层概念开始,通过添加子类将概念逐一细化,一直到应用所需要的粒度。
三、系统结构设计
(一)系统结构框架
知识库系统建模框架是指从建模的角度研究知识库系统开发方法。在研究者提出的各种各样的知识库建模框架中,kads方法最具代表性。该方法把求解特定任务的知识划分成三个不同的层次:领域层、推理层和任务层,分别对应着知识库系统的静态视图、功能视图和动态视图。其中,领域层包含了求解问题所需要的特定领域内的知识和对领域概念的描述(即领域本体一domainontology,它包含特定领域的相关知识)。推理层指明了求解问题采用的方法,包含了推理步骤和领域知识在其中所起的作用(roles)。任务层则把所需要求解的问题分解成若干个子任务,并为每一个子任务确定目标,同时明确对子任务的控制。
按照kads知识库建模框架,文本将教学本体知识库系统分为推理层、领域层和任务层,系统结构框架,其中:
1.任务层。包括查询请求输人接口、查询控制器、查询结果输出接口3个功能模块,负责分析查询请求,并对本体知识库进行查询,然后将查询结果返回给用户。
2.领域层。包括本体编辑模块和本体存储模块2个功能模块。教学领域专家和开发人员通过本体编辑模块建立保障本体知识库,并对其更新和扩充;本体存储模块主要实现本体知识库的持久化。
3.推理层。包括规则转换模块、本体推理模块和本体检验模块3个功能模块。负责本体规则的转换,本体的推理以及本体一致性检验。
(二)系统功能模块实现
教学本体知识库系统的实现框架,其中protege3.3.1可以提供可视化的本体编辑界面,可以方便地实现本体中的类、属性、关系以及实例的编辑;使用racer推理机和protege结合,实现了本体的推理、转换和一致性检验。
本文使用了语义开发工具jena2实现了查询控制器和本体存储模块。jena2是一个java开发工具包,它被广泛地应用于开发语义网的应用系统。jena由hp公司开发,jena本体解析器包括三个部分,即对rdf的解析、对rdql的查询支撑以及对owl的解析。从2004年2月起,jena2.1版本开始支持owl文档的处理,为应用开发者提供多种灵活地表现rdf图的方案,这种方式允许用户可以使用更高层接口或使用底层接口的不同方式访问处理rdf图数据。同时提供了一种rdf图的最简单的视图方式—三元组方式,主要方便了系统级程序开发人员处理数据,对基于rdfs和owl推理是非常有用的。
jena还提供了将rdf数据存人mysql,hsqldb,postgresq,oracle和microsoftsqlserver等关系数据库的接口,model,resource,query等接口可以用于访问和维护数据库里的rdf数据,采用jena2提供的数据存储接口和mysql数据库,实现了本体存储模块。
四、结束语
知识的共享和重用是当前研究的热点和难点问题,本文将本体技术引人到教学知识管理中,通过对教学领域知识内容与特点的描述,刻画出领域内的概念体系;构建了教学本体知识库,并在此基础上实现了基于本体的教学知识库系统,这为现有的网络教学系统以及其他用户提供了对教学领域知识一致、清晰、明确的理解,从而实现教学知识的共享和重用,也为教学知识管理提供了新的方法和思路。同时还存在两个主要问题,一是知识本体的构建方法多以手工标注为主,其工作量非常大,开发困难;二是教学知识本体中类之间的关系还是有一定的缺陷,如何建立教学知识本体自动更新完善体系非常重要,这些问题都有待进一步研究下去。