文章通过介绍数据挖掘技术概述,分析软件开发信息管理数据挖掘面临的挑战,对数据挖掘技术在软件开发信息管理中的应用展开探讨,旨在为相关人员基于数据挖掘技术概述、软件开发信息管理数据挖掘面临的挑战的促进软件开发信息管理有序开展研究适用提供一些思路。
数据的挖掘是一项复杂的系统工程,其主要指的是在庞大数据中收集有价值信息数据的过程。对数据挖掘技术在软件开发信息管理中的应用展开研究,有着十分重要的现实意义。
1 数据挖掘技术概述
1.1 数据挖掘流程
通常而言,数据挖掘可划分成四个阶段,分别为选择、预处理、挖掘以及吸收,如图1所示。其中,选择是就有着极强交互性的庞大数据而言的,在工作期间受信息数据不断更新影响,通常要对数据展开重新选择;预处理则是将没有得到加工的信息数据变换成适宜挖掘处理的形式;挖掘是经由科学计算方法将预处理数据输入系统,在庞大数据中收集有价值的信息内容,从而完成分类、聚类等工作;吸收也就是数据的后处理,其是为了将有价值的信息数据反馈给用户,使数据预处理、挖掘环节具备真实意义。
1.2 数据挖掘技术
现阶段,在软件开发中数据挖掘技术诸如分析、聚类、预测及统计等已经得到较好的应用,这些技术的应用能够使数据挖掘繁杂工程得到一定的简化,也就是在海量的数据中尽可能快的时间内找出人们所需的信息,且对系统予以反馈供人们使用。在数据挖掘工程中,较为常见的技术包括关联发现、分类树、课时数据挖掘等,同时还有一些较为特殊的数据挖掘技术包括回归建模、统计分析等。在软件开发信息管理中应当对数据挖掘技术进行科学合理的选择,以完成好软件开发信息管理工作。
2 软件开发信息管理数据挖掘面临的挑战
2.1 软件开发数据较为复杂
现阶段,软件开发数据以结构化数据和非结构化数据为主,前一种数据多牵涉软件版本对应信息及缺陷报告等,后一种数据主要涵盖相关软件代码及文档等。该两方面数据无法使用同一种算法,然而它们相互又有着很大的相关性。换而言之,在数据挖掘算法开发方面,为了尽可能权衡到两方面数据的复杂关联,很大程度上提升数据挖掘难度。
2.2 分析手段并非传统模式
软件开发数据挖掘后续工作是把取得的信息提供给需要的用户。在以往数据挖掘应用期间,就好比电子商务或者金融行业,就是把信息转化为文字或图表。然而,软件开发人员所需信息并非如此简单,其还涉及了缺陷定位、编程模板等用户信息,所以对数据挖掘技术提供较高的要求。
2.3 数据挖掘结果评价标准不统一
现如今,数据挖掘技术在诸多行业得到普及推广,同时在结果呈现及评价标准等内容上相对完备。然而,在软件开发新型管理中数据挖掘技术的应用却并非如此。软件开发人员要获取诸多、繁杂的信息,且信息表示方法各不相同,如此很大程度上提升了对数据挖掘结果展开定量准确分析的难度。
3 数据挖掘技术在软件开发信息管理中的应用
在软件开发信息管理过程中,经对数据挖掘技术科学合理应用,可为软件开发带来极有利的帮助,达到软件开发信息管理低成本、高质量、短工期的要求,消除软件开发信息管理期间存在的一系列问题。全面软件开发行业在时代发展新形势下,要与时俱进,大力进行改革创新,运用先进的科学技术不断优化数据挖掘技术研究。
3.1 数据挖掘技术在开源软件开发中的应用
开源软件,即源代码为开放的软件,此类软件现阶段大部分对用户是不收取费用的,也正是受此影响提升了开源软件控制管理难度,鉴于此,可应用数据挖掘技术来改善开源软件的资料。就好比,日本某高校学生推出了一个分布式数据挖掘系统,该系统一方面可对大型系统开展数据挖掘,一方面能够一系列开源软件开展数据挖掘。
3.2 数据挖掘技术在软件项目管理中的应用
软件项目管理中数据挖掘多表现于两个方面,一方面为对组织关系开展的挖掘,一方面为对版本控制信息开展的挖掘。软件项目管理作为一个系统工程,对组织关系开展挖掘主要是指对人力资源开展协调分配。就好比,一个庞大工程可能同时有千百余人参与,在工程运行期间人员相互会出现频繁的信息数据交互,经对数据挖掘技术的有效应用,能够对人员组织关系展开合理划分,积极促进软件项目管理的有序开展。同时,数据挖掘技术还可应用于挖掘版本控制信息,能够有效缩减系统维护成本,改善软件项目管理水平。
3.3 数据挖掘技术在程序代码及机构中的应用
在数据库中收集有价值的代码、构件,现阶段,较为常用的手段包括经由关键词开展索引、经由记录输入-输出关系索引以及以建立交互关系图为基础的方法等,我们常常使用的百度、搜狗等搜索引擎均能够开展数据检索。
4 结束语
总而言之,在软件开发信息管理过程中,经对数据挖掘技术科学合理应用,可为软件开发带来极有利的帮助,达到软件开发信息管理低成本、高质量、短工期的要求,消除软件开发信息管理期间存在的一系列问题。基于此,相关人员务必要明确认识软件开发信息管理数据挖掘面临的挑战,不断钻研研究、总结经验,积极促进软件开发信息管理有序开展。
作者简介
曾丽(1981-),女,四川省宜宾市人。硕士学位。现为四川工商学院计算机学院讲师。研究方向为大数据、数据挖掘、数据库、信息管理。