摘 要:摘要:本文通过对“业务分析模型”和“税务数据分析”这两个概念的解释,阐述了在税务数据分析工作中应用业务分析模型的理由和意义,然后在此基础上详细说明了如何在税务数据分析工作中创建和应用业务分析模型,从而更好地利用税务部门积累的大量有价值信息,推进“信息管税”。
关键词:关键词:税务数据分析 分析主题 业务分析模型
1. 引言
税务系统信息化工作的不断发展和大量有价值信息的积累,为加强税务数据分析、推进“信息管税”提供了坚实的基础。如何才能更好地进行税务数据分析呢?总结这几年的工作经验,笔者认为采用业务分析模型进行税务数据分析可以极大的促进这项工作,下面来看一下如何在税务数据分析工作中应用业务分析模型。
2. 业务分析模型和税务数据分析的概念
要想研究如何在税务数据分析工作中应用业务分析模型,首先要搞清楚本文所称的“业务分析模型”和“税务数据分析”分别是什么?
2.1 什么是业务分析模型
(1)定义
模型是指客观事物的抽象表达形式,一般表现为设计图、计算机程序、计算公式或是一个无二义性的概念描述等。业务分析模型是关于如何取得分析主题的结论而建立的模型,它有四个要素:分析主题、所属业务对象、对象属性、结论算法,其中分析主题、所属业务对象和结论算法有且只有一个,对象属性可以有一个或多个。
分析主题用来说明业务分析模型能够解决什么问题,是业务分析模型的核心,其它要素都是围绕分析主题设立的。所属业务对象用来说明分析工作所面对的客体,是一个客观事物对象。结论算法用来说明业务分析模型如何解决问题,它的质量决定着整个业务分析模型的质量,是业务分析模型的关键,用公式表示是:R = F(O1,O2,……,On),R表示得出的分析结论,F表示结论算法,O1,到On表示n个对象属性,基于数据库分析的结论算法就是一个SQL语句。对象属性一般就是结论算法中出现的参数,如果某个对象属性的过滤条件不为空,则表示该对象属性会限定所分析的业务对象范围。
(2)与数据模型的区别
业务分析模型不同于计算机系统开发领域内的数据模型,二者的区别如图1:
图1:业务分析模型与数据模型的区别对照表
2.2 什么是税务数据分析
(1)定义
税务数据分析是指为了实现特定的目的,按照科学的规则对税务部门积累掌握的大量有价值信息进行提取、计算、加工,并把结果展现出来或是根据结果进行后续处理的全部工作。它一般先要确定分析命题(即整个分析工作的目的框架),再将它细化为多个分析主题,然后对每个分析主题进行分析。如果分析命题特别简单,可以只有一个分析主题。
(2)分类
税务数据分析主要分为事前防控分析类、事中辅助分析类、事后监督分析类和宏观分析类。
(3)主要作用
税务数据分析的主要作用是通过对税务部门积累的大量有价值信息的分析,找出存在的问题,或是确定税务事物的达到程度,或是探索税收经济规律,然后对找出的已经存在的问题进行补正并惩戒违规的税务人员或纳税人,对找出的正在发生且尚未保存的问题进行阻断或是风险警示,用确定的税务事物所到达程度来辅助完成生产业务工作,把探索出的税收经济规律用做决策的参考。
3. 税务数据分析工作中应用业务分析模型的理由及意义
明白了业务分析模型和税务数据分析这两个概念后,下面来看一下为什么要在税务数据分析工作中应用业务分析模型和这样做的意义。
3.1 为什么要在税务数据分析工作中应用业务分析模型
从以上两个概念可以看出税务数据分析工作是对税务部门积累的大量有价值信息进行分析的工作过程,而业务分析模型可以使分析工作规范化和量化。因此在税务数据分析工作中应用业务分析模型可以使工作更加规范、计算机实现税务数据分析工作也更加容易,所以在税务数据分析工作中应该使用业务分析模型。
3.2 在税务数据分析工作中应用业务分析模型的意义
(1)业务分析模型要优于单一数据指标,它可以对分析主题所涉及的所有方面进行全面分析,使税务数据分析的结果更加全面、合理,错误率也更低。
(2)使税务数据分析系统在建设过程中业务需求和技术实现之间有了规范的接口,提高了效率。
(3)通过建立业务分析模型可以促进税务人员对相关业务的深入理解,从而培养人才、锻炼队伍。
(4)通过建立业务分析模型,可以找出哪些涉税信息以前还掌握的不足,再通过新建系统或升级原有系统重新获得这些数据,从而促进税务管理。
4. 如何创建业务分析模型
税务数据分析工作不同于生产业务工作,没有审批流转等复杂流程,一般功能相对单一,因此税务数据分析工作的质量基本上决定于分析结果的质量。因而作为决定分析结果质量的业务分析模型的质量,就会最终决定税务数据分析工作的质量。业务分析模型对于税务数据分析工作如此重要,那么如何创建业务分析模型呢?它应该在什么时候由哪些人创建呢?创建业务分析模型的一般流程是什么样的呢?有什么要求吗?
4.1 成立组织机构
要想建立业务分析模型,就必须先要成立一个建立它的组织,这个组织就是业务分析模型小组,它在项目建设之初与业务需求组同时成立并隶属于业务需求组。它由下列人员组成:小组长、业务人员、数据库操作人员、技术人员等(以上人员均可兼任)。小组长负责协调整个小组的事务,业务人员负责调查调研座谈、对象属性选取、结论算法的描述性定义等;技术人员负责把描述性的结论算法转换成计算机表达式;数据库操作人员负责从数据库中抽取属性值并通过已经转换成计算机表达式的结论算法得出分析结论。
4.2 结论算法的设计原则
业务分析模型的应用是为了让税务数据分析工作变得更加规范清晰,把复杂问题简单化,所以结论算法的设计原则是:简单明了,原则上不能再拆分。如果分析主题很复杂,可以采用下面第五、(二)2所述的复合应用的方式来解决。
4.3 结论算法的遵从要求
业务分析模型建立以后,用它分析出的结果有的被用于指导经济发展,有的被用于追究相关人员责任,有的被用于税收生产业务,都是非常严肃的,所以决定分析结果的结论算法必须有严格的遵从要求,它的遵从要求及次序如下:
(1)如果国家法律法规中有明确规定的,从其规定;
(2)如果国家标准中有明确规定的,从其规定;
(3)如果上级机关有明确规定的,从其规定;
(4)如果行业标准有规定的,从其规定;
(5)如果存在通用惯例,遵从惯
例;
(6)以上皆不存在,自行研究确定。
制定业务分析模型的结论算法时,按以上次序自上而下进行匹配,首先被匹配到的就是制定结论算法的适用遵从要求。
4.4 建立业务分析模型的流程
建立业务分析模型是一个业务性和创新性难度都非常高的工作,所以必须经过形成初稿、验证讨论、专家评审、印证四个环节,每一个环节的成果都是阶段性成果,都必须入案存档。如果业务分析模型的结论算法非常简单或是算法遵从要求属于上面提到的1、2、3、4条的,可以实行简易流程,简易流程不需要专家评审和印证环节,最终讨论稿即为定稿。业务分析模型建立的流程如图6
(1)形成初稿环节
首先是业务人员通过发放调查问卷、深入纳税人和基层税务机关调研、召开座谈会等方式,全面掌握分析主题所涉及的全部因素及关键因素。在此基础上,针对分析主题提出业务分析模型草稿,然后与字典小组进行充分沟通并由字典小组确定所有概念后形成初稿。这是建立业务分析模型最关键的一步,也是最耗费时间与精力的一步。
(2)验证讨论环节
初稿形成后就要进行验证讨论,验证讨论时一般应以会议的形式进行,参与会议的人员除了包括全体业务分析模型小组成员外,还可邀请相关功能模块小组的成员参加。首先由技术人员将结论算法转换为计算机表达式,然后由数据库操作人员从数据库中取出实际数据代入表达式计算出结果,再由业务人员与实际情况验证并判断是否合理。一般要经过多轮验证并且不断修改完善后形成最终讨论稿。
(3)专家评审环节
讨论稿形成后,需邀请相关领域的专家进行评审。评审时业务分析模型小组全体成员都要参加并解答专家的质疑,评审结束后根据专家的意见进行修改,并再次验证讨论后形成评审稿,一般只评审一次。
(4)印证环节
从一个角度对客观事物得到的认识,换一个角度就可能完全不同了,所以形成评审稿后,还需要再选择几个另外的分析角度进行印证,全部印证合理后才能形成定稿,如果印证明显不合理,就需要再次修改结论算法并重新验证讨论,必要时还要重新进行专家评审。
5. 在税务数据分析工作中如何应用业务分析模型
建立好业务分析模型后,就要在税务数据分析工作中应用了。那么业务分析模型在税务数据分析工作中有哪些应用呢?又分别如何应用的呢?
业务分析模型在税务数据分析工作中的应用分为一般应用和高级应用两类,一般应用是指直接使用业务分析模型中的属性或分析结论,高级应用是指对得出的分析结论进行二次加工后再使用。下面就这两类应用分别说明如下:
5.1 初级应用
(1)直接展现结论
对于临时性的或是宏观分析类、事中辅助类税务数据分析工作,它的分析结果不再需要后续处理,所以这类工作中的业务分析模型的分析结论一般都是直接展现。这些分析结论可能是一份分析报告,也可能是一个数值或是一段描述,如税收与经济发展运行情况、地区税源增量(总量)发展趋势、主要税种税源分布、行业地区税负、税收总体状况分析等都是直接显示分析报告,再如双定户核定税额分析直接显示税额数值等。
(2)准备基础数据
准备基础数据就是在税务数据分析系统的独立数据库里把分析时需要用到的所有基础数据从各原始数据库里通过ETL(抽取Extract、转换Transform、装载Load)工具生成的工作过程,这是税务数据分析系统开发过程中的一项非常关键又非常复杂的基础工作。有了业务分析模型以后,这项工作就可以变得异常简单。通过下面提供的利用业务分析模型产生数据库表的方法,把税务数据分析系统内的每一个分析主题的模型分别转变为一个数据库表,就能完成这项工作。
利用业务分析模型产生数据库表,就是在给定的数据库里生成一个数据库表,该表的列与业务分析模型中的对象属性和分析结论一一对应。与对象属性对应的列的名称和类型,就是业务分析模型中对象属性的名称和类型;与分析结论对应的列的名称和类型,是分析主题的名称和分析结论类型。利用业务分析模型中对象属性中的过滤条件,从原始数据库中查询出所有对象属性值并计算出分析结论值输入数据库表就可以了。
5.2 高级应用
(1)通过与临界值比较对所属对象定性
所谓临界值就是对事物的性质、程度进行界定的临界点,它一般为一个数值,可由以下几种途径获得:法律规定、国家或行业标准规定、上级文件规定、行业惯用、自行约定等。比如山东省地方税务局规定年纳税额大于50万元的属于重点税源户,这里的50万元就是临界值。
对于事前防控类分析和事后监督类分析即可配合临界值对业务分析模型的所属对象进行定性,然后系统自动采取后续处理。这种应用一般都是由开发人员在后台设定,无需人工干预。正是由于这种应用才使税务数据分析工作的自动化程度越来越高。
(2)复合应用
所谓复合应用就是一个业务分析模型的分析主题和分析结论,是另一个业务分析模型的对象属性的名称和值,这两个业务分析模型组成父子关系,这种复合应用可以无限层的复合。子模型只能有一个父模型,而父模型可以有一个或多个子模型。复合应用可以将复杂的业务分析模型简单化,是业务分析模型应用的常见方式。
6. 结束语
税务数据分析工作是税务管理部门的重要工作之一,因此积极研究这一工作并不断探索新的工作思路、工作方法、实用工具等是税务管理者的责任,希望本文对于税务数据分析工作能有所帮助,哪怕能起到抛砖引玉的作用,笔者也会感到非常欣慰。
参考文献:
[1] 刘建丽等. 基于决策树的税务数据分析. 现代计算机(专业版),2003年11期
[2] 周建军. 税务信息系统中的业务模型分析.中国管理信息化,2007年10月