基于判别分析的内部控制重大缺陷的修正方式

一、引言
    国内外财务丑闻频发造成资本市场动荡和投资者信心丧失，症结之一在于企业内部控制系统的失效。为加强对上市公司监管，改善财务报告质量，减少公司欺诈，恢复投资者信心，美国国会于2002年7月通过了萨班斯-奥克斯利法案。该法案从讨论通过实施至今，美国各界对于执行其中财务报告相关的内部控制有效性测试、评估及报告要求的302和404条款的成本效益之争甚嚣尘上。美国财务经理协会、普华永道公司、商业协商协会等机构对萨班斯法案执行成本所进行的若干次调查显示其高昂的执行成本远远超出可能带来的收益[1]。萨班斯法案404条款提高了通过证券市场募集资金的成本，发生股票回购的公司和金额都明显放大[2]。首批执行该法案要求的财富1000强样本公司2004年的审计费用比上一年平均增加了230万美元，并且规模小的公司审计费用高于大公司，这可能导致小公司减少内部控制资源投入因而更可能发生内部控制缺陷[3]。从长期来看，将资源过度转移到非增值型活动(遵循措施)中将阻碍公司的成长甚至整个经济发展[4]。萨班斯法案对提升资本市场投资者信心的作用是毋庸置疑的，但短期内很难对该法案的实施成本和效益做出全面准确的评价，关键是要找到平衡点降低执行成本。2006年我国深交所和上交所分别发布了《上市公司内部控制指引》(以下简称为《指引》)，沪深两市公司根据《指引》要求披露了内部控制信息，为拓展我国内部控制实证研究提供了数据。根据德勤2009、2010年中国企业内部控制调查报告数据，2009年仅有29.41％的企业认为指引有助于本企业监控并降低成本和费用，2010年这一比例为37％，略有提高。一些企业表示若按照《指引》实施日常内部控制以及进行内部控制评价，在一定程度上将增加员工的工作量，预计并不能提升经营效果和效率，反而提高了成本和费用。
    财政部联合证监会、审计署、银监会、保监会等五部委分别于2008年、2010年发布了《企业内部控制基本规范》和《企业内部控制配套指引》(以下将二者简称为内部控制规范体系)，明确要求从2011年开始在境内外同时上市的公司出具内部控制评价报告，披露其存在的内部控制重大缺陷等关键信息，并由注册会计师出具审计报告。但是，我国目前并未如美国萨班斯法案一样对出具不实内部控制报告的行为制定严苛的惩罚条款，内部控制规范体系的执行效果尚有待检验。因此，在我国内部控制规范体系生效前及此后一段时间内，通过公司特征判别内部控制重大缺陷存在与否具有重要的现实意义。即使在美国严苛的萨班斯法案之下，各界对执行法案的成本效益之争亦未有定论，在这样的背景下，缺陷预测方法则为降低遵循成本另辟蹊径。
    二、相关研究述评
    内部控制重大缺陷常常出现在存在管理层欺诈、财务指标异常、业务复杂等情况的公司。围绕上述方面，现有的内部控制缺陷定量研究方法主要有人工神经网络技术(ANN)、模糊集方法(FSA)、多元线性规划(MCLP)、Logistic或Probit回归等。
    Fanning等使用广义自适应神经网络架构(GANNA)和自适应逻辑网络(ALN)方法设计神经网络，区分管理层舞弊与非舞弊公司[5]。Cooley和Hicks基于模糊集理论，将语言测试方法和二分制的问卷调查相结合汇总评估内部控制缺陷，解决了审计师以往单独使用问卷调查或流程图等控制测试方法的不足[6]。Korvin等利用陶氏化学公司风险分析矩阵构建了基于模糊集理论的内部控制风险模型，帮助管理者评估会计信息系统内部控制风险[7]。
    多元判别分析法(MDA)从1936年首先应用于植物种群分类研究后，至今已经应用于多个学科的研究中，近年来成为客户信用评估、破产预测的主流分析方法。其中最突出的研究成果是Altman在1968建立的多变量Z分模型以及改进的“ZETA”判别模型。我国学者[8-9-10]应用此方法在企业财务预警方面进行了一些研究。
    Altman等在破产预测研究中通过比较神经网络法和判别分析法，认为神经网络分析法在信用风险预测中的应用结果并未显著优于线性判别模型[11]，并且在“内部控制的思考和投资标准”一节中特别提出Z分模型的研究结论可以应用于内部控制状况的预测[12]：“公司管理最为紧要也是非常困难的工作就是定期客观地评估公司现状……建议如果正确使用判别分析模型就能够尽早预测公司存在的问题，使管理层及时意识到问题的严重性，避免控制失败”。
    Franklin在Ge和McVay①内控缺陷影响因素实证研究结论的基础上，首次使用Altman财务困境预警模型中的三个财务指标预测内部控制重大缺陷②，以财务指标为桥梁为内控重大缺陷与公司财务困境之间的联系提供了初步证据。
    Doyle等对美国2002年8月至2005年间779家披露了内控重大缺陷的公司和5047家未披露重大缺陷的控制样本公司数据进行Logistics回归，发现重大缺陷公司规模较小、上市年限较短、财务状况较差、业务复杂或者正在经历重组[15]。Ashbaugh-Skaife等对2003年11月至2004年间披露内控缺陷(不区分严重程度)公司的分析得到了类似结论，即内控缺陷公司的业务复杂、会计风险高、内控建设资源投入较少[16]。另外，一些实证研究探讨审计定价、审计师变更、审计师质量与内部控制缺陷之间的关系。内部控制缺陷与审计定价正相关，审计师对存在较多内部控制缺陷的公司收取更多的审计费用[17-18-19]。内部控制缺陷与审计师变更相关，相当多的公司在解雇原审计师后被发现存在内部控制重大缺陷，披露内控重大缺陷的公司审计师变更频繁[16-20]。聘请高质量审计师的公司，存在内控重大缺陷的可能性相对较小，如聘请“四大”作为年报审计的公司通常规模较大，经济实力较强，对内控系统建设投入较多，发生内控重大缺陷的风险相对较小[20]。
    上述研究中，模糊集方法对于计算机会计信息系统内部控制缺陷的评估有一定效果，但是昂贵且费时。神经网络技术需要人为随机调试才能得到一个较好的神经网络结构，也需要耗费大量人力和时间，且该方法结论没有统计理论基础。多元线性规划模型的预测准确率仅达到50％左右，解释性不强，应用受到较大限制。Logistic或Probit回归从某些方面揭示了存在内控重大缺陷公司的特征，但在研究变量选取方面较为分散和随机。另外，在财务状况指标选取时直接应用破产预测模型(如ZETA模型)结果而未细化、区分不同财务指标所代表经济含义的做法并不科学，降低了回归方程的拟合优度。
    基于上述原因，本文尝试探索将多元判别分析法引入内部控制实证研究中，构建内部控制重大缺陷预测模型。在判别指标的选择上，一方面综合考虑公司财务状况、复杂性、审计师特征等因素，另一方面将各类财务指标进行分类、细化，以使指标选取更加合理、提高判别分析模型的预测准确率。
    三、样本选择与数据来源
    1.样本选择
    本文确定重大缺陷样本的来源主要有以下几种：第一，企业内部控制自我评价报告中明确本企业存在“重大缺陷”；第二，企业在内控自评报告中未确认自身存在重大缺陷，但存在《企业内部控制审计指引》中所列举的表明内部控制可能存在重大缺陷的几种迹象的，则确定为重大缺陷样本；第三，信息披露考评结果为“不合格”的上市公司以及因决策过程违规、违法使用资金等受到证监会、证交所及其他主管部门的处罚或谴责的上市公司；此外，在上市公司关于公司治理及内部控制问题整改报告中表明其存在交易和账户层面内控缺陷超过三项者，也确认为重大缺陷样本。控制样本则是在2007—2008年间均未发生重大缺陷的公司。
    根据上述原则，本研究选取深圳证券交易所主板上市公司作为研究对象，剔除数据缺失公司，得到内部控制重大缺陷样本公司138家，其中2007年101家、2008年37家；③同时，依据年度和行业选择138家非重大缺陷公司作为配对样本。内部控制缺陷资料从上市公司内部控制自我评价报告、各省证监局对辖区上市公司进行公司治理及内部控制的整改报告、深交所主板诚信档案等资料中整理分析得到，文中财务数据均来自国泰安数据服务中心，审计师数据来自RESSET金融研究数据库。
    2.变量选择
    在财务指标选取方面，为帮助预测内控重大缺陷，本文借鉴了国内外破产(财务困境)预测领域的前期研究成果，如Altman等与Ohlson破产预测中使用的变量[21-22]，以及吕长江等与邵希娟和曾海花在国内破产预测模型中使用的变量[23-24]，以全面反映公司财务状况为基础最终确定了22个财务指标(见表1所示)。　
    除以上破产预测变量外，本文还包含了以往实证研究中与内控缺陷相关的变量，包括上市年限、公司规模和经营复杂性等。Ge和McVay和 Doyle认为成立时间较短的公司内部控制程序较少，员工经验较少，存在重大缺陷的可能性更大。但是Krishnan(2005)研究表明，上市年限越久，发生财务舞弊和财务报告重述的可能性越大，也就意味着内部控制越差。林斌和饶静认为上市年限越长的公司，内控质量反而不如新上市公司，上市时间较短的公司更愿意披露内部控制鉴证报告[25]。公司规模越大，往往拥有更多高素质员工，将更多资产用于内部审计或咨询，形成更强有效的内部控制。本文用总资产的自然对数表示公司规模。另外，公司子公司数目越多，业务越复杂，内部控制出现问题的可能性越大；子公司数量越多，编制合并财务报表的难度也越大，内部控制越可能存在缺陷，因此，用上市公司拥有子公司的数量作为经营复杂性的代理变量。另外，本文包含三个审计师变量：是否由“四大”事务所审计代表审计师质量(Big Au=1代表由四大审计，否则为0)；采用与Kwak等相同的办法，将发生重大缺陷当年变更审计师(Auditor Ch)赋值为1，否则为0；五年内变更审计师(Auditor Ch5)赋值为1，否则为0。
    3.描述性统计分析
    表2报告了内部控制重大缺陷样本公司和非重大缺陷样本公司财务指标及非财务指标进行均值t检验的描述性统计结果。

    从表2可以看出，重大缺陷样本与非重大缺陷样本的公司特征变量中有一半显著不同。重大缺陷样本公司的上市年限均值显著大于非重大缺陷样本公司，与Krishnan的结论相同；五年内变更事务所的均值也显著大于非重大缺陷样本公司，但当年是否变更事务所以及是否由四大事务所审计的均值两组样本没有显著差异，与Kwak的结论有所不同；重大缺陷样本公司的规模(LnAsset)均值显著小于非重大缺陷样本公司，与Ge和McVay结论相同；经营复杂性方面，重大缺陷样本公司的子公司数目均值显著大于非重大缺陷样本公司。代表盈利能力的7个财务指标，非重大缺陷样本公司的表现都显著优于重大缺陷样本公司，说明盈利能力较差的公司更有可能存在内控重大缺陷，与Ge和McVay结论相同。在代表成长性的财务指标中，非重大缺陷样本的总资产增长率和营业收入增长率的均值都显著大于重大缺陷样本公司，股东权益增长率和存货占总资产比例的均值虽然大于重大缺陷样本公司但差异并不显著。在流动性指标中，只有经营现金流与总资产比率和现金流量比率指标，重大缺陷样本的均值显著较低，这一结果与Ge、McVay和 Kwak的结论相同。而流动比率、速动比率等指标，两组样本没有显著区别，重大缺陷样本公司的均值甚至高于非重大缺陷样本公司，这一结果与Franklin的研究发现类似。这意味着在Altman等人破产预测中有效的流动性变量在内部控制重大缺陷预测中并未发挥有效作用。而三个营运能力指标的t检验结果也并不一致，其中只有总资产周转率的均值在两组样本间存在显著差异。以上代表公司各方面财务状况的指标在t检验中所表现出的混合性结果说明，以往内部控制实证研究中不区分盈利能力、流动性指标而直接将Z值作为财务状况代理变量的做法是不科学的。
    四、判别分析结果
    将内部控制重大缺陷公司定义为“组合1”，非重大缺陷公司定义为“组合0”，同时将上述均值t检验结果中具有显著性差异的公司特征变量，即上市年限(Year)、子公司数(N)、五年内变更事务所(Auditor Ch5)、公司规模(LnAsset)、息税前利润与资产总额比(EBIT/TA)、总资产净利润率(ROA)、净资产收益率(ROE)、经营净收益比平均总资产(CRE/TA)、留存收益资产比(RE/TA)、每股收益(EPS)、每股经营现金流(CFOPS)、总资产增长率(TA Growth)、营业收入增长率(Revenue Growth)、经营现金流比平均总资产(CFO/TA)、现金流量比率(CFO/CL)和总资产周转率(TA Turnover)作为建立判别分析模型的输入变量，采用逐步判别分析法进行选择，结果见表3所示。

    表3显示，在16个变量中共有5个变量进入了模型，它们是：LnAsset(公司规模)、Auditor Ch5(五年内变更事务所)、Revenue Growth(营业收入增长率，以下简记为ReGr)、Year(上市年限)和RE/TA(留存收益资产比)。
    非重大缺陷公司贝叶斯判别函数为：

    采用交互验证方法来验证模型，④结果如表4所示。从表4可以看出，模型对内部控制重大缺陷公司的预测准确率是71.1％，对非重大缺陷公司的预测准确率是76.1％，第一类错误和第二类错误的比例分别是28.9％和23.9％，第一类错误比例略大于第二类错误比例。⑤这一预测结果要好于Kwak(2009)使用多元线性规划模型等方法所得到的50％左右的预测准确率。
    五、研究结论
    本文运用多元判别分析方法构建内部控制重大缺陷预测模型，得出了以下结论：第一，内部控制重大缺陷公司和非重大缺陷公司在成长性和盈利能力特征财务变量方面存在显著的差别，营业收入增长率是反映成长能力的指标，留存收益资产比是反映整个生命周期内累积盈利能力的指标。公司建立良好内部控制的能力随财务状况的变化而变化，成长性越低、累积盈利能力越差的公司由于没有足够的资源投入到内部控制，发生重大缺陷的可能性越大。值得注意的是，反映流动性与偿债能力和营运能力指标均没有一个入选模型。这说明公司在这两方面的表现差异不大，流动性与营运能力指标目前不是判别是否存在内控重大缺陷的主要因素。第二，除了财务指标外，公司规模、上市年限和审计师变量对于判别内控重大缺陷是否存在具有显著作用，反映了我国上市时间较长的公司整体内控水平低于上市时间较短公司的现状；小规模公司对信息和控制系统的投入较少，能够维持这些系统的人员和专家也少，不利于形成更强有效的内部控制；披露内控重大缺陷的公司审计师变更更加频繁，但是是否聘请“四大”审计年报不能作为判定公司存在重大缺陷的有效变量。
    本文构建的贝叶斯判别函数的预测准确率不到80％，一方面是由于本文所选择样本的期间是深交所刚开始强制上市公司披露内部控制报告的头两年，对内部控制缺陷的披露及评价存在许多不规范的地方，另一方面2007年适逢新旧会计准则交替之际，许多公司对正确执行新准则的控制不足。随着我国内部控制法规强制企业评价与披露内部控制状况，更多、更合适的样本将进一步提高本文所建模型的预测准确率，因此，本文的研究具有较高的应用价值。监管方、审计师以及外部投资者可以利用本文的研究方法及结论，判别上市公司内部控制重大缺陷存在的可能性。政府监管机构可以借助判别模型结论有的放矢，将最严格的内部控制监管措施应用于最有可能发生内控重大缺陷的公司而不是所有公司，这样一方面可以改善资源的宏观配置，节约监管成本；另一方面可以降低企业的平均遵循成本、节约资源进行再投资以刺激生产和经济增长。审计师可以应用本文的研究方法评估审计风险，调整审计策略。另外，本文还可以对投资者正确评价内部控制及公司投资价值提供参考信息。
    注释：
    论文提出的预测模型对于判断公司的内部控制质量具有较高的实践价值。
    ①公司业务复杂、规模较小和盈利能力较差的公司更有可能发生内部控制重大缺陷。
    ②Franklin使用的三个财务指标为利息保障倍数、留存收益与总资产比率和流动比率，进行了Wilcoxon秩和检验、符号检验和Spearman相关分析。
    ③样本中不包括金融保险业公司；为控制样本规模，2008年重大缺陷样本公司，不包含2007年已经确认为重大缺陷公司且其缺陷在2008年依然存在的公司。
    ④采用交互验证法，能够避免样本二分法要求样本量大、判别函数不稳定的问题。交互验证下不区分建模样本和验证样本。
    ⑤预测类研究通常有两类错误：第一类错误和第二类错误。第一类错误称为误拒错误，在破产预测中是指将破产企业错判为非破产企业；第二类错误称为误受错误，在破产预测中是指将非破产企业误判为破产企业。显然，发生第一类错误的损失大于第二类错误，会增加投资者决策风险。在内部控制重大缺陷预测中，第一类错误是指将确实存在内控重大缺陷的公司错误地预测为非重大缺陷公司，错判损失较大；第二类错误是指将非重大缺陷公司误判为重大缺陷公司，错判损失相对较小。