请采纳~~~ 浅谈问卷调查中模糊性问题的处理方法摘要:在社会经济中,存在着大量的模糊事件。传统的统计思想和方法对此往往无能为力,这就需要引入模糊数学的思想和方法本文对问卷调查中模糊性产生的原因进行简要的概括,对其处理方法进行了初步的探讨。 关键词 : 模糊 数学 统计调查 问卷调查 0 引言在统计学上,我们一般将社会经济现象划分为确定性事件和随机事件两类。 但在统计实践中,除了这两种事件外, 我们还会遇到一些模糊性事件。 这类事件往往呈现出亦此亦彼的特性,使人们无法将其准确地划归某一类或某一层次中。 在统计调查 (特别是在问卷调查)中, 会更多地涉及这类问题。本文拟就这一问题谈一点初步认识。1 问卷调查中模糊性产生的原因问卷调查是取得统计资料的一种重要形式,在统计调查中的应用越来越广泛。 特别是在社会调查(诸如空闲时间分配调查、 婚姻满意度调查) 、 民意测验、 企业信心调查 (景气调查) 、 居民消费意向调查、 消费者满意度调查等领域中, 它往往是唯一可以采用的方法。而问卷调查一个突出的特点就是涉及比较多的主观判断性问题。人们的主观判断介入以量化为最终目标的统计活动, 是产生模糊性的根本原因。具体而言, 其模糊性是由以下原因造成的:(1)人类认识的特点。 任何一种社会现象都是复杂的、变化的, 而且往往不具备可逆性。但人类的认识能力和认识手段总是有限的、 滞后的。 所以人们对事物的认识和判断往往无法精确化和数量化,只能用模糊的语言进行表达和似然的推理判断。例如, 对于非专业人士而言, 对某一个国家经济状况的认识, 只能用 “相当发达” 、 “一般发达” 、 “不发达” 、 “很不发达”等词汇表达; 对未来经济形势的判断,也只能用诸如 “乐观” 、 “谨慎乐观” 、 “不乐观” 等词汇表达; 对自己的婚姻状况只能用“满意” 、 “基本满意” 、 “不满意”等类似的词汇表达。 而诸如此类的表达方式都是模糊的,能用而且只能用模糊数学方法类处理。(2)认识的 “成本” 问题。实际上, 对某些问题, 我们完全可以不用模糊语言去表达, 而代之以精确的数据,但有时候并无此必要。因为只需要对事物进行大致的了解, 就可以满足我们研究问题的要求,所以, 没有必要过于精确; 而且, 精确性要求的提高势必加大取得信息的成本, 在时间和经济上是不合算的。例如, 对居民的消费意向进行调查,我们完全可以将其对每一类商品的预期购买数量和金额以数据的形式搜集起来,但这样要花费大量的时间、 人力和财力, 而且追求过分的精确往往带来更大的不精确; 所以, 在只要知道居民对某类商品的购买意向是“非常愿意” 、 “比较愿意” 、 “一般” 、 “不愿意” 等就能满足研究要求的情况下, 就没有必要追求过高的数据精确度。 这样, 模糊数学的语言系统就可以派上用场了。(3)价值观对认识的影响。 在不同的国家、民族,在不同的地域、 阶层, 甚至不同的个体, 由于历史、 文化、宗教、环境等因素不同,其价值判断标准就会有所不同, 对于同一问题的看法可能不完全一样。 而我们要从总体上把握事物的属性和本质,即最终达到对事物一般的、普遍的认识, 就只能舍弃一些特殊性, 牺牲一部分精确性, 用模糊语言来表达。如对生活状况的看法,不同地区、 不同职业、 不同性格的人会有不同的标准,这就需要我们通过特殊性去把握共同性,就必然要进行一定的抽象和概括。在这样情况下, 我们可以用含义比较模糊的语言 (诸如 “满意” 、 “不满意” 等) 来表达。2 问卷调查中模糊性问题的处理方法传统的问卷调查都是基于在二值逻辑思想上的,虽然增加了每一问题的选项,如将被择答案分为若干等级,但它的取值方法 (单点估计) 仍是基于二值逻辑的原理。对于确定性事件 (事前清晰事件) 和随机事件(事后清晰事件) 来说这固无不可, 但对于大量的模糊性事件来说,就不可避免地存在局限性: 第一, 对样本一刀切, 忽视了总体边界的模糊性。如被调查者是 32岁, 他 (她) 究竟应该归于 “青年” 还是 “中年” ?显然, 单纯地按非此即彼的逻辑, 归于哪一类都不十分合适。 如果这里引入模糊数学中 “隶属度” 的概念, 利用隶属函数计算出该被调查者分别对于 “青年” 和 “中年” 这两个模糊子集的隶属度 (介于 0- 1 之间的数值) , 问题就容易解决了。而我们目前对此问题的解决方法是硬性规定总体的边界(如以 30岁为界, 小于者为 “青年” , 大于者为 “中年” ) , 这实际上是一种简单化的做法。 第二,对总体内部缺乏进一步的分类, 尤其是模糊分类。第三,涉及到态度、 感情等主观认识方面的问题, 所给出的被择答案大多是封闭式的,对于开放式问卷缺乏有效的分析手段。第四, 尽管大部分被择答案都是使用日常用语, 即模糊语言, 而在分析时却忽视了日常用语的模糊属性。第五, 分析结果往往过于机械和绝对化, 缺乏似然推理。 有鉴于于此,本文认为应该将模糊数学思想引入问卷调查中, 以求解决此问题。 模糊数学思想可以在以下几个方面发挥作用:(1) 对研究假设中的概念、 判断和推理的解释,传统统计思想往往强调解释得越清楚越好,因为这样才能使研究的边界越清晰, 但模糊数学的思想与此不同。它认为, 由于某一些概念 (反映某一模糊集) 和理论框架 (或反映两个总体或论域之间的模糊关系,或反映某一模糊集中的元素对模糊集的隶属度)的内涵和外延存在着一定的不确定性,所以应该用模糊数学的方法对这些概念和理论进行模糊测度,寻找出概念之间的内在联系,界定其适用领域及有效程度,然后进行推理,以丰富研究假设, 使其更适合客观事物的丰富性和复杂性, 避免主观机械主义。(2) 对于随机抽样, 必先界定总体。传统统计思想界定总体的方法,往往是划定一个范围, 只要在此范围之内的总体单位皆属于此总体;这种方法存在两个缺点:一是没有对总体内的各个体单位根据其特征进行聚类分析并测定其隶属度,导致被抽出的样本缺乏真正的代表性;二是没有对类与类之间的关系进行模糊测量,忽视了类内与类间的差异。引进模糊数学的思想,可以先根据隶属函数及实际情况确定λ水平 (即对某一模糊子集隶属度的临界值) ,从而得到研究的总体; 然后对其进行模糊聚类, 根据研究所需要的精度,区分各类别或等级,并掌握类内的差距和类间的距离,从而把握总体的的实际分布情况, 提高样本的代表性。对事物的分类是模糊数学的关键, 只有合理分类, 才能准确测度隶属度、 隶属函数及模糊关系。(3) 用模糊数学方法筛选测量指标。测量指标是问卷的基本组成部分, 一份问卷质量的高低, 取决于指标设置的合理与否。 在传统统计思想下, 确定指标的方法大致可分为两种: 一是根据经验筛选, 二是利用统计方法(如系统聚类分析、 主成分分析等) 筛选。 经验筛选本身就含有模糊测量的意义, 不过比较粗糙, 没有经过模糊数学方法的量化处理, 所以在精确性、 稳定性和系统性上有所欠缺。统计方法虽然在一定程度上克服了上述缺点,但由于没有考虑到模糊关系的存在, 所以难免失之武断。 引入模糊数学方法以后, 就可以对每个指标或指标体系与研究对象的距离和贴近程度进行测量、比较, 从而筛选出性质比较优良的指标,并在此基础上对指标进行重要程度 (权数或权重) 的测度。(4) 在变量相关分析方面。在调查问卷回收以后,我们往往要对调查的结果进行相关分析,以探知变量之间所存在的相关关系。传统的做法是将所有变量之间的关系以相关矩阵的形式列出;至于这些关系是否存在,最多只能是从事物之间的定性认识上来进行判别。而将模糊数学引入对问卷的分析后, 我们就可以先对变量之间的关系进行模糊测量、 似然推理, 确定其间的关系网络及性质后, 再进行相关分析, 可以保证分析的有效性。(5) 结论和推理方面。如前所述,社会经济现象大多具有模糊性, 其发展规律大多具有或然性和似然性。传统分析方法大多采用必然性推理,给出一个指令性的方案, 难免会做出与事实明显相悖的结论。 利用模糊数学的方法,我们可以对复杂多变的现象作出模糊判断和似然推理,用模糊思维来表达社会经济现象的规律,人们从中得到的是启发式的结论, 从而可以运用于模糊控制机制和模糊决策机制。3 结束语由于模糊数学作为一门新兴学科,对许多问题的研究还不是十分成熟;其理论和方法在统计工作中得到广泛的应用还有待时日,广大统计工作者还要做大量的工作。但是, 将模糊数学的思想和方法引入统计实践是必然的趋势。—— —— —— —— —— —— —— —— —— —— —— —参考文献:①杨心恒、顾金土: 《模糊数学在社会研究中的应用》 [J]; 《社会学研究》 2000 (1)。②AKaufman: Theory of Fuzzy Sets[W]Masson Paris, ③欧阳泉: 《模糊数学综合评估法算法实现》 [J]; 《江汉大学学报》 2005 (4) 。