一、多层数据结构的普遍性多水平、多层次的数据结构普遍存在,如学生嵌套于班级,班级有嵌套与学校。传统的线性模型,如方差分析和回归分析,只能涉及一层数据的问题进行分析,不能综合多层数据问题。在实际研究中,更令人感兴趣的是学生一层的变量与班级一层的变量之间的交互作用,比如,学生之间的个体差异在不同班级之间可能是相同的、也可能是不同的。学生数据层中,不同变量之间的关系可能因班级的不同而不同。因此,学生层的差异可以解释为班级层的变量。另一种类型的两层嵌套数据来自纵向研究数据,不同时间观测数据形成了数据结构的第一层,而被试之间的个体差异形成了第二层。可以探索个体在发展趋势上的差异。二、传统技术处理多层数据结构的局限如果把变量分解到个体水平,在个体水平上分析。但是我们知道这些学生是来自同一班级的,不符合观察独立原则。导致个体间随机误差相互独立的假设不能满足。如果把个体变量集中到较高水平,在较高水平上进行分析。这样丢弃了组内信息,而组内变异可能占了大部分。三、原理☆水平1(学生)的模型与传统的回归模型类似,所不同的是回归方程的截距和斜率不再是一个常数,而是水平2变量水平不同(不同的班级),其回归方程的截距和斜率也不同的,是一个随机变量。如,每个班级的回归方程的截距和斜率都直接依赖于班级教师教学方法。☆多层线性模型分为“随机截距模型”和“随机截距和随机斜率模型”。“随机截距模型”假定因变量的截距随着群体的不同而不同,但各群体的回归斜率是固定,因此不同层次因素之间缺乏互动。“随机截距和随机斜率模型”假定截距和回归斜率都因群体而异,允许不同层次因素之间的互动。参数估计方法有:迭代广义最小二乘法、限制性的广义最小二乘估计、马尔科夫链蒙特卡罗法。这些方法代替了传统的最小二乘法估计,更为稳定和精确。比如,当第二层的某单位只有少量的被试,或不同组样本量不同时,多层线性模型进行了加权估计、迭代计算。