模型中变量可以是不可测的如下:
控制变量用来在多元回归分析中缓解混杂变量对因果效应估计的干扰。但其本身通常不具有结构性解释。即使是有效的控制变量,也常常会与其他未观察到 (或不能观测到) 的因素(unobserved factors)关联,从因果推断的角度来看,这使得它们的边际效应无法解释 (Westreich 和 Greenland,2013; Keele等,2020)。
对有偏差 (biased) 的控制变量系数的边际效应解释是存在问题的,研究人员可能会发现错误的结论,除非可以确定在回归分析中考虑了结果变量的所有相关影响因素 (all-causes regression),否则不建议在实证研究中讨论控制变量的系数。
同时,我们也建议仅将控制变量视为识别因果关系的干扰项,并不要在报告结果中展示 (Liang 和 Zeger,1995)。因此,研究人员应考虑在解释其分析结果时完全忽略它们。简而言之,我们不需要过多的担心「控制变量的系数变化并没有预期的迹象」。因为在实际操作中控制变量的估计总是可能会产生偏差。相反,研究人员应该更加专注于解释主要变量的边际效应。
相比之下,控制变量几乎没有实质性意义,我们可以放心地省略或只在附录中讨论。这样不仅会有效阻止研究人员从控制变量中得出错误的因果结论,而且还简化实证研究论文的讨论部分,并节省宝贵的资源用来讨论主要变量的经济效果。