再讨论中心化处理之前先说一下“多重共线性”。多重共线性是指在回归模型中,变量之间存在高度相关的问题。多重共线性会导致显著的回归系数变得不显著;因为该变量与其他预测变量高度相关,当控制其他变量恒定的时候,该变量也很大程度上是不变的,对因变量方差的解释率很低,所以就不显著了。
有学者担心,在调节模型中,X和M可能会和XM高度相关,导致多重共线性,从而使得对回归系数的估计不准确,有较大的标准误,降低对交互作用的统计检验力
“X and M are likely to be highly correlated with XM and this will produce
estimation problems caused by multicollinearity and result in poor or “strange”
estimates of regression coefficients, large standard errors, and reduced power
of the statistical test of the interaction.”
所以他们建议对X和M都进行中心化(mean centering),即减去对应的平均数,然后对它们进行回归:
或者:
为了检验中心化处理是否真的能够增加对回归系数估计的准确性,以及对交互作用的检验力,本文使用了同一批数据,分别进行了非中心化的回归以及中心化处理后的回归分析
模型1是非中心化回归的结果,模型2是中心化处理后回归的结果;我们可以看到不管是回归系数、它的标准误还是t值或者p值,只有交互项是没有发生改变的。
所以,是否进行中心化处理对交互项的系数的预测结果并没有影响。
那中心化处理是否会影响预测变量之间的多重共线性,以及交互项系数的标准误(即其置信区间的宽度,或者估计的准确性)呢?
在多元回归分析中,预测变量j的系数的标准误可以通过以下公式计算:
其中,是用其他变量来预测变量j时的多元相关系数的平方(就是把变量j当作因变量,其他变量作为自变量,算出来的R square);是预测变量的方差;n是样本量;
是预测Y的回归模型的误差(就是前面式子里的)的均方;
代表了变量j的方差能够被其他预测变量所解释的比率;则是不能解释的比率,被称为预测变量j的容忍度(tolerance);它的倒数被称为
方差膨胀因子(variance inflation factor,VIF);所以上面求系数的标准误的公式可以改写成:
从公式可以看出,VIF可以表示预测变量j的系数的标准误多大程度上受到它与其他预测变量的相关的影响。它们的相关越大,容忍度越低,方差膨胀因子就越大,从而导致系数的标准误越大。
回到数据上来,
我们发现,没有中心化处理之前,X和XM的相关系数很大(.766),从而XM的容忍度很小(0.061),方差膨胀因子很大(16.357);但中心化处理之后,X和XM的相关系数变小了(.092),XM的容忍度也增大了(0.991),方差膨胀因子也减小了(1.009);
所以,中心化处理确实可以减少预测变量之间的相关,减少多重共线性的影响
但是,是不是会影响交互项的系数的标准误,从而影响对交互项的效应的检验呢?
回到之前的公式,
我们发现影响系数标准误的处理方差膨胀因子之外,还有预测变量j的方差()
,预测变量的方差越小,系数的标准误越大;返回到数据结果的表格,我们可以看到,中心化处理之后,交互项的方差也减小了,从而会增加交互项的系数的标准误;之前我们看到中心化处理之后,作为分子的方差膨胀因子减小了,从而减小了标准误,现在我们又发现,中心化处理后,作为分母的方差同时也减小了,从而将增大标准误,那最终标准误是变大了还是变小了呢?
从上面数据的表格我们可以看到,膨胀因子减小的倍数和方差减小的倍数是一样的(16.357 / 1.009 = 16.21; 9489.221 /
585.166 = 16.221);
所以最后一综合,预测变量XM的系数的标准误并没有改变;因此我们不能说,中心化处理能够减小交互项系数的标准误,或者中心化处理能够增加对交互项的效应的检验力。
虽然,中心化处理并不像某些学者吹的那样神,但当你的回归模型由于多重共线性,预测变量之间存在高度相关,而不能在SPSS上进行分析的时候(因为SPSS默认的容忍度的最小值是0.000001),你可以通过中心化处理降低变量之间的相关,但这种情况太少见了(我认为,容忍度那么小,那这个预测变量与其他变量之间的相关肯定非常大,这种情况应该考虑实验设计是否有问题,而不是通过统计方法来降低多重共线性)。
但是,我们现在还只是说明了中心化处理对交互项系数的预测没有任何影响,但我们之前的数据结果表明,X和M的回归系数是发生了改变的,那是不是中心化处理会对主效应的检验产生影响呢?之后有空再写,嘿嘿~
参考文献:
Hayes, A. F. (2013). Truths and Myths about Mean Centering. Introduction to
mediation, moderation, and conditional process analysis: a regression-based
approach (pp. 282-288). New York: The Guiford Press.