조절회귀분석을 하게 될 경우, 독립변수(X)와 조절변수(M) 의 상호작용항(Interaction) 을 만들어 분석을 하게 된다.
이때 X, M 과 Interactuion 간에는 선형관계가 존재하기 때문에 다중공선성이 발생된다. 회귀분석에서는 독립변수들 간에 다중공선성이 있을 경우 분석을 할 수 없기 때문에 조절회귀분석을 실시하는데, Interaction 을 직접 사용하는데에는 문제가 발생된다.
이렇게 Interaction 항을 만들면 다중공선성이 발생되어, 다중공선성을 피하기 위한 방법으로 Mean Centering(평균집중화) 을 사용하게 된다.
이에 Mean Centering 을 하는 쉬운 방법을 알아보도록 한다.
Mean Centering 의 방법은 변수에서 평균값을 빼주는 것이다. 즉, X 변수의 평균값을 구해서 X - 평균을 해주고, M 의 평균을 구해서 M - 평균을 구하는 것이다. 이렇게 각 변수에서 평균값을 뺀 것을 Mean Centering 이라고 하며, Interaction 항은 단순히 X*M 을 해주는 것이 아니라 Mean Centering 을 해준 변수들의 곱으로 구해야 한다.
다음의 예제를 살펴보면,
독립변수 X, 조절변수 M 과 Interaction 항인 X와 M 의 곱인 XM 이 있는 경우, 이들 변수로 회귀분석을 했을 때,
위 결과처럼, X, M 만으로 회귀분석을 하게 되면 VIF 값이 4.790, 4.790 으로 둘다 10 보다 작게 나타나 다중공선성이 없는 것으로 나타났다. 하지만, Interaction 항이 추가된 경우 VIF 값이 31.687, 55.081, 143.617 로 모두 10 보다 크게 나타나 변수들 사이에 다중공선성이 존재하는 것으로 나타나, Interaction 항이 포함시켜 분석한 회귀분석 결과를 신뢰할 수 없다는 문제가 발생한다. 이때 필요한 것이 Mean Centering 이다.
X, M 의 기술통계분석을 실시하여 평균을 구하면 각각 2.6886 과 3.2791 이 나온다. 이 평균값을 각각의 변수에서 빼주는 것이 Mean Centering 이다.
변환 --> 변수계산
메뉴에 들어가서 X - 2.6886 을 계산하여 MC.X 라는 변수에 저장을 한다.
또다시 변환 --> 변수계산 메뉴에 들어가서, M - 3.2791 을 계산하여 MC.M 이라는 변수에 저장한다.
마지막으로 MC.X 와 MC.M 의 곱을 구하여 MC.XM 이라는 변수에 저장한다.
이렇게 3번의 작업을 거치게 되면 독립변수, 조절변수, Interaction 항의 Mean Centering 이 마무리 된다.

이제 회귀분석은 X, M, XM 이 아닌, MC.X, MC.M, MC.XM 을 이용하여 분석을 한다.

분석 결과를 보면 X, M 으로 분석한 결과와 MC.X, MC.M 으로 분석한 결과는 일치하는 것을 알 수 있다. 문제는 Interaction항인 MC.XM 이 추가된 경우 VIF 값이 모두 10 보다 작은 것을 알 수 있다.
이렇게 조절회귀분석에서는 Mean Centering 항을 만들어서 분석을 해주면 된다.
위와 같이 메뉴 방식을 이용해서 하게 되면 손이 많이 가게 된다. 이때, 명령어를 이용하여 쉽게 Mean Centering 을 할 수 있는 방법이 있다. 명령어 창을 열어서 다음과 같은 명령어를 작성하여 실행을 시키게 되면, Mean Centering 을 편하게 할 수 있다.
위 명령어에서 핵심적인 사항은 기술통계 분석을 하는 대신에 Aggregate 명령어를 이용하여 X, M 의 평균값을 X_mean, M_mean 이라는 변수에 저장을 할 수 있다는 것이다. 이렇게 Aggregate 명령어로 X, M 의 평균값인 2.6886 과 3.2791 대신에 X_mean, M_mean 이라는 변수로 만들어서 Mean Centering 을 한 후, 필요가 없어진 두 변수는 Delete Variabels 명령어를 이용하여 삭제한다.







좋은 자료 감사합니다.^^