조절회귀분석을 하게 될 경우, 독립변수(X)와 조절변수(M) 의 상호작용항(Interaction) 을 만들어 분석을 하게 된다.

이때 X, M 과 Interactuion 간에는 선형관계가 존재하기 때문에 다중공선성이 발생된다. 회귀분석에서는 독립변수들 간에 다중공선성이 있을 경우 분석을 할 수 없기 때문에 조절회귀분석을 실시하는데, Interaction 을 직접 사용하는데에는 문제가 발생된다.

이렇게 Interaction 항을 만들면 다중공선성이 발생되어, 다중공선성을 피하기 위한 방법으로 Mean Centering(평균집중화) 을 사용하게 된다.

이에 Mean Centering 을 하는 쉬운 방법을 알아보도록 한다.

 

Mean Centering 의 방법은 변수에서 평균값을 빼주는 것이다. 즉, X 변수의 평균값을 구해서 X - 평균을 해주고, M 의 평균을 구해서  M - 평균을 구하는 것이다. 이렇게 각 변수에서 평균값을 뺀 것을 Mean Centering 이라고 하며, Interaction 항은 단순히 X*M 을 해주는 것이 아니라 Mean Centering 을 해준 변수들의 곱으로 구해야 한다.

 

다음의 예제를 살펴보면,

MC1.jpg

 

독립변수 X, 조절변수 M 과 Interaction 항인 X와 M 의 곱인  XM 이 있는 경우, 이들 변수로 회귀분석을 했을 때,

 MC2.jpg

위 결과처럼, X, M 만으로 회귀분석을 하게 되면 VIF  값이 4.790, 4.790 으로 둘다 10 보다 작게 나타나 다중공선성이 없는 것으로 나타났다. 하지만, Interaction 항이 추가된 경우 VIF 값이 31.687, 55.081, 143.617 로 모두 10 보다 크게 나타나 변수들 사이에 다중공선성이 존재하는 것으로 나타나, Interaction 항이 포함시켜 분석한 회귀분석 결과를 신뢰할 수 없다는 문제가 발생한다. 이때 필요한 것이 Mean Centering 이다.

 

MC6.jpg

X, M 의 기술통계분석을 실시하여 평균을 구하면 각각 2.6886 과  3.2791 이  나온다. 이 평균값을 각각의 변수에서 빼주는 것이 Mean Centering 이다.

 

변환 --> 변수계산   

MC7.jpg

메뉴에 들어가서 X - 2.6886 을 계산하여 MC.X 라는 변수에 저장을 한다.

또다시 변환 --> 변수계산 메뉴에 들어가서, M - 3.2791 을 계산하여 MC.M 이라는 변수에 저장한다.

마지막으로 MC.X 와 MC.M  의 곱을 구하여  MC.XM 이라는 변수에 저장한다.

 

이렇게 3번의 작업을 거치게 되면 독립변수, 조절변수, Interaction 항의 Mean Centering 이 마무리 된다.

MC4.jpg

 

이제 회귀분석은 X, M, XM 이 아닌, MC.X,  MC.M,  MC.XM 을 이용하여 분석을 한다.

MC5.jpg

 

분석 결과를 보면 X, M 으로 분석한 결과와 MC.X,  MC.M 으로 분석한 결과는 일치하는 것을 알 수 있다. 문제는 Interaction항인 MC.XM 이 추가된 경우 VIF 값이 모두 10 보다 작은 것을 알 수 있다.

 

이렇게 조절회귀분석에서는 Mean Centering 항을 만들어서 분석을 해주면 된다.

 

 

 

위와 같이 메뉴 방식을 이용해서 하게 되면 손이 많이 가게 된다. 이때, 명령어를 이용하여 쉽게 Mean Centering 을 할 수 있는 방법이 있다. 명령어 창을 열어서 다음과 같은 명령어를 작성하여 실행을 시키게 되면, Mean Centering 을 편하게 할 수 있다.

MC3.jpg

 

위 명령어에서 핵심적인 사항은 기술통계 분석을 하는 대신에 Aggregate 명령어를 이용하여 X, M  의 평균값을 X_mean, M_mean 이라는 변수에 저장을 할 수 있다는 것이다. 이렇게 Aggregate 명령어로 X, M 의 평균값인 2.6886 과 3.2791 대신에 X_mean, M_mean 이라는 변수로 만들어서 Mean Centering 을 한 후, 필요가 없어진 두 변수는 Delete Variabels 명령어를 이용하여 삭제한다.


*진*

2012.01.29 23:52:43
*.235.18.7

좋은 자료 감사합니다.^^

List of Articles
번호 제목 조회 수
공지 용어정리 게시판에 대하여 [1] 9614
» Mean Centering(평균중심화) 방법 - 조절회귀분석에서 file [1] 1838
35 [지수 기준] Cohen's kappa (평가자간 일치도) 4844
34 [지수 기준] 다중공선성 3979
33 [지수 기준] Cronbah's alpha 3549
32 [지수 기준] 결정계수(R^2) 사회과학 4362
31 T-test와 ANOVA(분산분석)의 차이 [8] 20072
30 회귀계수가 이상하게 나오는 경우 file [1] 11045
29 회귀분석 B 와 beta 14573
28 로지스틱 회귀분석의 해석 18297
27 효과크기(Effect Size : ES) file 15180
26 변량인자(Random Factor) [1] 9352
25 모수인자(Fixed Factor) 9954
24 T, F 값의 의미, P(유의확률) 값의 계산식 file [2] 31210
23 잡음인자(Nuisance factor) 9495
22 공변량(Covariate) 14728
21 잔차(residual)와 오차(error) [3] 13103
20 추정량(estimator) 8991
19 통계량(statistic) 9934
18 모수(Parameter) 12045

Copyright ⓒ 2000 ~ 2011 StatEdu(스탯에듀) / Tel 050-5450-1001 / Fax 050-5460-1001 / 국민 764501-01-282203 스탯에듀컨설팅 / e-mail stat@statedu.com