조절변인
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
조절변인은 독립 변수와 종속 변수 간의 관계가 제3의 변수인 조절 변수에 의해 어떻게 달라지는지 분석하는 통계적 방법이다. 조절 분석은 선형 회귀 또는 인과 모형을 사용하며, 다중 회귀 분석에서 조절 변인의 효과를 정량화하기 위해 독립 변수와 조절 변수 간의 상호 작용 항을 모델에 추가한다. 조절 변수는 독립 변수와 종속 변수 간의 관계의 강도나 방향을 변화시키는 변수로, 성별, 연령, 교육 수준 등이 예시로 제시된다. 조절 효과는 강화, 약화, 반전 효과의 세 가지 유형으로 나타날 수 있으며, 조절 회귀 분석, 상호작용 효과의 사후 검증, 더미 코딩, 효과 코딩, 대비 코딩과 같은 다양한 분석 방법이 사용된다. 또한, 고차 상호작용 분석을 통해 세 개 이상의 변수 간의 상호작용을 탐구할 수 있으며, 분석 시 다중공선성, 변수의 신뢰도, 공변량과 같은 요소를 고려해야 한다.
더 읽어볼만한 페이지
- 회귀분석 - 회귀 분석
회귀 분석은 종속 변수와 하나 이상의 독립 변수 간의 관계를 모델링하고 분석하는 통계적 기법으로, 최소 제곱법 개발 이후 골턴의 연구로 '회귀' 용어가 도입되어 다양한 분야에서 예측 및 인과 관계 분석에 활용된다. - 회귀분석 - 로지스틱 회귀
로지스틱 회귀는 범주형 종속 변수를 다루는 회귀 분석 기법으로, 특히 이항 종속 변수에 널리 사용되며, 오즈에 로짓 변환을 적용하여 결과값이 0과 1 사이의 값을 가지도록 하는 일반화 선형 모형의 특수한 경우이다. - 심리측정학 - 재현성
재현성은 과학적 연구의 신뢰성을 평가하는 요소로, 동일한 조건에서 유사한 결과를 얻을 수 있는 정도를 의미하며, 실험 방법과 데이터의 투명한 공개를 통해 확보해야 한다. - 심리측정학 - 조작주의
조작주의는 과학적 개념을 측정 과정을 통해 정의하는 과학적 실천 방법으로, 물리학에서 시작되어 다양한 분야에서 활용되지만, 경제학에서는 주관적인 개념을 정당화하는 데 사용된다는 비판과 함께 복잡한 사회 현상에 대한 신중한 검토가 필요하다.
조절변인 | |
---|---|
개요 | |
학문 분야 | 통계학 |
하위 분야 | 회귀 분석, 분산 분석 |
관련 항목 | 교호작용, 매개변인 |
정의 | |
설명 | 조절변수는 독립변수와 종속변수 간의 관계의 크기나 방향에 영향을 미치는 변수이다. |
역할 | 독립변수와 종속변수 사이의 관계를 강화하거나 약화시키거나, 그 관계의 형태를 바꿀 수 있다. |
예시 | 약물과 질병 사이의 관계에서 연령; 교육 수준과 소득 사이의 관계에서 성별 |
통계적 의미 | |
상호작용 효과 | 조절 효과는 통계적으로 상호작용 효과로 나타난다. 즉, 독립변수와 조절변수 간의 곱셈 항이 종속변수에 유의미한 영향을 미친다. |
회귀 모형 | 조절 효과를 검증하기 위해 회귀 모형에 상호작용 항을 포함시킨다. |
수식 | 종속변수 = 상수 + 독립변수 + 조절변수 + (독립변수 * 조절변수) + 오차항 |
분석 방법 | |
회귀 분석 | 조절 회귀 분석을 통해 조절 효과를 검증한다. |
분산 분석 | 집단 간 차이를 분석하여 조절 효과를 확인한다. |
시각화 | 상호작용 효과를 시각적으로 표현하기 위해 그래프를 사용한다. |
고려 사항 | |
인과 관계 | 조절변수는 인과 관계를 설명하는 것이 아니라, 관계의 변화를 설명한다. |
측정 오차 | 조절변수의 측정 오차는 분석 결과에 영향을 미칠 수 있다. |
다중 공선성 | 상호작용 항은 다중 공선성 문제를 일으킬 수 있으므로 주의해야 한다. |
2. 조절 분석의 정의 및 기본 원리
조절 분석은 독립 변수(X, 또는 초점 선행 변인)가 종속 변수(Y, 또는 결과)에 미치는 영향이 제3의 변수인 조절 변수(W 또는 x2)에 따라 어떻게 달라지는지를 분석하는 통계적 방법이다. 즉, 독립 변수와 종속 변수 사이 관계의 강도나 방향이 조절 변수의 수준에 따라 달라지는지를 확인한다.
주로 행동 과학 분야에서 선형 회귀 분석이나 인과 모형을 사용하여 조절 효과를 분석한다.[1] 다중 회귀 분석에서는 조절 변수의 효과를 수치로 나타내기 위해, 확률 변수 ''Y''를 ''X''에 대해 회귀 분석할 때 모델에 추가적인 항을 포함시킨다. 이 항은 독립 변수 ''x''1과 조절 변수 ''x''2 간의 상호 작용을 나타낸다.[1]
반응 변수 ''Y''와 두 예측 변수 ''x''1(독립 변수) 및 ''x''2(조절 변수) 사이의 관계는 다음과 같은 회귀식으로 표현될 수 있다.
:
- ''b''0: 절편 (독립 변수와 조절 변수가 모두 0일 때의 Y 예측값)
- ''b''1: ''x''1의 주효과 (''x''2가 0일 때 ''x''1 한 단위 변화에 따른 Y의 변화량)
- ''b''2: ''x''2의 주효과 (''x''1이 0일 때 ''x''2 한 단위 변화에 따른 Y의 변화량)
- ''b''3: ''x''1과 ''x''2의 상호 작용 효과 (''x''2의 변화에 따라 ''x''1이 Y에 미치는 영향이 어떻게 달라지는지 나타냄)
- ''ε'': 오차항 (모델로 설명되지 않는 부분)
이 식에서 조절 변수 ''x''2의 역할은 상호 작용 항(''x''1 × ''x''2)의 회귀 계수 추정치인 ''b''3를 평가하여 확인한다.[1] 만약 ''b''3가 통계적으로 유의미하다면, ''x''1이 ''Y''에 미치는 영향이 ''x''2의 수준에 따라 달라진다고 해석할 수 있으며, 이는 조절 효과가 존재함을 의미한다. 회귀 분석에서 계수 추정치의 통계적 유의성 검증에 대한 자세한 내용은 선형 회귀 문서에서 확인할 수 있다.
3. 조절 회귀 분석
행동 과학 등 여러 분야에서 조절 효과를 분석할 때는 주로 선형 회귀 분석이나 인과 모형을 사용한다.[1] 다중 회귀 분석에서는 독립 변수와 조절 변수 간의 상호작용 항을 모델에 포함시켜, 이 상호작용 항이 통계적으로 유의미한지를 검토함으로써 조절 효과를 평가한다.[1] 상호작용 항의 계수 추정치에 대한 통계적 평가는 선형 회귀 분석의 일반적인 방법을 따른다.
3. 1. 회귀식
행동 과학 등에서 조절 효과를 분석할 때는 주로 선형 회귀나 인과 모형을 사용한다.[1] 다중 회귀 분석에서 조절 변인의 효과를 정량화하기 위해서는, 확률 변수 ''Y''를 독립 변수 ''X''에 대해 회귀 분석할 때 모델에 상호작용 항을 추가한다. 이 항은 독립 변수 ''X''와 제안된 조절 변수 간의 상호작용을 나타낸다.[1]
따라서 반응 변수 ''Y''와 독립 변수 ''x''1 및 조절 변수 ''x''2의 관계는 다음과 같은 회귀식으로 표현될 수 있다.
:
이 식에서 ''x''2가 조절 변수로서 역할을 하는지는 상호작용 항(''x''1 × ''x''2)의 계수 ''b''3를 평가하여 판단한다.[1] ''b''3가 통계적으로 유의미하다면, ''x''1이 ''Y''에 미치는 영향이 ''x''2의 수준에 따라 달라진다고 해석할 수 있다. 회귀 분석에서 계수 추정치의 통계적 유의성을 평가하는 방법에 대한 자세한 내용은 선형 회귀 문서에서 확인할 수 있다.
3. 2. 다중공선성 문제
조절된 회귀 분석에서는 독립 변수와 조절 변수의 곱으로 계산되는 새로운 상호작용 항()이 사용된다. 그런데 이 상호작용 항은 계산의 기반이 된 원래의 두 변수(주효과 항)와 상관관계를 가지는 경우가 많다. 이러한 상관관계는 조절된 회귀 분석에서 다중공선성 문제를 일으킬 수 있다. 다중공선성이 발생하면 회귀 계수의 표준 오차가 커져서 추정 결과의 불확실성이 높아지는 경향이 있다.다중공선성 문제를 완화하는 한 가지 방법은 평균 중심화(mean centering)이다. 평균 중심화는 각 변수의 값에서 해당 변수의 평균값을 빼는 방법이다. 이렇게 하면 변수 간의 다중공선성을 줄여 회귀 계수를 더 쉽게 해석할 수 있게 된다.[4][5] 하지만 평균 중심화는 다중공선성을 낮출 뿐, 회귀 모델 전체의 설명력이나 예측 정확도(모델 적합성)에는 영향을 미치지 않는다.
4. 상호작용 효과의 사후 검증
ANOVA의 단순 주효과 분석과 유사하게, 회귀 분석에서 상호작용 효과가 통계적으로 유의미하게 나타났을 때, 이를 더 깊이 이해하기 위해 사후 검증(post hoc test)을 실시할 수 있다. 사후 검증에서는 특정 독립 변수의 값이 고정되었을 때 다른 독립 변수가 종속 변수에 미치는 영향, 즉 단순 기울기(simple slope)를 조사한다.[6]
예를 들어, 두 독립 변수 A와 B, 그리고 이 둘의 상호작용 항(A*B)이 종속 변수 Y에 미치는 영향을 분석하는 회귀 방정식은 다음과 같이 표현될 수 있다.[6]
:
여기서 가 통계적으로 유의미하다면 상호작용 효과가 존재한다고 해석하며, 사후 검증을 통해 변수 B의 특정 수준(예: 평균, 평균±1 표준편차 등)에서 변수 A가 Y에 미치는 영향(단순 기울기)이 어떻게 달라지는지 등을 구체적으로 살펴볼 수 있다. 독립 변수가 범주형인지 연속형인지에 따라 구체적인 사후 검증 방법은 달라질 수 있다.
4. 1. 독립 변수가 범주형 변수인 경우


독립 변수 중 하나 또는 둘 모두가 범주형 변수일 경우, 회귀 분석을 통해 조절 효과를 분석할 수 있다.
예를 들어, 두 독립 변수가 모두 범주형 변수(예: 민족, 실험 조건)라고 가정해 보자. 이 경우, 특정 민족 집단(예: 유럽계 미국인)과 다른 민족 집단(동아시아인)에서 실험 조건의 효과가 다른지, 또는 반대로 특정 실험 조건(예: 대조군)과 다른 조건(실험군)에서 민족의 효과가 다른지를 분석하여 상호작용 효과를 확인할 수 있다. 각 변수의 회귀 계수는 특정 조건 하에서의 효과 크기를 나타낸다. 변수를 역코딩하여 분석하면 다른 조건에서의 효과도 확인할 수 있다.
만약 하나의 독립 변수가 범주형 변수(예: 성별)이고 다른 하나가 연속형 변수(예: 삶의 만족도 척도 점수)인 경우에도 조절 효과 분석이 가능하다. 이때 연속형 변수의 점수 범위에 따라 평균을 0으로 맞추는 중심화 과정이 필요할 수 있다. 예를 들어 삶의 만족도 점수가 0점부터 시작하지 않는다면, 평균 점수를 빼서 중심화한 후 분석해야 해석이 용이하다. 중심화 후 분석하면, 특정 범주(예: 남성과 여성) 간의 차이가 연속형 변수의 평균 수준에서 어떠한지를 알 수 있다. 코헨 등(2003)은 연속형 변수의 특정 수준(예: 평균, 평균±1 표준편차)에서 범주형 변수의 단순 효과를 살펴보는 방법을 제안했다.[7] 특정 집단(예: 여성)에 대한 연속형 변수의 효과는 회귀 계수를 통해 알 수 있으며, 범주형 변수를 역코딩하면 다른 집단(예: 남성)에 대한 효과도 파악할 수 있다.
이처럼 조절 회귀 분석에서 민족 집단이나 실험 조건과 같은 범주형 변수를 독립 변수로 다룰 때는, 해당 변수의 각 수준을 나타내는 방식으로 데이터를 변환하는 코딩 작업이 필요하다. 주로 사용되는 코딩 방법으로는 더미 코딩, 효과 코딩, 대비 코딩 등이 있다.[8][9] 각 코딩 방법에 대한 자세한 내용은 하위 섹션에서 설명한다.
4. 1. 1. 더미 코딩 (Dummy Coding)

조절 회귀 분석에서 민족 집단이나 실험 조건과 같은 범주형 변수를 독립 변수로 사용할 때는, 각 코드 변수가 범주형 변수의 특정 상태를 나타내도록 변수를 코딩해야 한다. 여기에는 더미 코딩(Dummy Coding), 효과 코딩(Effects Coding), 대비 코딩(Contrast Coding)의 세 가지 주요 방법이 있다.[8][9]
더미 코딩은 특정 기준 집단(예: 실험 연구의 통제 집단)을 다른 각 실험 집단과 비교하고자 할 때 주로 사용된다. 이 코딩 방식을 사용하면, 회귀 분석 모델의 절편(intercept)은 기준 집단의 평균값을 나타낸다. 또한, 각 비표준화 회귀 계수는 해당 집단의 평균과 기준 집단의 평균 간의 종속 변수 값 차이를 의미한다.
이러한 특징 때문에 더미 코딩은 분산 분석(ANOVA)과 유사한 접근 방식을 가지며, 연구자가 명확한 기준 집단을 설정하고 다른 모든 집단을 이 기준과 비교하려는 연구 설계에 적합하다.[8][9]
4. 1. 2. 효과 코딩 (Effect Coding)
효과 코딩은 특정 비교 집단이나 통제 집단이 없고, 계획된 직교 대비(orthogonal contrast)도 없을 때 사용된다. 이 방식에서 절편(intercept)은 전체 평균(모든 조건의 평균)을 의미하며, 회귀 계수는 특정 집단의 평균과 전체 집단 평균의 평균값 사이의 차이(예: A 집단의 평균 - 모든 집단의 평균)를 나타낸다. 효과 코딩은 분석 대상 집단들이 자연스러운 범주를 나타낼 때 적합하다.[8][9]4. 1. 3. 대비 코딩 (Contrast Coding)

대비 코딩(Contrast Coding)은 연구자가 미리 설정한 특정 가설, 즉 집단 간의 비교나 직교 대비(orthogonal contrasts)를 검증하고자 할 때 사용하는 코딩 방식이다.[8][9] 이 방법을 사용하면, 회귀 분석 결과에서 절편(intercept)은 각 집단 평균값들의 가중되지 않은 평균을 의미한다. 또한, 비표준화 회귀 계수(unstandardized regression coefficient)는 대비에서 설정된 두 집단(예: A 집단과 B 집단)의 가중되지 않은 평균 간 차이를 나타낸다. 따라서 대비 코딩은 집단 평균 간의 구체적인 차이에 대한 사전 가설을 가지고 있을 때 유용하게 활용될 수 있다.
4. 2. 독립 변수가 연속형 변수인 경우


두 독립 변수 모두 연속형인 경우, 독립 변수 ''X''와 ''Z''를 중심화(centering)하거나 표준화(standardizing)하는 것이 해석에 도움이 된다. 중심화는 각 변수의 원래 값에서 전체 표본의 평균값을 빼는 것이고, 표준화는 중심화를 한 뒤 표본의 표준 편차로 나누는 것을 의미한다. 독립 변수를 중심화하거나 표준화하면, 특정 독립 변수의 계수(회귀식에서의 기울기 값)는 다른 독립 변수가 평균 수준일 때 해당 변수가 종속 변수 ''Y''에 미치는 영향을 나타내는 것으로 해석될 수 있다.[10]
상호작용 효과를 탐구하기 위해서는 조절 변수 ''Z''의 값이 낮을 때와 높을 때 각각 독립 변수 ''X''가 종속 변수 ''Y''에 미치는 영향을 도표로 그려보는 것이 유용하다. 보통 평균을 기준으로 1 표준 편차만큼 낮거나 높은 ''Z'' 값을 사용하지만, 연구의 맥락에 따라 의미 있는 다른 값을 사용할 수도 있다. 이 도표는 일반적으로 ''X''와 ''Z''의 특정 값 조합(예: 낮은 X와 낮은 Z, 높은 X와 낮은 Z, 낮은 X와 높은 Z, 높은 X와 높은 Z)에 해당하는 ''Y'' 값을 계산하고, ''Z''의 각 수준(낮음, 높음)별로 ''X''와 ''Y''의 관계를 보여주는 두 개의 선으로 그려진다.
때로는 도표 작성과 더불어 단순 기울기 분석(simple slope analysis)을 수행하기도 한다. 이는 특정 조절 변수(''Z'') 값에서 독립 변수(''X'')가 종속 변수(''Y'')에 미치는 영향(기울기)이 통계적으로 유의미한지를 검정하는 방법이다. 단순 기울기 분석을 위한 대표적인 기법 중 하나로 Johnson-Neyman 접근 방식이 있다.[11] 이러한 상호작용 효과를 시각화하고 해석하는 데 도움을 주는 다양한 인터넷 기반 도구들도 활용할 수 있다.[12]
5. 고차 상호작용
두 변수 간의 상호작용 원리는 세 가지 또는 그 이상의 변수 간의 상호작용을 분석하고자 할 때에도 적용될 수 있다.
5. 1. 고차 상호작용의 회귀식
두 변수 간의 상호작용 원리는 세 가지 또는 그 이상의 변수 간의 상호작용을 탐구할 때 적용된다. 예를 들어, ''A'', ''B'', ''C'' 세 변수 간의 상호작용이 있는 경우, 회귀 방정식은 다음과 같다.:
5. 2. 주의사항
상호작용 항과 같은 상위 차수 항의 신뢰도는 개별 변수와 같은 하위 차수 항의 신뢰도에 영향을 받는다는 점을 알아야 한다. 예를 들어 변수 ''A''의 신뢰도가 0.70이고, 변수 ''B''의 신뢰도가 0.80이며, 두 변수 간의 상관관계가 ''r'' = 0.2라고 가정해 보자. 이 경우 상호작용 변수 ''A'' * ''B''의 신뢰도는 로 계산된다.[13] 상호작용 항의 신뢰도가 이렇게 낮으면 분석의 검정력을 낮추게 만들며, 따라서 실제로 상호작용 효과가 존재하더라도 이를 통계적으로 발견하지 못할 수 있다. 이 문제를 해결하기 위해서는 각 독립 변수에 대해 신뢰도가 높은 측정 방법을 사용하는 것이 좋다.또 주의할 점은, 두 변수 ''A''와 ''B'' 사이의 상관관계가 매우 높을 경우, 상호작용 항(''A'' * ''B'')이 실제로는 측정되지 않은 변수 ''A''의 제곱(''A''2) 효과와 비슷하게 나타날 수 있다는 점이다. 이는 누락 변수 편향의 한 예시가 될 수 있다. 결과적으로 통계적으로 유의미하게 나타난 조절 효과가 실제로는 변수 ''A'' 자체의 비선형적인 효과(예: 제곱 효과)일 가능성이 있다. 이런 경우에는 기존의 조절 회귀 분석 모델에 각 변수의 비선형 항(예: ''A''2, ''B''2)을 추가하여 비선형 효과를 고려한 모델을 함께 검토해야 한다. 이를 통해 상호작용 항(''A''*''B'')이 여전히 통계적으로 유의미한지 확인하는 것이 중요하다. 만약 비선형 항을 추가한 후에도 상호작용 효과 ''A''*''B''가 여전히 유의미하다면, 실제로 조절 효과가 존재한다고 더 강하게 주장할 수 있다. 하지만 비선형 항을 추가했을 때 상호작용 효과가 더 이상 유의미하지 않게 된다면, 원래 발견된 효과가 실제 조절 효과가 아닐 가능성이 높아진다. 이 경우, 상호작용 항 없이 비선형 효과만 고려한 더 간결한 모델이 선호될 수 있다.
조절 회귀 분석에서는 주된 관심 변수 외에 결과에 영향을 미칠 수 있는 다른 변수들, 즉 공변량(covariate)을 통제 변수로 포함시키는 경우가 많다. 하지만 공변량을 분석에 포함할 때 주의해야 할 점이 있다. 만약 공변량(''C'')이 분석의 주요 변수(''A'' 또는 ''B'')와 상관관계를 가지거나, 공변량 자체가 주요 변수와 종속 변수(''Y'') 사이의 관계에 영향을 미치는 또 다른 조절 변수 역할을 한다면, 분석 결과가 왜곡되어 실제로는 존재하지 않는 효과가 있는 것처럼 나타나는 허위 효과(spurious effect)가 발생할 수 있다.[14][15][16] 이러한 문제를 피하기 위한 한 가지 방법은, 모델에 공변량과 주요 변수들 간의 상호작용 항(''A''*''C'', ''B''*''C'')을 추가로 포함하여 분석하는 것이다. 예를 들어 다음과 같은 모델을 고려할 수 있다.
:
참조
[1]
서적
Applied multiple regression/correlation analysis for the behavioral sciences
L. Erlbaum Associates
[2]
간행물
Development of the Instrument to assess the Credibility of Effect Modification Analyses (ICEMAN) in randomized controlled trials and meta-analyses
2020-08-10
[3]
문서
"The moderator-mediator variable distinction in social psychological research: Conceptual, strategic, and statistical considerations"
1986
[4]
간행물
Mean centering helps alleviate "micro" but not "macro" multicollinearity
2016
[5]
간행물
Centering in Multiple Regression Does Not Always Reduce Multicollinearity: How to Tell When Your Estimates Will Not Benefit From Centering
2019
[6]
웹사이트
Testing and Interpreting Interactions in Regression-In a Nutshell
http://www.psy.mq.ed[...]
[7]
서적
Applied multiple regression/correlation analysis for the behavioral sciences
Erlbaum
[8]
서적
Multiple regression testing and interpretation.
Sage Publications, Inc.
[9]
서적
Applied multiple regression/correlation analysis for the behavioral sciences
Erlbaum
[10]
문서
Moderation in management research: What, why, when and how
2013
[11]
간행물
The Johnson-Neyman technique, its theory and application
https://doi.org/10.1[...]
1950-12-01
[12]
웹사이트
Interpreting interaction effects
http://www.jeremydaw[...]
[13]
간행물
Analysis of multiplicative combination rules when the causal variables are measured with error.
http://doi.apa.org/g[...]
1983
[14]
간행물
Gene × Environment Interaction Studies Have Not Properly Controlled for Potential Confounders: The Problem and the (Simple) Solution
2014
[15]
간행물
Adjusting researchers' approach to adjustment: On the use of covariates when testing interactions
https://linkinghub.e[...]
2004
[16]
간행물
Moderator Variables in Personality Research: The Problem of Controlling for Plausible Alternatives
http://journals.sage[...]
1992
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com