구조방정식 모델링
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
구조 방정식 모델링(SEM)은 관찰된 변수 간의 관계를 인과적으로 해석하여 분석하는 통계 기법이다. 세월 라이트의 경로 분석 연구에서 시작되었으며, 칼 조레스코그의 LISREL 개발을 통해 발전했다. SEM은 경로 분석, 확인적 요인 분석 등 다양한 분석에 활용되며, 교육학, 심리학, 사회학 등 사회과학 분야에서 널리 사용된다. 분석에는 AMOS, LISREL, Mplus, R, Python 등의 소프트웨어가 사용된다. 모델 구축 및 평가는 모델 사양, 자유 모델 계수 추정, 모델 평가 단계를 거쳐 이루어지며, 모델의 적합도, 카이제곱 검정, RMSEA, SRMR, CFI 등의 적합 지표를 활용하여 평가한다. SEM은 모델 테스트, 적합 지표 사용, 내생성 문제 해결, 경쟁 모델 비교 등과 관련된 다양한 논쟁과 함께 발전해 왔으며, 범주형 변수, 잠재 성장 모델링, 다층 모델 등 다양한 확장 모델을 포함한다.
더 읽어볼만한 페이지
- 회귀 모형 - 로지스틱 회귀
로지스틱 회귀는 범주형 종속 변수를 다루는 회귀 분석 기법으로, 특히 이항 종속 변수에 널리 사용되며, 오즈에 로짓 변환을 적용하여 결과값이 0과 1 사이의 값을 가지도록 하는 일반화 선형 모형의 특수한 경우이다. - 회귀 모형 - 다층 모형
다층 모형은 계층 구조 데이터 분석에 사용되는 통계 방법으로, 변수의 측정 수준을 명확히 하고 고정 효과와 변량 효과를 동시에 고려하며, 무작위 절편 모형, 무작위 기울기 모형 등 다양한 종류가 있다. - 그래프 모형 - 베이즈 네트워크
베이즈 네트워크는 확률 변수 간의 관계를 방향성 비순환 그래프로 표현하여 복잡한 확률 추론 및 인과 관계 분석을 가능하게 하는 확률적 그래픽 모델이다. - 그래프 모형 - 마르코프 네트워크
마르코프 네트워크는 무향 그래프로 표현되는 확률 모델로, 노드는 확률 변수를, 연결은 변수 간 조건부 독립성을 나타내며, 쌍별, 국소, 전역 마르코프 속성을 통해 정의되고 다양한 분야에서 활용된다. - 잠재 변수 모형 - 잠재 의미 분석
잠재 의미 분석은 텍스트 데이터의 의미 구조를 파악하기 위해 문서-단어 행렬에 특이값 분해를 적용하여 차원을 축소하고 잠재된 의미를 추출하는 정보 검색 기술이다. - 잠재 변수 모형 - 토픽 모델
토픽 모델은 텍스트 데이터에서 문서의 주제를 찾기 위해 사용되는 통계적 모델링 방법으로, 잠재 의미 분석(LSI)에서 잠재 디리클레 할당(LDA)까지 다양한 모델이 개발되어 텍스트 데이터 분석 외 여러 분야에 응용되며, Mallet, Gensim 등의 도구로 사용 가능하다.
구조방정식 모델링 | |
---|---|
구조 방정식 모델링 | |
![]() | |
유형 | 통계 모델링 기법 |
다른 이름 | 공분산 구조 분석 경로 분석 |
관련 항목 | |
관련 통계 기법 | 회귀분석 요인 분석 경로 분석 시계열 분석 |
관련 항목 | 잠재 변수 측정 오차 모델 식별 전체 최소 제곱 부분 최소 제곱 경로 모델링 다중 지표 다중 원인 모델 확인 요인 분석 |
분야 | |
적용 분야 | 행동 과학 사회 과학 경제학 마케팅 건강 과학 |
2. 역사
구조방정식 모델링(SEM)은 세월 라이트가 관찰된 변수 간의 인과 관계를 회귀 방정식으로 해석하면서 시작되었다.[11][12][13] O. D. 던컨은 1975년 자신의 저서를 통해 사회 과학에 SEM을 소개했고,[14] 1970년대 후반과 1980년대에 컴퓨터 성능이 향상되면서 SEM이 크게 발전하였다. 헤이덕[6]과 볼렌[15]은 잠재 변수를 사용한 구조 방정식 모델링을 소개하는 서적을 출간했다.
경로분석, 확인적 요인분석, 잠재성장곡선모형, 구조회귀모형, 조절분석, 매개분석 등을 구조방정식 모형을 통해 할 수 있다.
칼 조레스코그는 LISREL[16][17][18]을 개발하여 (심리학자들이 요인 분석에서 잠재 요인으로 알고 있는) 잠재 변수를 경로 분석 방정식에 포함시켜 SEM 발전에 기여했다.
주데아 펄[4]은 SEM을 비모수 모델로 확장하고, 인과적 추론을 위한 이론적 토대를 마련했다.[24]
오늘날 SEM은 머신 러닝과 해석 가능한 신경망의 기반을 형성한다.
3. 가능한 분석의 종류
그 외에도 다음과 같은 분석이 가능하다.
4. 활용 범위
현재 교육학, 심리학, 사회학, 경영학, 경제학 등 사회과학 분야의 다양한 부분에서 활용되고 있다.[11][12][13]
5. 분석에 사용되는 소프트웨어
SPSS와 연동되며, GUI 기반으로 사용이 편리한 AMOS가 국내에서 가장 널리 사용되고 있으나, 전통적으로 많이 사용되어 온 LISREL, EQS 등의 툴도 존재한다.[58] Muthen & Muthen 사에서 제작한 Mplus는 현존하는 구조방정식 소프트웨어들 중 가장 강력한 기능을 자랑한다. 이 외에도 최근에는 무료 통계분석 소프트웨어인 R의 패키지인 'sem'과 'lavaan'을 사용하여 구조방정식분석을 할 수 있게 되었다. 무료로 제공하는 것 중에는 Python 패키지인 seompy 등도 사용된다.
구조 방정식 모델링 프로그램은 기능과 사용자 요구 사항에서 광범위한 차이를 보인다.[58]
- SPSS의 AMOS
- LISREL
- [http://www.statmodel.com/ MPlus]
- [http://pls-gui.com/ PLS-GUI]
- SAS (소프트웨어) 프로시저
- [http://japan.smartpls.com/ SmartPLS - 차세대 구조 방정식 경로 모형]
- Stata [http://www.stata-press.com/manuals/structural-equation-modeling-reference-manual/ sem]
- [http://warppls.com/ WarpPLS]
6. 일반적인 단계 및 고려 사항
구조방정식 모델을 구축하고 평가할 때는 다음과 같은 일반적인 단계를 따르고 여러 사항들을 고려해야 한다.
일반적인 단계1. 모델의 인과적 해석: 구조방정식 모델(SEM)은 인과 관계를 명확하게 보여주지만, 모델 구조가 실제 세상의 인과 관계와 맞지 않으면 잘못된 해석을 할 수 있다.[39] 모델이 데이터에 얼마나 잘 맞는지, 그리고 어떻게 그렇게 되었는지가 해석의 핵심이다.
2. 직접 효과 및 간접 효과 해석: 직접 효과는 회귀분석 방정식의 계수처럼 해석되지만, 인과적인 의미를 가진다. 간접 효과는 여러 직접 효과의 곱으로 계산된다.[27] 관련된 단위는 관찰된 변수와 잠재 변수에 할당된 척도 값이다.
3. SEM 해석의 특징: SEM 해석은 잠재 변수들을 연결하는 인과 계수 네트워크를 고려하며, 간접 효과 패턴의 결과를 전달한다.[14] 여러 인과 경로가 어떻게 상호작용하는지 이해하도록 돕는다.
4. 모델링된 효과의 해석: 각 모델링된 효과는 관련된 변수와 효과 크기를 넘어선 미지의 요소를 포함한다.[14] 여러 효과를 연결하는 구조는 관찰된 변수를 조정하기 위해 사물이 어떻게 작동하는지 보여준다.
5. 통계적 유의성: 효과 추정치의 통계적 유의성이 없으면 실제 효과로 해석하기 어렵다.[42] 종속 변수의 분산 비율은 ''R''2로 제공되지만, 상호 효과나 루프 효과가 있는 경우 블록 오류 ''R''2를 사용해야 한다.
6. 모델 평가의 중요성: 모델이 데이터와 일치하는지 여부에 관계없이 해석이 가능해야 한다.[43] 실패한 모델과 적합한 모델을 신중하게 해석하면 연구 발전에 도움이 된다.
7. PLS 모델의 해석: PLS 모델은 개념화 방법에 따라 해석이 복잡해질 수 있다.[47] 비인과적 PLS 모델은 모델 계수가 세상의 대응물을 갖는지에 대한 우려를 줄여 해석 기준을 바꾼다.
8. 인과 관계 주장의 신중함: 실험이나 시간 순서 조사를 수행해도 인과 관계 주장은 신중해야 한다.[4] "인과 모델"은 검증된 인과적 결론이 아닌, "인과적 가정을 전달하는 모델"을 의미한다.
고려 사항
- 모델의 전반적인 상태와 구조: 모델의 추정된 계수뿐만 아니라 모델의 전반적인 상태와 구조를 고려해야 한다.
- 데이터 적합성: 모델이 데이터에 적합한지, 그리고 어떻게 데이터에 적합하게 되었는지가 해석에 가장 중요하다. 탐색이나 수정 지수를 통해 얻은 데이터 적합성은 모델이 틀렸다는 것을 보장하지 않는다.[39]
- 측정 오류: 데이터가 가정한 모델에 반박할 수 있는 능력은 "수정 지수 제안" 효과나 오류 공분산의 부당한 포함이 있을 때마다 약화된다.[39] 초기 모델에 오류가 많으면 올바른 모델을 복구하기 어렵다.
- 잠재 변수: 모델이 측정 오류를 조정하면 잠재 수준 효과를 실제 점수의 변동과 관련하여 해석할 수 있다.[27]
- 단위 증가: 단위 증가 자체가 실제 세계에서 가능하지 않은 것과 일치하지 않을 수 있으므로, 모델이 일정하게 유지된다는 가정은 실제 단위 증가에 의해 동시에 촉진될 수 있는 간접 효과를 할인해야 할 수 있다.[27]
- 공분산: 공통 원인은 두 개의 영향을 받은 변수 간의 공분산 또는 상관 관계에 기여한다.[14]
- 제어: 인과적 의미를 이해하는 것은 "제어"를 이해하는 것과 연결되며, 다른 변수가 아닌 일부 변수를 제어해야 하는 이유를 설명한다.[4]
- 상관 관계: 직접적인 0이 아닌 인과 효과로 연결되어 있음에도 불구하고 두 변수 사이에 상관 관계(0 공분산)가 없는 방법을 설명하는 것과 같이, 모델이 복잡해짐에 따라 기본 구성 요소는 직관적이지 않은 방식으로 결합될 수 있다.[14]
- 새로운 잠재 변수 추가: 새로운 잠재 변수를 추가하면 모델 오지정을 감지하는 데 도움이 된다.[30] 새로운 잠재 변수의 지표와 모든 원래 지표 간의 상관 관계는 원래 모델의 구조를 테스트하는 데 기여한다.
- 상호 작용, 비선형성, 다중 그룹 및 범주형 변수: 해석은 상호 작용, 비선형성, 여러 그룹 및 범주형 변수를 포함하는 모델에 대해 점진적으로 더 복잡해진다.[28] 인과 루프, 상호 효과 또는 상관된 잔차에 해당하는 효과도 약간 수정된 해석이 필요하다.[6]
6. 1. 모델 사양
구조방정식 모델을 만들 때는 다음 사항들을 고려해야 한다.- 사용할 변수들
- 변수들에 대해 알려진 사실
- 변수들 간의 인과 관계에 대한 이론이나 가설
- 모델을 통해 알고자 하는 것
구조 방정식 모델은 동일한 인과 구조를 가지지만, 원인과 결과 변수의 값이 다른 경우를 반영한다. 인과적 동질성을 확보하기 위해 사례를 선택하거나 다중 그룹 모델에서 분리할 수 있다.
모델 설정을 완료하려면 다음을 명확히 해야 한다.
- 어떤 효과나 상관/공분산을 포함하고 추정할 것인가
- 어떤 효과나 계수를 제외하거나 불필요하다고 간주할 것인가
- 어떤 계수에 고정된 값을 부여할 것인가 (예: 잠재 변수의 측정 척도를 제공하기 위해)
모델의 잠재 변수는 내생 변수와 외생 변수로 나뉜다. 내생 변수는 다른 변수의 영향을 받는 종속 변수처럼, 외생 변수는 다른 변수에 영향을 주는 예측 변수처럼 작동한다. 외생 변수 간의 인과 관계는 명시적으로 나타내지 않지만, 일반적으로 서로 자유롭게 상관될 수 있다고 가정한다. 모델은 일부 변수에서 영향을 받고 다른 변수로 영향을 주는 개입 변수를 포함할 수 있다. 회귀분석과 마찬가지로, 각 내생 변수에는 알려지지 않은 원인의 영향을 나타내는 잔차 또는 오차 변수가 할당된다.[27]
LISREL 프로그램은 모델 구성 요소를 추적하기 위해 행렬 요소에 그리스 문자를 할당했다. 이 표기법은 표준화되었지만, 통계적 고려 사항을 반영하여 확장 및 변경되었다.[18][6][15][28] 다이어그램이나 사용자 지정 변수 이름을 사용하는 방정식으로 모델 설정을 단순화하는 텍스트와 프로그램은 사용자의 모델을 표준 행렬 대수 형태로 변환한다. 그러나 이러한 단순화는 모델 구조 내에 숨겨진 문제를 모호하게 만들 수 있다.
구조방정식 모델에서 두 가지 주요 구성 요소는 다음과 같다.
- 구조 모델: 내생 및 외생 잠재 변수 간의 잠재적 인과 관계를 나타낸다.
- 측정 모델: 잠재 변수와 지표 간의 인과 관계를 나타낸다.
예를 들어, 탐색적 및 확인적 요인 분석 모델은 측정 모델에, 경로 모델은 구조 모델에 가깝다.
모델 제작자는 각 계수를 '자유'롭게 추정하거나, 특정 값으로 '고정'할 수 있다. 자유 계수는 연구자가 테스트하려는 효과, 외생 변수 간의 상관 관계, 내생 변수의 추가 변동을 나타내는 잔차의 분산 등이 될 수 있다. 고정 계수는 잠재 변수의 척도를 제공하거나 인과적 단절을 나타내는 값일 수 있다. 구조방정식 모델링 프로그램은 자유 계수에 대한 추정치와 검정을 제공하며, 고정 계수는 전체 모델 구조를 검정하는 데 기여한다. 계수 간의 다양한 제약 조건도 사용할 수 있다.[28][6][15] 모델 설정은 문헌에서 알려진 내용, 연구자의 경험, 조사되는 기능에 따라 달라진다.
모델에서 추정할 수 있는 계수의 수에는 제한이 있다. 추정된 계수 수보다 데이터 포인트가 적으면 모델은 "식별되지 않음" 상태가 되어 계수 추정치를 얻을 수 없다. 상호 효과나 인과 루프도 추정을 방해할 수 있다.[29][30][28]
6. 2. 자유 모델 계수 추정
자유 모델 계수 추정값은 데이터와의 적합성을 최대화하거나 데이터와의 차이를 최소화하는 방식으로 얻어진다. 이는 모델 내 계수의 위치, 변수 간 연결의 특성, 오차 변수의 특성, 변수의 측정 척도 등 다양한 요소를 고려하여 이루어진다.[28]최대 우도 추정(MLE)은 모든 자유 모델 계수의 수치 값을 조정하여 샘플 데이터를 관찰할 가능성을 최대화하는 방법이다. 최소 자승법(OLS) 추정은 모델이 올바르게 지정된 경우, 즉 모델의 모든 추정 특징이 실제 세계 특징에 해당하는 경우 데이터와 모델 예측 값 사이의 제곱 차이를 최소화하는 계수 값을 찾는 방법이다.[28]
변수의 측정 수준과 모델 내 위치에 따라 추정값을 얻기 위해 최대화하거나 최소화할 통계적 특징이 달라진다. 대부분의 SEM 프로그램은 다음과 같은 다양한 추정 옵션을 제공한다.[28]
- 최대 우도 추정(MLE)
- 전체 정보 최대 우도(FIML)
- 최소 자승법(OLS)
- 가중 최소 자승법(WLS)
- 대각 가중 최소 자승법(DWLS)
- 2단계 최소 자승법
계수 추정값이 모델과 데이터에 의해 충분히 제한되지 않아 과소 식별되는 문제가 발생할 수 있다. 이 경우 고유한 최적 추정값이 존재하지 않는다. 예를 들어, 두 변수 간의 단일 데이터 상관 관계 크기는 해당 변수 간의 상호 효과 쌍을 추정하기에 불충분하다.[30]
과소 식별된 효과 추정값은 추가 모델 또는 데이터 제약 조건을 도입하여 식별할 수 있다. 예를 들어, 상호 효과는 하나의 효과 추정값을 다른 효과 추정값의 두 배, 세 배 등으로 제한함으로써 식별할 수 있다.[30] 또한, 상호 인과적으로 연결된 변수 쌍 중 하나에 직접적인 원인이 되는 세 번째 변수에 대한 데이터를 활용하면 식별에 도움이 될 수 있다.[29]
6. 3. 모델 평가
모델 평가는 이론과 데이터, 모델, 그리고 추정 전략에 따라 달라진다. 따라서 모델 평가 시에는 다음과 같은 사항들을 고려해야 한다.[38]- 데이터의 적절성: 사용된 변수들이 합리적으로 측정되었는지 확인한다.
- 사례의 동질성: 모델링된 사례들이 인과적으로 동질적인지 확인한다. 서로 다른 인과 네트워크를 반영하는 경우, 하나의 모델을 추정하는 것은 의미가 없다.
- 이론 반영: 모델이 이론이나 관심 있는 특징을 적절하게 나타내는지 확인한다. 이론에 필요한 특징을 생략하거나, 이론과 일치하지 않는 계수를 포함하는 모델은 설득력이 떨어진다.
- 추정치의 통계적 정당성: 가정 위반, 부적절한 추정기 사용, 반복 추정기의 비수렴 등으로 인해 평가가 왜곡될 수 있다.
- 추정치의 실질적 합리성: 음수 분산이나 1.0 또는 -1.0을 초과하는 상관 관계는 불가능하다. 이론과 일치하지 않는 통계적으로 가능한 추정치는 이론과 우리의 이해에 도전할 수 있다.
- 모델과 데이터 간의 일관성/불일치: 추정 과정은 모델과 데이터 간의 차이를 최소화하지만, 중요하고 유익한 차이가 남을 수 있다.
이론을 검증하거나 "조사"한다고 주장하는 연구는 우연 이상의 모델-데이터 불일치에 주의를 기울여야 한다. 구조 방정식 모델링(SEM) 프로그램의 출력에는 추정된 모델 효과가 실제로 관찰된 변수의 값을 제어하는 경우 관찰될 변수 간의 관계를 보고하는 행렬이 포함된다. 모델의 "적합도"는 모델이 암시하는 관계와 변수 간의 해당 관찰된 관계 간의 일치 또는 불일치를 보고한다. 데이터와 모델의 의미 간의 크고 유의미한 차이는 문제를 나타낸다. 카이제곱 검정()에 수반되는 확률은 추정된 모델이 실제 기본 모집단 힘을 구성하는 경우 데이터를 임의 표본 추출 변동으로 인해 발생할 수 있는 확률이다. 작은 확률은 모델링된 구조가 실제 모집단 인과 관계를 구성하는 경우 현재 데이터가 발생했을 가능성이 낮다는 것을 보고한다. 여기서 나머지 차이는 임의 표본 추출 변동에 기인한다.[38]
최적의 계수 추정치를 선택했음에도 불구하고 모델이 데이터와 일치하지 않는 경우, 연구자는 이 증거(종종 유의미한 모델 검정)를 보고하고 주의를 기울여야 한다.[38] 모델-데이터 불일치는 데이터 문제, 부적절한 통계적 추정, 또는 잘못된 모델 사양 등 다양한 원인으로 발생할 수 있으며, 이는 계수 추정치와 모델 구조 조정 능력 모두에 문제를 야기한다.
데이터 불일치 모델의 계수 추정치는 사용 가능한 데이터와 충돌하는 모델을 믿는 사람에게 세상이 어떻게 보일지에 대한 보고로 해석할 수 있다. 추정치는 통계적으로 이상하거나 이론에 따라 잘못된 부호를 가질 수 있지만, 반드시 "명백히 잘못된" 것은 아니다. 추정치는 이론의 요구 사항과 밀접하게 일치할 수도 있지만, 남아 있는 데이터 불일치는 추정치와 이론 간의 일치가 위안을 제공할 수 없게 만든다. 실패한 모델은 여전히 해석할 수 있지만, 사용 가능한 증거와 충돌하는 해석으로만 해석할 수 있다.
모델 수정의 위험성수정 지수는 특정 고정 모델 계수를 추정을 위해 해제할 경우 모델의 데이터 적합도가 얼마나 "개선"될지에 대한 추정치이다. 데이터 불일치 모델에 직면한 연구자는 수정 지수가 적합성을 상당히 개선할 가능성이 있다고 보고하는 계수를 쉽게 해제할 수 있다. 그러나 이는 인과적으로 잘못된 실패 모델에서 인과적으로 잘못되었지만 적합한 모델로 이동할 상당한 위험을 초래한다. 적합한 데이터가 해제된 계수가 실질적으로 합리적이거나 세상과 일치한다는 보장을 제공하지 않기 때문이다. 원래 모델에는 잘못된 방향 효과 또는 사용 불가능한 변수에 대한 잘못된 가정과 같은 인과적 오배치 사양이 포함될 수 있으며, 이러한 문제는 현재 모델에 계수를 추가하여 수정할 수 없다. 결과적으로 이러한 모델은 추가 계수로 제공되는 더 가까운 적합성에도 불구하고 오배치된 상태로 유지된다. MacCallum(1986)은 "유리한 조건에서도 사양 검색에서 발생하는 모델은 주의해서 보아야 한다"고 경고했다.
모델 적합도 지수많은 연구자들이 표본 크기(N)가 증가함에 따라 증가하고(따라서 확률이 감소함) 있다고 주장하며, 모델을 테스트하는 대신 적합 지수로 전환하는 것을 정당화하려고 한다. 그러나 적절한 모델의 경우는 N과 함께 증가하지 않으며,[38] 가 N과 함께 증가하면 그 자체가 무언가 감지 가능한 문제가 있다는 신호이다. 또한, 감지 가능한 오배치된 모델의 경우 는 N과 함께 증가하면 모델 오배치를 감지할 통계적 검정력(즉, 제2종 오류를 감지할 검정력)을 증가시키는 좋은 소식을 제공한다.
모델 검정은 수정되었을 수 있으며,[35] 사용 가능한 가장 강력한 구조 방정식 모델 검정이다.[38]
다양한 적합 지수가 모델이 데이터에 얼마나 밀접하게 적합하는지 정량화하지만, 모든 적합 지수는 적합도의 크기나 양이 데이터 불일치를 생성하는 문제의 심각성 또는 특성과 신뢰할 수 있게 조정되지 않는다는 논리적 어려움을 겪는다.[34]
등가 모델데이터에 동일하게 적합한 서로 다른 인과 구조를 가진 모델을 등가 모델이라고 한다.[28] 이러한 모델은 데이터 적합 등가이지만 인과적으로 등가가 아니므로 소위 등가 모델 중 적어도 하나는 세상의 구조와 일치하지 않아야 한다. 예를 들어 X와 Y 사이에 완벽한 상관 관계가 있고, 이를 X가 Y를 유발하는 것으로 모델링하면 완벽한 적합도를 얻을 수 있지만, 실제로는 Y가 X를 유발하거나, X와 Y 모두 공통 원인 Z에 반응하는 등 다른 인과 구조가 존재할 수 있다. 따라서 완벽한 적합도조차 모델이 올바르게 인과적으로 지정되었음을 의미하지는 않는다.
적합 지수 사용의 지속이러한 논리적 약점에도 불구하고, 여러 요인들이 적합 지수 사용을 계속 확산시키고 있다. 예를 들어, Dag Sorbom이 Karl Joreskog에게 첫 번째 구조 방정식 모델링 프로그램 개발자에게 "그럼 왜 GFI를 추가했습니까?"라고 질문했을 때 Joreskog는 "음, 사용자는 LISREL을 사용하면 항상 큰 카이제곱이 생성된다고 말하면서 위협합니다. 그래서 사람들을 행복하게 만들 무언가를 발명해야 했습니다. GFI는 그 목적을 수행합니다."라고 답했다.[36] 즉, 모델-데이터 불일치의 증거는 통계적으로 너무 견고하여 제거할 수 없었지만, 적어도 사람들은 "불안한" 증거에서 주의를 돌릴 수 있는 방법을 제공받을 수 있었다.
적합 지수 사용 시 고려 사항적합 지수를 사용할 때는 다음과 같은 사항들을 고려해야 한다.[38]
# 데이터 실수가 모델-데이터 불일치를 유발하지 않도록 데이터 문제를 해결했는지 확인한다.
# 연구자의 모델과 같은 구조를 가진 모델에 대해 지수의 기준값이 조사되었는지 확인한다.
# 현재 모델의 잠재적 오배치의 종류가 지수 기준의 기초가 되는 오배치의 종류에 해당하는지 확인한다.
# 연구자가 지수 기준이 기반으로 하는 오배치의 종류를 지적하는 증거를 의도적으로 무시하는 데 동의하는지 여부이다.
# 최신 지수 기준이 사용되고 있는지 확인한다.
# 지수의 쌍에 대한 기준값을 충족해야 하는지 확인한다.
# 모델 검정이 가능한지 여부( 값, 자유도 및 확률).
# 연구자가 지수 기반 의사 결정 시 알파(제1종) 오류와 베타(제2종) 오류를 모두 고려했는지 여부.
주요 적합 지수가장 일반적으로 사용되는 적합 통계는 다음과 같다.
- 카이제곱
- * 많은 다른 적합도 측정을 계산하는 데 사용되는 기본적인 적합도 검정이다. 관찰된 공분산 행렬과 모델이 암시하는 공분산 행렬 간의 불일치의 함수이다. 카이제곱은 모델에 감지 가능한 오배치가 있는 경우에만 표본 크기와 함께 증가한다.[38]
- 아카이케 정보 기준 (AIC)
- * 상대적 모델 적합 지수: 선호하는 모델은 AIC 값이 가장 낮은 모델이다.
- * 여기서 ''k''는 통계 모델의 매개변수 수이고, ''L''은 모델의 우도의 최대값이다.
- 근사 평균 제곱근 오차 (RMSEA)
- * 값이 0이면 최상의 적합도를 나타내는 적합도 지수이다. RMSEA를 사용하여 "근접 적합"을 결정하기 위한 지침은 매우 논쟁적이다.
- 표준화된 평균 제곱근 잔차 (SRMR)
- * SRMR은 널리 사용되는 절대 적합 지표이다. Hu와 Bentler(1999)는 좋은 적합에 대한 지침으로 .08 또는 그 이하를 제안했다.
- 비교 적합 지수 (CFI)
- * 기준선 비교를 검토할 때 CFI는 데이터의 상관 관계의 평균 크기에 크게 의존한다. 변수 간의 평균 상관 관계가 높지 않으면 CFI가 그다지 높지 않다. CFI 값은 .95 이상이 바람직하다.
다음 표는 RMSEA, SRMR, CFI 등 몇 가지 일반적인 지수에 대한 정보를 제공한다.
RMSEA | SRMR | CFI | |
---|---|---|---|
지수 이름 | 근사 평균 제곱근 오차 | 표준화된 평균 제곱근 잔차 | 비교 적합 지수 |
공식 | |||
기본 참조 | |||
요인 모델 제안된 표현 | .06 표현?[37] | ||
비요인 모델 제안된 표현 | |||
수정/변경을 제안하는 참조, | [37] | [37] | [37] |
두 지수 또는 쌍 지수를 나타내는 참조 | [37] | [37] | [37] |
지수 기반 | 예 | 아니요 | 예 |
사용을 권장하지 않는 참조 |
7. 논쟁 및 동향
세월 라이트가 제안한 경로 분석은 초기 구조방정식 모델링(SEM)의 발전에 큰 영향을 미쳤지만, 미국의 계량 경제학자들은 모델링 목표와 데이터 구조의 차이로 인해 SEM을 크게 지지하지 않았다.[11][12][13] 이러한 분리는 절차 및 용어상의 차이를 낳았지만, 두 접근 방식 사이에는 여전히 깊은 수학적, 통계적 연결이 존재한다.[21][22] SEMNET에서는 내생성 문제와 방향성 비순환 그래프(DAG)를 통한 인과성 논의가 활발하게 이루어지고 있다.[4]
SEM 분석은 복잡한 개념을 분해하고 인과 과정을 이해하는 데 유용하여 사회 과학 분야에서 널리 사용되지만, 모델의 복잡성, 통제 변수의 존재, 표본 크기, 관심 변수에 따라 결과의 변동성이 크다는 단점이 있다.[25] 이러한 문제점은 실험 설계를 통해 일부 해결할 수 있다.[26]
SEM과 관련하여 다음과 같은 논쟁들이 존재한다.
- 모델 테스트 vs. 적합도 지수: 경로 분석 연구자들은 모델 테스트를 중시하는 반면, 요인 분석 연구자들은 적합도 지수를 더 옹호하는 경향이 있었다.[19][20] 폴 바렛은 모델의 적합도를 나타내는 지표 사용을 금지해야 한다고 주장하기도 했다.
- 단계별 접근 방식의 문제점: 요인 분석에서는 여러 지표를 묶어 척도나 요인 점수를 만들고, 이를 경로 구조 모델에 사용하는 단계별 접근 방식을 취하는 경우가 많다. 그러나 이러한 방식은 척도나 요인 점수가 지표를 유효하게 나타내는지, 잠재 수준 효과를 제대로 반영하는지 확인하기 어렵게 만든다.[30]
- 경쟁 모델: 경쟁 모델을 비교하는 것은 유용하지만, 단순히 더 나은 적합도를 보이는 모델을 선택하는 것만으로는 근본적인 문제를 해결할 수 없다.
- 단일 지표 모델: 모델링된 각 잠재 변수에 단일 지표만 사용하는 경우, 측정 오차를 고려하고 조정하는 방법에 대한 논의가 필요하다.[31]
최근에는 오차/잔차 변수의 독립성 부족으로 인해 발생하는 내생성 문제를 해결하고, SEM을 통해 인과 관계 추론을 강화하려는 연구가 진행되고 있다.[38] 주데아 펄은 SEM을 비모수 모델로 확장하여 효과의 선형성이나 오차 항의 분포에 대한 가정 없이 총 효과, 직접 효과, 간접 효과를 추정할 수 있도록 했다.[4]
오늘날 SEM은 머신 러닝과 해석 가능한 신경망의 기반을 형성하며, 고전 통계의 탐색적 및 확인적 요인 분석은 비지도 및 지도 머신 러닝에 반영되고 있다.
8. 확장, 모델링 대안 및 통계적 관련성
구조 방정식 모델링(SEM)은 다양한 확장 모델과 관련 통계 기법을 포함한다.
- 범주형 변수: 범주형 종속 변수 및 범주형 매개 변수를 다루는 모델이 있다.
- 코풀라: 코풀라(Copula)를 활용한 모델도 연구되고 있다.
- 심층 경로 모델링: 심층 경로 모델링은 더 복잡한 관계를 탐구한다.
- 탐색적 구조 방정식 모델링: 탐색적 구조 방정식 모델링(ESEM)[52]은 요인 구조를 탐색하는 데 사용된다.
- 융합 타당성 모델: 융합 타당성 모델[53]은 측정 도구의 타당성을 평가한다.
- 문항 반응 이론 모델: 문항 반응 이론 모델은 개별 문항 수준에서 분석을 수행한다.
- 잠재 계층 모델: 잠재 계층 모델은 여러 계층의 잠재 변수를 고려한다.
- 잠재 성장 모델링: 잠재 성장 모델링은 시간 경과에 따른 변화를 분석한다.
- 연결 함수: 연결 함수는 다양한 형태의 변수를 연결한다.
- 종단 모델: 종단 모델[54]은 시간의 흐름에 따른 변화를 추적한다.
- 측정 불변성 모델: 측정 불변성 모델[55]은 서로 다른 집단에서 측정 도구가 동일하게 작동하는지 확인한다.
- 혼합 모델: 혼합 모델은 여러 분포를 결합하여 이질적인 데이터를 분석한다.
- 다층 모델: 다층 모델[56]은 위계적 데이터 구조(예: 학교 내 학생)를 분석한다.
- 다중 그룹 모델링: 다중 그룹 모델링은 여러 집단(예: 성별, 문화) 간의 차이를 비교한다.
- 다중 방법 다중 특성 모델: 다중 방법 다중 특성 모델은 다양한 측정 방법과 특성을 고려한다.
- 임의 절편 모델: 임의 절편 모델은 집단 간 차이를 반영한다.
- 구조 방정식 모델 트리: 구조 방정식 모델 트리는 의사 결정 트리와 유사한 방식으로 모델을 분할한다.
- 구조 방정식 다차원 척도법: 구조 방정식 다차원 척도법[57]은 변수 간의 관계를 시각적으로 표현한다.
참조
[1]
서적
Encyclopedia of Epidemiology
2008
[2]
서적
Encyclopedia of Educational Leadership and Administration
2006
[3]
웹사이트
Structural Equation Modeling - an overview {{!}} ScienceDirect Topics
https://www.scienced[...]
2024-11-15
[4]
서적
Causality: Models, Reasoning, and Inference
Cambridge University Press
2009
[5]
서적
Principles and practice of structural equation modeling
2016
[6]
서적
Structural Equation Modeling with LISREL: Essentials and Advances
Johns Hopkins University Press
1987
[7]
서적
Structural equations with latent variables
Wiley
1989
[8]
서적
Structural equation modeling: foundations and extensions
SAGE
2009
[9]
간행물
Have Multilevel Models Been Structural Equation Models All Along?
2003-10-01
[10]
간행물
An overview of structural equation modeling: Its beginnings, historical development, usefulness and controversies in the social sciences
[11]
간행물
Correlation and causation
1921
[12]
간행물
The Method of Path Coefficients
1934
[13]
간행물
"Sewall Wright on the method of path coefficients: An annotated bibliography"
1999
[14]
서적
Introduction to Structural Equation Models
Academic Press
1975
[15]
서적
Structural Equations with Latent Variables
Wiley
1989
[16]
문서
ACOVS: A General Computer Program for Analysis of Covariance Structures
Educational Testing Services
1970
[17]
간행물
LISREL: A General Computer Program for Estimating a Linear Structural Equation System Involving Multiple Indicators of Unmeasured Variables
https://files.eric.e[...]
1972
[18]
문서
LISREL III: Estimation of Linear Structural Equation Systems by Maximum Likelihood Methods
National Educational Resources, Inc.
1976
[19]
간행물
"Jiving the Four-Step, Waltzing Around Factor Analysis, and Other Serious Fun"
2000
[20]
간행물
"Doing the Four-Step, Right-2-3, Wrong-2-3: A Brief Reply to Mulaik and Millsap; Bollen; Bentler; and Herting and Costner"
2000
[21]
서적
Structural Equation Modeling: From Paths to Networks
Springer
2015
[22]
간행물
The Cowles Commission's Contributions to Econometrics at Chicago, 1939-1955
https://www.jstor.or[...]
1994
[23]
간행물
"Potential outcome and directed acyclic graph approaches to causality: Relevance for empirical practice in economics"
2020
[24]
서적
Handbook of Causal Analysis for Social Research
2013
[25]
서적
Eight Myths About Causality and Structural Equation Models
https://doi.org/10.1[...]
Springer Netherlands
2024-12-11
[26]
간행물
Social connectedness as a mediator for horticultural therapy's biological effect on community-dwelling older adults: Secondary analyses of a randomized controlled trial
https://doi.org/10.1[...]
2021-09
[27]
간행물
The theoretical status of latent variables
2003
[28]
서적
Principles and Practice of Structural Equation Modeling
Guilford Press
2016
[29]
간행물
"A necessary and sufficient identification rule for structural models estimated in practice."
1995
[30]
서적
LISREL Issues, Debates, and Strategies
Johns Hopkins University Press
1996
[31]
간행물
Should researchers use single indicators, best indicators, or multiple indicators in structural equation models?
2012
[32]
간행물
"When fit indices and residuals are incompatible."
2002
[33]
간행물
Structural equation model testing and the quality of natural killer cell activity measurements
2005
[34]
간행물
Seeing Perfectly Fitting Factor Models That Are Causally Misspecified
2014
[35]
문서
“Corrections to test statistics and standard errors in covariance structure analysis”
Sage
1994
[36]
서적
xxxxx
Scientific Software International
2001
[37]
논문
"Cutoff criteria for fit indices in covariance structure analysis: Conventional criteria versus new alternatives."
1999
[38]
학술지
Describing qualitative research undertaken with randomised controlled trials in grant proposals: A documentary analysis
2014
[39]
논문
“Another perspective on “The proper number of factors” and the appropriate number of steps.”
2000
[40]
서적
Structural Equation Modeling with LISREL: Essentials and Advances
Johns Hopkins University Press
1987
[41]
논문
“Pearl’s D-separation: One more step into causal thinking.”
2003
[42]
논문
“Blocked-Error-R2: A conceptually improved definition of the proportion of explained variance in models containing loops or correlated residuals.”
2006
[43]
논문
“Structural equation modeling made difficult.”
2007
[44]
서적
Early Schooling: Cognitive and Affective Outcomes
Johns Hopkins University Press
1982
[45]
논문
“Personal space: Understanding the simplex model.”
1994
[46]
논문
“Sexual Orientation and the Willingness of Catholic Seminary Students to Conform to Church Teachings.”
1997
[47]
학술지
On Comparing Results from CB-SEM and PLS-SEM: Five Perspectives and Five Recommendations
2017
[48]
논문
“Testing! testing! one, two, three – Testing the theory in structural equation models!”
2007
[49]
서적
Foundations of Factor Analysis (second edition)
Chapman and Hall/CRC
2009
[50]
논문
“A framework of statistical tests for comparing mean and covariance structure models.”
2007
[51]
학술지
Review essay on Rex B. Kline's Principles and Practice of Structural Equation Modeling: Encouraging a fifth edition
2018
[52]
학술지
Exploratory Structural Equation Modeling: An Integration of the Best Features of Exploratory and Confirmatory Factor Analysis
https://www.annualre[...]
2014-03-28
[53]
논문
[54]
학술지
From Data to Causes I: Building A General Cross-Lagged Panel Model (GCLM)
2020-10
[55]
학술지
Measurement invariance in the social sciences: Historical development, methodological challenges, state of the art, and future perspectives
https://linkinghub.e[...]
2023-02
[56]
서적
Multilevel structural equation modeling for intensive longitudinal data: A practical guide for personality researchers
https://linkinghub.e[...]
Elsevier
2023-11-03
[57]
학술지
SEMDS: An R Package for Structural Equation Multidimensional Scaling
https://www.tandfonl[...]
2019-09-03
[58]
학술지
A Review of Eight Software Packages for Structural Equation Modeling
https://doi.org/10.1[...]
2012-05-01
[59]
서적
A Primer on Partial Least Squares Structural Equation Modeling (PLS-SEM)
http://www.pls-sem.c[...]
Sage
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com