인과 추론
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
인과 추론은 한 변수의 변화가 다른 변수에 영향을 미치는지 연구하는 방법론으로, 과학적 방법과 통계적 추론을 활용한다. 인과 추론은 실험, 준실험, 역학 연구, 컴퓨터 과학, 사회 과학 등 다양한 분야에서 사용되며, 특히 상관관계가 인과관계를 의미하지 않는다는 점에 유의해야 한다. 인과 효과를 추정하기 위해 평균 처치 효과, 도구 변수법, 회귀 불연속 설계, 차분법, 합성 통제법 등 다양한 기법이 활용된다. 그러나 과학적 부정행위와 방법론적 한계로 인해 인과 추론에는 어려움이 있으며, 재현성 문제와 같은 과제가 남아있다.
더 읽어볼만한 페이지
- 추론 - 추론 규칙
추론 규칙은 전제가 참일 때 결론이 필연적으로 참임을 보이는 논리적 도출 과정을 형식적으로 표현한 규칙으로, 다양한 유형이 존재하며 명제 논리와 술어 논리에서 기본적인 추론을 수행하는 데 사용되고, 형식 체계의 핵심 요소이다. - 추론 - 추론 엔진
추론 엔진은 지식 베이스의 규칙과 주어진 사실을 이용하여 새로운 결론을 도출하는 시스템으로, 초기 전문가 시스템 개발에서 시작하여 다양한 알고리즘과 기술 발전을 거쳐 딥러닝과 융합되며 윤리적 문제와 사회적 영향에 대한 고려가 중요해지고 있다. - 그래프 모형 - 베이즈 네트워크
베이즈 네트워크는 확률 변수 간의 관계를 방향성 비순환 그래프로 표현하여 복잡한 확률 추론 및 인과 관계 분석을 가능하게 하는 확률적 그래픽 모델이다. - 그래프 모형 - 마르코프 네트워크
마르코프 네트워크는 무향 그래프로 표현되는 확률 모델로, 노드는 확률 변수를, 연결은 변수 간 조건부 독립성을 나타내며, 쌍별, 국소, 전역 마르코프 속성을 통해 정의되고 다양한 분야에서 활용된다. - 귀납 - 마음
마음은 의식, 사고, 지각, 감정, 동기, 행동, 기억, 학습 등을 포괄하는 심리적 현상과 능력의 총체이며, 다양한 분야에서 연구되고 인간 삶의 중추적인 역할을 한다. - 귀납 - 이론
이론은 특정 주제를 이해, 설명, 예측하기 위한 분석적 도구로, 논리적 원칙을 따르며, 과학에서는 관찰과 실험으로 확인된 사실에 기반한 자연 세계에 대한 설명으로, 반증 가능성을 지니고 학문 분야에서 지식 축적과 논리적 설명에 필수적인 역할을 한다.
| 인과 추론 | |
|---|---|
| 개요 | |
| 학문 분야 | 통계학 |
| 하위 분야 | 인과 모델링 인과 추론 |
| 주요 개념 | |
| 잠재적 결과 | 반사실적 추론 도널드 루빈 |
| 식별 | 인과 그래프 혼란 변수 백도어 기준 프런트도어 기준 IV 추정 |
| 추정 | |
| 추정 방법 | 경향 점수 매칭 IPW 표준화 |
| 관련된 주제 | |
| 기타 관련된 주제 | 계량경제학 역학 사회학 정치학 인공지능 머신 러닝 |
2. 방법론
인과 추론은 일반적으로 과학적 방법에 따라 수행되며, 반증 가능한 귀무 가설을 설정하고 통계적 가설 검정을 사용하여 이를 검증하는 단계를 거친다. 빈도주의적 통계적 추론은 데이터가 귀무 가설에서 우연히 발생할 확률을 결정하고, 베이즈 추론은 독립 변수의 효과를 결정하는 데 사용된다.[51]
역학 연구에서는 위험 요인과 영향에 대한 증거를 수집하고 측정하는 다양한 역학적 방법과 둘 사이의 연관성을 측정한다. 그러나 2020년 인과 추론 방법 검토에 따르면, 임상 훈련 프로그램에 기존 문헌을 사용하는 것은 어려울 수 있다. 이는 출판된 논문이 종종 고급 기술적 배경을 가정하고, 여러 통계, 역학, 컴퓨터 과학 또는 철학적 관점에서 작성될 수 있으며, 방법론적 접근 방식이 계속해서 빠르게 확장되고, 인과 추론의 많은 측면이 제한적인 범위를 받기 때문이다.[52]
어떤 것의 원인을 추론하는 것은 다음과 같이 묘사된다.
- "어떤 것이 다른 것의 원인이거나 원인이 될 가능성이 있다는 결론에 도달하는 [추론]."[3]
- "원인과 결과의 공변성, 원인이 결과보다 앞서는 시간 순서 관계를 설정하고, 그럴듯한 다른 원인들을 제거함으로써 현상의 원인 또는 원인들을 식별하는 것."[4]
인과 추론의 일반적인 프레임워크에는 인과적 파이 모델, 펄의 구조적 인과 모델(인과 다이어그램 + do-미적분), 구조 방정식 모델링, 루빈 인과 모델 등이 있으며, 사회 과학 및 역학과 같은 분야에서 자주 사용된다.[7]
경제학과 정치학에서 인과 추론은 종종 어렵다. 이는 경제적, 정치적 현실의 복잡성과 통제된 실험 내에서 많은 대규모 현상을 재현할 수 없다는 데 기인한다. 그럼에도 불구하고, 사회 과학 분야의 인과 추론은 기술 수준, 연구 수, 그리고 방법론의 개선으로 인해 엄격성이 지속적으로 향상되고 있다.[22]
2. 1. 통계적 추론
인과 추론은 한 변수의 측정값이 다른 변수의 측정값에 영향을 미치는 것으로 의심되는 시스템 연구를 통해 수행된다. 인과 추론의 첫 번째 단계는 반증 가능한 귀무 가설을 공식화하는 것이며, 이는 이후에 통계적 방법으로 테스트된다. 빈도주의적 통계적 추론은 통계적 방법을 사용하여 데이터가 귀무 가설에서 우연히 발생할 확률을 결정하는 것이다. 베이즈 추론은 독립 변수의 효과를 결정하는 데 사용된다.[51] 일반적으로 통계적 추론은 무작위 변동인 원본 데이터의 변동 또는 잘 지정된 인과 관계 메커니즘의 효과 간의 차이를 결정하는 데 사용된다. 특히 상관관계가 인과관계를 의미하지는 않는다는 점에 유의해야 한다.2. 2. 실험 및 준실험
인과 관계를 밝히는 가장 이상적인 방법은 무작위 대조 실험(RCT, Randomized Controlled Trial)이다. 이 방법은 연구 대상을 무작위로 두 그룹으로 나누어, 한 그룹에는 처치를 하고 다른 그룹에는 처치를 하지 않거나 다른 처치를 한 뒤 결과를 비교한다. 이렇게 하면 처치 외의 다른 요인들은 동일하게 유지되므로, 두 그룹 간의 결과 차이는 처치에 의한 것이라고 결론 내릴 수 있다.[51]하지만 현실적으로 무작위 대조 실험을 하기 어려운 경우가 많다. 예를 들어 비용이 너무 많이 들거나, 윤리적인 문제가 있거나, 대규모 시스템(예: 경제, 선거)에 대한 실험은 현실적으로 불가능할 수 있다. 또한 법적인 이유로 정보가 공개되지 않아 실험이 어려울 수도 있다.[51]
이러한 경우에는 준실험(Quasi-experiment)적 방법을 사용한다. 준실험은 무작위 배정이 아닌 다른 방법으로 처치 그룹과 통제 그룹을 구성하여 인과 관계를 추론하는 방법이다. 준실험에는 다음과 같은 방법들이 있다:
- 자연 실험 (Natural experiment): 연구자가 직접 처치를 조작하는 것이 아니라, 자연적으로 발생한 사건이나 정책 변화 등을 이용하여 처치 그룹과 통제 그룹을 구성하는 방법이다. 예를 들어, 특정 지역에만 시행된 정책의 효과를 평가하기 위해, 정책이 시행된 지역과 시행되지 않은 지역을 비교하는 것이 자연 실험의 한 예이다.
- 회귀 불연속 설계 (Regression discontinuity design): 특정 기준값을 기준으로 처치 여부가 결정되는 경우, 기준값 근처의 데이터를 이용하여 처치의 효과를 추정하는 방법이다. 예를 들어, 특정 점수 이상인 학생들에게만 장학금을 주는 경우, 장학금 지급 기준 점수 근처의 학생들을 비교하여 장학금의 효과를 추정할 수 있다.
준실험은 무작위 대조 실험만큼 엄격하게 통제되지 않기 때문에, 인과 관계를 추론할 때 주의해야 한다. 하지만 현실적인 제약이 있는 상황에서 인과 관계를 연구하는 데 유용한 방법이다.
무작위 대조 실험(RCT)은 다음과 같이 나뉜다.
| 종류 | 설명 |
|---|---|
| 실험실 실험 | 심리 실험 등에서 사용 |
| 현장 실험 | 실생활의 다양한 현장에서의 RCT (특히 사회 과학 분야) |
| 설문 실험 | 조사표를 이용한 RCT |
자연 실험의 결과 관찰은 "후향적 연구"라고도 불리며, 통계적 인과 추론의 정의 중 하나로 반사실 모델(Counterfactual Model)을 채택한 추론이라고 여겨지기도 한다.
2. 3. 역학에서의 접근
역학은 원인과 결과를 추론하기 위해 정의된 생명체 집단에서 건강과 질병의 패턴을 연구한다. 추정되는 위험 인자에 대한 노출과 질병 사이의 연관성은 암시적일 수 있지만, 상관관계가 인과관계를 암시하지 않기 때문에 인과관계와 동등하지 않다.[53] 분자 역학에서 연구되는 현상은 유전학을 포함한 분자생물학 수준에서 이루어지며, 여기서 바이오마커는 원인 또는 결과의 증거이다.2. 4. 컴퓨터 과학에서의 접근
컴퓨터 과학에서 인과 관계 추론은 알고리즘 정보 이론 모델과 노이즈 모델을 기반으로 한다.[10] 이는 인과적 인공지능 분야에서 중요한 개념이다. 두 개의 시간 독립적인 변수 X와 Y에 대한 공동 관측 데이터로부터 원인과 결과를 결정하는 것은 X → Y와 Y → X 방향의 어떤 모델에 대한 증거 간의 비대칭성을 사용하여 해결해 왔다.모델에 독립적인 잡음 항을 통합하여 두 방향의 증거를 비교한다. 가설 Y → X에 대한 잡음 E를 사용한 잡음 모델은 다음과 같다.
이러한 모델의 일반적인 가정은 다음과 같다.
- Y의 다른 원인은 없다.
- X와 E는 공통 원인이 없다.
- 원인의 분포는 인과 메커니즘과 독립적이다.
직관적으로, 공동 분포 P(원인, 결과)를 P(원인)\*P(결과 | 원인)으로 인수분해하면 P(결과)\*P(원인 | 결과)로 인수분해하는 것보다 일반적으로 총 복잡성이 낮은 모델이 생성된다는 아이디어가 있다. "복잡성"의 개념은 직관적으로 매력적이지만, 어떻게 정확하게 정의해야 할지는 분명하지 않다.[13] 다른 일련의 방법들은 대량의 레이블된 데이터로부터 인과 "흔적"을 발견하려고 시도하며, 보다 유연한 인과 관계의 예측을 허용한다.[14]
2. 5. 사회 과학에서의 접근
사회 과학, 특히 경제학과 정치학에서는 인과 관계 평가를 위한 정량적 프레임워크가 발전해왔다. 여기에는 도구 변수, 모델 구체화, 민감도 분석 등의 방법론이 사용된다.- 정치학: 1994년 게리 킹(Gary King), 로버트 쾨헤인(Robert Keohane), 시드니 베르바(Sidney Verba)의 저서 《사회 과학 연구 설계》는 정치학 연구에 큰 영향을 미쳤다. 이들은 양적 및 질적 방법을 모두 사용하고 통계적 추론을 통해 연구 주제를 명확히 할 것을 권장했다.[54][55] 카시와야(2018)에 따르면, 2000년대 중반 이후 인과 추론을 사용한 논문이 670% 증가하여 "인과 추론 혁명" 또는 "신뢰성 혁명"이라고 불리는 상황이 되었다.[48]
- 경제학: 2010년대 이후 대학원 수준의 통계 조사 텍스트에서 인과 추론은 표준적인 주제가 되었다. 2019년, 2021년, 2024년 노벨 경제학상은 무작위 대조 실험(RCT) 및 자연 실험을 활용한 연구자들에게 수여되었다.[45][46][47]
이러한 발전에도 불구하고, 사회 과학에서 인과 추론은 여전히 어려운 과제이다. 경제 및 정치 현실의 복잡성과 통제된 실험의 어려움 때문이다. 그러나 사회 과학자들은 사용 가능한 기술 수준의 증가, 연구 수의 증가, 그리고 방법론의 개선을 통해 인과 추론의 엄격성을 지속적으로 향상시키고 있다.[60]
2. 5. 1. 이론적 방법
경제학자와 정치학자는 인과 관계가 존재한다고 믿는 경우, 그 인과 관계의 크기를 추정하기 위해 이론(종종 이론 주도 계량 경제학에서 연구됨)을 사용할 수 있다.[61] 이론가들은 인과적이라고 믿는 메커니즘을 전제하고, 데이터 분석을 사용하여 제안된 이론을 정당화하면서 그 영향을 설명할 수 있다. 예를 들어, 이론가들은 논리를 사용하여 모델을 구축할 수 있으며, 비가 경제 생산성의 변동을 유발하지만 그 반대는 아니라고 이론화할 수 있다.[62]2. 5. 2. 도구 변수
도구 변수 (IV) 기법은 모델의 설명 변수 중 하나와 모델의 오차 항 사이의 상관 관계를 제거하여 인과 관계를 결정하는 방법이다. 이 방법은 모델의 오차항이 다른 변수의 변동과 관련이 있는 경우, 모델의 오차항이 해당 설명 변수의 변동에 영향을 받을 가능성이 높다고 가정한다. 따라서 새로운 도구 변수를 도입하여 이러한 상관 관계를 제거하면 모델 전체에 존재하는 오류가 줄어든다.[63]2. 5. 3. 모델 구체화
모델 구체화는 데이터 분석에 사용할 모델을 선택하는 행위이다.[64] 사회 과학자들은 서로 다른 모델이 서로 다른 관계를 추정하는 데 더 적합하기 때문에, 사용할 올바른 모델을 결정해야 한다.[64]모델 구체화는 한 기간의 행동 효과가 나중 기간에만 느껴지는 경우와 같이, 느리게 나타나는 인과관계를 결정하는 데 유용할 수 있다. 상관관계는 두 변수가 유사한 분산을 갖는지 여부만 측정할 뿐, 특정 방향으로 서로 영향을 미치는지 여부는 측정하지 않는다. 따라서 상관관계만으로는 인과관계의 방향을 결정할 수 없다. 인과적 행위가 인과적 효과보다 선행한다고 믿어지기 때문에, 사회 과학자들은 일정 기간 동안 한 변수가 다른 변수에 미치는 영향을 구체적으로 찾는 모델을 사용할 수 있다.
2. 5. 4. 민감도 분석
민감도 분석은 모델 구현이 새로운 변수를 추가하는 것에 얼마나 민감한지를 연구하는 것이다.[28] 이는 교란 변수를 발견하는 데 주된 목적이 있다. 교란 변수는 통계 검사 결과에 큰 영향을 미치지만, 인과 추론에서 연구하고자 하는 변수가 아닌 변수를 의미한다. 교란 변수는 한 구현에서는 회귀 변수가 유의미하게 나타나지만, 다른 구현에서는 그렇지 않게 만들 수 있다.2. 5. 5. 설계 기반 계량경제학
최근 설계 기반 계량경제학의 발전으로 자연 실험과 준실험 연구 설계가 널리 사용되고 있다.[31]3. 주요 개념 및 기법
인과 추론은 한 변수의 측정값이 다른 변수의 측정값에 영향을 미치는 것으로 의심되는 시스템 연구를 통해 수행된다. 이는 과학적 방법과 관련하여 수행되며, 첫 번째 단계는 반증 가능한 귀무 가설을 공식화하는 것이다. 이 가설은 이후에 통계적 방법으로 테스트된다. 통계적 추론은 일반적으로 원본 데이터의 변동이 무작위 변동인지, 아니면 잘 정의된 인과적 메커니즘의 효과인지 결정하는 데 사용된다. 특히, 상관관계가 인과관계를 의미하지는 않는다는 점에 유의해야 한다. 따라서 인과 관계 연구는 데이터 간의 변동뿐만 아니라 잠재적인 인과관계 메커니즘 연구와도 관련이 있다.[51]
역학에서는 위험 요인과 영향에 대한 증거를 수집하고 측정하는 다양한 역학적 방법과 둘 사이의 연관성을 측정하는 다양한 방법을 사용한다. 그러나 출판된 논문들이 고급 기술적 배경을 가정하고, 여러 학문 분야의 관점에서 작성될 수 있으며, 방법론이 빠르게 발전하고 있어 임상 훈련 프로그램에서 기존 문헌을 활용하기 어려울 수 있다는 문제점이 지적되기도 한다.[52]
역학은 원인과 결과를 추론하기 위해 정의된 생명체 집단에서 건강과 질병의 패턴을 연구한다. 추정되는 위험 인자에 대한 노출과 질병 사이의 연관성은 암시적일 수 있지만, 상관관계가 인과관계를 암시하지 않기 때문에 인과관계와 동등하지 않다. 역사적으로 코흐의 가설이 미생물이 질병의 원인인지 여부를 결정하기 위해 19세기부터 사용되었다. 20세기에는 1965년에 기술된 브래드포드 힐 기준[53]이 미생물학 외부의 변수의 인과관계를 평가하는 데 사용되었지만, 이러한 기준조차도 인과성을 결정하는 배타적인 방법은 아니다.
분자 역학에서 연구되는 현상은 분자생물학 수준에서 이루어지며, 여기서 바이오마커는 원인 또는 결과의 증거이다.
사회과학은 인과관계를 평가하기 위한 양적 틀을 포함하는 쪽으로 점점 더 나아가고 있다. 1994년 Gary King, Robert Keohane 및 Sidney Verba의 "Designing Social Inquiry" 출판은 정치학에 상당한 영향을 미쳤다. King, Keohane 및 Verba는 연구자가 양적 및 정성적 방법을 모두 적용하고 통계적 추론의 언어를 채택하여 관심 주제와 분석 단위를 더 명확하게 할 것을 권장한다.[54][55] 정량적 방법을 지지하는 사람들은 인과 관계를 추론하기 위한 표준으로 Donald Rubin이 개발한 잠재적 결과 프레임워크를 점점 더 많이 채택하고 있다.
사회 과학 방법론자들은 때때로 "혼합 방법" 접근이라고 하는 질적 방법과 양적 방법 모두를 사용하여 인과 추론을 수행하는 새로운 도구를 개발했다.[56][57] 다양한 방법론적 접근을 옹호하는 사람들은 다양한 방법론이 다양한 연구 주제에 더 적합하다고 주장한다. 사회학자 허버트 스미스와 정치학자 제임스 마호니와 게리 괴르츠는 통계학자이자 1986년 기사 "통계와 인과적 추론"의 저자인 폴 홀랜드의 관찰을 인용했다.[58][59] 정성적 방법론자들은 프로세스 추적 및 퍼지 집합 이론을 포함하여 공식화된 인과 관계 모델이 사례 연구 내에서 중요한 요인의 식별 또는 여러 사례 연구 간의 비교 과정을 통해 인과 관계를 추론할 수 있는 기회를 제공한다고 주장해 왔다.[55]
경제 과학 및 정치 과학에서 인과 추론은 경제 및 정치 현실의 현실 세계 복잡성과 통제된 실험 내에서 많은 대규모 현상을 재현할 수 없기 때문에 종종 어렵다. 그럼에도 불구하고 사회 과학자가 사용할 수 있는 기술 수준의 증가, 사회 과학자 및 연구 수의 증가, 사회 과학 전반의 인과 추론 방법론의 개선으로 인해 방법론과 엄격성이 계속 향상되고 있다.[60]
경제학자와 정치학자는 인과 관계가 존재한다고 믿는 경우 이론(이론 중심 계량 경제학에서 종종 연구됨)을 사용하여 추정되는 인과 관계의 크기를 추정할 수 있다.[61] 이론가들은 인과관계가 있다고 믿어지는 메커니즘을 가정하고 제안된 이론을 정당화하기 위해 데이터 분석을 사용하여 효과를 설명할 수 있다. 예를 들어, 비가 경제 생산성에 변동을 일으키지만 그 반대는 아니라는 이론과 같이 논리를 사용하여 모델을 구성할 수 있다.[62]
도구 변수 (IV) 기법은 모델의 설명 변수 중 하나와 모델의 오차 항 사이의 상관 관계를 제거하여 인과 관계를 결정하는 방법이다. 이 방법은 모델의 오차항이 다른 변수의 변동과 관련이 있는 경우, 모델의 오차항은 해당 설명 변수의 변동 효과일 수 있다는 가정에 기반한다. 따라서 새로운 도구 변수를 도입하여 이러한 상관 관계를 제거하면 모델 전체에 존재하는 오류가 줄어든다.[63]
모델 구체화는 데이터 분석에 사용할 모델을 선택하는 행위이다. 사회 과학자(그리고 실제로 모든 과학자)는 서로 다른 모델이 서로 다른 관계를 잘 추정하기 때문에 사용할 올바른 모델을 결정해야 한다.[64] 모델 구체화는 한 기간의 행동 효과가 나중 기간에만 느껴지는 경우에 나타나는 느린 인과관계를 결정하는 데 유용할 수 있다. 상관 관계는 두 변수가 특정 방향으로 서로 영향을 미치는지 여부가 아니라 유사한 분산을 갖는지 여부만 측정한다는 점을 기억할 가치가 있다. 따라서 상관 관계만으로는 인과 관계의 방향을 결정할 수 없다.
3. 1. 인과 효과 추정
평균 인과 효과(Average Causal Effect, ACE), 평균 처치 효과(Average Treatment Effect, ATE), 노출군의 평균 처치 효과(Average Treatment effect for Treated, ATT) 등 다양한 인과 효과 추정 방법이 존재한다.- 조건부 교환성(conditional exchangeability: CE)을 만족하는 공변량의 조건을 설정할 수 있는 경우
- * 공변량(covariate) 선택
- * 표준화(standardization) 또는 IPW(Inverse Probability Weighting)에 의한 평균 처치 효과(ATE) 추정
- * 층별 또는 매칭에 의한 조건부 평균 처치 효과(conditional average treatment effect: CATE) 추정
- * 성향 점수 매칭(Propensity Score Matching, PSM)
- 조건부 교환성(conditional exchangeability: CE)을 만족하는 공변량의 조건을 설정할 수 없는 경우
- * 도구 변수법(instrumental variable: IV), Marginal Treatment Effect(MTE), 부분 식별(partial identification: PI) [40]
- * 회귀 불연속 디자인(Regression Discontinuity Design, RDD)
- * 고정 효과(FE) 모델: 차분법(Difference In Differences, DID), 합성 통제법(Synthetic Control Method, SCM)
- * 프런트도어 기준
- 기타 기법과의 관계
- * 머신 러닝(Machine Learning, ML)과의 관계는 Pearl(2019)을 참조 [41]
- * 베이즈 추론(Bayesian inference)과의 관계는 Alaa and van der Schaar(2017)을 참조 [42]。베이즈 추론을 이용한 준모수적 인과 추정 기법으로 LiNGAM 등이 있다. [43]
- * 공분산 구조 분석(Covariance Structure Analysis / Structural Equation Modeling, SEM)과의 관계는 Morgan and Winship(2007)을 참조 [44]
3. 2. 조건부 교환 가능성
인과 추론에서 조건부 교환 가능성은 인과 효과를 추정하기 위한 중요한 가정이다.3. 3. 무시 가능성
무시 가능성(ignorability)은 처치 할당이 관측되지 않은 변수와 독립적이라는 가정이다.[1]3. 4. 백도어 기준
백도어 기준은 인과 효과를 식별하기 위한 그래픽 기준이다.[1]3. 5. 성향 점수 매칭
성향 점수 매칭(Propensity Score Matching, PSM)은 관측 연구에서 처치 그룹과 대조 그룹을 비교 가능하게 만들기 위해 사용되는 방법이다.[40]3. 6. 회귀 불연속 설계
회귀 불연속 설계(Regression Discontinuity Design, RDD)는 처치 할당이 특정 임계값을 기준으로 결정되는 경우 인과 효과를 추정하는 데 사용된다.[40]3. 7. 차분법
차분법(DID)은 고정 효과(FE) 모델의 일종으로, 시간 경과에 따른 처치 그룹과 대조 그룹의 변화를 비교하여 인과 효과를 추정한다.[40]3. 8. 합성 통제법
합성 통제법(Synthetic Control Method, SCM)은 단일 처치 단위를 여러 대조 단위의 가중 평균과 비교하여 인과 효과를 추정한다.[40] 고정 효과(FE) 모델의 하나로, 차분법(DID)과 함께 사용된다.3. 9. 프런트도어 기준
프런트도어 기준은 관측되지 않은 교란 요인이 존재하더라도 인과 효과를 식별할 수 있는 그래픽 기준이다.[40]4. 인과 추론의 한계 및 과제
인과 추론은 한 변수의 측정값이 다른 변수의 측정값에 영향을 미치는지 연구하는 것이다. 인과 추론은 과학적 방법과 관련하여 수행되며, 첫 단계는 반증 가능한 귀무 가설을 세우고 통계적 방법으로 검증하는 것이다. 통계적 추론은 데이터가 귀무 가설에서 우연히 발생할 확률을 결정하거나, 베이즈 추론을 통해 독립 변수의 효과를 추정한다.[51] 그러나 상관관계가 곧 인과관계를 의미하는 것은 아니므로, 인과 관계 연구는 데이터 변동과 잠재적 인과관계 메커니즘을 모두 고려해야 한다.
인과 관계를 밝히는 방법론은 발전하고 있지만, 복잡한 시스템에서 인과 관계를 규명하는 것은 여전히 어려운 과제이다. 2020년 연구에 따르면 임상 훈련 프로그램에서 인과 추론 관련 최신 문헌을 활용하기 어려운데, 이는 출판된 논문들이 고급 기술적 배경 지식을 요구하고, 다양한 학문 분야(통계학, 역학, 컴퓨터 과학, 철학 등)의 관점에서 작성되며, 방법론이 빠르게 발전하고 있기 때문이다.[52]
4. 1. 과학적 과실 및 방법론적 문제
과학계, 특히 사회과학계에서는 과학적 과실이나 잘못된 방법론 사용에 대한 우려가 존재한다.[65][60][66][67] 과학 연구는 광범위한 주제이므로 연구자의 과실 없이도 인과 추론이 약화될 수 있는 방법은 이론적으로 다양하다. 그럼에도 불구하고 많은 연구자들이 인과 추론에 있어 기본적인 의무를 다하지 않거나 충분히 다양한 방법을 실행하지 않는다는 우려가 남아있다.[65][60][66][67]흔히 사용되는 비인과적 방법론의 예로 상관 관계를 인과 관계로 잘못 가정하는 것을 들 수 있다. 상관 관계가 있는 현상 사이에는 본질적인 인과 관계가 없다. 회귀 모델은 이론적 모델과 관련된 데이터 내의 분산을 측정하도록 설계되었다. 높은 수준의 공분산을 나타내는 데이터는 (예측 속성이 있는 제안된 인과 메커니즘이나 무작위 치료 할당이 없는 한) 의미 있는 관계를 시사하는 것이 아니다. 잘못된 방법론 사용, 특히 회귀 모델, 그 중에서도 선형 회귀 모델의 과도한 사용은 널리 퍼져 있다.[5] 두 개의 상관 관계가 있는 현상이 본질적으로 관련되어 있다는 전제는 허위 상관으로 알려진 논리적 오류이다.
상관 관계와 인과 관계를 혼동하는 것은 과학 연구의 재현성을 떨어뜨리는 요인이 된다. 새로운 데이터에는 기존 데이터에서 발견된 특이한 상관 관계가 포함되지 않을 수 있기 때문이다. 과학적 부정행위의 영향과 인과 관계를 찾는 것의 어려움에 대한 논쟁이 진행 중이다.[35] 널리 사용되는 방법론에 대한 비판가들은 연구자들이 인과 관계의 증거를 제시하는 것처럼 보이는 논문을 발표하기 위해 통계적 조작, 즉 P 해킹을 해왔다고 주장한다.[36]
이러한 문제를 방지하기 위해 일부에서는 연구자들이 연구를 수행하기 전에 연구 설계를 미리 등록하여, 통계적으로 유의미하지만 재현 불가능한 발견을 강조하지 않도록 옹호한다.[37]
4. 2. P 해킹
연구자들이 통계적 유의성을 얻기 위해 데이터를 조작하는 행위(P 해킹)는 인과 추론의 신뢰성을 저해한다.[36] 이를 방지하기 위해 일부에서는 연구자들이 연구를 수행하기 전에 연구 설계를 미리 등록하여, 처음에 탐구 대상이 아니었지만 데이터 분석 중에 통계적으로 유의미한 것으로 밝혀진 재현 불가능한 발견을 부주의하게 강조하지 않도록 옹호한다.[37]4. 3. 재현성 문제
상관 관계를 인과 관계로 잘못 해석하면 제3자가 연구 결과를 재현할 수 없는 문제가 발생할 수 있다. 이러한 비재현성은 상관 관계가 일시적으로만 존재하고 본질적인 관계가 없는 메커니즘으로 일반화될 때 나타난다. 즉, 새로운 데이터에는 원래 데이터에 있던 특이한 상관 관계가 없기 때문이다.[35]일부 연구자들이 인과 관계가 있는 것처럼 보이게 하려고 통계적 조작( P 해킹)을 한다는 비판도 제기된다.[36] 이를 막기 위해 연구 수행 전 연구 설계를 미리 등록하여 재현 불가능한 발견을 강조하지 않도록 해야 한다는 주장도 있다.[37]
참조
[1]
논문
Causal inference in statistics: An overview
http://ftp.cs.ucla.e[...]
2009-01-01
[2]
서적
Counterfactuals and Causal inference
Cambridge University Press
[3]
웹사이트
causal inference
http://www.britannic[...]
Encyclopædia Britannica, Inc.
[4]
서적
Research Methods in Psychology
http://www.mhhe.com/[...]
McGraw-Hill Humanities/Social Sciences/Languages
2000
[5]
논문
Seven deadly sins of contemporary quantitative political analysis
https://doi.org/10.1[...]
2014-03-01
[6]
논문
A Narrative Review of Methods for Causal Inference and Associated Educational Resources
https://dx.doi.org/1[...]
2020
[7]
논문
An overview of relations among causal modelling methods
2002-10
[8]
논문
The Environment and Disease: Association or Causation?
http://www.edwardtuf[...]
[9]
간행물
Causal Effect Inference with Deep Latent-Variable Models
2017
[10]
간행물
Nonlinear causal discovery with additive noise models
https://papers.nips.[...]
NIPS
2008
[11]
논문
DirectLiNGAM: A direct method for learning a linear non-Gaussian structural equation model
http://www.jmlr.org/[...]
[12]
간행물
On the identifiability of the post-nonlinear causal model
https://arxiv.org/ab[...]
Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence. AUAI Press
2009
[13]
간행물
Probabilistic latent variable models for distinguishing between cause and effect
http://papers.nips.c[...]
NIPS
2010
[14]
간행물
Towards a learning theory of cause-effect inference
http://www.jmlr.org/[...]
ICML
2015
[15]
서적
Designing social inquiry : scientific inference in qualitative research
Princeton Univ. Press
2012
[16]
논문
After KKV
2010-01
[17]
서적
Designing and Conducting Mixed Methods Research
https://books.google[...]
SAGE Publications
2011
[18]
서적
Multi-Method Social Science by Jason Seawright
https://www.cambridg[...]
Cambridge Core
2016-09
[19]
논문
Effects of Causes and Causes of Effects: Some Remarks from the Sociological Side
2014-02-10
[20]
논문
A Tale of Two Cultures: Contrasting Quantitative and Qualitative Research
2006
[21]
논문
Historical Persistence
https://www.annualre[...]
2022
[22]
논문
The Credibility Revolution in Empirical Economics: How Better Research Design Is Taking the Con out of Econometrics
2010-06
[23]
웹사이트
Theory of Causation - Department of Philosophy - Dietrich College of Humanities and Social Sciences - Carnegie Mellon University
http://www.cmu.edu/d[...]
[24]
서적
Models of Discovery
Springer
[25]
논문
Instrumental Variables and the Search for Identification: From Supply and Demand to Natural Experiments
https://economics.mi[...]
2001
[26]
간행물
Model specification in regression analysis
https://doi.org/10.1[...]
Springer US
1997
[27]
서적
The Philosophy of Causality in Economics: Causal Inferences and Policy Proposals
Routledge
[28]
간행물
Sensitivity Analysis and Model Validation
Springer International Publishing
2016
[29]
웹사이트
Introductory Statistics
https://openstax.org[...]
2013
[30]
논문
The in-principle inconclusiveness of causal evidence in macroeconomics
2018
[31]
서적
Mostly Harmless Econometrics: An Empiricist's Companion
Princeton University Press
[32]
논문
Toward a new political methodology: Microfoundations and ART
2002-06
[33]
논문
The robust beauty of improper linear models in decision making
https://psycnet.apa.[...]
1979
[34]
논문
Causality and causal inference in epidemiology: the need for a pluralistic approach
2016-12
[35]
논문
For and Against Methodologies: Some Perspectives on Recent Causal and Statistical Inference Debates
https://pubmed.ncbi.[...]
2017-01
[36]
뉴스
When the Revolution Came for Amy Cuddy
https://www.nytimes.[...]
2017-10-18
[37]
웹사이트
The Statistical Crisis in Science
https://www.american[...]
2019-04-18
[38]
웹사이트
回帰分析から因果推論へ ―統計的因果推論への誘い
http://www.math.s.ch[...]
Jinfang Wang
2021-04-16
[39]
간행물
因果推論の道具箱
[40]
서적
部分識別入門:計量経済学の革新的アプローチ
日本評論社
[41]
간행물
The Seven Tools of Causal Inference
[42]
간행물
Bayesian Inference of Individualized Treatment Effects using Multi-task Gaussian Processes
[43]
서적
統計的因果探索
講談社
2017
[44]
서적
Counterfactuals and Causal Inference: Methods and Principles for Social Research
Cambridge University Press
[45]
웹사이트
貧困対策 データで実証 開発経済学に新風=高野久紀
https://weekly-econo[...]
エコノミストOnline
2021-11-05
[46]
웹사이트
2021年のノーベル経済学賞に社会の変化と雇用の関係など調べた3人
https://www3.nhk.or.[...]
NHK
2021-11-05
[47]
웹사이트
アセモグル氏ら3氏にノーベル経済学賞、歴史データから検証する政策の「帰結」
https://www.rieti.go[...]
RIETI
2024-11-04
[48]
간행물
政治学における「因果推論革命」の進行
[49]
저널
Causal inference in statistics: An overview
http://ftp.cs.ucla.e[...]
[50]
서적
Counterfactuals and Causal inference
https://archive.org/[...]
[51]
저널
Seven deadly sins of contemporary quantitative political analysis
https://doi.org/10.1[...]
[52]
저널
A Narrative Review of Methods for Causal Inference and Associated Educational Resources
https://dx.doi.org/1[...]
[53]
저널
The Environment and Disease: Association or Causation?
http://www.edwardtuf[...]
2022-04-03
[54]
서적
Designing social inquiry : scientific inference in qualitative research
[55]
저널
After KKV
https://archive.org/[...]
[56]
서적
Designing and Conducting Mixed Methods Research
https://books.google[...]
[57]
서적
Multi-Method Social Science by Jason Seawright
https://www.cambridg[...]
2019-04-18
[58]
저널
Effects of Causes and Causes of Effects: Some Remarks from the Sociological Side
[59]
저널
A Tale of Two Cultures: Contrasting Quantitative and Qualitative Research
[60]
저널
The Credibility Revolution in Empirical Economics: How Better Research Design Is Taking the Con out of Econometrics
[61]
웹인용
Theory of Causation - Department of Philosophy - Dietrich College of Humanities and Social Sciences - Carnegie Mellon University
http://www.cmu.edu/d[...]
2021-02-16
[62]
서적
Models of Discovery
[63]
저널
Instrumental Variables and the Search for Identification: From Supply and Demand to Natural Experiments
https://economics.mi[...]
2022-04-03
[64]
인용
Understanding Regression Analysis
https://doi.org/10.1[...]
[65]
저널
Toward a new political methodology: Microfoundations and ART
[66]
저널
The robust beauty of improper linear models in decision making
https://psycnet.apa.[...]
[67]
저널
Causality and causal inference in epidemiology: the need for a pluralistic approach
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com