맨위로가기

심슨의 역설

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

심슨의 역설은 두 변수의 관계가 하위 그룹으로 나눌 때 반전되는 통계적 현상이다. 예를 들어, A군과 B군이 두 번의 시험에서 B군이 각 시험에서 더 높은 정답률을 보였지만, 전체 점수에서는 A군이 더 높은 경우이다. 이는 신장 결석 치료법, 캘리포니아 대학교 버클리 입학 성차별 연구, 야구 타율 등 다양한 사례에서 나타난다. 심슨의 역설은 2차원 벡터 공간으로 설명되기도 하며, 변수 간의 상관관계와 숨겨진 변수의 영향, 데이터 계층화 방식에 따라 발생할 수 있다. 심슨의 역설은 혼동 변수를 제대로 고려하지 않거나 변수 간의 인과 관계를 간과하여 발생한다는 비판도 있으며, 데이터 해석 시 혼동 변수와 인과 관계를 신중하게 고려해야 함을 강조한다. 심리학적으로는 사람들이 부호 반전을 불가능하다고 여기는 이유를 설명하며, 인과적 논리에 의해 뒷받침된다고 본다.

더 읽어볼만한 페이지

  • 확률론의 역설 - 생일 문제
    생일 문제는 임의의 집단에서 생일이 같은 두 사람이 존재할 확률을 계산하는 문제로, 23명만 되어도 생일이 같은 사람이 있을 확률이 50%를 넘으며, 암호 시스템 등 다양한 분야에 응용된다.
  • 확률론의 역설 - 몬티 홀 문제
    몬티 홀 문제는 세 개의 문 중 하나를 선택한 후 진행자가 상품이 없는 문을 열어 보여줄 때, 선택을 바꾸는 것이 유리한지를 묻는 확률 문제로, 직관과 달리 선택을 바꾸는 것이 당첨 확률을 높이는 전략임을 보여주는 확률 역설이며, 의사 결정 방식에 대한 통찰을 제공한다.
심슨의 역설
개요
이름심슨의 역설
다른 이름율-심슨 효과 (Yule–Simpson effect)
병합 역설 (amalgamation paradox)
반전 역설 (reversal paradox)
분야통계학, 인과추론
최초 언급Karl Pearson (1899년)
G. U. Yule (1903년)
중요 기여Edward H. Simpson (1951년)
설명그룹별로 존재하는 추세가, 그룹을 합쳤을 때 반대로 나타나는 현상
상세 내용
정의여러 그룹에서 관찰되는 경향이, 그룹을 결합했을 때 반대로 나타나거나 사라지거나 약화되는 현상.
전체 데이터에서 나타나는 경향과 부분 데이터에서 나타나는 경향이 다를 수 있음.
원인누락된 변수 (혼란 변수)가 존재하고, 이 변수가 결과와 원인 모두에 영향을 미칠 때 발생.
중요성통계적 결론을 내릴 때 그룹화를 신중하게 고려해야 함을 강조. 인과 관계 추론의 복잡성을 보여주는 예시.
예시신장 결석 치료 방법 선택 시, 작은 결석에는 A 치료법이, 큰 결석에는 B 치료법이 더 효과적이지만, 전체 환자에게는 B 치료법이 더 효과적인 것처럼 보이는 경우.
대학 입학률 분석 시, 남녀별 입학률은 여성이 높지만, 전체 입학률은 남성이 높은 것처럼 보이는 경우.
관련 개념혼란 변수
인과 관계
통계적 유의성
상관 관계
확률
참고 문헌Wagner, Clifford H. (1982). "Simpson's Paradox in Real Life". The American Statistician, 36(1), 46–48.
Franks, Alexander; Airoldi, Edoardo; Slavov, Nikolai (2017). "Post-transcriptional regulation across human tissues". PLOS Computational Biology, 13(5), e1005535.
Blyth, Colin R. (1972). "On Simpson's Paradox and the Sure-Thing Principle". Journal of the American Statistical Association, 67(338), 364–366.
Good, I. J.; Mittal, Y. (1987). "The Amalgamation and Geometry of Two-by-Two Contingency Tables". The Annals of Statistics, 15(2), 694–711.
Ellenberg, Jordan (2021). Shape: The Hidden Geometry of Information, Biology, Strategy, Democracy and Everything Else. Penguin Press.
추가 정보심슨의 역설은 데이터 분석 및 해석 시 주의해야 할 함정을 보여주는 대표적인 사례임.
통계적 결론은 반드시 맥락과 함께 고려되어야 함.

2. 사례

심슨의 역설은 전체 결과를 합쳐서 냈을 때, 각 부분을 나눠서 낸 결과와 다른 결과가 나오는 현상을 말한다.

A군과 B군이 두 번에 걸쳐 테스트를 본 사례를 통해 심슨의 역설을 설명할 수 있다.

'''정답률과 우열 비교표'''

A군B군우열
1회60/100 = 60%9/10 = 90%A군 < B군
2회1/10 = 10%30/100 = 30%A군 < B군
합계61/110 = 55%39/110 = 35%A군 > B군



위 표와 같이 각 시험에서는 B군의 정답률이 높았지만, 전체를 합치면 A군의 정답률이 더 높아지는 역설적인 결과가 나타난다. 이는 심슨의 역설의 한 예시이다.

이러한 결과는 A군과 B군이 '똑같은 110문제를 풀었다'는 가정 하에서만 의미가 있다. 현실에서는, 예를 들어 고객 만족도 조사와 같이, A군과 B군이 담당하는 대상(고객)이 서로 다를 수 있기 때문에 위와 같이 단순하게 결과를 비교하기는 어렵다.

총점을 기준으로 A군이 더 낫다고 판단할 수도 있지만, 다른 관점에서는 B군이 더 낫다고 볼 수도 있다. 예를 들어, A군과 B군이 의사이고 환자의 중증도에 따라 치료 결과를 비교하는 경우, B군이 중증 환자를 더 많이 담당했다면 전체 치료 성적은 낮아질 수 있지만, 각 그룹별 치료 성적은 B군이 더 좋을 수 있다.

2. 1. 신장 결석 치료법

심슨의 역설을 보여주는 사례 중 하나는 신장 결석 치료법에 관한 의학 연구이다.[44][45]

아래 표는 작은 크기의 신장 결석과 큰 크기의 신장 결석에 대해 두 가지 치료법(A, B)을 적용한 결과 성공률을 나타낸 것이다. 치료법 A는 개방 외과 수술을 포함하고, 치료법 B는 비개방 외과 수술을 포함한다.

결석 크기치료법 A치료법 B
작은 결석93% (81/87)87% (234/270)
큰 결석73% (192/263)69% (55/80)
모두78% (273/350)83% (289/350)



표에서 볼 수 있듯이, 작은 결석과 큰 결석 모두에서 치료법 A의 성공률이 높게 나왔다. 하지만 결석의 크기를 구분하지 않고 합친 경우에는 치료법 B의 성공률이 더 높게 나타났다.

이는 결석의 크기라는 숨겨진 변수(혼재변수)가 각 치료법의 성공률에 영향을 미쳤기 때문이다. 결석의 크기에 따라 성공률 자체가 달라지며, 환자의 특성(결석 크기 등)에 따라 선택하는 치료법이 달라진다는 점[45]이 심슨의 역설 현상을 낳게 하였다.

의사들은 큰 결석 환자에게는 더 나은 치료법 A를, 작은 결석 환자에게는 치료법 B를 적용하는 경향이 있었다. 결석 크기가 클수록 치료 성공률이 낮아지는 경향이 있는데, 치료법 A가 더 어려운 케이스에 적용되었음에도 불구하고 개별적으로는 더 좋은 결과를 보인 것이다. 그러나 전체적으로 보면 치료법 B가 더 쉬운 케이스(작은 결석)에 많이 적용되어 성공률이 높아 보이는 착시가 발생한 것이다.[18]

제인스는 신장 결석 크기가 치료법 선택보다 더 중요하다는 것이 올바른 결론이며, 그럼에도 치료법 A가 B보다 더 좋다고 주장한다.[19]

2. 2. UC 버클리 성차별

심슨의 역설의 예로 캘리포니아 대학교 버클리 대학원 입학 지원자들의 성차별 연구 사례가 있다.[15][16] 1973년 가을 입학 자료를 보면 남성이 여성보다 입학할 가능성이 높았고, 그 차이가 커서 우연의 일치로 보기 어려웠다.[15][16]

전체 지원자합격률
남성8,44244%
여성4,32135%
전체12,76341%



하지만, 지원한 학과별로 자료를 분석하면, 학과별 입학 난이도 차이를 확인할 수 있었다. 여성은 합격률이 낮은 경쟁이 치열한 학과(예: 영어학과)에 지원하는 경향이 있었고, 남성은 합격률이 높은 덜 경쟁적인 학과(예: 공학과)에 지원하는 경향이 있었다. 이를 고려하여 보정한 데이터에서는 "여성에게 유리한 작지만 통계적으로 유의미한 편견"이 나타났다.[16]

6개의 가장 큰 학과의 데이터는 다음과 같다.

학과남성 지원자남성 합격률여성 지원자여성 합격률
A82562%10882%
B56063%2568%
C32537%59334%
D41733%37535%
E19128%39324%
F3736%3417%



전체 85개 학과 중 4개 학과가 여성에게, 6개 학과가 남성에게 유의미하게 편향되어 있었다. 하지만, 이는 학과별 편향의 개수가 아닌, 각 학과의 모든 지원자에 대한 거부율로 가중치를 부여하여 전체 학과의 성별 입학을 통합한 결과이다.[16]

2. 3. 야구 타율

프로 야구 선수들의 타율과 관련하여 심슨의 역설의 흔한 예시를 들 수 있다. 어떤 선수가 여러 해 동안 다른 선수보다 매년 더 높은 타율을 기록했지만, 그 모든 해를 통틀어 더 낮은 타율을 기록할 수 있다. 이러한 현상은 각 해마다 타석 수의 큰 차이가 있을 때 발생할 수 있다. 수학자 켄 로스는 1995년과 1996년 데릭 지터데이비드 저스티스 두 야구 선수의 타율을 사용하여 이를 증명했다.[20][21]

타자1995년1996년합계
데릭 지터12/48 (0.250)183/582 (0.314)195/630 (0.310)
데이비드 저스티스104/411 (0.253)45/140 (0.321)149/551 (0.270)



1995년과 1996년 모두, 저스티스는 지터보다 더 높은 타율(굵은 글씨)을 기록했다. 그러나 두 야구 시즌을 합산하면, 지터가 저스티스보다 더 높은 타율을 보인다. 로스에 따르면, 이러한 현상은 가능한 선수 쌍 중 1년에 약 한 번 관찰될 것이다.[20]

2. 4. 시험 정답률 (일본어 위키 예시)

A군과 B군이 1회와 2회에 걸쳐 총 110문제를 푸는 테스트를 치렀다. 1회 테스트에서 A군은 100문제 중 60문제를 맞혔고, B군은 10문제 중 9문제를 맞혔다. 2회 테스트에서 A군은 10문제 중 1문제를, B군은 100문제 중 30문제를 맞혔다.

'''정답률과 우열 일람표'''

A군B군우열 판단
1회60/100 = 60%9/10 = 90%A군 < B군
2회1/10 = 10%30/100 = 30%A군 < B군
합계61/110 = 55%39/110 = 35%A군 > B군



위 표에서 다음을 알 수 있다.


  • 1회 테스트에서 B군의 정답률이 더 높았다.
  • 2회 테스트에서도 B군의 정답률이 더 높았다.
  • 하지만 두 테스트를 합한 총점(총 득점)으로 보면, '''A군의 정답률이 더 높다'''는 결과가 나왔다.


1회에서 A군 < B군이고, 2회에서도 A군 < B군이라면, 1회와 2회를 합쳐도 A군 < B군일 것이라고 생각하기 쉽다. 하지만 실제로는 '''A군 > B군'''이 된다. 이 점에서 이 예시는 "심슨의 역설"의 한 예이다.

물론 이것은 A군과 B군이 "전혀 같은 내용의 110문제 테스트를 치렀다"는 가정 하에서만 유효하다. 예를 들어 110명의 고객 대응에 대한 재구매율이나 고객 만족 설문조사 답변 집계 등 현실적인 통계 처리에서는, A군의 고객 110명과 B군의 고객 110명은 동일한 고객이 아닌 경우가 보통이므로, 위와 같은 단순한 평가는 어려워진다.

총 득점을 기준으로 하면 A군이 더 낫다고 생각할 수 있다. 하지만 다음 예시처럼 B군이 더 낫다고 말할 수도 있다.

A군과 B군은 의사로서 병원에서 치료를 하고 있다. 환자는 중등증과 중증 2개 그룹으로 나누어 치료 성적을 테스트했다. B군은 중등증, 중증 두 그룹 모두 A군보다 치료 성적이 좋았지만, 전체 치료 성적은 좋지 않았다. 그 이유는 B군의 환자는 대부분이 중증이었고(100/110), A군의 환자는 대부분이 중등증(100/110)이었기 때문이다. 따라서 A군의 치료 성적이 좋았다는 결론은 논리적으로 오류이다.

위 이야기에서 A군과 B군의 상황은 앞선 테스트 이야기에서 전혀 변경되지 않았다. 이러한 문제는 최근 문헌에서 심슨의 역설로 논의된 문제이다.

3. 벡터 해석

심슨의 역설의 벡터 해석


심슨의 역설은 2차원 벡터 공간을 사용하여 설명할 수도 있다.[22] 성공률 \frac{p}{q} (''성공/시도'')는 벡터 \vec{A} = (q, p)로 표현할 수 있으며, 기울기\frac{p}{q}이다. 기울기가 가파른 벡터는 더 높은 성공률을 나타낸다. 위에 제시된 예와 같이 두 비율 \frac{p_1}{q_1}\frac{p_2}{q_2}가 결합되면, 그 결과는 벡터 (q_1, p_1)(q_2, p_2)의 합으로 표현할 수 있으며, 이는 평행사변형 규칙에 따라 기울기가 \frac{p_1 + p_2}{q_1 + q_2}인 벡터 (q_1 + q_2, p_1 + p_2)이다.

심슨의 역설은 벡터 \vec{L}_1 (그림에서 주황색)의 기울기가 다른 벡터 \vec{B}_1 (파란색)보다 작고 \vec{L}_2의 기울기가 \vec{B}_2보다 작더라도, 두 벡터의 합 \vec{L}_1 + \vec{L}_2는 두 벡터의 합 \vec{B}_1 + \vec{B}_2보다 기울기가 더 클 수 있다는 것을 보여준다. 이러한 현상이 발생하려면 주황색 벡터 중 하나가 파란색 벡터 중 하나보다 더 큰 기울기를 가져야 하며(여기서는 \vec{L}_2\vec{B}_1), 일반적으로 교차된 첨자를 가진 다른 벡터보다 더 길어 전체 비교에서 우위를 차지하게 된다.

4. 변수 간 상관관계

심슨의 역설은 두 변수 사이에 양의 상관관계가 있는 것처럼 보여도, 실제로는 음의 상관관계가 존재할 수 있음을 보여준다. 이는 숨겨진 교란 변수의 영향으로 발생한다. Berman 외의 연구[23]에서는 경제학 분야의 예시를 제시한다. 일반적으로 수요와 가격은 반비례 관계를 가지지만, 특정 데이터 세트에서는 가격이 높을수록 수요도 증가하는 양의 상관관계가 나타났다. 그러나 분석 결과, '시간'이라는 교란 변수가 작용하고 있음이 밝혀졌다. 시간 경과에 따른 가격과 수요 변화를 함께 고려하면 예상대로 음의 상관관계가 나타났지만, 시간 요인을 무시하고 가격과 수요만 비교하면 양의 상관관계로 왜곡되는 현상이 발생했다.

A군과 B군이 두 번의 시험을 통해 총 110문제를 푸는 테스트를 치른 경우를 예시로 들어보자.

'''정답률과 우열 비교표'''

A군B군우열
1회60/100 = 60%9/10 = 90%A군 < B군
2회1/10 = 10%30/100 = 30%A군 < B군
합계61/110 = 55%39/110 = 35%A군 > B군



위 표를 보면, 1회와 2회 시험 모두 B군의 정답률이 높았다. 하지만 두 시험을 합산한 전체 정답률은 A군이 더 높게 나타나는 역설적인 결과가 나타났다.

이는 A군과 B군이 동일한 110문제를 풀었다는 가정 하에서만 유효하다. 예를 들어 고객 응대 후 재구매율이나 고객 만족도 조사와 같이 A군과 B군이 응대한 고객이 서로 다른 경우에는 위와 같은 단순 비교는 어렵다.

총점을 기준으로 A군이 더 우수하다고 판단할 수도 있지만, 다른 관점에서는 B군이 더 낫다고 볼 수도 있다. 예를 들어, A군과 B군이 의사로서 중등증 환자와 중증 환자를 치료하는 상황을 가정해 보자. B군은 중등증, 중증 환자 모두에게서 A군보다 치료 성적이 좋았지만, 전체 치료 성적은 낮게 나타났다. 이는 B군의 환자 대부분이 중증(100/110)이었던 반면, A군의 환자는 대부분 중등증(100/110)이었기 때문이다. 따라서 A군의 치료 성적이 더 좋았다는 결론은 논리적으로 오류일 수 있다.

심슨이 제시한 예시에서는 관련성의 역전이 나타나지 않는다.

트럼프 카드 52장을 예로 들어보자. 그림 카드(잭, 퀸, 킹) 여부와 색상(스페이드, 클럽은 검정, 하트, 다이아몬드는 빨강) 간의 관계를 살펴보자. 일부 카드가 더러워진 경우, 더러워진 카드와 더러워지지 않은 카드 각각에서는 그림 카드가 아닌 카드가 빨간색일 확률이 높게 나타난다. 하지만 카드 전체를 살펴보면, 그림 카드 여부와 색상 간에는 관련성이 없다는 "분별 있는 답"을 얻을 수 있다.

치료 유무와 생존 간의 관계를 남성과 여성으로 나누어 분석하는 경우에도 비슷한 현상이 나타난다. 남성과 여성 각각에서는 치료를 받은 쪽의 생존율이 높게 나타나지만, 전체를 합쳐서 보면 치료 유무와 생존 간의 관련성이 사라진다.

en은 이러한 예시들을 통해 심슨의 역설에 대한 해석을 제시한다.[35]


  • 트럼프 카드 예시에서, 오염 유무(C)는 그림 카드 여부(A)와 카드 색상(B)의 공통된 결과, 즉 합류점이다. (A \rightarrow C \leftarrow B )
  • 치료 예시에서, 성별(C)은 치료 유무(A)와 생사(B)의 공통된 원인, 즉 교락 인자이다. (A \leftarrow C \rightarrow B )


트럼프 카드 예시에서는 합류점에 의한 선택 편향을 피하기 위해 카드 전체를 살펴봐야 하고, 치료 예시에서는 교락을 피하기 위해 성별로 층화하여 생각해야 한다.

결론적으로, 동일한 데이터라도 인과 구조에 따라 다른 분석이 필요하며, 유익한 인과 추론을 위해서는 통계학적 지식뿐만 아니라 해당 주제에 대한 인과 관계 지식이 필요하다.[36]

5. 심슨의 두 번째 역설

심슨의 역설 논문(1951)에서는 덜 알려진 두 번째 역설도 다루고 있다. 이 역설은 신장 결석 예시처럼 "합리적인 해석"이 분리된 데이터에서는 보이지 않고, 결합된 데이터에서 나타나는 경우에 발생한다. 데이터를 어떻게 나누고 합치느냐에 따라 결과가 달라질 수 있다는 것이다. 어떤 데이터를 사용해야 하는지는 데이터를 생성하는 과정에 달려 있으며, 단순히 표를 보는 것만으로는 올바른 해석을 할 수 없음을 의미한다.[26]

주디아 펄은 분할된 데이터가 두 변수 XY 사이의 올바른 인과 관계를 나타내려면, 분할 변수가 "백도어 기준"이라는 조건을 만족해야 한다고 설명했다.[27][28] 이 기준은 다음 두 가지로 구성된다.

# 분할 변수는 XY 사이의 모든 가짜 경로를 차단해야 한다.

# 어떤 변수도 X의 영향을 받아서는 안 된다.

이 기준은 심슨의 두 번째 역설에 대한 해결책을 제시하며, 데이터만으로는 올바른 해석을 할 수 없는 이유를 설명한다. 데이터와 맞아떨어지지만 서로 다른 두 그래프가 서로 다른 백도어 기준을 정할 수 있기 때문이다.

공변량 집합 ''Z''가 백도어 기준을 만족하면 조정 공식(교란변수)을 통해 ''X''가 ''Y''에 미치는 올바른 인과적 효과를 얻을 수 있다. 만약 그런 집합이 없다면, 펄의 ''do''-미적분학을 사용하여 인과적 효과를 추정하는 다른 방법을 찾을 수 있다.[4][29] ''do''-미적분학의 완전성[30][29]은 심슨의 역설에 대한 완전한 해결책을 제공하는 것으로 여겨진다.

5. 1. 심슨의 예시 (트럼프 카드와 치료)

심슨 본인이 제시한 예에서는 관련성의 역전이 보이지 않는다.

52장의 트럼프 카드를 생각해 보자. 그림 카드(잭, 퀸, 킹)인지 여부와 색상(스페이드와 클럽은 검정, 하트와 다이아몬드는 빨강) 사이에 어떤 관련성이 있을까? 아기가 이 카드로 놀아서 그중 20장 정도가 더러워졌다. 더러워진 카드만 보거나, 더러워지지 않은 카드만 보면, 그림 카드가 아닌 쪽이 빨간 카드일 가능성이 높다는 것을 알 수 있다. 그렇다면 "그림 카드가 아닌 쪽이 빨간 카드일 가능성이 높다"고 결론내도 될까? 카드 전체를 살펴봄으로써 "분별 있는 답"(sensible answer)을 얻을 수 있다. 즉, 그러한 관계는 없다.

더러워진 카드
그림 카드그림 카드 아님
빨강4/528/52
검정3/525/52



더러워지지 않은 카드
그림 카드그림 카드 아님
빨강2/5212/52
검정3/5215/52



카드 전체
그림 카드그림 카드 아님
빨강6/5220/52
검정6/5220/52



어떤 치료의 유무와 생존 간의 관련성을 남녀별로 검토해 보자. 나오는 숫자는 트럼프 카드의 예와 완전히 같다. 남녀별로 조사하면, 치료를 받은 쪽이 생존율이 높다는 것을 알 수 있다. 그러나 남녀를 합하면 치료 유무와 생존 간의 관련성이 없어진다. "분별 있는 해석"(sensible interpretation)은 어떻게 될까? 이 치료가 무효라고 여겨지는 일은 거의 없을 것이다.

남성
치료 없음치료 있음
생존4/528/52
사망3/525/52



여성
치료 없음치료 있음
생존2/5212/52
사망3/5215/52



대상 집단 전체
치료 없음치료 있음
생존6/5220/52
사망6/5220/52



미겔 에르난영어은 이 예에 대해 심슨 본인의 기술에 모호성이 있음을 지적하면서도 다음과 같은 해석을 제시한다.[35]

트럼프 카드의 예에서는 오염 유무 (C)가 그림 카드 여부 (A)와 카드 색상 (B)의 공통된 결과, 즉 합류점이다.

:A \rightarrow C \leftarrow B

치료의 예에서는 성별 (C)이 치료 유무 (A)와 생사 (B)의 공통된 원인, 즉 교락 인자이다.

:A \leftarrow C \rightarrow B

트럼프 카드의 예에서는 합류점에 의한 선택 편향을 피하기 위해 카드 전체를 살펴봐야 하고, 치료의 예에서는 교락을 피하기 위해 성별로 층화해서 생각해야 한다. 다만, C가 A와 관계없이 B의 원인이 될 때(예를 들어 무작위 할당이 이루어진 경우)에는 층화할 필요는 없다. 인과 관계의 방향성을 기반으로 분석 기법을 검토하지만, 인과 관계의 방향에 대해서는 그 주제에 관한 인과 구조에 대한 지식이 필요하다. 트럼프 카드가 더러워졌다고(C) 해서 그림 카드가 되거나(A) 빨간 카드가 되거나(B) 하는 것은 아니고, 치료를 했다고(A) 해서 또는 생존했다고(B) 해서 남성이 되는(C) 일은 없다.

그리고 다음과 같이 결론짓고 있다.[36]


  • 같은 데이터라도 다른 인과 구조에서 기인한 것이라면 다른 분석이 필요하다.
  • 유익한 인과 추론을 하기 위해서는 통계학뿐만 아니라 주제에 관한 인과 관계에 대한 지식이 필요하다.

6. 비판

심슨의 역설에 대한 한 가지 비판은 이 역설이 실제로는 역설이 아니라, 혼동 변수를 제대로 고려하지 못하거나 변수 간의 인과 관계를 고려하지 못한 데서 비롯된 것이라는 점이다.[31]

또 다른 비판은 데이터가 특정 방식으로 계층화되거나 그룹화된 결과일 수 있다는 것이다. 데이터가 다르게 계층화되거나 다른 혼동 변수가 고려될 경우 이 현상은 사라지거나 심지어 반전될 수도 있다. 심슨의 예는 실제로 비축약성[32]이라고 하는 현상을 강조했는데, 이는 비율이 높은 하위 그룹이 결합될 때 단순한 평균을 만들지 못하는 경우에 발생한다. 이는 역설이 보편적인 현상이 아니라, 더 일반적인 통계적 문제의 특정 사례일 수 있음을 시사한다.

비판론자들은 또한, 이 역설에 대한 초점이 데이터를 해석할 때 혼동 변수와 인과 관계를 신중하게 고려해야 하는 등 더 중요한 통계적 문제에서 주의를 분산시킬 수 있다고 주장한다.[33]

이러한 비판에도 불구하고, 심슨의 역설은 통계 및 데이터 분석에서 여전히 인기 있고 흥미로운 주제로 남아 있다. 다양한 분야의 연구자들과 실무자들에 의해 지속적으로 연구되고 논쟁되고 있으며, 신중한 통계 분석의 중요성과 데이터에 대한 단순한 해석의 잠재적인 함정을 상기시켜주는 가치 있는 역할을 한다.

7. 심리학적 관점

심슨의 역설에 대한 심리학적 관심은 사람들이 부호 반전을 처음에는 불가능하다고 여기는 이유를 설명하려는 데 있다. 문제는 사람들이 이러한 강력한 직관을 어디에서 얻는지, 그리고 그것이 마음 속에 어떻게 인코딩되는가이다.

심슨의 역설은 이러한 직관이 고전 논리나 확률 계산만으로는 도출될 수 없음을 보여주며, 따라서 철학자들은 그것이 사람들의 행동과 그 결과에 대한 추론을 안내하는 타고난 인과적 논리에 의해 뒷받침된다고 추측하게 했다.[4] 새비지의 확실성 원리[12]는 그러한 논리가 무엇을 수반할 수 있는지 보여주는 한 예시이다. 새비지의 확실성 원리의 수정된 버전은 실제로 펄의 ''do''-계산법[4]으로부터 도출될 수 있으며 다음과 같이 읽힌다. "사건 ''B''의 확률을 전체 모집단에서 ''C''의 각 하위 모집단 ''Ci''에서 증가시키는 행동 ''A''는, 그 행동이 하위 모집단의 분포를 변경하지 않는다는 조건 하에, 전체 모집단에서도 ''B''의 확률을 증가시켜야 한다." 이는 행동과 결과에 대한 지식이 베이즈 네트워크와 유사한 형태로 저장됨을 시사한다.

참조

[1] 간행물 Simpson's Paradox in Real Life 1982-02
[2] 논문 Potential Simpson's paradox in multicenter study of intraperitoneal chemotherapy for ovarian cancer. http://jco.ascopubs.[...] 2016
[3] 간행물 Post-transcriptional regulation across human tissues
[4] 서적 Causality: Models, Reasoning, and Inference Cambridge University Press 2000
[5] 논문 Simpson's paradox, moderation and the emergence of quadratic relationships in path models: An information systems illustration. http://cits.tamiu.ed[...] 2016
[6] 문서 Simpson's paradox in psychological science: a practical guide https://doi.org/10.3[...]
[7] 뉴스 Simpson's Paradox and the Hot Hand in Basketball The American Statistician 1995-02
[8] 서적 Categorical Data Analysis John Wiley and Sons 2002
[9] 간행물 The Interpretation of Interaction in Contingency Tables
[10] 간행물 Genetic (reproductive) selection: Inheritance of fertility in man, and of fecundity in thoroughbred racehorses
[11] 간행물 Notes on the Theory of Association of Attributes in Statistics https://zenodo.org/r[...]
[12] 간행물 On Simpson's Paradox and the Sure-Thing Principle 1972-06
[13] 간행물 The Amalgamation and Geometry of Two-by-Two Contingency Tables 1987-06
[14] 서적 Shape: The Hidden Geometry of Information, Biology, Strategy, Democracy and Everything Else https://www.worldcat[...] Penguin Press 2021-05-25
[15] 서적 Statistics W. W. Norton & Company 2007
[16] 간행물 Sex Bias in Graduate Admissions: Data From Berkeley http://homepage.stat[...]
[17] 간행물 Comparison of treatment of renal calculi by open surgery, percutaneous nephrolithotomy, and extracorporeal shockwave lithotripsy 1986-03-29
[18] 간행물 Confounding and Simpson's paradox http://bmj.bmjjourna[...] 1994-12-03
[19] 서적 Probability theory: the logic of science Cambridge University Press 2003
[20] 서적 A Mathematician at the Ballpark: Odds and Probabilities for Baseball Fans (Paperback) Pi Press 2004
[21] 웹사이트 Data for Derek Jeter https://www.baseball[...]
[22] 간행물 Proofs without Words: Simpson's Paradox http://www.math.siu.[...]
[23] 간행물 Simpson's Paradox: A Cautionary Tale in Advanced Analytics http://www.statslife[...] 2012
[24] 간행물 How Likely is Simpson's Paradox? 2009-08
[25] 논문 How likely is Simpson's paradox in path models? http://cits.tamiu.ed[...] 2015
[26] 간행물 Simpson's paradox ... and how to avoid it 2015-08
[27] 간행물 Understanding Simpson's Paradox
[28] 간행물 Graphical Models, Causality, and Intervention
[29] 서적 The Book of Why: The New Science of Cause and Effect Basic Books 2018
[30] 간행물 Identification of Conditional Interventional Distributions AUAI Press 2006
[31] 간행물 On Simpson's Paradox and the Sure-Thing Principle http://www.tandfonli[...] 1972-06
[32] 간행물 Noncollapsibility, confounding, and sparse-data bias. Part 2: What should researchers make of persistent controversies about the odds ratio? https://www.jclinepi[...] 2021-11-01
[33] 간행물 The Simpson's paradox unraveled 2011-06
[34] 간행물 The Interpretation of Interaction in Contingency Tables. http://math.bme.hu/~[...] 2020-10-17
[35] 간행물 The Simpson's paradox unraveled https://doi.org/10.1[...] 2020-10-17
[36] 트윗 I thought I understood Simpson's paradox until I read Simpson’s paper. Turn out to be more interesting than expected 2021-08-12
[37] 논문 Simpson's Paradox in Real Life 1982-02
[38] 간행물 Potential Simpson's paradox in multicenter study of intraperitoneal chemotherapy for ovarian cancer. http://jco.ascopubs.[...] Holt, G. B. 2016
[39] 논문 Post-transcriptional regulation across human tissues
[40] 논문 The Interpretation of Interaction in Contingency Tables
[41] 논문 Genetic (reproductive) selection: Inheritance of fertility in man, and of fecundity in thoroughbred racehorses
[42] 논문 Notes on the Theory of Association of Attributes in Statistics https://zenodo.org/r[...]
[43] 논문 On Simpson's Paradox and the Sure-Thing Principle https://archive.org/[...] 1972-06
[44] 논문 Comparison of treatment of renal calculi by open surgery, percutaneous nephrolithotomy, and extracorporeal shockwave lithotripsy 1986-03-29
[45] 논문 Confounding and Simpson's paradox http://bmj.bmjjourna[...] 1994-12-03
[46] 논문 Proofs without Words: Simpson's Paradox http://lagrange.math[...]



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com