맨위로가기

상관관계와 인과관계

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

상관관계와 인과관계는 두 변수 간의 연관성을 나타내는 개념으로, 상관관계가 있다고 해서 반드시 인과관계가 성립하는 것은 아니다. 상관관계는 통계적 지표로, 인과는 한 변수가 다른 변수의 원인이 되는 관계를 의미한다. 인과관계는 상관관계의 충분 조건이지만, 상관관계가 인과관계를 함의하는 것은 아니며, 제3의 변수, 인과관계의 역전, 우연의 일치 등의 이유로 상관관계만으로 인과관계를 단정할 수 없다. 인과관계를 판정하기 위해서는 반사실적 의존 관계를 고려하거나, 과학적 실험 및 통계적 방법을 통해 증거를 확보해야 한다.

더 읽어볼만한 페이지

  • 인과관계의 오류 - 미끄러운 비탈길 논증
    미끄러운 비탈길 논증은 특정 행위를 금지하기 위해 그 행위가 용납할 수 없는 결론으로 이어질 것이라고 주장하는 논증 방식이며, 정치적 논쟁에서 부정적인 결과를 초래할 수 있다는 주장에 사용되고, 개념적, 결정적, 인과적 유형으로 나뉜다.
  • 인과관계의 오류 - 피해자 비난
    피해자 비난은 피해자의 행동이나 특성에서 사건의 원인을 찾는 현상으로, 사회 부조리를 정당화하는 이데올로기이며, 다양한 요인에 의해 전 세계적으로 발생하고 법적 문제를 야기하기도 한다.
  • 라틴어 논리학 구 - 인신 공격
    인신 공격은 논쟁에서 상대방의 주장이 아닌 인격이나 배경을 공격하여 주장의 타당성을 훼손하려는 시도로, 다양한 형태로 나타나며 정치 및 여론에서 활용되기도 하지만 언어 폭력과는 구별되고 일부 지역에서는 축제로 이어지기도 한다.
  • 라틴어 논리학 구 - 전통에 호소하는 논증
    전통에 호소하는 논증은 어떤 주장이나 관행이 오랫동안 지속되었다는 이유만으로 그것이 옳다고 주장하는 비형식적 오류이다.
  • 인과관계 - 도미노 효과
    도미노 효과는 작은 간격으로 세워진 도미노들이 연쇄적으로 넘어지는 현상으로, 위치 에너지 시각화 도구, 루브 골드버그 장치, 수학적 귀납법 설명 등에 활용되며, 기네스 세계 기록, 관련 방송 프로그램, 장기 이식의 효율성을 높이기 위한 도미노 이식 등 다양한 분야에서 응용된다.
  • 인과관계 - 연쇄반응
    연쇄 반응은 분자 반응으로 생성물과 불안정한 분자가 생성되어 추가 반응을 촉발하는 과정으로, 화학, 핵반응, 기체 내 전자 사태, 반도체 항복, 생명체 내 반응 등에서 관찰되며 개시, 성장, 종결 단계를 거친다.
상관관계와 인과관계
개요
주제상관관계가 인과관계를 의미하지 않음
설명두 변수 사이의 상관관계가 있다고 해서 반드시 한 변수가 다른 변수의 변화를 일으키는 것은 아님
관련 개념가짜 상관
제3의 변수 문제
역인과관계
데이터 오염
선택 편향
심슨의 역설
인과관계 추론
양자택일 오류
예시
아이스크림 판매와 범죄율아이스크림 판매량과 범죄율 사이의 상관관계가 있지만, 이는 둘 다 여름이라는 요인에 의해 영향을 받기 때문임
부모의 이름과 자녀의 성공부모의 이름이 자녀의 성공과 관련이 있을 수 있지만, 이는 부모의 사회경제적 지위와 교육 수준 때문일 가능성이 높음
의약품과 질병 호전특정 의약품을 복용한 환자들이 질병이 호전되었다고 해서 반드시 그 의약품이 효과가 있다는 것을 의미하지는 않음. 자연적인 치유 또는 다른 요인에 의한 효과일 수 있음
더 많은 소방관이 화재 현장에 투입될수록 화재 피해가 커짐더 많은 소방관이 투입되는 것은 화재 규모가 크기 때문이며, 소방관 수가 피해를 유발하는 원인이 아님
통계적 함정
가짜 상관두 변수 사이에 실제로는 아무런 관계가 없지만, 통계적으로 상관관계가 있는 것처럼 보이는 현상
제3의 변수 문제두 변수 모두에 영향을 미치는 제3의 변수가 존재하여, 두 변수 사이에 상관관계가 있는 것처럼 보이는 현상
데이터 오염데이터 수집 또는 분석 과정에서 오류가 발생하여, 잘못된 상관관계가 나타나는 현상
선택 편향표본 선택 과정에서 특정 집단이 과대 또는 과소 대표되어, 잘못된 상관관계가 나타나는 현상
심슨의 역설전체 데이터에서는 특정 상관관계가 나타나지만, 데이터를 세분화하면 그 상관관계가 사라지거나 반대로 나타나는 현상
인과관계 추론 시 고려 사항
시간적 선후 관계원인이 결과보다 먼저 발생해야 함
일관성동일한 상황에서 반복적으로 동일한 결과가 나타나야 함
합리성인과관계가 이론적으로 타당해야 함
강도원인과 결과 사이의 관계가 강해야 함
배제다른 가능한 원인들을 배제할 수 있어야 함

2. 상관관계와 인과관계

넓게 연구된 예로서 호르몬 보충 요법(HRT)을 실시하고 있는 여성으로의 관상 동맥성 심장병(CHD)의 발생율이 낮은 것으로부터, HRT가 CHD 예방에 효과가 있다는 제안이 이루어졌던 적이 있다. 그러나 대조 시험을 가 보면, HRT에 의해서 CHD의 리스크가 약간이지만 분명하게 의미가 있는 증가를 나타냈다. 데이터를 재검토해 보면, HRT를 받고 있던 여성은 상류계급의 부인이 대부분, 다이어트나 운동을 자주 가고 있던 것을 알 수 있었다. 즉, HRT를 받는 것으로 CHD 발증율이 낮은 것은 공통의 원인의 결과이며, 양자에게 제안된 것 같은 원인과 결과의 관계는 존재하지 않는다[38].

수학적으로는 "Correlation does not ''imply'' causation" (상관은 인과를 함축하지 않는다)는 올바르다. 논리학에서는, "imply"는 논리 포함을 의미한다. 그러나, "imply"라는 말은 통상 '시사한다'라는 의미에서도 사용된다. 상관과 인과에 어떠한 관계가 있다는 것은 올바르고, 인과관계를 증명할 때 상관관계의 존재가 필요하다.

공룡 문맹과 멸종은 상관 관계가 있을 수 있지만, 변수들이 인과 관계를 갖는다는 의미는 아니다.


상관관계는 함의 관계를 가지지만, '''상관관계가 인과관계를 함의하는 것은 아니다'''.

상관관계와 인과관계의 관계는 다음과 같이 설명될 수 있다.

  • 인과는 상관관계의 충분 조건이다.
  • 상관관계는 인과의 필요 조건이다.
  • 상관관계는 인과의 충분 조건이 아니다.
  • 인과는 상관관계의 필요 조건이 아니다.


"'''상관관계가 인과관계를 함의하는 것은 아니다'''"는 과학이나 통계학에서 사용되는 용어이며, 두 변수의 상관관계가 자동적으로 한쪽이 다른 쪽의 원인을 의미하는 것은 아님을 강조한다(물론, 그러한 관계가 있는 경우를 완전히 부정하는 것은 아니다)[27][28]。정반대되는 말인 "상관관계는 인과관계를 증명한다"는, 동시에 또는 전후에 발생한 두 사건 사이의 인과 관계를 주장하지만, 이는 오류이다. 이러한 오류를 '''허위 원인의 오류'''[29]라고 한다(라틴어로는 "Cum hoc ergo propter hoc.la", 직역하면 "그것과 함께, 그리고 그것 때문에"). 전후 즉 인과의 오류는, 두 사건 사이에 선후 관계가 있음을 전제로 "허위 원인의 오류"의 일종이다.

상관과 인과에 어떤 관계가 있다는 것은 옳으며, 인과 관계를 증명하기 위해서는, 상관 관계의 존재가 필요하다.

거짓 원인의 오류는 다음과 같이 표현할 수 있다.

#사건 A의 발생은 사건 B와 상관관계가 있다.

#따라서, A는 B의 원인이다.

이러한 종류의 오류는, 여러 사건 간의 상관 관계를 관측한 것만으로, 두 사건의 인과 관계를 단정한다. 그러나, 실제로는, 다음과 같은 가능성이 있기 때문에, 성급한 판단을 의심해야 한다.

  • B가 A의 원인이다. (인과 관계가 역전)
  • 알려지지 않은 제3의 요인 C가 있으며 (교락), 실제로는 A도 B도 C를 원인으로 한다. (유사 상관 관계)
  • 단순한 우연이거나, 실질적으로 우연이라고 할 정도로 복잡하고 우회적이다. (바람이 불면 통나무 장수가 돈을 번다)


또한, 경우에 따라서는 B가 A의 원인인 동시에, A가 B의 원인인 경우도 있다. 양의 되먹임 시스템의 동작이 이에 해당한다.

다시 말해, A와 B에 상관 관계가 있다는 사실만으로, 그들 사이의 인과 관계를 결론 내릴 수는 없다. 설령 상관 관계가 유의하고 효과 크기가 크거나, 분산의 대부분이 설명되는 (결정 계수가 높음) 경우에도, 인과 관계의 존재를 확정하기 위해서는 추가적인 조사 및 연구가 필요하다.

2. 1. 상관관계의 정의

상관관계는 두 변수 간의 관련성 정도를 나타내는 통계적 지표이다. 상관관계는 상관계수로 정량화되며, -1에서 1 사이의 값을 갖는다.[3] 1에 가까울수록 양의 상관관계, -1에 가까울수록 음의 상관관계, 0에 가까울수록 상관관계가 없음을 의미한다.[3]

A와 B에 상관이 있다는 사실만으로, 그러한 사이의 인과관계를 결론 붙일 수 없다.[3] 비록 상관관계가 유의하고 효과량이 크거나, 분산의 대부분이 설명되고 있다고 해도, 인과관계의 존재를 확정하려면 새로운 조사·연구가 필요하다.[3]

2. 2. 인과관계의 정의

한 변수가 다른 변수의 원인이 되는 관계를 인과관계라고 한다. 어떤 변수 A가 다른 변수 B와 상관관계가 있다고 해서, A가 B의 원인이라고 단정 지을 수는 없다.[3]

  • B가 A의 원인일 수도 있다.
  • 제3의 요인 C가 존재하여 A와 B 모두 C가 원인일 수도 있다.
  • 단순한 우연의 일치일 수도 있다.
  • B가 A의 원인이면서 동시에 A가 B의 원인일 수도 있다. (양성 피드백 시스템)


따라서 상관관계가 있다는 사실만으로 인과관계를 섣불리 결론지을 수 없으며, 인과관계의 존재를 확정하기 위해서는 추가적인 연구가 필요하다.[3]

'원인'이라는 단어는 철학적 용어에서 필요 조건, 충분 조건, 기여 원인 등 여러 의미를 가질 수 있다. 상관 관계를 조사할 때 '원인'은 주로 '하나의 기여 원인'(유일한 기여 원인은 아님)을 의미한다.[3]

3. 인과관계 추론의 오류

두 변수 모두에 영향을 미치는 숨겨진 제3의 변수는 허위 상관관계를 발생시킬 수 있다.[6] 예를 들어, '아이스크림 판매량 증가'와 '익사자 수 증가'는 모두 '여름의 더위'라는 공통 원인에 의해 발생한다.[40][41]


  • 예시 1: 신발을 신고 자는 것은 두통을 느끼며 일어나는 것과 강한 상관 관계가 있다. 그러나 이는 '음주'라는 제3의 요인에 의한 것이다.[7]
  • 예시 2: 어린아이가 불을 켜고 자면 나중에 근시가 발생할 가능성이 더 높다는 연구 결과가 있었으나, 이는 '부모의 근시'라는 요인이 작용한 결과였다.[9][10][11][12]
  • 예시 3: 아이스크림 판매량이 증가하면 익사 사망률이 급증하지만, 이는 '계절(여름)'과 '온도'라는 제3의 요인이 작용한 결과이다.
  • 예시 4: 시험 불안 점수와 수줍음 점수는 양의 상관관계를 가지지만, '자기 의식 점수'라는 또 다른 변수가 존재할 수 있다. 세 가지 측정이 서로 밀접하게 관련되어 있으면, 각 측정이 서로 어느 정도 영향을 미치는 양방향 경향을 가질 수 있다.
  • 예시 5: 1950년대 이후 대기 중 이산화 탄소(CO2) 수치와 비만 수치가 모두 급증했지만, 이는 '더 부유한 인구'가 더 많은 음식을 먹고 더 많은 CO2를 생산하는 경향이 있기 때문이다.
  • 예시 6: 고밀도 지단백질(HDL, "좋은" 콜레스테롤)은 심장 마비 발생률과 음의 상관 관계가 있지만, 유전자, 식단, 운동과 같은 다른 근본적인 요인이 HDL 수치와 심장 마비 발생 가능성에 모두 영향을 미칠 수 있다.


호르몬 대체 요법(HRT)을 받는 여성에게서 관상 동맥 심장 질환(CHD) 발생률이 낮은 것은 HRT의 효과가 아니라, HRT를 받는 여성이 상류층이 많고, 다이어트와 운동을 자주 하는 경향이 있기 때문일 수 있다.

  • ---


화재 현장에 출동하는 소방 대원이 많을수록, 화재의 규모는 크다. 따라서, 출동하는 소방 대원이 많아지는 것이, 화재가 커지는 원인이다. 소방 대원의 인원 수와 화재 규모에는 강한 상관관계가 있지만, 위와 같은 인과관계는 존재하지 않는다. 실제로는 화재가 크기 때문에 다수의 소방 대원이 거기에 이송되고 있는 것이며, 인과관계는 역이다.

'''역인과관계''' 또는 '''역인과''' 또는 '''잘못된 방향'''은 원인과 결과가 뒤바뀐 비형식적 오류의 일종인 의심스러운 원인이다. 원인은 결과라고 하고, 결과는 원인이라고 한다.

예시:

  • 풍차가 더 빠르게 회전할수록 바람이 더 많이 관찰된다. 따라서 바람은 풍차의 회전에 의해 발생한다. (또는 간단히 말해서 풍차는 이름에서 알 수 있듯이 바람을 생성하는 기계이다.)
  • 낮은 콜레스테롤은 사망률 증가와 관련이 있다. 따라서 낮은 콜레스테롤은 사망 위험을 증가시킨다.[4]
  • TV를 많이 시청하는 아이들이 가장 폭력적이다. 분명히 TV는 아이들을 더 폭력적으로 만든다.
  • 오락용 마약 사용과 정신 질환 사이의 상관 관계.
  • 중세 시대의 유럽인들이 가 건강에 유익하다고 믿었던 것.[5]

  • ---


해적의 수가 줄어들면서 지구 온난화가 큰 문제로 대두되었는데, 이는 날아다니는 스파게티 괴물교에서 상관관계와 인과관계를 혼동하는 오류를 풍자하는 데 사용한 예시이다. 1950년대 이후 대기 중의 이산화탄소(CO2) 농도와 범죄 발생률이 동시에 증가했지만, 이 둘 사이의 인과관계는 매우 복잡하고 우회적이어서 단순히 상관관계만으로 결론을 내리는 것은 성급하다.

독일 사회민주당선거 득표율과 서독의 조강 생산량 사이의 상관관계를 나타내는 미어샤이트의 법칙도 우연의 일치를 보여주는 예시이다. 하지만, 사회민주주의 정당의 득표와 철강 생산량 사이에는 '경제 성장의 추이가 쌍방의 원인'이라는 허위 상관관계가 있을 수 있다.

이 외에도, 레드스킨스 규칙은 워싱턴 커맨더스의 마지막 홈 경기 결과가 1936년부터 2000년까지의 모든 미국 대통령 선거 결과를 예측했지만, 2004년 (혹은 다른 공식을 사용했을 때 2012년)에 깨지면서 축구 경기 결과와 대중 투표 결과는 아무런 관련이 없음이 드러났다. 또한, 러시아 지도자의 대머리 여부가 번갈아 나타나는 현상이나, 성경 암호에서 역사적 사건을 예측하는 히브리어 단어가 숨겨져 있다는 주장도 우연의 일치로 간주된다.

  • ---


이상 기체 법칙 PV=nRT는 압력과 온도의 관계를 나타낸 것으로, 양자에게는 상관관계가 있다. 질량이 변하지 않는 경우, 압력을 높게 하면 온도가 올라가고, 온도를 높게 하면 압력이 오른다.[15] 이 경우, 양자는 독립하고 있지 않고, 직접적인 비례 관계에 있다.[15] 인과 관계는 반드시 일방적인 것은 아니다.[15] 포식-피식 관계에서 포식자의 수는 먹이의 수에 영향을 미치지만, 먹이의 수, 즉 식량 공급도 포식자의 수에 영향을 미친다.[15] 또 다른 잘 알려진 예는 자전거를 타는 사람이 자전거를 타지 않는 사람보다 낮은 체질량 지수를 갖는다는 것이다.[15] 이는 자전거 타기가 신체 활동 수준을 높여 BMI를 감소시킨다고 가정하여 설명되는 경우가 많다.[15] 자전거 이용을 늘린 사람들을 대상으로 한 전향적 연구의 결과가 단면 연구보다 BMI에 미치는 영향이 작기 때문에, 역의 인과 관계도 있을 수 있다.[15] 예를 들어, BMI가 낮은 사람이 자전거를 타는 것을 더 선호할 수 있다.[15]

3. 1. 제3의 변수 (교란변수)

두 변수 모두에 영향을 미치는 숨겨진 제3의 변수는 허위 상관관계를 발생시킬 수 있다.[6] 예를 들어, '아이스크림 판매량 증가'와 '익사자 수 증가'는 모두 '여름의 더위'라는 공통 원인에 의해 발생한다.[40][41]

  • 예시 1: 신발을 신고 자는 것은 두통을 느끼며 일어나는 것과 강한 상관 관계가 있다. 그러나 이는 '음주'라는 제3의 요인에 의한 것이다.[7]
  • 예시 2: 어린아이가 불을 켜고 자면 나중에 근시가 발생할 가능성이 더 높다는 연구 결과가 있었으나, 이는 '부모의 근시'라는 요인이 작용한 결과였다.[9][10][11][12]
  • 예시 3: 아이스크림 판매량이 증가하면 익사 사망률이 급증하지만, 이는 '계절(여름)'과 '온도'라는 제3의 요인이 작용한 결과이다.
  • 예시 4: 시험 불안 점수와 수줍음 점수는 양의 상관관계를 가지지만, '자기 의식 점수'라는 또 다른 변수가 존재할 수 있다. 세 가지 측정이 서로 밀접하게 관련되어 있으면, 각 측정이 서로 어느 정도 영향을 미치는 양방향 경향을 가질 수 있다.
  • 예시 5: 1950년대 이후 대기 중 이산화 탄소(CO2) 수치와 비만 수치가 모두 급증했지만, 이는 '더 부유한 인구'가 더 많은 음식을 먹고 더 많은 CO2를 생산하는 경향이 있기 때문이다.
  • 예시 6: 고밀도 지단백질(HDL, "좋은" 콜레스테롤)은 심장 마비 발생률과 음의 상관 관계가 있지만, 유전자, 식단, 운동과 같은 다른 근본적인 요인이 HDL 수치와 심장 마비 발생 가능성에 모두 영향을 미칠 수 있다.


호르몬 대체 요법(HRT)을 받는 여성에게서 관상 동맥 심장 질환(CHD) 발생률이 낮은 것은 HRT의 효과가 아니라, HRT를 받는 여성이 상류층이 많고, 다이어트와 운동을 자주 하는 경향이 있기 때문일 수 있다.

3. 2. 인과관계의 역전

화재 현장에 출동하는 소방 대원이 많을수록, 화재의 규모는 크다. 따라서, 출동하는 소방 대원이 많아지는 것이, 화재가 커지는 원인이다. 소방 대원의 인원 수와 화재 규모에는 강한 상관관계가 있지만, 위와 같은 인과관계는 존재하지 않는다. 실제로는 화재가 크기 때문에 다수의 소방 대원이 거기에 이송되고 있는 것이며, 인과관계는 역이다.

'''역인과관계''' 또는 '''역인과''' 또는 '''잘못된 방향'''은 원인과 결과가 뒤바뀐 비형식적 오류의 일종인 의심스러운 원인이다. 원인은 결과라고 하고, 결과는 원인이라고 한다.

예시:

  • 풍차가 더 빠르게 회전할수록 바람이 더 많이 관찰된다. 따라서 바람은 풍차의 회전에 의해 발생한다. (또는 간단히 말해서 풍차는 이름에서 알 수 있듯이 바람을 생성하는 기계이다.)
  • 낮은 콜레스테롤은 사망률 증가와 관련이 있다. 따라서 낮은 콜레스테롤은 사망 위험을 증가시킨다.[4]
  • TV를 많이 시청하는 아이들이 가장 폭력적이다. 분명히 TV는 아이들을 더 폭력적으로 만든다.
  • 오락용 마약 사용과 정신 질환 사이의 상관 관계.
  • 중세 시대의 유럽인들이 가 건강에 유익하다고 믿었던 것.[5]

3. 3. 우연의 일치

해적의 수가 줄어들면서 지구 온난화가 큰 문제로 대두되었는데, 이는 날아다니는 스파게티 괴물교에서 상관관계와 인과관계를 혼동하는 오류를 풍자하는 데 사용한 예시이다. 1950년대 이후 대기 중의 이산화탄소(CO2) 농도와 범죄 발생률이 동시에 증가했지만, 이 둘 사이의 인과관계는 매우 복잡하고 우회적이어서 단순히 상관관계만으로 결론을 내리는 것은 성급하다.

독일 사회민주당선거 득표율과 서독의 조강 생산량 사이의 상관관계를 나타내는 미어샤이트의 법칙도 우연의 일치를 보여주는 예시이다. 하지만, 사회민주주의 정당의 득표와 철강 생산량 사이에는 '경제 성장의 추이가 쌍방의 원인'이라는 허위 상관관계가 있을 수 있다.

이 외에도, 레드스킨스 규칙은 워싱턴 커맨더스의 마지막 홈 경기 결과가 1936년부터 2000년까지의 모든 미국 대통령 선거 결과를 예측했지만, 2004년 (혹은 다른 공식을 사용했을 때 2012년)에 깨지면서 축구 경기 결과와 대중 투표 결과는 아무런 관련이 없음이 드러났다. 또한, 러시아 지도자의 대머리 여부가 번갈아 나타나는 현상이나, 성경 암호에서 역사적 사건을 예측하는 히브리어 단어가 숨겨져 있다는 주장도 우연의 일치로 간주된다.

3. 4. 양방향 인과관계

이상 기체 법칙 PV=nRT는 압력과 온도의 관계를 나타낸 것으로, 양자에게는 상관관계가 있다. 질량이 변하지 않는 경우, 압력을 높게 하면 온도가 올라가고, 온도를 높게 하면 압력이 오른다.[15] 이 경우, 양자는 독립하고 있지 않고, 직접적인 비례 관계에 있다.[15] 인과 관계는 반드시 일방적인 것은 아니다.[15] 포식-피식 관계에서 포식자의 수는 먹이의 수에 영향을 미치지만, 먹이의 수, 즉 식량 공급도 포식자의 수에 영향을 미친다.[15] 또 다른 잘 알려진 예는 자전거를 타는 사람이 자전거를 타지 않는 사람보다 낮은 체질량 지수를 갖는다는 것이다.[15] 이는 자전거 타기가 신체 활동 수준을 높여 BMI를 감소시킨다고 가정하여 설명되는 경우가 많다.[15] 자전거 이용을 늘린 사람들을 대상으로 한 전향적 연구의 결과가 단면 연구보다 BMI에 미치는 영향이 작기 때문에, 역의 인과 관계도 있을 수 있다.[15] 예를 들어, BMI가 낮은 사람이 자전거를 타는 것을 더 선호할 수 있다.[15]

4. 인과관계의 판정

데이비드 흄은 인과관계가 경험에 근거한다고 주장하면서, 경험은 미래가 과거를 모방한다는 가정에 근거하고, 그 가정 또한 경험에 근거한다는 순환 논법을 지적했다. 그는 '인과관계는 구체적 추론에 근거하지 않는다'라고 결론지으며, 관측할 수 있는 것은 상관관계 뿐이라고 했다.[42][33]

직관적으로 인과관계에는 상관관계뿐만 아니라 반사실적 의존 관계(counterfactual dependence영어)도 필요하다. 예를 들어, 한 학생의 시험 성적이 나쁘고 그 원인이 공부 부족 때문이라고 가정할 때, 이를 증명하기 위해 같은 학생이 같은 환경에서 같은 시험을 보지만 공부를 열심히 한 반사실적 상황을 상정한다. 시간을 되돌려 이 두 경우를 비교할 수 있다면 인과관계를 관측할 수 있지만, 현실에서는 불가능하므로 인과관계는 추측할 수밖에 없다. 이를 '인과적 추론의 근본 문제(Fundamental Problem of Causal Inference영어)'라고 부른다.[43][34]

과학적 실험과 통계적 방법은 세계의 반사실적 상태를 최대한 근사하는 것을 목표로 한다.[44][35] 예를 들어, 일란성 쌍둥이를 대상으로 한쪽은 공부를 시키고 다른 한쪽은 놀게 한 후 시험 성적을 비교하는 실험을 통해 공부가 성적에 미치는 인과적 효과를 확인할 수 있다.

통계적 방법은 개인 대신 집단의 등가성을 이용한다. 무작위로 표본을 추출하여 실제 치료를 하는 집단과 위약을 주는 집단으로 나누어 두 집단이 최대한 등질적이 되도록 한다. 치료법과 위약의 효과에 큰 차이가 나타나면 치료법에 인과적 효과가 있다고 결론지을 수 있으며, 실험 결과의 유의성은 P값으로 정량화된다.

많은 과학적 증거는 변수 간의 상관관계에 기반한다.[16] 그러나 과학자들은 상관관계가 반드시 인과관계를 의미하는 것은 아니라는 점을 지적한다. A가 B와 상관관계가 있다는 이유만으로 A가 B의 원인이라고 가정하는 것은 논리적으로 타당하지 않다.

상관관계를 완전히 무시하는 것 또한 오류이며, 중요한 과학적 증거를 무시하는 결과를 초래할 수 있다.[16] 통제된 이중 맹검 연구가 어렵거나 윤리적으로 불가능한 경우, 여러 각도에서 얻은 상관관계 증거는 예측에 유용할 수 있다. 예를 들어, 아동 학대와 학업 성취도 간의 부정적 상관관계가 존재한다면, 학대가 학업 성취도를 감소시킨다는 인과적 증거는 아니더라도 예측에 활용될 수 있다.[17]

담배 산업은 담배 연기와 폐암 사이의 연관성을 부정하기 위해 상관관계 증거를 무시하는 전략을 사용했으며,[18] 로널드 피셔도 이러한 주장을 펼쳤다.[19][20][21][22][23][24][25]

상관관계는 의학, 심리학, 사회학 등에서 가치 있는 과학적 증거 유형이다. 그러나 상관관계만으로는 인과관계에 대한 증거로 사용될 수 없으며, 성급한 결론은 경계해야 한다.[18]

5. 한국 사회에서의 오해 사례

5. 1. 정치/사회 분야

5. 2. 경제 분야

5. 3. 문화/기타 분야

6. 각주




참조

[1] 서적
[2] 학술지 Correlations Genuine and Spurious in Pearson and Yule https://eprints.soto[...]
[3] 웹사이트 Sufficient http://mathworld.wol[...] 2019-12-02
[4] 학술지 Reverse Causality in Cardiovascular Epidemiological Research 2017-06-13
[5] 웹사이트 Of lice and men: An itchy history https://blogs.scient[...] 2019-02-26
[6] 웹사이트 Dr. LaBossiere's Philosophy Pages http://www.opifexpho[...] 2009-05-22
[7] 학술지 Myopia and ambient lighting at night 1999-05
[8] 뉴스 Night-light may lead to nearsightedness http://www.cnn.com/H[...] CNN 1999-05-13
[9] 뉴스 Night lights don't lead to nearsightedness, study suggests http://researchnews.[...] Ohio State University 2000-03-09
[10] 학술지 Vision: Myopia and ambient night-time lighting
[11] 학술지 Vision: Myopia and ambient night-time lighting
[12] 학술지 Vision: reply: Myopia and ambient night-time lighting
[13] 서적 The Psychology of Personality: Viewpoints, Research, and Applications https://books.google[...] John Wiley & Sons
[14] 문서 Cholesterol: The good, the bad, and the truth http://www.huffingto[...]
[15] 학술지 Transport mode choice and body mass index: Cross-sectional and longitudinal evidence from a European-wide study http://spiral.imperi[...]
[16] 웹사이트 Evidence in Medicine: Correlation and Causation http://www.scienceba[...] Science-Based Medicine 2009-11-18
[17] 웹사이트 If correlation doesn't imply causation, then what does? | DDI http://www.michaelni[...] Michaelnielsen.org 2012-01-23
[18] 웹사이트 Evidence in Medicine: Correlation and Causation – Science-Based Medicine http://www.scienceba[...] Sciencebasedmedicine.org 2009-11-18
[19] 서적 The Signal and the Noise: Why So Many Predictions Fail – But Some Don't Penguin Books
[20] 학술지 Dangers Of Cigarette-Smoking British Medical Association 1957-07-06
[21] 학술지 Dangers Of Cigarette-Smoking British Medical Association 1957-08-03
[22] 학술지 Cigarettes, Cancer, and Statistics https://www.york.ac.[...] Michigan State University Press
[23] 학술지 The Nature of Probability https://www.york.ac.[...] Michigan State University Press
[24] 학술지 Lung Cancer and Cigarettes https://www.york.ac.[...] Nature Publishing Group 1958-07-12
[25] 학술지 Cancer and Smoking https://www.york.ac.[...] Nature Publishing Group 1958-08-30
[26] 문서 Correlation does not imply causation.
[27] 서적 The Cognitive Style of PowerPoint: Pitching Out Corrupts Within http://www.edwardtuf[...] Graphics Press 2006
[28] 학술지 Correlations Genuine and Spurious in Pearson and Yule http://www.jstor.org[...]
[29] 문서 false cause
[30] 문서 The hormone replacement - coronary heart disease conundrum: is this the death of observational epidemiology? Lawlor DA, Smith GD & Ebrahim S, International Journal of Epidemiology, 2004;33:464-467
[31] 뉴스 Night-light may lead to nearsightedness http://www.cnn.com/H[...] CNN 1999-05-13
[32] 뉴스 Night lights don't lead to nearsightedness, study suggests http://researchnews.[...] Ohio State University 2000-03-09
[33] 웹사이트 David Hume (Stanford Encyclopedia of Philosophy) http://plato.stanfor[...]
[34] 문서 "Statistics and Causal Inference" Journal of the American Statistical Association, Vol. 81, No. 396. (Dec., 1986), pp. 945-960.
[35] 서적 Causality: Models, Reasoning, and Inference Cambridge University Press
[36] 서적 '사회조사'의 거짓말 문예춘추 2000
[37] 서적 The Cognitive Style of PowerPoint: Pitching Out Corrupts Within http://www.edwardtuf[...] Graphics Press 2014-12-20
[38] 간행물 The hormone replacement - coronary heart disease conundrum: is this the death of observational epidemiology? 2004
[39] 서적 The Cognitive Style of PowerPoint: Pitching Out Corrupts Within http://www.edwardtuf[...] Graphics Press 2014-12-20
[40] 뉴스 Night-light may lead to nearsightedness http://www.cnn.com/H[...] CNN 1999-05-13
[41] 뉴스 Night lights don't lead to nearsightedness, study suggests http://researchnews.[...] Ohio State University Research News 2000-03-09
[42] 웹사이트 David Hume (Stanford Encyclopedia of Philosophy) http://plato.stanfor[...]
[43] 논문 "Statistics and Causal Inference" 1986
[44] 서적 Causality: Models, Reasoning, and Inference Cambridge University Press 2000



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com