맨위로가기

기저율 오류

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

기저율 오류는 사람들이 일반적인 정보보다 개별적인 정보를 더 선호하여, 통계적 기저율을 무시하는 경향을 말한다. 이는 대표성 휴리스틱에 의해 설명되며, 거짓 양성 역설과 같은 예시를 통해 나타난다. 이러한 오류는 질병 진단, 음주 운전자 단속, 테러리스트 식별, 법적 판단 등 다양한 분야에서 발생하며, 정보 제시 방식을 바꾸거나 교육 및 훈련을 통해 극복할 수 있다. 특히 자연 빈도 형식이나 시각적 도구를 활용하는 것이 도움이 된다.

더 읽어볼만한 페이지

  • 행동금융학 - 아모스 트버스키
    아모스 트버스키는 인지 편향 연구를 통해 인지과학과 행동경제학 발전에 기여한 이스라엘의 인지심리학자이자 수리심리학자이다.
  • 행동금융학 - 행동경제학
    행동경제학은 인간의 심리적 요인과 인지적 한계를 고려하여 경제적 의사결정을 분석하는 학문으로, 전망이론, 현상유지 편향, 넛지 이론 등의 개념을 통해 비합리적 의사결정의 원인과 영향을 연구하며 금융, 마케팅, 정책 등 다양한 분야에 응용되지만 비판도 존재한다.
  • 연관성 오류 - 허수아비 때리기 오류
    허수아비 때리기 오류는 상대방의 주장을 왜곡하여 공격하는 오류로, 허위 진술, 맥락 무시, 단순화 등을 통해 실제 논점과 다른 허수아비를 세워 공격하는 형태를 띤다.
  • 연관성 오류 - 붉은 청어
    붉은 청어는 논쟁에서 주의를 딴 데로 돌리는 비형식적 오류의 일종으로, 논점과 관련 없는 주장을 제시하여 주의를 끄는 기술이며, 핵심 쟁점과 관련 없음을 지적하는 데 사용되는 용어이다.
  • 인지 편향 - 호손 효과
    호손 효과는 작업 환경 변화보다 작업자에게 관심을 기울이는 행위 자체가 생산성 향상에 영향을 미치는 현상을 의미하며, 산업 심리학 및 조직 행동 분야에 큰 영향을 미쳤다.
  • 인지 편향 - 합리화
    합리화는 심리학에서 개인이 자신의 행동 동기를 숨기기 위해 상황을 단순화하거나 미화하여 해석하는 방어 기제이며, 자기 방어적인 설명으로 정의되고, 정신분석학에서 긍정적 및 부정적 관점으로 연구되었으며, 사회적으로 불평등과 차별을 정당화하는 수단으로도 작용한다.
기저율 오류
개요
이름기저율 오류
다른 이름기저율 무시
기저율 소홀
기저율 편향
기본 비율 오류
기본 비율 소홀
기본 비율 편향
분류형식적 오류
인지 편향확증 편향
대표성 휴리스틱
정보 과부하
주의력 편향
설명특정 사건의 기저율(기본 확률)을 무시하고 조건부 확률을 잘못 평가하는 오류
예시
설명의사가 특정 질병의 유병률과 검사 정확도를 고려하지 않고 검사 결과에만 의존하여 환자를 진단하는 경우
검사 상황질병 X에 대한 검사가 있고, 이 검사는 질병에 걸린 사람의 99%를 정확하게 식별하고(민감도) 질병에 걸리지 않은 사람의 99%를 정확하게 음성으로 판정한다(특이도). 인구의 0.1%가 질병에 걸렸다고 가정한다. 무작위로 선택된 사람이 양성으로 검사받았다면, 그 사람이 실제로 질병에 걸렸을 확률은 99%인가?
답변아니다.
설명대부분의 사람들은 민감도가 매우 높기 때문에 약 99%라고 생각할 것이다. 하지만 이는 틀렸다. 양성으로 검사받은 사람이 실제로 질병에 걸렸을 확률은 약 9.1%에 불과하다.
추가 설명양성 결과를 보이는 100,000명 중 약 99명은 실제로 질병에 걸렸지만, 99,900명은 질병에 걸리지 않았음에도 불구하고 약 999명이 양성 결과를 보인다. 따라서 양성 결과를 보인 1098명 중 약 99명만이 질병에 걸렸을 확률은 99/1098 = 약 9.1%이다.
원인
설명사람들은 구체적인 정보에 더 큰 가치를 부여하고 일반적인 기저율 정보를 무시하는 경향이 있기 때문이다.
관련 개념
관련 개념검사 전 확률
같이 보기
같이 보기가용성 휴리스틱
희소 기저율 효과
검사 정확도 모순
확률적 사고
역설
심슨의 역설
집단 발생 착각
법정에서의 확률 오류
대표성 휴리스틱
참고 문헌
참고 문헌https://doh.wa.gov/sites/default/files/2022-02/421-010-CasesInNotFullyVaccinated.pdf
http://dx.doi.org/10.1016/j.obhdp.2012.04.001
http://www.fallacyfiles.org/baserate.html
http://uctv.canterbury.ac.nz/viewfile.php/4/sharing/55/74/74/NZEPVersionofImpreciseProbabilitiespaperVersi.pdf
https://web.archive.org/web/20230126022307/https://doh.wa.gov/sites/default/files/2022-02/421-010-CasesInNotFullyVaccinated.pdf

2. 기저율 오류

실험에 따르면 사람들은 일반적인 정보가 주어져도 개별적인 정보를 선호하는 경향을 보인다.[50][52][51]

카너먼트버스키는 이러한 현상을 대표성 휴리스틱이라는 개념으로 설명하고자 했다. 이들은 사람들이 어떤 대상이 특정 범주에 얼마나 전형적인지에 따라 가능성이나 인과 관계를 판단한다고 보았다.[52]
거짓 양성 역설(정확도 역설)은 기저율 오류의 한 예시이다. 이는 실제 양성보다 거짓 양성 검사 결과가 더 많이 나오는 상황을 말한다. 예를 들어, 어떤 안면 인식 카메라가 범죄자를 99% 정확도로 식별한다고 해도, 하루에 10,000명을 분석하면 높은 정확도가 검사 횟수에 의해 상쇄될 수 있다. 범죄자보다 일반인이 훨씬 많기 때문에, 프로그램의 범죄자 목록에는 실제 범죄자(실제 양성)보다 일반인(거짓 양성)이 더 많이 포함될 가능성이 높다. 양성 검사 결과의 확률은 검사의 정확도뿐만 아니라 표본 집단의 특성에도 영향을 받는다.[7]

어떤 상태를 가진 사람의 비율, 즉 유병률이 검사의 거짓 양성률보다 낮으면, 개별적으로는 거짓 양성 위험이 매우 낮은 검사라도 전체적으로는 실제 양성보다 거짓 양성을 더 많이 만들게 된다.[8] 이는 유병률이 낮은 모집단에서 양성 결과가 나왔을 때, 유병률이 높은 모집단에서의 경험에 비추어 직관에 어긋나는 결과로 이어질 수 있다.[8] 유병률이 높은 모집단에서 검사를 해 온 관리자는 양성 결과가 대개 양성 대상자를 의미한다고 경험적으로 판단할 수 있지만, 실제로는 거짓 양성이 발생했을 가능성이 더 높다.

2. 1. 기저율 오류의 개념

실험에서 사람들은 일반 정보를 사용할 수 있을 때 일반 정보보다 개별 정보를 선호하는 것으로 나타났다.[50][52][51]

심리학자 카너먼트버스키는 이 발견을 대표성(representativeness)이라고 하는 단순한 규칙 또는 "휴리스틱"의 관점에서 설명하려고 시도했다. 그들은 가능성이나 원인과 결과에 관한 많은 판단이 한 사물이 다른 사물이나 범주에 얼마나 대표되는지에 근거한다고 주장했다.[52]

기저율 오류의 한 예는 '''거짓 양성 역설''' ('''정확도 역설'''이라고도 함)이다. 이 역설은 실제 양성보다 거짓 양성 검사 결과가 더 많은 상황을 설명한다(이는 분류기의 정밀도가 낮다는 것을 의미한다). 예를 들어, 안면 인식 카메라가 수배 중인 범죄자를 99% 정확하게 식별할 수 있지만 하루에 10,000명을 분석한다면 높은 정확도는 검사 횟수에 의해 상쇄된다. 이로 인해 프로그램의 범죄자 목록에는 범죄자(실제 양성)보다 훨씬 더 많은 민간인(거짓 양성)이 포함될 가능성이 있는데, 이는 범죄자보다 민간인이 훨씬 더 많기 때문이다. 양성 검사 결과의 확률은 검사의 정확도뿐만 아니라 표본 모집단의 특성에 따라 결정된다.[7] 근본적인 문제는 진음성의 훨씬 더 높은 유병률은 양성으로 검사되는 사람들의 풀이 거짓 양성에 의해 지배된다는 것이다. 훨씬 더 큰 [음성] 그룹의 작은 일부라도 훨씬 작은 [양성] 그룹의 더 큰 비율보다 더 많은 수의 양성 지표를 생성하기 때문이다.

유병률, 즉 주어진 상태를 가진 사람들의 비율이 검사의 거짓 양성률보다 낮을 경우, 개별 사례에서 거짓 양성을 줄 위험이 매우 낮은 검사조차도 ''전반적으로'' 실제 양성보다 거짓 양성을 더 많이 생성한다.[8]

이는 유병률이 낮은 모집단에 대한 검사에서 양성 결과를 해석할 때 유병률이 높은 모집단에서 얻은 양성 결과를 처리한 후에 특히 직관에 반한다.[8] 검사의 거짓 양성률이 해당 조건을 가진 ''새로운'' 모집단의 비율보다 높다면, 유병률이 높은 모집단에서의 검사에서 경험을 얻은 검사 관리자는 양성 검사 결과가 일반적으로 양성 대상자를 나타낸다고 경험으로 결론 내릴 수 있지만, 실제로 거짓 양성이 발생했을 가능성이 훨씬 더 높다.

2. 2. 심리학적 발견

심리학자 대니얼 카너먼아모스 트버스키는 사람들이 일반적인 정보보다 개별적인 정보를 선호하는 현상을 대표성 휴리스틱이라는 개념으로 설명했다.[52][51] 이들은 사람들이 어떤 대상이 특정 범주에 얼마나 대표되는지에 따라 가능성이나 인과 관계를 판단한다고 주장했다.[52]

일부 실험에서 학생들에게 가상 학생들의 평점 평균(GPA)을 예측하도록 했을 때, GPA 분포에 대한 통계가 주어져도 특정 학생에 대한 설명 정보가 주어지면 기저율 정보를 무시하는 경향을 보였다. 이는 개별 정보가 학교 성적과 거의 관련이 없다는 것이 명백한 경우에도 마찬가지였다.[26]

리처드 니스벳은 기본 귀인 오류와 같은 귀인 편향이 기저율 오류의 예시라고 주장했다. 사람들은 다른 사람들이 유사한 상황에서 어떻게 행동했는지에 대한 "합의 정보"("기저율")를 사용하지 않고, 더 간단한 성향 귀인을 선호한다는 것이다.[29]

사람들이 기저율 정보를 이해하는 조건에 대해서는 심리학계에서 상당한 논쟁이 있었다.[30][31] 휴리스틱 및 편향 연구자들은 사람들이 기저율을 무시하고 확률적 추론의 규범을 위반하는 경향이 있다고 강조했지만,[32] 다른 연구자들은 인지 과정과 정보 형식 간의 연관성을 강조하며, 사람들이 정보를 자연 빈도 형식으로 제시받을 때 베이즈 규칙에 더 잘 따르는 추론을 한다고 주장했다.[33][34]

자연 빈도 형식은 필요한 계산을 단순화하고, 허위 양성 반응의 수를 더 투명하게 만들며, 중첩 집합 구조를 나타내기 때문에 추론을 용이하게 한다.[41][42] 그러나 모든 빈도 형식이 베이시안 추론을 돕는 것은 아니며,[42][43] 자연 빈도는 기저율 정보를 보존하는 자연 표본 추출에서 발생하는 빈도 정보를 나타낼 때 효과적이다.

3. 기저율 오류의 예시

기저율 오류는 일상생활과 전문 분야 모두에서 다양한 형태로 나타난다. 다음은 몇 가지 대표적인 예시이다.


  • '''거짓 양성 역설''': 질병 검사에서 거짓 양성 결과가 실제 양성보다 더 많이 나타나는 현상이다. 이는 검사의 정밀도가 낮거나, 검사 대상 집단의 질병 유병률이 낮을 때 발생한다. 예를 들어, 유병률이 낮은 모집단에서 검사를 시행하면 양성 결과의 대부분이 거짓 양성일 수 있다.[8]
  • '''집단 A''': 감염률 40%, 1,000명 대상 검사 (위양성률 5%, 위음성률 0%)



집단 A에서는 양성 결과의 93% 이상(400/(30+400))이 실제 감염을 나타낸다.

  • '''집단 B''': 감염률 2%, 1,000명 대상 검사 (동일한 검사 조건)



집단 B에서는 양성 결과의 29% (20/(20+49))만이 실제 감염을 나타낸다. 이는 사후 확률사전 확률을 혼동하여 발생하는 오류이다.

  • '''음주 운전자 단속''': 호흡 측정기가 5%의 확률로 술에 취하지 않은 운전자를 음주 상태로 표시하고, 실제로 술에 취한 사람은 항상 정확하게 감지한다고 가정하자. 전체 운전자 중 1,000명 중 1명이 술을 마시고 운전한다면, 무작위로 검사했을 때 양성 반응이 나온 운전자가 실제로 술에 취했을 확률은 약 2%에 불과하다. 많은 사람들이 95%라고 생각하지만, 이는 기저율 오류 때문이다.
  • 1,000명 중 술에 취한 운전자 1명은 확실히 양성 판정 (진짜 양성).
  • 술에 취하지 않은 999명 중 5%는 오작동으로 양성 판정 (거짓 양성, 약 50명).
  • 따라서 양성 판정 51건 중 실제 음주 운전자는 1명이므로, 확률은 약 2%이다.
  • 베이즈 정리를 사용하여 이 확률을 더 공식적으로 계산할 수 있다.

  • '''테러리스트 식별''': 100만 명의 시민 중 테러리스트가 100명이고, 얼굴 인식 소프트웨어의 오류 음성율(테러리스트인데 벨이 울리지 않을 확률)이 1%, 오류 양성율(비테러리스트인데 벨이 울릴 확률)이 1%라고 가정하자. 어떤 시민이 경보를 울렸을 때, 그 사람이 테러리스트일 확률은 99%가 아니라 1%에 가깝다. 이는 테러리스트의 기저율이 매우 낮기 때문이다.
  • 테러리스트 100명 중 99명이 경보를 울린다.
  • 비테러리스트 999,900명 중 9,999명 정도가 경보를 울린다.
  • 경보를 울린 약 10,098명 중 테러리스트는 99명이므로, 확률은 1% 미만이다.

  • '''법적 판단''': 법정에서는 확률과 통계에 대한 오해, 특히 기저율 오류가 잘못된 판단으로 이어질 수 있다.
  • '''검사의 오류 (Prosecutor's fallacy)''': 특정 증거가 무작위로 일치할 확률이 낮다는 점을 근거로 피고인이 유죄라고 주장하는 오류이다. 예를 들어, 범죄 현장의 혈액형이 전체 인구의 10%에게만 나타나고 용의자가 이 혈액형을 가졌다고 해서, 용의자가 유죄일 확률이 90%라고 주장하는 것은 기저율 오류이다.[13]
  • '''변호사의 오류 (Defendant's fallacy)''': 특정 증거가 많은 사람에게서 나타날 수 있다는 점을 근거로 해당 증거가 무의미하다고 주장하는 오류이다. O. J. 심슨 사건에서 변호인단은 범죄 현장의 혈액이 심슨의 혈액과 일치하지만, 이 혈액형은 흔하기 때문에 증거 가치가 없다고 주장했는데, 이는 기저율 오류이다.[14][15]
  • '''샐리 클라크 사건''': 두 아들을 살해한 혐의로 기소된 샐리 클라크 사건에서, 검찰 측 전문 증인은 한 가족 내에서 두 아이가 영아 돌연사 증후군(SIDS)으로 사망할 확률이 매우 낮다고 증언하며 기저율 오류를 범했다.[17] 왕립 통계 학회는 이 오류를 지적했고,[22] 결국 법원은 샐리 클라크의 유죄 판결을 뒤집었다.[24]

3. 1. 질병 진단

거짓 양성 검사 결과가 실제 양성보다 더 많은 상황을 설명하는 '''거짓 양성 역설'''(또는 '''정확도 역설''')은 기저율 오류의 한 예시이다. 이는 검사의 정밀도가 낮다는 것을 의미한다. 양성 검사 결과의 확률은 검사의 정확도뿐만 아니라 표본 모집단의 특성에 따라 결정된다.[7]

유병률, 즉 주어진 상태를 가진 사람들의 비율이 검사의 거짓 양성률보다 낮을 경우, 개별 사례에서 거짓 양성을 줄 위험이 매우 낮은 검사조차도 ''전반적으로'' 실제 양성보다 거짓 양성을 더 많이 생성한다.[8] 이는 유병률이 낮은 모집단에 대한 검사에서 양성 결과를 해석할 때 특히 직관에 반한다.[8] 만약 검사의 거짓 양성률이 해당 조건을 가진 ''새로운'' 모집단의 비율보다 높다면, 유병률이 높은 모집단에서의 검사에서 경험을 얻은 검사 관리자는 양성 검사 결과가 일반적으로 양성 대상자를 나타낸다고 경험으로 결론 내릴 수 있지만, 실제로는 거짓 양성이 발생했을 가능성이 훨씬 더 높다.

예를 들어, 감염률이 40%인 1,000명으로 구성된 집단 ''A''에 대해 위양성률이 5% (0.05)이고 위음성률이 0인 전염병 검사를 실시한다고 가정해 보자.

사람 수감염자비감염자총계
검사
양성
400
(진양성)
30
(위양성)
430
검사
음성
0
(위음성)
570
(진음성)
570
총계4006001000


  • 감염되었고 검사에서 질병이 나타남 (진양성): 1000 × 40/100 = 400명이 진양성 결과를 받음
  • 비감염되었고 검사에서 질병이 나타남 (위양성): 1000 × (100 – 40)/100 × 0.05 = 30명이 위양성 결과를 받음
  • 나머지 570번의 검사는 올바르게 음성으로 나타남.


집단 ''A''에서 양성 검사 결과를 받은 사람은 93% 이상(400/(30 + 400))의 확률로 검사가 감염을 정확하게 나타낸다고 확신할 수 있다.

이제 2%만이 감염된 집단 ''B''에 동일한 검사를 적용하는 것을 고려해 보자.

사람 수감염자비감염자합계
검사
양성
20
(진양성)
49
(위양성)
69
검사
음성
0
(가음성)
931
(진음성)
931
합계209801000


  • 감염되었고 검사 결과 질병을 나타냄 (진양성): 1000 × 2/100 = 20명이 진양성 결과를 받음
  • 감염되지 않았고 검사 결과 질병을 나타냄 (위양성): 1000 × (100 – 2)/100 × 0.05 = 49명이 위양성 결과를 받음
  • 나머지 931건의 검사는 정확히 음성이다.


집단 ''B''에서 양성 검사 결과를 받은 총 69명 중 실제 감염자는 20명뿐이다. 따라서, 감염되었다는 통보를 받은 후 실제로 감염되었을 확률은 "95% 정확도"인 검사에서 단지 29% (20/(20 + 49))에 불과하다.

집단 ''A''에 대한 경험이 있는 검사자는 집단 ''B''에서 일반적으로 감염을 정확하게 나타내던 결과가 이제는 일반적으로 위양성이 되는 것이 역설적이라고 생각할 수 있다. 건강을 위협하는 검사 결과를 받은 후 감염의 사후 확률과 위양성을 받을 사전 확률을 혼동하는 것은 자연스러운 오류이다.

3. 2. 음주 운전자 단속

경찰이 사용하는 호흡 측정기는 운전자가 술에 취하지 않았음에도 5%의 경우에 음주 상태로 표시한다. 하지만 이 측정기는 실제로 술에 취한 사람을 항상 정확하게 감지한다. 전체 운전자 중 1,000명 중 1명은 실제로 술을 마시고 운전한다.

만약 경찰이 무작위로 운전자를 세워 호흡 측정기로 검사했을 때 양성 반응이 나왔다면, 실제로 운전자가 술에 취했을 확률은 얼마일까? 많은 사람들은 95%라고 생각하겠지만, 실제로는 약 2%에 불과하다.

이는 다음과 같이 설명할 수 있다. 1,000명의 운전자를 검사한다고 가정하면:

  • 술에 취한 운전자는 1명이고, 이 운전자는 100% 확률로 양성 판정을 받는다. (''진짜'' 양성)
  • 술에 취하지 않은 운전자는 999명이고, 이 중 5%는 오작동으로 양성 판정을 받는다. (''거짓'' 양성, 999명 × 0.05 = 49.95명)


따라서 총 양성 판정은 1 + 49.95 = 50.95건이고, 이 중 실제로 술에 취한 운전자는 1명이므로, 양성 판정을 받은 운전자가 실제로 술에 취했을 확률은 1 / 50.95 ≈ 0.019627 (약 2%)이다.

이 결과는 경찰이 운전자를 '무작위로' 선택했다는 가정에 기반한다. 만약 난폭 운전과 같이 다른 이유로 운전자를 세웠다면, 술에 취한 운전자가 운전을 잘할 확률과 술에 취하지 않은 운전자가 운전을 못할 확률도 고려해야 한다.

베이즈 정리를 사용하면 이 확률을 더 공식적으로 계산할 수 있다. 호흡 측정기가 양성(D)일 때 운전자가 실제로 술에 취했을(drunk) 확률은 다음과 같다.

:p(\mathrm{drunk}\mid D) = \frac{p(D \mid \mathrm{drunk})\, p(\mathrm{drunk})}{p(D)}

주어진 정보는 다음과 같다.

  • p(\mathrm{drunk}) (실제로 술에 취한 운전자 비율) = 0.001
  • p(\mathrm{sober}) (술에 취하지 않은 운전자 비율) = 0.999
  • p(D\mid\mathrm{drunk}) (술에 취한 운전자가 양성 판정을 받을 확률) = 1.00
  • p(D\mid\mathrm{sober}) (술에 취하지 않은 운전자가 양성 판정을 받을 확률) = 0.05


전체 확률의 법칙에 따라, p(D) (양성 판정을 받을 확률)는 다음과 같이 계산된다.

:p(D) = p(D \mid \mathrm{drunk})\,p(\mathrm{drunk})+p(D\mid\mathrm{sober})\,p(\mathrm{sober})

:p(D) = (1.00 \times 0.001) + (0.05 \times 0.999) = 0.05095

이 값을 베이즈 정리에 대입하면:

:p(\mathrm{drunk}\mid D) = \frac{1.00 \times 0.001}{0.05095} \approx 0.019627

즉, 호흡 측정기 검사 결과가 양성일 때 실제로 운전자가 술에 취했을 확률은 약 2%이다.

3. 3. 테러리스트 식별

100만 명의 시민이 있는 도시에서 테러리스트는 100명, 비테러리스트는 999,900명이라고 가정한다. 이때 무작위로 선택된 시민이 테러리스트일 확률은 0.0001이고, 비테러리스트일 확률은 0.9999이다.

테러리스트를 식별하기 위해 도시에는 감시 카메라와 얼굴 인식 소프트웨어가 장착된 경보 시스템이 설치되어 있다. 이 소프트웨어는 다음과 같은 오류율을 가진다.

  • 오류 음성율: 테러리스트를 스캔했을 때 99%는 벨이 울리고 1%는 울리지 않는다.
  • 오류 양성율: 비테러리스트를 스캔했을 때 99%는 벨이 울리지 않지만 1%는 울린다.


어떤 시민이 경보를 울렸을 때, 그 사람이 테러리스트일 확률은 99%라고 추론하기 쉽다. 하지만 이는 기저율 오류를 범하는 것이다. 실제로는 테러리스트일 확률은 1%에 가깝다.

이는 서로 다른 두 오류율의 특성을 혼동했기 때문이다. '테러리스트 100명당 울리지 않는 벨의 수'(P(¬B | T))와 '벨 100개당 비테러리스트의 수'(P(¬T | B))는 서로 관련이 없는 양이다.

만약 100만 명의 시민 모두가 카메라 앞을 지나간다면, 테러리스트 100명 중 약 99명이 경보를 울리고, 비테러리스트 999,900명 중 약 9,999명이 경보를 울릴 것이다. 즉, 약 10,098명이 경보를 울릴 것이고, 그중 약 99명이 테러리스트이다. 따라서 경보를 울린 사람이 실제로 테러리스트일 확률은 1% 미만으로, 처음 추측했던 99%보다 훨씬 낮다.

이처럼 기저율 오류가 오해를 일으키는 이유는 테러리스트보다 비테러리스트가 훨씬 많고, 오류 양성(테러리스트로 잘못 스캔된 비테러리스트)의 수가 진실 양성(실제 테러리스트)보다 훨씬 크기 때문이다.

테러리즘의 기저율이 매우 낮기 때문에 데이터 마이닝과 예측 알고리즘을 사용하여 테러리스트를 식별하는 것은 오류 양성 역설로 인해 실현 가능하지 않다는 주장이 제기되고 있다.[9][10][11][12] 각 정확한 결과에 대한 오류 양성 추정치는 10,000개 이상에서[12] 10억 개까지 다양하다.[10] 이러한 모델을 실행 가능하게 만드는 데 필요한 정확도 수준은 달성하기 어려우며, 테러리즘의 낮은 기저율은 정확한 알고리즘을 만들 수 있는 데이터가 부족하다는 것을 의미한다.[11] 또한, 테러리즘 감지에서 오류 음성은 매우 바람직하지 않으므로 최소화해야 하지만, 이는 특이도 희생을 통한 민감도 증가를 필요로 하여 오류 양성을 증가시킨다.[12] 법 집행 기관이 이러한 모델을 사용할 경우 99% 이상의 결과가 오류 양성이므로 필요한 입증 책임을 충족하는지 여부도 의문이다.[12]

3. 4. 법적 판단

법정에서는 종종 확률과 통계에 대한 오해가 발생하여 잘못된 판단으로 이어질 수 있다. 이러한 오해는 특히 기저율 오류와 관련하여 두드러지게 나타난다.
검사의 오류 (Prosecutor's fallacy)검사의 오류는 특정 증거가 무작위로 일치할 확률이 낮다는 점을 근거로 피고인이 유죄라고 주장하는 논리적 오류이다.

예를 들어, 범죄 현장에서 발견된 혈액형이 전체 인구의 10%에게서만 나타나는 희귀한 유형이라고 가정해 보자. 용의자가 이 혈액형을 가지고 있다면, 검사는 이 사실만으로 용의자가 유죄일 확률이 90%라고 주장할 수 있다.

하지만 이는 심각한 기저율 오류이다. 범죄가 발생한 마을에 1,000명이 살고 있다면, 이 혈액형을 가진 사람은 100명이고, 그중 진범은 단 한 명이다. 따라서 용의자가 이 혈액형을 가졌다는 사실만으로는 유죄일 확률이 1%에 불과하다. 검사는 혈액형 일치라는 증거 외에 다른 정황 증거들을 종합적으로 고려하여 유죄 여부를 판단해야 한다.

검사의 오류는 "무고한 사람에게서 이 증거를 발견할 확률이 매우 작으니, 피고인이 무죄일 가능성은 무시해도 된다"는 식으로 표현되기도 한다. 그러나 증거가 무고한 사람에게서 발견될 확률과, 증거가 발견되었을 때 그 사람이 무죄일 확률은 전혀 다른 개념이다.[13]
변호사의 오류 (Defendant's fallacy)변호사의 오류는 특정 증거가 많은 사람에게서 나타날 수 있다는 점을 근거로 해당 증거가 무의미하다고 주장하는 논리적 오류이다.

O. J. 심슨 사건에서 변호인단은 범죄 현장에서 발견된 혈액이 심슨의 혈액과 일치하지만, 이러한 혈액형은 400명 중 1명꼴로 나타나기 때문에 증거로서 가치가 없다고 주장했다.[14][15]

하지만 이는 기저율 오류에 해당한다. 변호인단은 "400명 중 1명"이라는 수치에만 집중하여, 심슨이 범인일 가능성을 의도적으로 낮추려고 시도한 것이다.
샐리 클라크 사건샐리 클라크 사건은 기저율 오류가 법정에서 어떻게 비극적인 결과를 초래할 수 있는지 보여주는 대표적인 사례이다.

샐리 클라크는 두 아들을 살해한 혐의로 기소되었는데, 검찰 측 전문 증인인 로이 메도우 경은 한 가족 내에서 두 아이가 영아 돌연사 증후군(SIDS)으로 사망할 확률이 7,300만 분의 1이라고 증언했다.[17] 이는 실제 발생률보다 훨씬 낮은 수치였으며, SIDS 발생 확률이 영아들 사이에서 상관관계가 없다는 잘못된 가정에 기반한 것이었다.[18]

메도우 교수는 이 극히 낮은 확률을 근거로 두 번의 SIDS 사망보다는 살인일 가능성이 훨씬 높다고 주장했다. 그러나 SIDS에 대한 유전적 소인이 존재할 수 있으므로, 한 가족 내에서 SIDS로 인한 사망 가능성은 더 높을 수 있다.[19]

더 중요한 것은 7,300만 분의 1이라는 숫자 자체가 아니라, 다른 가능성(이중 살인, 살인 1건과 SIDS 1건 등)과의 비교이다. 왕립 통계 학회는 이 오류를 지적하는 보도 자료를 발표했으며,[22] 레이 힐 교수는 연속적인 사고(SIDS)가 연속적인 살인보다 4.5배에서 9배 더 발생할 가능성이 높다는 연구 결과를 발표했다.[23]

결국 법원은 샐리 클라크의 유죄 판결을 뒤집었다.[24]

4. 기저율 오류 극복 방안

기저율 오류를 극복하기 위한 방안으로는 정보를 자연 빈도 형식으로 제시하거나, 교육 및 훈련을 통해 확률적 추론 능력을 향상시키거나, 시각적 도구를 활용하는 방법 등이 있다.


  • 자연 빈도 형식: 정보를 확률 대신 자연 빈도 형식으로 제시하면 사람들의 추론 능력이 향상되어 기저율 오류를 줄일 수 있다.[34][35] 예를 들어, 음주 운전 단속 상황에서 "1,000명의 운전자 중 1명이 음주 운전을 한다. 호흡 분석기는 실제로 술에 취한 사람을 감지하는 데 실패하지 않는다. 술에 취하지 않은 999명의 운전자 중 50명이 호흡 분석기에서 음주 상태로 잘못 표시된다."와 같이 제시할 수 있다. 이는 일반인뿐만 아니라 전문가에게도 적용되며,[34][35] 코크란 협력과 같은 기관에서는 건강 통계를 전달할 때 이러한 형식의 사용을 권장한다.[36] 하지만 모든 빈도 형식이 베이즈 추론을 쉽게 만드는 것은 아니며,[42][43] 자연 빈도는 자연 표본 추출에서 발생하는 빈도 정보를 나타내야 하고, 기저율 정보가 보존되어야 한다.

  • 교육 및 훈련: 사람들은 확률적 추론, 특히 베이즈 정리를 사용하는 데 어려움을 겪지만, 적절한 교육과 훈련을 통해 개선될 수 있다.[32] 베이즈 추론 문제를 자연 빈도 형식으로 변환하도록 가르치는 것이 확률 공식을 직접 가르치는 것보다 효과적이며,[37] 아이콘 배열과 같은 시각적 표현을 활용하면 추론 능력을 더욱 향상시킬 수 있다.[37][38][39][40]

  • 시각적 도구 활용: 아이콘 배열, 가설 결과 플롯과 같은 자연 빈도의 그래픽 표현은 사람들이 더 나은 추론을 하는 데 도움이 된다.[37][38][39][40]

4. 1. 자연 빈도 형식

정보를 자연 빈도 형식으로 제시하면 기저율 오류를 줄이는 데 도움이 된다. 예를 들어, 앞선 음주 측정 예시를 다음과 같이 바꿔 생각해 볼 수 있다.

: 1,000명의 운전자 중 1명이 음주 운전을 한다. 호흡 측정기는 실제로 술에 취한 사람을 항상 정확하게 감지한다. 술에 취하지 않은 999명의 운전자 중에서는 50명이 호흡 측정기에 의해 음주 상태로 잘못 판별된다. 경찰관이 무작위로 운전자를 세워 호흡 측정 검사를 실시했고, 그 결과 운전자가 음주 상태로 나왔다. 다른 정보는 없다. 이 운전자가 실제로 음주 운전을 하고 있을 확률은 얼마인가?

이 경우, 필요한 정보는 특정 기준 집단에 대한 자연 빈도 형태로 제시된다.[34][35] 이러한 방식으로 정보가 제시되면 사람들의 추론은 베이즈 정리에 더 부합하게 되며, 이는 일반인과 전문가 모두 기저율 무시를 극복하는 데 도움을 준다. 코크란 협력과 같은 기관에서는 건강 통계를 전달할 때 이러한 형식의 사용을 권장한다.[36]

자연 빈도 형식이 베이즈 추론을 쉽게 만드는 이유는 다음과 같다.

  • 계산 단순화: 자연 빈도를 사용하면 정규화된 분수(확률) 대신 자연수를 사용하여 계산할 수 있다.
  • 투명성: 거짓 양성 반응의 수를 명확하게 보여준다.
  • 중첩 집합 구조: 자연 빈도는 중첩 집합 구조를 나타내므로 추론이 단순해진다.[41][42]


예를 들어, 필요한 확률 p(음주|D)는 다음과 같이 계산할 수 있다.

:p(\mathrm{음주}\mid D) = \frac{N(\mathrm{음주} \cap D)}{N(D)} = \frac{1}{51} = 0.0196

여기서 N(음주 ∩ D)는 술에 취하고 호흡 측정기 결과가 양성인 운전자 수이고, N(D)는 호흡 측정기 결과가 양성인 총 경우의 수이다.

하지만 모든 빈도 형식이 베이즈 추론을 쉽게 만드는 것은 아니다.[42][43] 자연 빈도는 자연 표본 추출에서 발생하는 빈도 정보를 나타내야 하며, 기저율 정보가 보존되어야 한다.

4. 2. 교육 및 훈련

심리학 연구에 따르면 사람들은 확률적 추론, 특히 베이즈 정리를 사용하는 데 어려움을 겪으며, 이는 기저율 오류로 이어진다. 그러나 이러한 오류는 적절한 교육과 훈련을 통해 개선될 수 있다.[32]

정보를 제시하는 방식이 사람들의 이해도에 큰 영향을 미친다는 연구 결과가 있다.[33][34] 예를 들어, 확률 대신 자연 빈도 형식으로 정보를 제공하면 사람들의 추론 능력이 향상되어 기저율 오류를 줄이는 데 도움이 된다.[34][35] 이는 일반인뿐만 아니라 전문가에게도 적용된다.[34][35]

예를 들어, 음주 운전 단속 상황에서 다음과 같이 정보를 제공할 수 있다.

: 1,000명의 운전자 중 1명이 음주 운전을 한다. 호흡 분석기는 실제로 술에 취한 사람을 감지하는 데 실패하지 않는다. 술에 취하지 않은 999명의 운전자 중 50명이 호흡 분석기에서 음주 상태로 잘못 표시된다.

이처럼 자연 빈도 형식으로 정보를 제공하면, 사람들은 베이즈 정리를 사용하지 않고도 필요한 확률(음주 운전자가 실제로 술에 취했을 확률)을 더 쉽게 계산할 수 있다. 이는 자연 빈도가 중첩 집합 구조를 나타내고, 허위 양성 반응의 수를 명확하게 보여주기 때문이다.[41][42]

코크란 협력과 같은 기관에서는 건강 통계를 전달할 때 자연 빈도 형식을 사용할 것을 권장한다.[36] 연구에 따르면, 베이즈 추론 문제를 자연 빈도 형식으로 변환하도록 가르치는 것이 확률 공식을 직접 가르치는 것보다 효과적이다.[37] 또한, 아이콘 배열과 같은 시각적 표현을 활용하면 추론 능력을 더욱 향상시킬 수 있다.[37][38][39][40]

하지만 모든 빈도 형식이 베이즈 추론을 돕는 것은 아니다.[42][43] 자연 빈도는 무작위 표본 추출에서 얻은 빈도 정보를 의미하며, 기저율 정보를 보존한다. 반면, 체계적 표본 추출에서는 기저율이 고정되어 있으므로, 베이즈 정리를 사용하여 기저율 정보를 명시적으로 고려해야 한다.

4. 3. 시각적 도구 활용

아이콘 배열, 가설 결과 플롯과 같은 자연 빈도의 그래픽 표현은 사람들이 더 나은 추론을 하는 데 도움이 된다는 연구 결과가 있다.[37][38][39][40] 복잡한 통계 정보를 시각적으로 표현하면 일반인[34]과 전문가[35] 모두 기저율 무시를 극복하고 베이즈 정리에 더 부합하는 추론을 할 수 있다.

참조

[1] 웹사이트 COVID-19 Cases, Hospitalizations, and Deaths by Vaccination Status https://doh.wa.gov/s[...] Washington State Department of Health 2023-01-18
[2] 학술지 Seeing is believing: Priors, trust, and base rate neglect http://dx.doi.org/10[...] 2012
[3] 웹사이트 Logical Fallacy: The Base Rate Fallacy http://www.fallacyfi[...] Fallacyfiles.org 2013-06-15
[4] 학술지 Interpretation of Statistical Evidence in Criminal Trials: The Prosecutor's Fallacy and the Defense Attorney's Fallacy
[5] 웹사이트 Ambiguity, the Certainty Illusion, and Gigerenzer's Natural Frequency Approach to Reasoning with Inverse Probabilities http://uctv.canterbu[...] University of Canterbury 2010-02
[6] 학술지 The Prosecutor's Fallacy Framed as a Sample Space Substitution 2023-10-04
[7] 서적 Probability and Statistics in Aerospace Engineering https://ntrs.nasa.go[...] NASA 1998-03
[8] 학술지 Quantitative literacy - drug testing, cancer screening, and the identification of igneous rocks http://findarticles.[...] 2003-05
[9] 학술지 100,000 false positives for every real terrorist: Why anti-terror algorithms don't work https://firstmonday.[...] 2017-09-01
[10] 간행물 Why Data Mining Won't Stop Terror https://www.wired.co[...] 2022-08-30
[11] 웹사이트 Effective Counterterrorism and the Limited Role of Predictive Data Mining https://www.cato.org[...] 2022-08-30
[12] 학술지 The Implication of Terrorism's Extremely Low Base Rate https://doi.org/10.1[...] 2021-02-17
[13] 학술지 Bayes and the Law 2016-06
[14] 문서 " Interpreting evidence: Evaluating forensic evidence in the courtroom." Chichester: John Wiley and Sons. 1995
[15] 문서 " Criminal Investigative Failures." CRC Press Taylor & Francis Group. 2009
[16] 문서 Reckoning with Risk: Learning to Live with Uncertainty Penguin 2003
[17] 간행물 Resolution adopted by the Senate (21 October 1998) on the retirement of Professor Sir Roy Meadow http://reporter.leed[...] University of Leeds 2015-10-17
[18] 웹사이트 Beyond reasonable doubt http://plus.maths.or[...] plus.maths.org 2010-06-12
[19] 뉴스 Gene find casts doubt on double 'cot death' murders http://observer.guar[...] 2001-07-15
[20] 웹사이트 Convicted on Statistics? http://understanding[...] 2010-05-21
[21] 학술지 Multiple sudden infant deaths – coincidence or beyond coincidence? http://www.cse.salfo[...] 2010-06-13
[22] 웹사이트 Royal Statistical Society concerned by issues raised in Sally Clark case http://www.rss.org.u[...] 2001-10-23
[23] 학술지 Multiple sudden infant deaths – coincidence or beyond coincidence? http://www.cse.salfo[...] 2010-06-13
[24] 웹사이트 R v Clark. [2003] EWCA Crim 1020 (11 April 2003) http://www.bailii.or[...]
[25] 학술지 The base-rate fallacy in probability judgments http://ratio.huji.ac[...]
[26] 학술지 On the psychology of prediction
[27] 학술지 Judgment under uncertainty: Heuristics and biases 1974-09-27
[28] 서적 Choices, Values and Frames
[29] 서적 Cognition and social behavior John Wiley & Sons, Incorporated
[30] 학술지 The base rate fallacy reconsidered: Descriptive, normative, and methodological challenges
[31] 학술지 Base-rate respect: From ecological rationality to dual processes
[32] 학술지 Judgment under Uncertainty: Heuristics and Biases
[33] 학술지 Are humans good intuitive statisticians after all? Rethinking some conclusions of the literature on judgment under uncertainty
[34] 학술지 How to improve Bayesian reasoning without instruction: Frequency formats
[35] 학술지 Medicine: Communicating Statistical Information
[36] 논문 Using alternative statistical formats for presenting risks and risk reductions
[37] 논문 Teaching Bayesian reasoning in less than two hours http://edoc.mpg.de/1[...]
[38] 논문 Pictorial representations in statistical reasoning
[39] 논문 Explaining risks: Turning numerical data into meaningful pictures
[40] 서적 Proceedings of the 2019 CHI Conference on Human Factors in Computing Systems 2019-05-02
[41] 논문 Solving probabilistic and statistical problems: A matter of information structure and question form
[42] 논문 Representation facilitates reasoning: What natural frequencies are and what they are not
[43] 논문 Overcoming difficulties in Bayesian reasoning: A reply to Lewis and Keren (1999) and Mellers and McGraw (1999) http://edoc.mpg.de/2[...]
[44] 서적 Contributions to Mathematical Psychology, Psychometrics, and Methodology
[45] 저널 Seeing is believing: Priors, trust, and base rate neglect http://dx.doi.org/10[...] 2012
[46] 웹인용 Logical Fallacy: The Base Rate Fallacy http://www.fallacyfi[...] Fallacyfiles.org 2013-06-15
[47] 서적 Probability and Statistics in Aerospace Engineering https://ntrs.nasa.go[...] NASA 1998-03
[48] 서적 Assessing Mathematical Proficiency Cambridge University Press 2007-08
[49] 서적 The cartoon guide to statistics http://findarticles.[...] Harper Collins 2003-05
[50] 저널 The base-rate fallacy in probability judgments http://ratio.huji.ac[...] 2022-08-01
[51] 서적 Judgment under uncertainty: Heuristics and biases
[52] 저널 On the psychology of prediction



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com