맨위로가기

도수 확률

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

도수 확률은 빈도주의적 해석에서 무작위 실험의 반복 관찰을 통해 사건 발생의 상대적 빈도를 확률로 정의하는 개념이다. 시행 횟수가 증가함에 따라 상대적 빈도의 변화가 감소한다는 가정하에, 상대 빈도의 극한값을 확률로 간주한다. 빈도주의적 해석은 확률 이론을 실제 상황에 적용하는 지침을 제공하지만, 다른 확률 해석과의 차이점과 한계점을 가지고 있으며, 특히 베이즈주의적 해석과 대조된다. 아리스토텔레스의 개연성에 대한 언급을 시작으로 푸아송, 벤, 피셔, 네이만 등에 의해 발전되었으며, 20세기 초 통계적 추론 도구 확립에 기여했다.

더 읽어볼만한 페이지

  • 확률 해석 - 불확실성
    불확실성이란 현재나 미래를 정확히 예측할 수 없는 상태를 말하며, 확률을 알 수 없는 근본적인 불확실성도 존재하고, 바람직하지 않은 결과를 초래할 수 있는 위험과는 구별되며, 과학, 경제, 철학 등 다양한 분야에서 다뤄지는 중요한 개념이다.
  • 확률 해석 - 퍼지 논리
    퍼지 논리는 로트피 자데가 제안한 퍼지 집합 이론에 기반하여 0과 1 사이의 소속 함수 값과 언어 변수를 통해 모호한 개념을 수학적으로 표현하는 논리 시스템으로, 가전제품 제어, 인공지능 등 다양한 분야에 응용되며 여러 퍼지 시스템 모델과 형식 체계가 존재한다.
  • 통계학 - 확률
    확률은 사건의 가능성을 수치화한 개념으로, 도박에서 시작되어 수학적으로 발전했으며, 다양한 해석과 요소, 응용 분야를 가지며 양자역학, 사회 현상 등에도 적용된다.
  • 통계학 - 사분위수
    사분위수는 정렬된 데이터를 4등분하는 세 개의 값으로 데이터 분포 요약 및 이상치 탐지에 활용되며, 제1사분위수(Q₁)는 하위 25%, 제2사분위수(Q₂ 또는 중앙값)는 하위 50%, 제3사분위수(Q₃)는 하위 75%를 나타낸다.
도수 확률
통계적 확률
다른 이름경험적 확률
사후 확률
유형확률 해석
분야통계학
반대되는 해석베이즈 확률
주관적 확률

2. 정의

빈도주의적 해석에서 확률은 잘 정의된 무작위 실험을 다룰 때만 논의된다.[26] 무작위 실험에서 일어날 수 있는 모든 가능한 결과의 집합을 그 실험의 표본 공간이라고 한다. 사건은 고려할 표본 공간의 특정 부분 집합으로 정의되며, 주어진 사건은 발생하거나 발생하지 않거나 둘 중 하나의 가능성만 가진다.

실험을 여러 번 반복하여 관찰된 사건 발생의 상대적 빈도는 해당 사건의 '''확률'''을 측정하는 척도가 된다. 이것이 빈도주의적 해석에서 확률의 핵심 개념이다. 빈도주의적 접근 방식에서는 시행 횟수가 증가함에 따라 상대적 빈도의 변화가 점차 줄어든다고 본다. 따라서 확률은 해당 상대 빈도의 ''극한 값''으로 간주될 수 있으며, 통계적 확률은 사건의 상대 도수가 무한히 많은 시행을 통해 수렴하는 값으로 정의된다.[27]

3. 대상

빈도주의적 해석에서 확률은 잘 정의된 무작위 실험을 다룰 때만 논의된다. 무작위 실험의 모든 가능한 결과의 집합은 그 실험의 표본 공간이며, 사건은 고려할 표본 공간의 특정 부분 집합으로 정의된다. 어떤 사건에 대해 발생하거나 발생하지 않거나 두 가지 가능성만 존재한다. 빈도주의적 관점에서 확률은, 실험을 여러 번 반복했을 때 관찰되는 사건 발생의 상대 빈도를 통해 측정된다. 즉, 시행 횟수가 무한히 증가함에 따라 상대 빈도가 수렴하는 극한 값을 그 사건의 '''확률'''로 간주한다.

이러한 빈도주의적 해석은 확률의 정의와 사용에 대한 여러 철학적 접근 방식 중 하나이며, 일상 대화에서 사용되는 '확률적'이라는 개념의 모든 의미를 포괄하지는 않는다. 하지만 확률 이론의 수학적 공리화와 충돌하지 않으며, 오히려 수학적 확률 이론을 실제 상황에 어떻게 적용할지에 대한 구체적인 지침을 제공한다. 특히 베이즈주의 확률과 비교했을 때, 실제 실험의 구성 및 설계에 있어 뚜렷한 방향을 제시한다는 특징이 있다.

그러나 이러한 접근 방식의 유용성이나 오해 가능성에 대해서는 논란이 존재한다. 예를 들어, 빈도주의적 해석이 빈도주의적 추론의 유일한 근거라고 잘못 이해되는 경우가 있다. p-값의 의미에 대한 오해나 통계적 가설 검정을 둘러싼 논쟁들이 대표적이며, 제프리스-린들리 역설은 동일한 데이터를 두고도 확률 해석 방식에 따라 통계적 유의성에 대한 결론이 달라질 수 있음을 보여준다.

또한, 빈도주의적 확률은 원칙적으로 반복 가능한 실험에 적용되므로, 반복이 불가능한 단일 사건의 확률을 다루는 데에는 한계가 있다는 지적도 있다. 윌리엄 펠러는 이와 관련하여 다음과 같이 언급하며, '내일 해가 뜰 확률'과 같은 문제에 빈도주의적 접근을 적용하기 전에 명확한 확률 모델 설정이 필요함을 강조했다.

우리의 방식에는, 내일 해가 뜰 확률을 추측할 여지가 없다. 그것을 이야기하기 전에, 우리의 세계는 "무수히 많은 세계 중에서 무작위로 하나의 세계가 선택된다..."라는 (이상화된) 모델을 따라야 한다고 동의해야 한다. 이러한 모델의 구축은 작은 상상력으로 가능하지만, 그것으로는 재미도 없고 의미도 없다고 생각한다.[5][28]

4. 역사

빈도주의적 관점의 기원은 고대 아리스토텔레스까지 거슬러 올라갈 수 있다. 그는 ''수사학''에서 "개연적인 것은 대부분 일어나는 것"이라고 언급했는데, 이는 빈도주의적 사고의 초기 형태로 볼 수 있다.[6][30]

근대에 들어 푸아송은 1837년 저술에서 객관적 확률과 주관적 확률을 명확히 구분했다.[8][31] 이후 19세기 중반, , 엘리스(1843[9], 1854[10]), 쿠르노(1843)[11], 프리스 등이 거의 동시에 빈도주의적 관점을 도입하는 저술들을 발표했다. 은 1866년 ''The Logic of Chance''를 시작으로 1876년, 1888년 개정판을 통해 빈도주의적 확률론에 대한 체계적인 설명을 제시했다.[35] 이러한 빈도주의적 해석은 과 베르트랑 등의 연구를 통해 더욱 지지받았으며, 19세기 말에는 과학 분야에서 확고히 자리 잡아 지배적인 확률 해석으로 여겨졌다.[8]

한편, 야코프 베르누이는 이미 18세기 초에 빈도주의적 확률 개념을 이해하고 있었으며, 그의 사후 1713년에 출판된 저작에서 대수의 법칙에 대한 중요한 증명을 제시했다.[12][36] 그는 또한 베이즈 정리가 등장하기 전에 주관 확률에 대한 이해도 가지고 있었다는 평가를 받는다.[13][37][14][38] 가우스와 라플라스 역시 푸아송보다 한 세대 앞서 최소제곱법을 유도하는 과정에서 빈도주의적 확률 개념을 활용했다.[15][39] 라플라스는 증언의 신뢰도, 사망표, 법원 판결과 같이 전통적인 고전적 확률로는 다루기 어려운 문제들에 확률 개념을 적용하기도 했다. 이러한 맥락에서 푸아송의 기여는 당시 대안적 확률 해석이었던 "역확률", 즉 주관 확률(베이즈 확률)에 대한 명확한 비판을 제기했다는 점에 있다. 가우스나 라플라스는 역확률에 대해 직접적인 비판보다는 암묵적인 방식을 택했다.[15]

20세기에 들어서면서 로널드 피셔, 예르지 네이만, 에곤 피어슨 등은 빈도주의 확률에 기반한 고전적 추론 통계학의 핵심 도구들, 즉 유의성 검정, 가설 검정, 신뢰 구간 등을 확립했다. 이들은 통계적 추론의 객관성을 중시했기 때문에 빈도주의적 해석을 선호했다. 피셔는 현대 통계학의 여러 분야에 크게 기여하고 유의성 검정을 실험 과학의 표준 방법으로 만들었지만, "동일한 모집단에서 반복적으로 표본을 추출한다"는 빈도주의의 핵심 가정을 비판하기도 했다.[16][40] 네이만은 신뢰 구간 개념을 정립하고 표본 추출 이론 발전에 크게 기여했으며, 피어슨과 함께 가설 검정 이론을 공동으로 개발했다. 이들은 모두 등확률의 원리에 기반하여 사전 확률을 설정하는 베이즈주의적 접근법("역확률")에 대해 회의적이었다. 특히 피셔는 "역확률 이론은 오류에 기반하고 있으며 완전히 거부되어야 한다"고 주장하며 베이즈 정리의 적용에 강하게 반대했다.[17] 네이만은 철저한 빈도주의자였던 반면,[18][26] 피셔의 확률관은 다소 독자적인 측면이 있었다. 이 시기 리하르트 폰 미제스는 빈도주의에 대한 수학적, 철학적 토대를 제공하며 이론적 발전에 기여했다.[19][20][27][41]

'빈도주의자(frequentist)'라는 용어 자체는 1949년 모리스 켄달이 베이즈주의자(그는 '비빈도주의자(non-frequentists)'라고 불렀다)와 구분하기 위해 처음 사용한 것으로 알려져 있다.[21][22] 켄달은 빈도주의자들이 확률을 실제 또는 가상의 집단이 갖는 객관적인 속성으로 정의하려는 경향이 있는 반면, 비빈도주의자들은 확률을 '합리적 믿음의 정도'와 같은 주관적인 개념으로 본다고 지적했다.[22]

5. 다른 관점

확률을 이해하고 적용하는 방식에는 빈도주의적 해석 외에도 여러 가지 관점이 존재한다. 이러한 다양한 해석들은 확률론이라는 수학적 틀 안에서 공존하지만, 확률의 본질과 적용 방식에 대해 서로 다른 철학적 입장을 제시한다.[23][44]

수학의 한 분야인 확률론안드레이 콜모고로프가 1933년에 제시한 확률의 공리를 통해 현대적인 모습을 갖추게 되었다. 이 공리 체계는 확률 값 자체를 어떻게 정하는지보다는, 정해진 확률 값들을 가지고 어떻게 유효한 계산을 할 것인지에 초점을 맞춘다. 따라서 확률론의 수학적 구조는 특정 해석 방식에 얽매이지 않는다.

그러나 실제 세계의 현상에 확률 이론을 적용할 때는 어떤 해석을 따르느냐가 중요해진다. 주요 확률 해석으로는 물리적 대칭성에 기반한 고전적 확률, 개인의 믿음의 정도를 다루는 베이즈(주관적) 확률, 그리고 현상의 내재적 경향성을 강조하는 성향 확률 등이 있다.[23][44] 각 해석은 나름의 장점과 함께 해결해야 할 문제점들을 안고 있다. 예를 들어, 빈도주의적 해석은 고전적 확률이 다루기 어려운 비대칭적 상황에 유용하지만, '도박 빚' 문제와 같이 일회성 사건의 확률을 다루는 데는 한계가 있을 수 있다.

서로 다른 확률 해석은 때로 동일한 데이터를 두고도 상반된 결론을 내리게 하여 논쟁을 불러일으키기도 한다. 대표적인 예로 p-값의 의미를 둘러싼 오해와 논란[5], 그리고 베이즈주의적 접근과 빈도주의적 접근이 동일한 데이터로부터 통계적 유의성에 대해 다른 결론을 도출할 수 있음을 보여주는 제프리스-린들리 역설 등이 있다.

윌리엄 펠러와 같은 학자는 특정 확률 해석의 한계를 지적하기도 했다. 그는 피에르시몽 라플라스가 다른 확률 해석을 사용하여 "내일 해가 뜰 확률"을 계산한 것에 대해, 이는 현실 세계를 지나치게 이상화한 모델에 기반한 무의미한 추측일 수 있다고 비판했다.[5][28] 이는 확률을 어떻게 해석하고 적용할 것인가에 대한 근본적인 질문이 계속되고 있음을 보여준다.

결국 확률 해석은 철학, 과학, 통계학 등 다양한 분야에서 관찰로부터 지식을 얻는 귀납적 추론 과정에 영향을 미치는 중요한 문제이다.

5. 1. 고전적 확률

고전적 확률은 주사위, 동전, 카드와 같이 물리적으로 이상화된 대칭성을 가진 대상을 기반으로 확률을 할당하는 방식이다.[24] 예를 들어, 완벽하게 대칭적인 주사위를 던질 때 각 면이 나올 확률은 동일하게 1/6이라고 보는 것이다. 하지만 이러한 고전적 정의는 모든 가능한 결과(근원 사건)가 발생할 확률이 동일하다는 것을 전제로 하는데, 이는 확률을 정의하기 위해 다시 확률의 동일성을 가정하는 순환성의 문제를 안고 있다.[45] 또한, 이러한 명확한 물리적 대칭성이 존재하지 않는 현실의 많은 문제에 대해서는 고전적 확률을 적용하기 어렵다는 한계를 지닌다.

5. 2. 베이즈 확률 (주관적 확률)

주관적(베이즈) 확률은 확률을 해석하는 여러 방법 중 하나로, 개인의 신념의 정도를 확률로 간주한다. 모든 실용적인 "주관적" 확률 해석은 지나친 주관성을 배제하기 위해 합리성에 의해 제한된다. 즉, 개인의 믿음을 바탕으로 하지만, 논리적인 제약을 따른다는 의미이다.

순수한 주관성은 관찰자나 분석가에 따라 결과가 달라질 수 있어, 객관적인 결과를 중요시하는 일부 과학적 관점과는 맞지 않을 수 있다. 그러나 베이즈주의를 과학에 응용하는 경우, 예를 들어 논리적 베이즈주의에서는 연구 대상이나 과정에 내재된 주관성을 인정한다. 이러한 접근 방식은 베이즈 추론을 활용하여 분석 결과에 미치는 주관성의 영향을 명확히 하고 그 맥락을 이해하는 데 도움을 준다.[25]

이러한 베이즈 확률의 개념은 단순히 수치적인 확률 계산을 넘어, 법적 증거와 같이 수치화하기 어려운 분야에서도 그 타당성이나 신뢰도를 평가하는 데 확장되어 적용될 수 있다.

5. 3. 성향 확률

Propensity probability|성향 확률eng은 확률을 순수한 기술적 또는 주관적 현상이라기보다는 인과적 현상으로 보는 관점이다.[23][44] 즉, 특정 결과가 나타날 확률은 단순히 관찰된 빈도나 개인의 믿음의 정도가 아니라, 해당 결과를 발생시키는 시스템 자체의 내재적인 경향성이나 성향(propensity)에 의해 결정된다고 설명한다.

6. 비판 및 한계

빈도주의적 해석은 확률을 정의하고 사용하는 여러 철학적 접근 방식 중 하나이지만, 일상 대화에서 사용되는 '확률적'이라는 개념의 모든 의미를 포착하지는 못한다는 한계가 있다. 이 해석은 잘 정의된 무작위 실험을 반복할 수 있는 상황에만 적용될 수 있으며, 모든 종류의 불확실성을 다루기에는 제약이 따른다.

대표적인 비판 중 하나는 단일 사건(unique event)의 확률을 다루기 어렵다는 점이다. 예를 들어, 통계학자 윌리엄 펠러는 "내일 해가 뜰 확률"과 같은 문제에 빈도주의적 확률을 적용하는 것에 대해 회의적인 입장을 보였다. 그는 이러한 확률을 논하기 위해서는 "무한히 많은 세계 중 하나를 무작위로 선택한다"는 식의 이상화된 모델이 필요하며, 이는 현실적으로 구성하기 어렵고 큰 의미를 갖기 어렵다고 지적했다.[5][28] 펠러의 이러한 언급은 과거 피에르시몽 라플라스가 다른 확률 해석을 통해 일출 문제를 다루었던 것에 대한 비판적 시각을 반영한다.

또한, 빈도주의적 접근 방식에 기반한 빈도주의적 추론 방법들이 실제 적용 과정에서 오해를 불러일으키기 쉽다는 비판도 제기된다. 특히 p-값의 의미를 잘못 해석하는 경우가 빈번하며, 이는 통계적 가설 검정과 관련된 여러 논란으로 이어지기도 했다.

더 나아가, 제프리스-린들리 역설은 동일한 데이터 세트를 두고 빈도주의적 해석과 베이즈주의적 해석과 같은 다른 확률 해석을 적용했을 때, 결과의 '통계적 유의성'에 대해 서로 다른 결론에 도달할 수 있음을 보여준다. 이는 어떤 확률 해석을 채택하는지에 따라 현실 문제에 대한 결론이 달라질 수 있음을 시사하며, 빈도주의적 해석의 보편적 적용 가능성에 대한 의문을 제기한다.

참조

[1] 서적 Bayesian Statistics for the Social Sciences https://books.google[...] Guilford Publications 2022-04-23
[2] 간행물 Toward evidence-based medical statistics. 1: The p value fallacy
[3] 간행물 The fallacy of placing confidence in confidence intervals
[4] 간행물 The p-value statement, five years on
[5] 서적 An Introduction to Probability Theory and Its Applications
[6] 서적 A Treatise on Probability
[7] 서적 Rhetoric
[8] 서적 The Empire of Chance : How probability changed science and everyday life Cambridge University Press
[9] 간행물 On the foundations of the theory of probabilities
[10] 간행물 Remarks on the fundamental principles of the theory of probabilities
[11] 서적 Exposition de la théorie des chances et des probabilités https://archive.org/[...] L. Hachette
[12] 서적 Ars Conjectandi: Usum & applicationem praecedentis doctrinae in civilibus, moralibus, & oeconomicis
[13] 간행물 A Brief History of Statistics in Three and One-half Chapters: A Review Essay
[14] 서적 Games, Gods, & Gambling Hafner
[15] 서적 A history of Parametric Statistical Inference from Bernoulli to Fisher, 1713 to 1935 Anders Hald, Department of Applied Mathematics and Statistics, University of Copenhagen
[16] 간행물 "Repeated sampling from the same population?" A critique of Neyman and Pearson's responses to Fisher https://doi.org/10.1[...]
[17] 서적 Statistical Methods for Research Workers
[18] 간행물 Outline of a theory of statistical estimation based on the classical theory of probability 1937-08-30
[19] 서적 Probability, Statistics, and Truth Dover Publications
[20] 서적 Philosophical Theories of Probability Psychology Press
[21] 웹사이트 Earliest known uses of some of the words of probability & statistics http://www.leidenuni[...] Leiden University
[22] 간행물 On the Reconciliation of Theories of Probability
[23] encyclopedia Interpretations of probability http://plato.stanfor[...] 2002-10-21
[24] 서적 Basic Probability Theory Wiley
[25] 간행물 Explicit Bayesian analysis for process tracing: Guidelines, opportunities, and caveats http://eprints.lse.a[...] 2017-05-15
[26] 간행물 Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability 1937-08-30
[27] 서적 Probability, Statistics, and Truth
[28] 서적 An Introduction to Probability Theory and Its Applications, Vol. 1
[29] 서적 A Treatise on Probability
[30] 서적 Rhetoric
[31] 서적 The Empire of chance : how probability changed science and everyday life Cambridge University Press
[32] 간행물 On the Foundations of the Theory of Probabilities
[33] 간행물 Remarks on the Fundamental Principles of the Theory of Probabilities
[34] 서적 Exposition de la théorie des chances et des probabilités
[35] 서적 The Logic of Chance
[36] 서적 A history of parametric statistical inference from Bernoulli to Fisher, 1713 to 1935 Anders Hald, Department of applied Mathematics and Statistics, [[コペンハーゲン大学|University of Copenhagen]]
[37] 간행물 A Brief History of Statistics in Three and One-half Chapters: A Review Essay
[38] 서적 Games, Gods & Gambling Hafner
[39] 서적 A history of parametric statistical inference from Bernoulli to Fisher, 1713 to 1935 Anders Hald, Department of Applied Mathematics and Statistics, University of Copenhagen
[40] 간행물 "Repeated sampling from the same population?" A critique of Neyman and Pearson's responses to Fisher. https://doi.org/10.1[...]
[41] 서적 The Frequency theory Psychology Press
[42] 웹사이트 Earliest Known Uses of Some of the Words of Probability & Statistics https://web.universi[...] 2022-04-24
[43] 간행물 On the Reconciliation of Theories of Probability Biometrika Trust
[44] 서적 Interpretations of Probability http://plato.stanfor[...] 2002-10-21
[45] 서적 Basic Probability Theory Wiley
[46] 간행물 Explicit Bayesian Analysis for Process Tracing: Guidelines, Opportunities, and Caveats http://eprints.lse.a[...] 2017-05-15



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com