맨위로가기

표본 공간

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

표본 공간은 통계학에서 실험이나 관찰의 가능한 모든 결과의 집합을 의미한다. 표본 공간은 결과가 상호 배타적이고 전체 포괄적이며, 실험자의 관심사에 따라 적절한 세분성을 가져야 한다. 표본 공간은 그 크기에 따라 유한, 가산, 비가산 표본 공간으로 분류되며, 유한 표본 공간은 다시 등확률 공간과 비등확률 공간으로 나뉜다. 동일한 실험에 대해 여러 표본 공간을 설정할 수 있으며, 통계적 추론을 위해 단순 무작위 표본을 사용하기도 한다.

더 읽어볼만한 페이지

  • 공간 (수학) - 사영 공간
    사영 공간은 공면선 교차점 공식화, 원근법 연구, 벡터 공간의 벡터 선 집합 등으로 정의되며, 대수기하학, 위상수학 등 다양한 분야에서 중요한 대수적 개념이다.
  • 공간 (수학) - 아핀 공간
    아핀 공간은 벡터 공간에서 원점 개념을 제외한 기하학적 구조로, 벡터 공간이 정추이적으로 작용하는 집합이며, 유클리드 공간의 일반화된 형태이고 사영 공간과 밀접한 관계를 가진다.
  • 공간 - 우주 공간
    우주 공간은 지구 대기권 바깥의 극한 환경을 가진 공간으로, 국제항공연맹은 카르만 선을 기준으로 대기권과 구분하며 우주 탐사 및 다양한 위성 활용이 이루어지고 있다.
  • 공간 - 위상 공간 (물리학)
    위상 공간은 역학계의 모든 가능한 상태를 모아 시스템의 상태 변수를 좌표로 나타낸 공간으로, 시간의 흐름에 따라 궤적을 그리며 시스템의 동역학적 거동을 분석하는 데 사용된다.
  • 확률론 - 확률 밀도 함수
    확률 밀도 함수는 연속 확률 변수의 확률 분포를 나타내는 함수로, 특정 구간에서 확률 변수가 값을 가질 확률은 해당 구간에 대한 함수의 적분으로 계산되며, 통계적 특성 계산 및 변수 변환 등에 활용되어 불확실성 모델링 및 분석에 중요한 역할을 한다.
  • 확률론 - 체비쇼프 부등식
    체비쇼프 부등식은 확률 변수가 평균에서 얼마나 멀리 떨어져 있는지에 대한 확률의 상한을 제공하는 부등식으로, 이레네-쥘 비네메가 처음 공식화하고 체비쇼프와 안드레이 마르코프에 의해 일반화 및 증명되었으며, 확률론적 표현 외에도 측도 공간에 대한 명제로 확장될 수 있다.
표본 공간
확률 공간
정의확률 실험의 가능한 모든 결과의 집합
다른 이름표본 기술 공간
사건 공간
가능성 공간
기호Ω (오메가)
U

2. 표본 공간의 조건

표본 공간이 되기 위해서는, 결과 s_1, s_2, \ldots, s_n을 가진 집합 \Omega (즉, \Omega = \{s_1, s_2, \ldots, s_n\})는 몇 가지 조건을 충족해야 한다.[13]


  • 결과는 '''상호 배타적'''이어야 한다. 즉, s_j가 발생하면 다른 s_i는 발생하지 않아야 한다 (\forall i,j=1,2,\ldots,n \quad i\neq j).[6]
  • 결과는 '''전체 포괄적'''이어야 한다. 즉, 모든 실험(또는 임의 시행)에서 항상 i \in \{1, 2, \ldots, n\}에 대해 어떤 결과 s_i \in \Omega가 발생해야 한다.[6]
  • 표본 공간(\Omega)은 실험자가 무엇에 관심이 있는지에 따라 '''적절한 세분성'''을 가져야 한다. 표본 공간에서 관련 없는 정보는 제거되어야 하며, 적절한 추상화가 선택되어야 한다.


예를 들어, 동전 던지기 실험에서 한 가지 가능한 표본 공간은 \Omega_1 = \{H,T\}인데, 여기서 H는 동전이 앞면으로 나오는 결과이고 T는 뒷면을 의미한다. 다른 가능한 표본 공간은 \Omega_2 = \{(H,R), (H,NR), (T,R), (T,NR)\}일 수 있다. 여기서, R은 비가 오는 날을 나타내고, NR은 비가 오지 않는 날을 나타낸다. 대부분의 실험에서, 실험자는 날씨가 동전 던지기에 어떤 영향을 미치는지에 대해 관심이 없을 것이므로, \Omega_1\Omega_2보다 더 나은 선택일 것이다.

'''확률'''은 표본 공간의 크기에 따라 정의 방식이 다르다.

3. 표본 공간의 종류

표본 공간은 포함하는 근원 사건의 개수, 즉 크기에 따라 분류할 수 있다. 확률은 표본 공간의 크기에 따라 정의하는 방식이 달라지기도 한다.[9] 예를 들어, 52장의 트럼프 카드 덱에서 카드를 뽑는 실험처럼 결과가 유한한 경우(유한 표본 공간)도 있고[4][14], 전구의 수명을 측정하는 실험처럼 수명이 0 이상의 어떤 실수 값도 가능하여(`[0, ∞)`) 결과가 무한한 경우(비가산 표본 공간)도 있다.[9]

표본 공간은 크게 결과의 개수가 유한한 경우(유한 표본 공간), 무한하지만 자연수와 일대일 대응이 가능한 경우(가산 표본 공간), 그리고 무한하면서 자연수와 일대일 대응이 불가능한 경우(비가산 표본 공간)로 나눌 수 있다. 각 종류에 따라 사건을 정의하고 확률을 계산하는 방식에 차이가 있을 수 있다.[9]

3. 1. 유한 표본 공간

동전을 던지면 거의 같은 확률로 나타나는 두 가지 결과로 구성된 '''표본 공간'''이 생성된다.


머리핀의 뾰족한 부분이 아래로 향함
위 또는 아래? 머리핀을 던지면 균등하게 나타나지 않는 두 가지 결과로 구성된 '''표본 공간'''이 생성된다.


유한 표본 공간은 어떤 확률 실험에서 발생 가능한 모든 근원 사건(결과)의 수가 유한한 경우를 말한다. 유한 표본 공간은 각 근원 사건이 발생할 확률이 모두 동일한지 여부에 따라 크게 두 가지 유형으로 나눌 수 있다.

첫 번째 유형은 모든 근원 사건이 동일한 확률로 발생하는 경우로, 이를 '''등확률 공간'''이라고 한다. 동전 던지기나 공정한 주사위 던지기 등이 대표적인 예시에 해당한다.[15][16]

두 번째 유형은 근원 사건들의 발생 확률이 서로 다른 경우로, '''비등확률 공간'''이라고 한다. 예를 들어, 압정을 던졌을 때 뾰족한 부분이 위를 향할 확률과 아래를 향할 확률은 일반적으로 동일하지 않다.[17]

3. 1. 1. 등확률 공간



어떤 실험에서는 각 근원 사건(결과)이 항상 동일한 확률로 발생한다고 가정하기도 한다.[15] 이러한 표본 공간을 등확률 공간이라고 부른다. 표본 공간에 N개의 동일한 확률을 가진 근원 사건이 있다면, 각 근원 사건의 확률은 \frac{1}{N}이 된다.[16]

모든 실험이 등확률 공간으로 쉽게 설명되는 것은 아니다. 예를 들어, 압정을 여러 번 던져 뾰족한 부분이 위를 향하는지 아래를 향하는지 관찰하는 실험을 생각해보자. 압정의 모양 때문에 두 결과가 같은 확률로 나타날 것이라고 기대하기는 어렵다. 즉, 물리적인 대칭성이 부족하여 각 결과의 발생 가능성이 같다고 보기 어렵다.[17]

하지만 많은 무작위 현상에서, 비록 실제로는 확률이 정확히 같지 않더라도, 결과를 대략적으로 동일한 확률을 갖도록 표본 공간을 정의하는 것이 유용할 때가 많다. 왜냐하면 각 근원 사건의 확률이 같다고 가정하면, 특정 사건이 일어날 확률을 계산하는 것이 매우 간단해지기 때문이다. 등확률 공간에서 어떤 사건의 확률은 다음과 같이 계산할 수 있다.[18]

: \mathrm{P}(\text{사건}) = \frac{\text{사건에 포함된 결과의 수}}{\text{표본 공간에 포함된 결과의 수}}

이 공식은 라플라스가 제시한 확률의 고전적 정의(수학적 확률 또는 이론적 확률이라고도 함)에 해당하며, 다음과 같이 표현하기도 한다.[26]

: P(\text{사건}) = \frac{\text{사건의 크기}}{\text{표본 공간의 크기}}

예를 들어, 공정한 6면체 주사위 두 개를 던지는 경우를 생각해보자. 각 주사위는 1부터 6까지의 숫자가 나올 확률이 이산 균등 분포를 따른다고 가정한다. 이때 가능한 결과는 (첫 번째 주사위 눈, 두 번째 주사위 눈)의 순서쌍으로 나타낼 수 있으며, 총 36가지(6 \times 6 = 36)의 경우가 존재한다. 이 36가지 결과는 모두 동일한 확률(\frac{1}{36})을 가지므로 등확률 공간을 형성한다. 이 경우 위의 공식을 사용하여 특정 사건의 확률을 계산할 수 있다. 예를 들어, 두 주사위 눈의 합이 5가 될 확률을 구해보자. 합이 5가 되는 경우는 (1, 4), (2, 3), (3, 2), (4, 1)의 4가지 경우가 있다. 따라서 확률은 \frac{4}{36} = \frac{1}{9}이다. 만약 두 눈의 합이 7이 될 확률을 구한다면, 합이 7이 되는 경우는 (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)의 6가지 경우가 있으므로 확률은 \frac{6}{36} = \frac{1}{6}이다.[19]

표본 공간이 유한 집합일 경우, 실험의 근원 사건들이 정말로 "동일한 가능성"을 가지는지 항상 신중하게 고려해야 한다.[27] 앞서 언급한 압정 던지기처럼 명백히 비대칭적인 경우에는, 각 결과가 얼마나 자주 발생하는지를 실제로 관찰하여 통계적 확률을 구하는 것이 더 적합할 수 있다(대수의 법칙 참조).

반대로, 동전 던지기의 앞면과 뒷면, 또는 공정한 주사위의 각 눈처럼 대칭성이 명확하게 인정되는 경우에는 각 근원 사건의 확률이 같다고 가정하는 것이 합리적이다. 물론 동전이나 주사위에 눈에 띄는 왜곡이 있다면, 이 경우에도 실제 실험을 통해 통계적 확률을 구해야 할 것이다.

3. 1. 2. 비등확률 공간

모든 근원 사건이 동일한 확률을 가지는 것은 아니다. 어떤 실험에서는 특정 결과가 다른 결과보다 더 자주 발생할 수 있는데, 이러한 경우의 표본 공간을 비등확률 공간이라고 한다.[15] 이는 모든 결과가 나올 확률이 같다고 가정하는 등확률 공간과 구분된다.

대표적인 예로 압정 던지기를 들 수 있다. 압정은 머리 부분과 뾰족한 부분이 비대칭적인 모양을 하고 있어, 던졌을 때 뾰족한 부분이 위로 향할 확률과 아래로 향할 확률이 같다고 보기 어렵다.[17] 이처럼 물리적인 대칭성이 부족하여 각 결과의 발생 가능성이 다른 경우가 비등확률 공간에 해당한다.

비등확률 공간에서는 각 근원 사건의 확률이 다르므로, 등확률 공간처럼 단순히 '사건에 포함된 결과의 수 / 전체 결과의 수'라는 고전적 방식으로 확률을 계산하기 어렵다.[18]

대신, 각 사건의 실제 확률은 빈도주의 통계학적 관점에서 파악하는 것이 일반적이다. 즉, 동일한 실험을 매우 많이 반복했을 때 특정 결과가 나타나는 상대적인 빈도수를 관찰하여 확률을 추정하는 것이다. 이는 대수의 법칙에 근거한다.[27]

압정처럼 명백히 비대칭적인 경우 외에도, 동전이나 주사위처럼 대칭적으로 보이는 대상이라도 실제 제작상의 미세한 불균형이나 던지는 방식의 특성 등으로 인해 엄밀히는 비등확률 공간을 이룰 수 있다. 이런 경우에도 실제 확률은 반복 실험을 통한 통계적 확률로 파악해야 한다.

3. 2. 가산 표본 공간

발생 가능한 결과의 수가 무한하지만, 자연수와 일대일 대응이 가능한 경우를 가산 표본 공간이라고 한다. 예를 들어, 주어진 시간 내에 발생하는 특정 사건의 횟수를 모아 놓은 집합은 가산 표본 공간이 된다.[9] 이러한 경우는 푸아송 분포와 관련이 깊다.

3. 3. 비가산 표본 공간

발생 가능한 결과의 수가 무한히 많고, 각 결과를 자연수와 하나씩 짝지을 수 없는 경우를 비가산 표본 공간이라고 한다. 예를 들어, 전구의 수명을 측정하는 경우, 수명은 0 이상의 어떤 실수 값도 가질 수 있으므로 표본 공간은 구간 [0, ∞) 이 된다.[9]

확률에 대한 기본적인 접근에서는 표본 공간의 임의의 부분 집합을 사건으로 정의한다.[9] 그러나 전구 수명과 같이 표본 공간이 연속적인 값을 가질 때는 이러한 접근 방식에 문제가 생길 수 있다. 모든 부분 집합을 사건으로 간주하기 어렵기 때문에, 표본 공간의 측도 가능한 부분 집합만을 사건으로 다루는 보다 정확한 정의가 사용된다. 이러한 사건들은 표본 공간에 대한 σ-대수를 구성한다. 비가산 표본 공간에서는 특정 결과값 하나의 확률보다는 특정 구간에 속할 확률을 구하는 것이 일반적이며, 이는 주로 확률 밀도 함수를 이용하여 계산한다.

4. 다중 표본 공간

하나의 실험이나 시행에 대해, 어떤 결과에 관심을 가지는지에 따라 여러 개의 표본 공간을 설정할 수 있다. 예를 들어, 52장의 트럼프 카드 덱에서 카드 한 장을 뽑는 경우를 생각할 수 있다.[4][14][24]


  • 만약 카드의 숫자 (에이스부터 킹까지)에만 관심이 있다면, 표본 공간은 {에이스, 2, 3, ..., 10, 잭, 퀸, 킹}이 될 수 있다.
  • 만약 카드의 무늬 (클럽, 다이아몬드, 하트, 스페이드)에만 관심이 있다면, 표본 공간은 {클럽, 다이아몬드, 하트, 스페이드}가 될 수 있다.


결과를 더 자세하게 기술하고 싶다면, 숫자와 무늬를 모두 고려하여 각 카드를 구별할 수 있다. 이 경우 표본 공간은 숫자 집합과 무늬 집합의 데카르트 곱으로 구성되며, 총 52개의 동일하게 발생 가능한 결과(개별 카드)를 포함하게 된다.[28]

또 다른 관점에서 표본 공간을 설정할 수도 있다. 예를 들어, 카드를 섞을 때 일부 카드가 뒤집히는 상황에 관심이 있다면, 표본 공간을 {'정위치', '역위치'}와 같이 설정할 수도 있다.

5. 단순 무작위 표본

통계학에서는 모집단의 특성에 대한 추론은 해당 모집단의 표본을 연구하여 이루어진다. 표본이 모집단의 진정한 특징에 대해 편향되지 않은 추정을 제시하도록 하기 위해, 통계학자들은 종종 단순 임의 표본—즉, 모집단의 모든 개체가 표본에 포함될 확률이 동일한 표본—을 연구하려고 한다.[18][26] 이로 인해 표본으로 선택될 수 있는 모든 가능한 개체 조합이 선택될 표본이 될 가능성이 동일해진다(즉, 주어진 모집단에서 주어진 크기의 단순 임의 표본 공간은 동일하게 가능성이 높은 결과로 구성된다).[20]

6. 한국 사회와 표본 공간

통계학에서는 전체 모집단의 특징을 파악하기 위해 일부 표본을 조사하는 방식을 사용한다. 이때 표본이 모집단의 특성을 편향 없이 잘 나타내도록 하기 위해, 통계학자들은 단순 무작위 표본 추출 방법을 사용하는 경우가 많다. 이 방법은 모집단에 속한 모든 개체가 표본으로 선택될 확률이 동일하도록 하는 방식이다.[26]

한국의 고등학교 수학 교육 과정에서는 '확률과 통계' 과목을 통해 표본 공간, 확률, 통계적 추정 등 통계학의 기본 개념을 학습한다. 이는 학생들이 데이터를 기반으로 합리적인 판단을 내리고 다양한 사회 현상을 분석하는 능력을 함양하는 데 도움을 준다.

실제로 한국 사회에서 여론 조사는 정치, 사회, 경제 등 다양한 분야에서 국민 의견을 파악하는 중요한 도구로 활용된다. 많은 여론 조사가 단순 무작위 표본 추출과 같은 확률 표집 방법을 이용해 조사 대상을 선정하고, 그 결과를 바탕으로 전체 국민의 여론을 추정한다. 특히 선거 기간에는 여론 조사 결과가 각 후보정당의 지지율에 큰 영향을 미치기도 한다.

표본 공간의 개념은 여러 사회 현상을 이해하고 분석하는 데에도 활용될 수 있다. 예를 들어, 특정 질병발병률을 파악할 때, 전체 인구를 모집단이자 표본 공간으로 설정하고, 해당 질병에 걸린 사람들을 특정 사건으로 정의하여 그 확률을 계산할 수 있다.

참조

[1] 서적 Probability and Random Processes with Applications to Signal Processing Pearson
[2] 서적 Statistical Distributions https://archive.org/[...] Wiley
[3] 서적 Probability and Statistical Inference Pearson Education, Inc 2013-12-24
[4] 웹사이트 Listing All Possible Outcomes (The Sample Space) http://www-math.bgsu[...] Bowling Green State University 2013-06-25
[5] 서적 Fundamentals of probability and statistics for engineers https://www.worldcat[...] Wiley 2004
[6] 웹사이트 UOR_2.1 https://web.mit.edu/[...] 2019-11-21
[7] 서적 A First Course in Probability http://julio.staff.i[...] Pearson Prentice Hall
[8] 서적 A modern introduction to probability and statistics : understanding why and how Springer 2005
[9] 웹사이트 Sample Space, Events and Probability https://faculty.math[...]
[10] 서적 An Introduction to Mathematical Statistics and Its Applications Prentice Hall
[11] 서적 Planning Algorithms http://lavalle.pl/pl[...] Cambridge University Press
[12] 웹사이트 Sample Spaces, Events, and Their Probabilities https://saylordotorg[...] 2019-11-21
[13] 웹사이트 Sample Spaces https://ocw.mit.edu/[...] Massachusetts Institute of Technology 2018-07-09
[14] 웹사이트 Stats: Introduction to Probability - Sample Spaces https://people.richl[...] Richland Community College 2013-11-30
[15] 서적 Algebra and Trigonometry: Functions and Applications, Teacher's Edition https://archive.org/[...] Prentice Hall
[16] 웹사이트 Equally Likely outcomes https://www3.nd.edu/[...]
[17] 웹사이트 Chapter 3: Probability https://www.coconino[...]
[18] 서적 The Practice of Statistics http://bcs.whfreeman[...] Freeman
[19] 웹사이트 Probability: Rolling Two Dice http://www.math.hawa[...] 2021-12-17
[20] 웹사이트 Simple Random Samples https://web.ma.utexa[...] 2019-11-21
[21] 서적 Probability and Random Processes with Applications to Signal Processing Pearson
[22] 웹사이트 OECD Glossary of Statistical Terms - Sample space Definition http://stats.oecd.or[...] "" 2015-02-27
[23] 서적 Statistical Distributions Wiley
[24] 웹사이트 Listing All Possible Outcomes (The Sample Space) http://www-math.bgsu[...] Bowling Green State University 2013-06-25
[25] 서적 確率論の基礎概念 http://www.chikumash[...] 筑摩書房 2010-07-07
[26] 서적 The Practice of Statistics http://bcs.whfreeman[...] Freeman
[27] 서적 Algebra and Trigonometry: Functions and Applications, Teacher's Edition Prentice Hall
[28] 웹사이트 Stats: Introduction to Probability - Sample Spaces https://people.richl[...] Richland Community College 2013-11-30
[29] 서적 통계수학 세종출판사 2003-10-10
[30] 서적 수리통계학 입문 1995-03-10



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com