맨위로가기

확률 질량 함수

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

확률 질량 함수는 이산 확률 변수의 확률 분포를 정의하는 함수로, 변수가 특정 값을 가질 확률을 나타낸다. 확률 질량 함수는 음이 아닌 값을 가지며, 모든 가능한 값에 대한 확률의 합은 1이다. 확률 질량 함수는 이산 확률 변수의 누적 분포 함수와 밀접한 관련이 있으며, 측도론을 사용하여 보다 일반적인 형태로 정의될 수도 있다. 동전 던지기, 주사위 던지기, 베르누이 분포, 이항 분포, 기하 분포 등 다양한 확률 분포를 설명하는 데 사용되며, 다변수 확률 변수의 결합 확률 분포를 표현하는 데에도 활용된다.

더 읽어볼만한 페이지

  • 확률론 - 확률 밀도 함수
    확률 밀도 함수는 연속 확률 변수의 확률 분포를 나타내는 함수로, 특정 구간에서 확률 변수가 값을 가질 확률은 해당 구간에 대한 함수의 적분으로 계산되며, 통계적 특성 계산 및 변수 변환 등에 활용되어 불확실성 모델링 및 분석에 중요한 역할을 한다.
  • 확률론 - 체비쇼프 부등식
    체비쇼프 부등식은 확률 변수가 평균에서 얼마나 멀리 떨어져 있는지에 대한 확률의 상한을 제공하는 부등식으로, 이레네-쥘 비네메가 처음 공식화하고 체비쇼프와 안드레이 마르코프에 의해 일반화 및 증명되었으며, 확률론적 표현 외에도 측도 공간에 대한 명제로 확장될 수 있다.
확률 질량 함수
일반 정보
유형이산 확률 분포
표기P(X = x)
p(x)
정의
설명각 값에서 이산 확률 변수가 특정 값을 가질 확률
확률 값0 ≤ p(x) ≤ 1
총 확률∑x p(x) = 1 (모든 x 값에 대한 합)
속성
평균E(X) = ∑x x p(x)
분산Var(X) = ∑x (x - μ)^2 p(x)

2. 정의

확률 질량 함수(Probability Mass Function, PMF)는 이산 확률 변수가 특정 값을 가질 확률을 나타내는 함수이다.[7][8] 이는 이산 확률 분포를 표현하는 방법 중 하나로, 확률 변수가 취할 수 있는 각각의 값과 그 값에 해당하는 확률을 연결한다.

표본 공간 S에서 정의된 이산 확률 변수 X에 대해, 확률 질량 함수 f_X(x) 또는 p_X(x)는 다음과 같이 정의된다.

:f_X(x) = \Pr(X=x)

여기서 \Pr(X=x)는 확률 변수 X가 정확히 값 x를 가질 확률을 의미한다.

확률 질량 함수는 두 가지 중요한 성질을 만족한다. 첫째, 모든 가능한 값 x에 대해 확률은 0 이상이어야 한다 (f_X(x) \ge 0). 둘째, 모든 가능한 값 x에 대한 확률의 총합은 1이어야 한다 (\sum_x f_X(x) = 1). 이는 확률의 기본 공리를 반영하는 것이다. 확률을 일종의 '질량'으로 생각하여, 가능한 모든 결과에 분포된 확률 질량의 총합이 1로 보존된다고 이해할 수도 있다.

2. 1. 수학적 정의

이산 확률 변수 X: S \to \mathbb{R}표본 공간 S에서 정의될 때, 확률 질량 함수(Probability Mass Function, PMF) f_X(x): \mathbb{R} \to [0,1]는 특정 값 x에 대해 확률 변수 X가 그 값을 가질 확률을 나타내며, 다음과 같이 정의된다.[7][8]

: f_X(x) = \Pr(X = x) = \Pr(\{s \in S: X(s) = x\})

여기서 \Pr확률을 나타내는 기호이며, P는 확률 측도를 의미한다. 간단히 p_X(x) 또는 p(x)로 표기하기도 한다.

확률 질량 함수는 이산 확률 변수가 취할 수 있는 각각의 값에 대해 그 값이 나타날 확률을 지정하는 함수이다. 따라서 모든 가능한 값 x에 대한 확률 질량 함수의 값은 다음 두 조건을 만족해야 한다.

1. 모든 x에 대해 f_X(x) \ge 0 이다. (확률은 음수가 될 수 없다.)

2. 모든 가능한 x 값들에 대한 확률의 총합은 1이다.

:\sum_x f_X(x) = 1

확률을 일종의 '질량'으로 생각하면 이해에 도움이 될 수 있다. 각 가능한 결과 x에 확률이라는 질량이 분포되어 있고, 모든 결과에 대한 질량(확률)의 총합은 항상 1로 보존된다는 개념은 물리적인 질량 보존 법칙과 유사하다.

확률 질량 함수는 이산 확률 변수의 확률 분포를 나타내는 한 방법이며, 더 일반적인 측도론적 관점에서도 이해할 수 있다. 확률 변수 X의 분포는 푸시포워드 측도 X_{*}(P)로 표현되며(여기서 P는 확률 공간 (A, \mathcal A, P)의 확률 측도), 확률 질량 함수는 이 분포를 계수 측도(counting measure) \mu에 대한 라돈-니코딤 도함수로 볼 수 있다. 즉, 확률 질량 함수 f_Xf_X = \frac{d X_*P}{d \mu} 로 표현되며, 각 b 값에 대해 다음이 성립한다.

:\Pr(X=b) = X_*(P)(\{b\}) = \int_{\{b\}} f_X d\mu = f_X(b)

확률 변수 X X(S)에 포함되지 않는 모든 값 x에 대해 f_X(x)=0이다. X의 상은 가산 집합이므로, 확률 질량 함수는 기껏해야 가산 개의 점에서만 0이 아닌 값을 가진다.

확률 질량 함수가 0이 아닌 값을 갖는 지점들은 불연속적이며, 이는 이산 확률 변수의 누적 분포 함수(Cumulative Distribution Function, CDF) 역시 해당 지점에서 불연속적인 계단 형태를 가지는 것과 관련이 있다.

이산 확률 변수의 경우, \Pr(X = x) = 1이라는 것은 사건 (X = x)가 반드시 일어남을 의미하고, \Pr(X = x) = 0은 해당 사건이 절대로 일어나지 않음을 의미한다. 이는 특정 단일 값에 대한 확률이 항상 0인 연속 확률 변수와는 다른 특징이다.

2. 2. 측도론적 정의

이산 확률 변수 X의 확률 질량 함수는 더 일반적인 측도론적 관점에서 두 가지 방식으로 이해할 수 있다. 이는 X확률 분포를 이용하는 방법과, 계수 측도에 대한 X확률 밀도 함수를 이용하는 방법이다.

첫째, (A, \mathcal A, P)확률 공간이라 하고, (B, \mathcal B)가측 공간이라 하자. 여기서 B시그마 대수 \mathcal B는 이산적이며, 특히 B에 속하는 각 점으로 이루어진 집합(단일 집합, singleton set)을 포함한다고 가정한다. 이때 확률 변수 X \colon A \to B가 이산 확률 변수라는 것은 X가 가질 수 있는 값의 집합(X)이 가산 집합임을 의미한다. 푸시포워드 측도 X_{*}(P)는 확률 변수 X에 의해 A의 확률 측도 PB로 옮겨진 것으로, 이를 X의 분포라고 부른다. 이 푸시포워드 측도는 B 위의 확률 측도가 된다. 확률 질량 함수 f_X \colon B \to \mathbb R는 이 분포 측도를 이용하여 각 b \in B에 대해 다음과 같이 정의할 수 있다.

f_X(b) = P(X^{-1}(b)) = P(X=b) = X_{*}(P)(\{b\})

이는 특정 값 b가 나올 확률을 의미한다.

둘째, (B, \mathcal B, \mu)를 계수 측도 \mu를 갖는 측도 공간이라고 하자. 계수 측도는 집합 내 원소의 개수를 세는 측도이다. 만약 확률 변수 X확률 밀도 함수 f가 계수 측도 \mu에 대해 존재한다면, 이 함수 fX의 푸시포워드 측도 X_{*}(P)의 라돈-니코딤 도함수가 된다. 즉, f = \frac{d X_*P}{d \mu} 이며, fB에서 음이 아닌 실숫값을 갖는 함수이다. 따라서, 임의의 b \in B에 대해 다음 관계가 성립한다.[7][8]

P(X=b) = P(X^{-1}(\{b\})) = \int_{X^{-1}(\{b\})} dP = \int_{\{b\}} f d\mu = f(b)

여기서 마지막 등식은 계수 측도의 성질(\int_{\{b\}} f d\mu = f(b) \mu(\{b\})이고 \mu(\{b\}) = 1)에 의해 성립한다. 이는 함수 f가 실제로 확률 질량 함수임을 보여준다.

결론적으로, 측도론적 접근을 통해 확률 질량 함수는 푸시포워드 측도의 단일 집합에 대한 값으로 정의되거나, 계수 측도에 대한 라돈-니코딤 도함수(확률 밀도 함수)로 정의될 수 있다. 두 방식 모두 동일한 확률 질량 함수를 나타낸다.

3. 성질

확률 질량 함수 f_X(x) = P(X=x)는 다음과 같은 성질을 만족한다.


  • 모든 가능한 결과 x에 대해 확률값은 음수가 아니다:

f_X(x) \geq 0

  • 모든 가능한 결과 x에 대한 확률의 총합은 1이다:

\sum_{x} f_X(x) = 1

이는 마치 물리적 질량이 보존되는 것처럼, 전체 확률의 합이 1로 일정하게 유지됨을 의미한다.[7][8]

  • 확률 변수 X가 취할 수 있는 값의 집합, 즉 X(S)에 포함되지 않는 모든 x에 대해서는 f_X(x) = 0으로 정의한다.
  • 이산 확률 변수의 상은 기껏해야 가산 집합이므로, 확률 질량 함수 f_X(x)는 가산 개의 점을 제외한 모든 실수 x에 대해 0의 값을 가진다.

  • 확률 질량 함수의 불연속성은 이산 확률 변수의 누적 분포 함수(CDF)가 불연속이라는 점과 직접적으로 연관된다. 만약 특정 값 x_0에서 f_X(x_0) > 0이라면, 누적 분포 함수는 x_0에서 f_X(x_0)만큼의 크기로 점프(jump)하는 불연속점을 가진다.

  • 이산 확률 변수 X에 대해, P(X = x) = 1이라는 것은 사건 (X = x)가 확실히 일어난다는 의미이다. 반대로 P(X = x) = 0은 사건 (X = x)가 절대로 일어나지 않음을 의미한다. 그러나 이 설명은 연속 확률 변수에는 적용되지 않는데, 연속 확률 변수의 경우 특정 한 지점에서의 확률은 항상 0이기 때문이다.

4. 예제

확률 질량 함수의 주요 예시로는 베르누이 분포, 이항 분포, 기하 분포 등이 있다. 예를 들어, 동전 던지기 실험에서 앞면(1) 또는 뒷면(0)이 나올 확률은 각각 1/2로, 이는 베르누이 분포 또는 시행 횟수가 1인 이항 분포로 설명될 수 있다.

결과가 여러 개인 이산 확률 변수를 다루는 다변량 분포의 예시로는 다항 분포가 있다.

4. 1. 동전 던지기

동전을 한 번 던지는 실험에서 모든 결과의 표본 공간S라 하고, S에서 정의되는 확률 변수X라고 하자. X는 동전의 앞면이 나오면 1, 뒷면이 나오면 0의 값을 갖는다. 만약 동전이 공정하여 각 면이 나올 확률이 \frac{1}{2}로 같다면, 확률 변수 X의 확률 질량 함수 f_X(x)는 다음과 같다.

f_X(x) = \begin{cases}\frac{1}{2}, &x \in \{0, 1\},\\0, &x \notin \{0, 1\}.\end{cases}

이는 두 가지 결과(성공/실패 또는 1/0)만 가능한 실험을 모델링하는 베르누이 분포의 대표적인 예시이다. 베르누이 분포의 확률 질량 함수는 일반적으로 성공 확률을 p라고 할 때 다음과 같이 표현된다.

p_X(x) = \begin{cases} p, & \text{if }x=1 \\ 1-p, & \text{if }x=0 \end{cases}

공정한 동전 던지기는 p = \frac{1}{2}인 경우에 해당한다. 또한, 이는 시행 횟수 n=1이고 성공 확률 p=\frac{1}{2}이항 분포의 특별한 경우로도 볼 수 있다.

4. 2. 베르누이 분포

베르누이 분포는 결과가 두 가지(성공 또는 실패) 중 하나로만 나타나는 실험을 모델링하는 데 사용된다. 이 두 가지 결과는 보통 1(성공)과 0(실패)으로 표현된다. 성공 확률을 p라고 할 때, 확률 질량 함수는 다음과 같다.

p_X(x) = \begin{cases}

p, & \text{if }x\text{ is 1} \\

1-p, & \text{if }x\text{ is 0}

\end{cases}

베르누이 분포의 대표적인 예시는 동전 던지기이다. 표본 공간 S가 공정한 동전을 한 번 던졌을 때 나올 수 있는 모든 결과의 집합이라고 하자. 이때 확률 변수 X를 정의하여 동전의 뒷면이 나오면 0, 앞면이 나오면 1의 값을 갖도록 할 수 있다. 동전이 공정하다면, 각 결과가 나올 확률은 1/2이므로 확률 질량 함수는 다음과 같이 표현된다.

p_X(x) = \begin{cases}

\frac{1}{2}, &x = 0,\\

\frac{1}{2}, &x = 1,\\

0, &x \notin \{0, 1\}.

\end{cases}

4. 3. 이항 분포

이항 분포는 결과가 두 가지뿐인 베르누이 시행독립적으로 n번 반복했을 때, 특정 결과(성공)가 나타나는 횟수를 모델링하는 이산 확률 분포이다. 각 시행은 독립적이며 두 가지 가능한 결과(성공 또는 실패)를 가진다.

각 시행에서 성공 확률이 p일 때, 총 n번의 시행 중 k번 성공할 확률에 대한 확률 질량 함수는 다음과 같이 주어진다.

f(k; n, p) = \binom{n}{k} p^k (1-p)^{n-k}

여기서 \binom{n}{k}조합을 나타낸다.

예를 들어, 공정한 주사위를 세 번 던져서 숫자 6이 정확히 한 번 나올 확률을 구하는 경우가 이항 분포의 예시에 해당한다. 이 경우 n=3, k=1, p=1/6이 된다.

4. 4. 기하 분포

기하 분포는 어떤 실험에서 한 번의 성공을 얻기까지 필요한 시도 횟수를 나타내는 이산 확률 분포이다. 각 시도에서 성공할 확률을 p라고 할 때, k번째 시도에서 첫 번째 성공이 나올 확률 질량 함수는 다음과 같다.

p_X(k) = (1-p)^{k-1} p \quad \text{for } k = 1, 2, 3, \dots

여기서 k는 시도 횟수이고, p는 각 시도에서의 성공 확률이다. 예를 들어, 동전 던지기에서 첫 번째 "앞면"이 나올 때까지 동전을 던지는 경우를 생각해 볼 수 있다. 이때 p는 동전 던지기에서 "앞면"이 나올 확률을 나타내고, k는 첫 "앞면"이 나올 때까지 던진 횟수를 의미한다.

기하 분포는 베르누이 분포, 이항 분포와 함께 기본적인 이산 확률 분포 중 하나이다.

5. 다변수 확률 질량 함수

둘 이상의 이산 확률 변수는 결합 확률 질량 함수를 가지며, 이는 확률 변수에 대한 각 가능한 실현 조합의 확률을 제공한다.

참조

[1] 웹사이트 7.2 - Probability Mass Functions | STAT 414 - PennState - Eberly College of Science https://online.stat.[...]
[2] 서적 Probability, Markov Chains, Queues, and Simulation: The Mathematical Basis of Performance Modeling https://books.google[...] Princeton University Press
[3] 서적 A modern introduction to probability and statistics : understanding why and how Springer 2005
[4] 서적 Engineering optimization : theory and practice Wiley 1996
[5] 서적 Probability, Markov Chains, Queues, and Simulation: The Mathematical Basis of Performance Modeling https://books.google[...] Princeton University Press
[6] 웹사이트 Probability Function http://mathworld.wol[...] Mathworld
[7] 서적 Reliability & Six Sigma https://books.google[...] Birkhäuser
[8] 서적 Engineering optimization: theory and practice https://books.google[...] John Wiley & Sons



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com