맨위로가기

확률 변수

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

확률 변수는 확률 공간의 가측 함수로서, 가능한 결과에 수치를 할당하는 변수이다. 확률 변수는 이산형과 연속형으로 구분되며, 이산형은 확률 질량 함수, 연속형은 확률 밀도 함수로 확률 분포를 나타낸다. 확률 변수의 개념은 측도론을 기반으로 정의되며, 기댓값, 분산, 모멘트 등을 통해 확률 분포를 특징짓는다. 또한 확률 변수의 함수는 새로운 확률 변수를 정의하며, 수렴과 관련된 다양한 개념을 포함한다.

더 읽어볼만한 페이지

  • 난수 - 주사위
    주사위는 다양한 게임, 교육, 점술 등에 사용되는 도구로, 정육면체 외에도 다양한 형태가 존재하며, 플라스틱 사출 성형으로 제작되고 무게 중심과 눈의 배치를 통해 공정성을 유지한다.
  • 난수 - 비결정론
    비결정론은 미래가 미리 정해져 있지 않다고 보며, 우연의 개념을 중요하게 생각하고, 확률 과정, 양자역학, 진화 생물학 등 다양한 분야에서 논의된다.
  • 통계적 무작위성 - 정보 엔트로피
    정보 엔트로피는 확률 변수의 불확실성을 측정하는 방법으로, 사건 발생 가능성이 낮을수록 정보량이 커진다는 원리에 기반하며, 데이터 압축, 생물다양성 측정, 암호화 등 다양한 분야에서 활용된다.
  • 통계적 무작위성 - 교환 가능 확률 변수족
    교환 가능 확률 변수족은 확률 변수들의 순서를 바꿔도 결합 확률 분포가 변하지 않는 경우를 의미하며, 데 피네티 정리에 의해 조건부 독립 동일 분포를 따르고 꼬리 사건, 공분산, 상관관계 등과 관련되어 다양한 분야에 활용된다.
  • 수학 사이드바 - 추론 규칙
    추론 규칙은 전제가 참일 때 결론이 필연적으로 참임을 보이는 논리적 도출 과정을 형식적으로 표현한 규칙으로, 다양한 유형이 존재하며 명제 논리와 술어 논리에서 기본적인 추론을 수행하는 데 사용되고, 형식 체계의 핵심 요소이다.
  • 수학 사이드바 - 벡터 공간
    벡터 공간은 체 위의 가군으로 정의되는 대수적 구조로, 벡터 덧셈과 스칼라 곱셈 연산을 가지며 특정 공리들을 만족하고, 기저, 차원, 선형 사상 등의 개념을 통해 수학과 물리학 등 다양한 분야에서 활용된다.
확률 변수
확률 변수
정의확률 공간에서 정의된 함수로, 표본 공간의 각 원소에 실숫값을 할당하는 변수
분류
이산 확률 변수유한하거나 셀 수 있는 무한 개의 값을 가짐
연속 확률 변수주어진 범위 내의 모든 값을 가질 수 있음
특징
확률 분포확률 변수가 특정 값을 가질 확률을 나타내는 함수 또는 표
기댓값확률 변수의 평균 값
분산확률 변수의 값이 평균에서 얼마나 퍼져 있는지를 나타내는 지표
관련 개념
베르누이 시행성공 또는 실패의 두 가지 결과만 갖는 확률 실험
확률 과정시간의 흐름에 따라 변화하는 확률 변수의 집합
마르코프 연쇄현재 상태만이 미래 상태에 영향을 주는 확률 과정
영어
영어 명칭random variable, aleatory variable, stochastic variable
일본어
일본어 명칭確率変数
한국어
한국어 명칭확률 변수

2. 정의

확률 공간 (\Omega, \mathcal{F}, \Pr) 위의, 가측 공간 (E, \mathcal{E})의 값을 가지는 '''확률 변수'''는 가측 함수 X\colon (\Omega, \mathcal{F}) \to (E, \mathcal{E})이다. 즉, 임의의 가측 집합 S\in\mathcal E에 대하여, 사건 X^{-1}(S)\in\mathcal F 및 그 확률을 생각할 수 있다. 확률론에서는 측도론의 용어를 다음과 같이 대체한다.


  • 확률 변수의 정의역 (\Omega,\mathcal F,\Pr)은 확률 변수의 '''확률 공간'''이다.
  • 확률 변수의 공역 (E,\mathcal E)은 확률 변수의 '''상태 공간'''(狀態空間, state space영어)이다.


확률 변수 X\colon\Omega\to E는 그 상태 공간 E 위에 다음과 같은 확률 측도 \Pr(X\in\cdot)를 유도한다.

:\Pr(X\in S)=\Pr(X^{-1}(S))\qquad\forall S\in\mathcal E

이는 확률 변수 X가 '''S 속의 값을 가질 확률'''이라고 한다. 여기서

:X^{-1}(S)=\{\omega\in\Omega\colon X(\omega)\in S\}

이다.

만약 상태 공간이 위상 공간인 경우, 상태 공간은 통상적으로 보렐 시그마 대수를 사용한다. 예를 들어, 실수 값을 갖는 확률 변수는 실수의 보렐 시그마 대수에 대한 가측 함수이다. 만약 정의역이 이산 확률 공간(즉, 모든 부분 집합이 사건인 확률 공간)일 경우, 모든 함수 \Omega\to E가측 함수이며, 따라서 정의에서 가측성 조건을 생략할 수 있다.

확률 변수는 표본 공간 \Omega (가능한 결과들의 집합)에서 측정 가능 공간 E로의 가측 함수 X \colon \Omega \to E이다.

X가 측정 가능 집합 S\subseteq E에 속하는 값을 취할 확률은 다음과 같이 쓸 수 있다.

:\operatorname{P}(X \in S) = \operatorname{P}(\{ \omega \in \Omega \mid X(\omega) \in S \}).

측도론적 정의에 따르면 (\Omega, \mathcal{F}, P)확률 공간으로 하고 (E, \mathcal{E})가측 공간으로 할 때, '''(E, \mathcal{E})-값 확률변수'''는 가측 함수 X\colon \Omega \to E이며, 이는 모든 부분집합 B\in\mathcal{E}에 대해 그 역상\mathcal{F}-가측적임을 의미한다. 즉, X^{-1}(B)\in \mathcal{F}이고, 여기서 X^{-1}(B) = \{\omega : X(\omega)\in B\}이다.[12]

E위상 공간인 경우, σ-대수 \mathcal{E}에 대한 가장 일반적인 선택은 E의 모든 열린 집합의 모임에 의해 생성되는 보렐 σ-대수 \mathcal{B}(E)이다. 이 경우 (E, \mathcal{E})-값 확률변수를 '''E-값 확률변수'''라고 한다. E가 실수선 \mathbb{R}인 경우, 이러한 실수값 확률변수를 간단히 '''확률변수'''라고 한다.

JIS Z 8101-1:1999에서는 확률 변수(random variable)를 "어떤 값이 될지는 확률 법칙에 따라 결정되는 변수"로 정의하고 있다.

확률 변수는 앞으로 할 시행의 결과나 이미 한 시행의 결과가 아직 불확실한 경우(실험 결과가 모두 나오지 않았거나 측정 결과가 불확실한 경우 등)의 결과에 할당된 값이다.

확률 변수는 확률 분포를 기술하는 데 필요한 개념이며, 이산형 확률 변수와 연속형 확률 변수로 나뉜다.

2. 1. 이산 확률 변수

확률 변수의 치역이 유한하거나 무한히 가산 가능할 때, 이 확률 변수를 '''이산 확률 변수'''[5]라고 하며, 그 분포는 이산 확률 분포가 된다. 즉, X의 치역의 각 값에 확률을 할당하는 확률 질량 함수로 설명될 수 있다.

예를 들어, 주사위를 던져 나오는 눈의 수를 추상화한 확률 공간을 생각해보자.

:\Omega=\{1,2,\dots,6\}

1부터 6까지의 수가 나올 수 있으며, 각각의 수가 나올 확률은 같다. 이 확률 공간 위에 확률 변수 X를 다음과 같이 정의할 수 있다.

:X\colon 2,4,6\mapsto 0

:X\colon 1,3,5\mapsto 1

즉, X는 짝수가 나왔을 경우 0, 홀수가 나왔을 경우 1을 취한다. 그렇다면 주사위를 던져 짝수가 나올 확률은 다음과 같다.

:\operatorname{Pr}(X=0)=\operatorname{Pr}(\{2,4,6\})=1/2

마찬가지로, 홀수가 나올 확률은 다음과 같다.

:\operatorname{Pr}(X=1)=\operatorname{Pr}(\{1,3,5\})=1/2

두 개의 주사위를 던진 결과의 확률 공간에서 두 눈의 수의 합을 나타내는 확률 변수 Y확률 분포는 다음과 같이 나타낼 수 있다. (두 주사위의 눈의 수는 서로 독립이다.)

Y의 값확률
2\operatorname{Pr}(Y=2)=\operatorname{Pr}(\{(1,1)\})=1/36
3\operatorname{Pr}(Y=3)=\operatorname{Pr}(\{(1,2),(2,1)\})=1/18
4\operatorname{Pr}(Y=4)=\operatorname{Pr}(\{(1,3),(2,2),(3,1)\})=1/12
5\operatorname{Pr}(Y=5)=\operatorname{Pr}(\{(1,4),(2,3),(3,2),(4,1)\})=1/9
6\operatorname{Pr}(Y=6)=\operatorname{Pr}(\{(1,5),(2,4),(3,3),(4,2),(5,1)\})=5/36
7\operatorname{Pr}(Y=7)=\operatorname{Pr}(\{(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)\})=1/6
8\operatorname{Pr}(Y=8)=\operatorname{Pr}(\{(2,6),(3,5),(4,4),(5,3),(6,2)\})=5/36
9\operatorname{Pr}(Y=9)=\operatorname{Pr}(\{(3,6),(4,5),(5,4),(6,3)\})=1/9
10\operatorname{Pr}(Y=10)=\operatorname{Pr}(\{(4,6),(5,5),(6,4)\})=1/12
11\operatorname{Pr}(Y=11)=\operatorname{Pr}(\{(5,6),(6,5)\})=1/18
12\operatorname{Pr}(Y=12)=\operatorname{Pr}(\{(6,6)\})=1/36



다른 예시로, 임의의 사람을 선택하는 실험에서 그 사람의 자녀 수를 나타내는 확률 변수를 생각할 수 있다. 이 변수는 음이 아닌 정수 값을 가지는 이산 확률 변수이다. 이때, "짝수의 자녀 수"와 같은 특정 사건에 대한 확률은 확률 질량 함수(PMF)를 이용하여 계산할 수 있다. 예를 들어 짝수의 자녀 수에 대한 확률은 \operatorname{PMF}(0) + \operatorname{PMF}(2) + \operatorname{PMF}(4) + \cdots 와 같이 무한 합으로 표현된다.

2. 2. 연속 확률 변수

X의 치역이 비가산 무한(일반적으로 구간)일 경우, X를 '''연속 확률 변수'''[6][7]라고 한다. 특별히 절대 연속인 경우, 그 분포는 확률 밀도 함수로 설명될 수 있으며, 이는 구간에 확률을 할당한다. 특히, 절대 연속 확률 변수의 경우 각각의 점은 반드시 확률이 0이어야 한다. 모든 연속 확률 변수가 절대 연속인 것은 아니다.[8]

연속 확률 변수는 누적 분포 함수가 모든 곳에서 연속인 확률 변수이다.[10] 유한한 확률로 발생하는 숫자에 해당하는 "틈"은 없다. 대신, 연속 확률 변수는 거의 확실하게 주어진 정확한 값 ''c''를 취하지 않지만(형식적으로, \forall c \in \mathbb{R}:\; \Pr(X = c) = 0), 그 값이 특정 구간(임의로 작을 수 있음)에 속할 확률은 양수이다. 연속 확률 변수는 일반적으로 확률 밀도 함수(PDF)를 허용하며, 이는 누적 분포 함수와 확률 측도를 특징짓는다. 이러한 분포는 절대 연속 분포라고도 하지만, 일부 연속 분포는 특이 분포이거나 절대 연속 부분과 특이 부분이 혼합된 것이다.

연속 확률 변수의 예로는 수평 방향을 선택할 수 있는 회전판을 기반으로 하는 확률 변수가 있다. 이때 확률 변수가 취하는 값은 방향이 된다. 이러한 방향을 북쪽, 서쪽, 동쪽, 남쪽, 남동쪽 등으로 나타낼 수 있다. 그러나 일반적으로 표본 공간을 실수값을 취하는 확률 변수에 매핑하는 것이 더 편리하다. 예를 들어, 방향을 북쪽에서 시계 방향으로 측정한 방위각으로 매핑하여 이를 수행할 수 있다. 그러면 확률 변수는 구간 [0, 360)의 실수값을 취하며, 범위의 모든 부분이 "똑같이 가능성이 있다". 이 경우, '''''X'''''는 회전된 각도이다. 임의의 실수는 선택될 확률이 0이지만, 임의의 ''범위''의 값에 대해서는 양의 확률을 할당할 수 있다. 예를 들어, [0, 180]의 숫자를 선택할 확률은 1/2이다. 확률 질량 함수에 대해 이야기하는 대신, '''''X'''''의 확률 ''밀도''가 1/360이라고 한다. [0, 360)의 부분 집합의 확률은 집합의 측도에 1/360을 곱하여 계산할 수 있다. 일반적으로, 주어진 연속 확률 변수에 대한 집합의 확률은 주어진 집합에 대한 밀도를 적분하여 계산할 수 있다.

JIS Z 8101-1:1999에서는 확률 변수를 취할 수 있는 값이 연속적인지에 따라 연속 (확률) 변수라고 한다.

2. 3. 혼합형 확률 변수

'''혼합형 확률변수'''는 누적 분포 함수가 이산형도 아니고 전 구간 연속도 아닌 확률 변수이다.[10] 이는 이산 확률 변수와 연속 확률 변수의 혼합으로 나타낼 수 있으며, 이 경우 누적 분포 함수(CDF)는 구성 변수의 CDF의 가중 평균이 된다.[10]

혼합형 확률 변수의 예로는 동전을 던지는 실험을 들 수 있다. 동전의 앞면이 나오면 회전판을 돌리고, 뒷면이 나오면 회전판을 돌리지 않는다. 뒷면이 나오면 '''X''' = −1이 되고, 앞면이 나오면 '''X'''는 앞선 예에서와 같이 회전판의 값이 된다. 이 확률 변수가 −1의 값을 가질 확률은 1/2이다. 다른 값의 범위는 앞선 예의 절반 확률을 가진다.

3. 확장

확률 변수는 실수값뿐만 아니라, 벡터, 행렬, 수열, 트리, 집합, 함수 등 다양한 값을 가질 수 있다. 이러한 일반적인 확률 요소를 확률 요소라고 부른다. 확률 과정은 시간이나 공간 등으로 첨자가 붙은 확률 변수이다.

이러한 개념은 그래프 이론, 기계 학습, 자연어 처리, 이산 수학 및 컴퓨터 과학과 같이 비수치적 데이터 구조의 확률적 변화를 모델링하는 데 유용하다.[4]

4. 분포 함수

확률 변수의 확률 분포는 누적 분포 함수로 나타낼 수 있다.

:F_X(x) = \operatorname{P}(X \le x)

연속 확률 변수의 경우 확률 밀도 함수 f_X를 사용하기도 한다.[9] 측도론적 용어로는, 확률 변수 X를 사용하여 \Omega상의 측도 P\mathbb{R}상의 측도 p_X로 "푸시포워드(push-forward)"한다. 이때, p_XX의 확률 분포라고 한다.

기저 확률 공간 \Omega는 확률 변수의 존재를 보장하고, 때로는 확률 변수를 구성하며, 동일한 확률 공간 상의 두 개 이상의 확률 변수의 결합 분포를 기반으로 상관 관계 및 종속성 또는 독립성과 같은 개념을 정의하는 데 사용되는 기술적인 장치이다.

5. 예시

임의의 사람을 선택하는 실험에서 그 사람의 키는 확률 변수의 예시가 될 수 있다. 수학적으로 확률 변수는 사람을 키에 대응시키는 함수로 해석된다. 이 확률 변수에는 확률 분포가 따르며, 이를 통해 키가 특정 범위(예: 180~190cm)에 속할 확률을 계산할 수 있다.[16]

다른 예시로, 한 사람의 자녀 수 역시 음이 아닌 정수 값을 갖는 이산 확률 변수로 볼 수 있다. 확률 질량 함수(PMF)를 통해 특정 자녀 수를 가질 확률이나, "짝수 자녀 수"와 같이 특정 조건을 만족하는 확률을 계산할 수 있다. 이때 확률은 PMF(0) + PMF(2) + PMF(4) + ... 와 같이 무한 합으로 계산된다.[16]

표본 공간은 수학적으로 설명하기 어려워 생략되기도 하지만, 같은 표본 공간에서 두 확률 변수(예: 키와 자녀 수)를 측정할 때는 두 변수의 관계(상관관계 등)를 파악하는 것이 중요하다.[16]

\{a_n\}, \{b_n\}이 실수의 가산 집합이고, b_n >0이며 \sum_n b_n=1이면, F=\sum_n b_n \delta_{a_n}(x)는 이산형 분포 함수이다. 여기서 \delta_t(x) = 0 x < t이고, \delta_t(x) = 1 x \ge t일 때이다. 예를 들어, 모든 유리수의 열거를 \{a_n\}으로 하면, 단계 함수(구간별 상수 함수)가 아닐 수도 있는 이산형 함수를 얻게 된다.[16]

혼합형 확률 변수의 예로는 동전 던지기를 하여 앞면이 나올 때만 룰렛을 돌리는 경우를 생각할 수 있다. 동전이 뒷면이면 확률 변수는 -1, 앞면이면 룰렛의 각도가 된다. 이 경우 -1이 나올 확률은 1/2이고, 다른 숫자가 나올 확률은 룰렛 예시의 절반이 된다.[10]

5. 1. 주사위 던지기

주사위를 던져서 나오는 눈의 수를 확률 공간을 통해 추상화할 수 있다. 1부터 6까지의 수가 나올 수 있으며, 각 수가 나올 확률은 1/6로 동일하다. 이때, 확률 변수를 다음과 같이 정의할 수 있다.

  • 짝수가 나오면 0, 홀수가 나오면 1을 값으로 갖는 확률 변수 X를 정의할 수 있다. 이 경우, X=0 (짝수)일 확률과 X=1 (홀수)일 확률은 각각 1/2이다.

  • 두 개의 주사위를 던질 때, 두 눈의 합을 나타내는 확률 변수 Y를 정의할 수 있다. 이때, Y의 확률 분포는 다음과 같다.


Y의 값확률
21/36
31/18
41/12
51/9
65/36
71/6
85/36
91/9
101/12
111/18
121/36



만약 표본 공간이 두 개의 주사위를 굴렸을 때 나올 수 있는 숫자들의 집합이고, 관심 있는 확률 변수가 두 주사위 숫자의 합 ''S''라면, ''S''는 위 그림의 막대 높이로 나타낸 확률 질량 함수로 설명되는 이산 확률 변수이다.[16]

5. 2. 동전 던지기

동전 던지기의 결과는 확률 변수로 나타낼 수 있다. 예를 들어, 동전 한 번 던지기의 가능한 결과는 표본 공간 \Omega = \{\text{앞면}, \text{뒷면}\}으로 표현할 수 있다. 이때, 앞면이 나오는 횟수를 확률 변수 Y로 정의하면 다음과 같다.[16]

:Y(\omega) = \begin{cases}

1, & \text{만약 } \omega = \text{앞면}, \\[6pt]

0, & \text{만약 } \omega = \text{뒷면}.

\end{cases}

만약 공정한 동전을 던진다면, 확률 변수 ''Y''는 다음과 같은 확률 질량 함수 f_Y를 갖는다.[16]

:f_Y(y) = \begin{cases}

\tfrac 12,& \text{만약 }y=1,\\[6pt]

\tfrac 12,& \text{만약 }y=0,

\end{cases}

5. 3. 회전판

회전판이 가리키는 각도를 확률 변수로 정의할 수 있다. 예를 들어, 수평 방향으로 회전하는 룰렛을 생각해 볼 수 있다. 룰렛의 방향 전체를 표본 공간으로 생각하고, 진북 방향을 0도로 하여 확률 변수 ''X''를 "룰렛이 진북 방향에 대해 취하는 각도"로 정의할 수 있다. 이때 확률 변수 ''X''는 0도 이상 360도 미만의 모든 실수값을 가질 수 있으며, 각 값을 취할 확률은 동일하다고 가정할 수 있다.[10]

이 경우, 특정 각도가 나올 확률은 0이지만, 특정 범위의 각도가 나올 확률은 양수이다. 예를 들어, 0도 이상 180도 이하의 각도가 나올 확률은 1/2이다. 확률 밀도를 고려하면, 폭 1도의 확률 밀도는 1/360이며, 확률 분포는 연속 균일 분포가 된다.

6. 측도론적 정의

확률 공간 (\Omega, \mathcal{F}, \Pr) 위의, 가측 공간 (E, \mathcal{E})의 값을 가지는 '''확률 변수'''는 가측 함수 X\colon (\Omega, \mathcal{F}) \to (E, \mathcal{E})를 뜻한다. 즉, 임의의 가측 집합 S\in\mathcal E에 대하여, 사건 X^{-1}(S)\in\mathcal F 및 그 확률을 생각할 수 있다. 확률론에서는 측도론의 용어를 다음과 같이 대체한다.


  • 확률 변수의 정의역 (\Omega,\mathcal F,\Pr)은 확률 변수의 '''확률 공간'''이다.
  • 확률 변수의 공역 (E,\mathcal E)은 확률 변수의 '''상태 공간'''(狀態空間, state space영어)이다.


확률 변수 X\colon\Omega\to E는 그 상태 공간 E 위에 다음과 같은 확률 측도 \Pr(X\in\cdot)를 유도한다.

:\Pr(X\in S)=\Pr(X^{-1}(S))\qquad\forall S\in\mathcal E

이는 확률 변수 X가 '''S 속의 값을 가질 확률'''이라고 한다. 여기서

:X^{-1}(S)=\{\omega\in\Omega\colon X(\omega)\in S\}

이다.

만약 상태 공간이 위상 공간인 경우, 상태 공간은 통상적으로 보렐 시그마 대수를 사용한다. 예를 들어, 실수 값을 갖는 확률 변수는 실수의 보렐 시그마 대수에 대한 가측 함수이다. 만약 정의역이 이산 확률 공간(즉, 모든 부분 집합이 사건인 확률 공간)일 경우, 모든 함수 \Omega\to E가측 함수이며, 따라서 정의에서 가측성 조건을 생략할 수 있다.

(\Omega, \mathcal{F}, P)확률 공간으로 하고 (E, \mathcal{E})가측 공간으로 하자. 그러면 '''(E, \mathcal{E})-값 확률변수'''는 가측 함수 X\colon \Omega \to E이며, 이는 모든 부분집합 B\in\mathcal{E}에 대해 그 역상\mathcal{F}-가측적임을 의미한다. 즉, X^{-1}(B)\in \mathcal{F}이고, 여기서 X^{-1}(B) = \{\omega : X(\omega)\in B\}이다.[12]

E위상 공간인 경우, σ-대수 \mathcal{E}에 대한 가장 일반적인 선택은 E의 모든 열린 집합의 모임에 의해 생성되는 보렐 σ-대수 \mathcal{B}(E)이다. 이 경우 (E, \mathcal{E})-값 확률변수를 '''E-값 확률변수'''라고 한다. 또한, 공간 E가 실수선 \mathbb{R}인 경우, 이러한 실수값 확률변수를 간단히 '''확률변수'''라고 한다.

7. 모멘트

확률 변수의 확률 분포는 기댓값, 분산 등의 모멘트로 특징지을 수 있다. 모멘트는 실수값 함수뿐만 아니라, 일반적인 확률 변수의 실수값 함수에 대해서도 정의할 수 있다.[1]

수학적으로, 주어진 확률 변수 ''X''가 속한 모집단에 대한 (일반화된) 모멘트 문제[1]는 확률 변수 ''X''의 분포의 성질을 나타내는 기댓값의 함수들의 집합으로 정의된다.[1]

모멘트는 확률 변수가 실수 함수일 경우(복소수 등에 대해서도) 정의할 수 있다.[1] 확률 변수 자체가 연속적이라면, 변수의 모멘트 자체는 확률 변수의 항등 함수와 같다.[1] 그러나, 비실수 확률 변수의 경우에도, 모멘트를 그 변수의 실수 함수로 얻을 수 있다.[1] 예를 들어, 명목척도 변수 ''X''로 "빨강", "파랑", "녹색"이 있다면, 실수 함수를 생각할 수 있다.[1] 아이버슨의 기호를 사용함으로써, ''X''가 "녹색"일 때 1, 그 외에는 0으로 기술할 수 있으므로, 기댓값 및 다른 모멘트를 정의할 수 있다.[1]

8. 확률 변수의 함수

보렐 가측 함수를 확률 변수에 적용하여 새로운 확률 변수를 정의할 수 있다. 실수값 확률 변수 X에 실수값 보렐 가측 함수 g\colon \mathbb{R} \rightarrow \mathbb{R}를 적용하면, Y=g(X)와 같이 새로운 확률 변수 Y를 얻을 수 있다. 이때 Y누적 분포 함수는 다음과 같이 표현된다.

:F_Y(y) = \operatorname{P}(g(X) \le y).

만약 함수 g역함수 h = g^{-1}를 가지고, 이 역함수가 증가하거나 감소하는 함수라면, 위 식은 다음과 같이 확장될 수 있다.

:F_Y(y) = \operatorname{P}(g(X) \le y) =

\begin{cases}

\operatorname{P}(X \le h(y)) = F_X(h(y)),

& \text{만약 } h = g^{-1} \text{ 이 증가하는 경우},\\

\\

\operatorname{P}(X \ge h(y)) = 1 - F_X(h(y)),

& \text{만약 } h = g^{-1} \text{ 이 감소하는 경우} .

\end{cases}

g의 가역성과 미분 가능성을 가정하면, 양변을 y에 대해 미분하여 확률 밀도 함수 사이의 관계를 얻을 수 있다.[10]

:f_Y(y) = f_X\bigl(h(y)\bigr) \left| \frac{d h(y)}{d y} \right|.

만약 g가 가역적이지 않지만, 각 y에 대해 유한하거나 가산적으로 무한한 수의 x_i가 존재하여 y = g(x_i)를 만족한다면, 확률 밀도 함수 사이의 관계는 다음과 같이 일반화된다.

:f_Y(y) = \sum_{i} f_X(g_{i}^{-1}(y)) \left| \frac{d g_{i}^{-1}(y)}{d y} \right|

여기서 x_i = g_i^{-1}(y)이며, 이는 역함수 정리에 따른다. 이 공식은 g가 증가 함수일 필요는 없다.

측도 이론적 공리적 접근법에서는, \Omega에 대한 확률 변수 X와 보렐 가측 함수 g\colon \mathbb{R} \rightarrow \mathbb{R}가 주어지면, Y = g(X)는 가측 함수의 합성도 가측이므로 \Omega에 대한 확률 변수이다. 확률 공간 (\Omega, P) 에서 (\mathbb{R}, dF_{X})로 이동하는 절차를 통해 Y의 분포를 구할 수 있다.
예시


  • X가 연속 확률 변수이고 Y = X^2일 때,
  • y < 0이면, F_Y(y) = 0
  • y \ge 0이면, F_Y(y) = F_X(\sqrt{y}) - F_X(-\sqrt{y})
  • X의 누적분포함수가 F_{X}(x) = P(X \leq x) = \frac{1}{(1 + e^{-x})^{\theta}} (\theta > 0는 상수)이고, Y = \mathrm{log}(1 + e^{-X})이면, F_Y(y) = 1 - e^{-y \theta}이며, 이는 지수분포를 따른다.
  • X가 표준 정규 분포를 따르고 확률 밀도 함수가 f_X(x) = \frac{1}{\sqrt{2\pi}}e^{-x^2/2}일 때, Y = X^2의 밀도 함수는 f_Y(y) = \frac{1}{\sqrt{2\pi y}}e^{-y/2}이며, 이는 자유도가 1인 카이제곱 분포이다.
  • X가 정규분포를 따르고 그 확률밀도함수가 f_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}}e^{-(x-\mu)^2/(2\sigma^2)}일때, 확률변수 Y = X^2의 확률밀도함수는 f_Y(y) = \frac{1}{\sqrt{2\pi\sigma^2}} \frac{1}{2\sqrt{y}} (e^{-(\sqrt{y}-\mu)^2/(2\sigma^2)}+e^{-(-\sqrt{y}-\mu)^2/(2\sigma^2)}) 이며, 이는 자유도가 1인 비중심 카이제곱 분포이다.

9. 확률 변수의 동치성

두 확률 변수는 분포가 같거나, 거의 확실하게 같거나, 함수로서 같을 수 있다.


  • 분포가 같다: 표본 공간이 실수 집합의 부분집합인 경우, 확률 변수 ''X''와 ''Y''가 모든 x에 대해 \operatorname{P}(X \le x) = \operatorname{P}(Y \le x)를 만족하면, 즉 동일한 누적분포함수를 가지면 분포가 같다고 한다. (X \stackrel{d}{=} Y 로 표기). 두 확률 변수가 같은 적률 생성 함수를 가질 때도 같은 분포를 갖는다.
  • 거의 확실하게 같다: 두 확률 변수 ''X''와 ''Y''가 \operatorname{P}(X \neq Y) = 0를 만족하면, 즉 서로 다를 확률이 0이면 거의 확실하게 같다고 한다. (X \; \stackrel{\text{a.s.}}{=} \; Y 로 표기). 이는 확률론에서 실제 등식만큼 강력하다.
  • 같다: 두 확률 변수 ''X''와 ''Y''가 측정 가능 공간에서 함수로서 같을 때, 즉 모든 ω에 대해 X(\omega)=Y(\omega)를 만족하면 같다고 한다. 이 개념은 확률 공간이 명시적으로 특징지어지는 경우가 드물기 때문에 확률 이론에서 가장 유용하지 않다.

10. 확률 변수의 수렴

수리통계학에서 중요한 주제는 특정 확률변수들의 수열에 대한 수렴 결과를 얻는 것이다. 예를 들어, 대수의 법칙과 중심극한정리가 있다.

확률변수열 X_n이 확률변수 X로 수렴하는 다양한 의미가 있다. 이는 확률변수의 수렴 문서에서 설명한다.

참조

[1] 서적 Introduction to Probability CRC Press 2014
[2] 서적 Mathematics for machine learning https://www.worldcat[...] Cambridge University Press 2020
[3] 학술지 Harmonic analysis as the exploitation of symmetry – a historical survey 1980-07-01
[4] 웹사이트 Random Variables https://www.mathsisf[...] 2020-08-21
[5] 서적 The Practice of Statistics https://web.archive.[...] Freeman
[6] 웹사이트 Random Variables http://www.stat.yale[...] 2020-08-21
[7] 학술지 A Modern Introduction to Probability and Statistics https://doi.org/10.1[...] 2005
[8] 서적 Introduction to Probability and Stochastic Processes with Applications https://books.google[...] Wiley
[9] 서적 Probability and Measure Wiley 1995
[10] 서적 Introduction to Probability Athena Scientific 2002
[11] 웹사이트 Economics 245A – Introduction to Measure Theory http://faculty.econ.[...] University of California, Santa Barbara 2013-04-26
[12] harvtxt
[13] 서적 The Practice of Statistics http://bcs.whfreeman[...] Freeman
[14] 웹사이트 Economics 245A – Introduction to Measure Theory http://econ.ucsb.edu[...] University of California, Santa Barbara 2013-04-26
[15] 서적 Introduction to Probability and Stochastic Processes with Applications https://books.google[...] Wiley
[16] 기타
[17] harvtxt
[18] 기타
[19] 웹인용 Economics 245A – Introduction to Measure Theory http://econ.ucsb.edu[...] University of California, Santa Barbara 2013-04-26
[20] 서적 Introduction to Probability CRC Press 2014



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com