독립 (확률론)
1. 개요
확률론에서 독립은 여러 사건 또는 확률 변수 간의 관계를 설명하는 중요한 개념이다. 사건의 독립은 두 사건의 결합 확률이 각 사건의 확률의 곱과 같을 때 성립하며, 한 사건의 발생이 다른 사건의 발생에 영향을 미치지 않음을 의미한다. 확률 변수의 독립은 결합 누적 분포 함수가 각 확률 변수의 누적 분포 함수의 곱으로 분해될 때 정의된다. 독립은 쌍별 독립, 상호 독립, 조건부 독립 등의 형태로 확장되며, 독립성은 카이 제곱 검정, 분할표 등 다양한 통계적 방법을 통해 검정할 수 있다. 독립의 개념은 주사위 던지기, 카드 뽑기 등의 예시를 통해 쉽게 이해할 수 있으며, 1933년 안드레이 콜모고로프의 확률 공리화 이후 표준 정의로 자리 잡았다.
| 정의 | 두 사건의 발생이 서로에게 영향을 주지 않는 관계 |
|---|---|
| 기호 | P(A∩B) = P(A)P(B) |
| 설명 | 사건 A와 B가 독립이면, A가 일어났을 때 B가 일어날 확률은 A가 일어나지 않았을 때 B가 일어날 확률과 같다. |
| 확률 공간 | (Ω, F, P) |
|---|---|
| 독립 | 두 사건 A와 B가 다음을 만족하면 독립이다: P(A ∩ B) = P(A)P(B) |
| 조건부 확률 | 사건 A가 일어났을 때 사건 B가 일어날 조건부 확률 P(B|A) = P(B) (단, P(A) > 0) |
| 독립의 일반화 | n개의 사건 A₁, A₂, ..., Aₙ이 모두 독립일 필요충분조건은 모든 k (2 ≤ k ≤ n)와 모든 1 ≤ i₁ < i₂ < ... < iₖ ≤ n에 대해 다음이 성립하는 것이다: P(Aᵢ₁ ∩ Aᵢ₂ ∩ ... ∩ Aᵢₖ) = P(Aᵢ₁)P(Aᵢ₂) ... P(Aᵢₖ) |
| 동전 던지기 | 동전을 두 번 던질 때, 첫 번째 던지기 결과와 두 번째 던지기 결과는 독립이다. |
|---|---|
| 주사위 굴리기 | 주사위를 두 번 굴릴 때, 첫 번째 굴리기 결과와 두 번째 굴리기 결과는 독립이다. |
| 카드 뽑기 | 카드 덱에서 카드를 한 장 뽑고 다시 넣은 후 다시 뽑을 때, 첫 번째 뽑기와 두 번째 뽑기는 독립이다. 하지만 카드를 다시 넣지 않으면 독립이 아니다. |
| 상호 배타성과 독립성 | 상호 배타적인 두 사건은 특별한 경우를 제외하고는 독립이 아니다. |
|---|
| 관련 개념 | 조건부 독립 상관 관계 |
|---|
-
확률론 -
확률 밀도 함수
확률 밀도 함수는 연속 확률 변수의 확률 분포를 나타내는 함수로, 특정 구간에서 확률 변수가 값을 가질 확률은 해당 구간에 대한 함수의 적분으로 계산되며, 통계적 특성 계산 및 변수 변환 등에 활용되어 불확실성 모델링 및 분석에 중요한 역할을 한다. -
확률론 -
체비쇼프 부등식
체비쇼프 부등식은 확률 변수가 평균에서 얼마나 멀리 떨어져 있는지에 대한 확률의 상한을 제공하는 부등식으로, 이레네-쥘 비네메가 처음 공식화하고 체비쇼프와 안드레이 마르코프에 의해 일반화 및 증명되었으며, 확률론적 표현 외에도 측도 공간에 대한 명제로 확장될 수 있다.
2. 정의
확률 공간 $(\Omega, \mathcal{F}, P)$에서 정의되는 사건, 확률 변수, 시그마 대수의 독립성은 각각 다음과 같이 정의된다.
* 사건의 독립: 두 사건 $A$와 $B$가 독립이라는 것은 $P(A \cap B) = P(A)P(B)$가 성립하는 것을 의미한다. 여기서 $A \cap B$는 $A$와 $B$가 모두 일어나는 사건(곱사건)을 나타낸다. $P(B) \neq 0$이라면, 조건부 확률을 사용하여 $P(A|B) = P(A)$로 표현할 수 있는데, 이는 사건 $B$가 일어나는 것이 사건 $A$의 확률에 영향을 주지 않는다는 것을 의미한다. 사건 $A$와 $B$가 독립임을 나타내는 기호는 $A$ ⫫ $B$이다. 사건이 독립이 아닌 경우 종속이라고 한다. 일반적으로, 사건의 족 $\{A_\lambda\}$가 독립이라는 것은, 그 부분 유한족 $\{ A_{\lambda_1}, A_{\lambda_2}, ..., A_{\lambda_n} \}$에 대해 $P(A_{\lambda_1} \cap A_{\lambda_2} \cap \dotsb \cap A_{\lambda_n}) = P(A_{\lambda_1})P(A_{\lambda_2}) \dotsm P(A_{\lambda_n})$가 성립하는 것을 의미한다.
* 확률 변수의 독립: 두 확률 변수 $X$와 $Y$가 독립이라는 것은, 임의의 실수 $a, b$에 대해 $P(X누적 분포 함수가 주변 누적 분포 함수의 곱으로 분해될 때 독립이라고 한다. 확률 변수 $X$와 $Y$가 독립임을 나타내는 기호는 $X$ ⫫ $Y$이다. 일반적으로, 확률 변수의 족 $\{ X_\lambda | \lambda \in \Lambda \}$가 독립이라는 것은, 임의의 실수 $a_\lambda$에 대해 사건의 족 $\bigl\{ \{\, X_\lambda < a_\lambda \} \mathrel{\big|} \lambda \in \Lambda \, \bigr\}$가 독립임을 의미한다.
* 시그마 대수의 독립: 완전 가법족의 족 $\{F_\lambda\}$가 독립이라는 것은, 임의의 유한 부분족 $\{ \mathcal{F}_{\lambda_1}, \mathcal{F}_{\lambda_2}, \dotsc, \mathcal{F}_{\lambda_n} \}$에 대해, $P(A_1 \cap A_2 \cap \dotsb \cap A_n) = P(A_1)P(A_2) \dotsm P(A_n),\quad {}^\forall A_1 \in \mathcal{F}_{\lambda_1}, {}^\forall A_2 \in \mathcal{F}_{\lambda_2}, \dotsc, {}^\forall A_n \in \mathcal{F}_{\lambda_n}$이 성립하는 것을 의미한다.
2.1. 사건의 독립
확률 공간 위의 사건들의 집합 가 다음 조건을 만족시킨다면, 가 서로 독립이라고 한다.
* 모든 유한 집합 에 대하여,
*:
두 사건 와 는 독립적이며(종종 또는 로 표기하며, 후자의 기호는 종종 조건부 독립에도 사용됨), 이는 두 사건의 결합 확률이 각 확률의 곱과 같을 경우에만 해당된다.
:
는 두 독립 사건 와 가 표본 공간에서 공통 요소를 가지고 있어 상호 배타적이지 않음을 나타낸다(상호 배타적인 경우는 ).
이 정의가 독립성을 어떻게 정의하는지는 조건부 확률 를 사용하여, 사건 가 발생했거나 발생했다고 가정했을 때 사건 가 발생할 확률로 다시 작성하면 명확해진다.
:
유사하게 다음이 성립한다.
:
따라서, 의 발생은 의 확률에 영향을 미치지 않으며, 그 반대도 마찬가지이다. 즉, 와 는 서로 독립적이다. 파생된 표현이 더 직관적으로 보일 수 있지만, 또는 가 0이면 조건부 확률이 정의되지 않을 수 있으므로 선호되는 정의는 아니다. 또한, 선호되는 정의는 대칭성을 통해 가 와 독립적일 때 도 와 독립적이라는 것을 명확하게 보여준다.
오즈의 관점에서 말하면, 두 사건 A영어와 B영어의 오즈비가 1일 때 두 사건은 독립이다. 확률과 유사하게, 이는 조건부 오즈가 무조건부 오즈와 같다는 것과 같다.
:
또는 한 사건의 오즈가 다른 사건이 주어졌을 때 다른 사건이 발생하지 않았을 때의 오즈와 같다는 것과 같다.
:
오즈비는 다음과 같이 정의될 수 있다.
:
또는 A영어가 주어졌을 때 B영어의 오즈에 대해 대칭적으로 정의되며, 따라서 사건이 독립일 때 1이다.
유한 개의 사건 집합 는 모든 사건의 쌍이 독립일 때, 즉, 서로 다른 모든 쌍의 인덱스 에 대해 다음과 같을 때 쌍별 독립이라고 한다.
:
유한 개의 사건 집합은 모든 사건이 다른 사건들의 교집합과 독립일 때 상호 독립이라고 한다. 즉, 모든 과 모든 k개의 인덱스 에 대해 다음이 성립한다.
:
이것을 독립 사건에 대한 곱셈 규칙이라고 한다. 이것은 모든 단일 사건의 모든 확률의 곱만을 포함하는 단일 조건이 아니며, 사건의 모든 부분 집합에 대해 참이어야 한다.
사건이 세 개 이상일 때, 상호 독립인 사건 집합은 (정의에 따라) 쌍별 독립이지만, 그 역은 반드시 참인 것은 아니다.
로그 확률로 표현하면, 두 사건은 결합 사건의 로그 확률이 개별 사건의 로그 확률의 합과 같을 때, 즉 다음과 같을 때 독립이다.
:
정보 이론에서, 음의 로그 확률은 정보량으로 해석되며, 따라서 두 사건은 결합 사건의 정보량이 개별 사건의 정보량의 합과 같을 때 독립이다.
:
자세한 내용은 생략한다.
사건의 독립을 정의하는 데 가장 기본적인 것은 사건의 독립이다. 두 사건 A한국어와 B한국어가 독립이라는 것은
:
가 성립하는 것이다. 여기서, 좌변의 A ∩ B한국어는 사건 A한국어와 B한국어가 모두 일어나는 사건(곱사건)을 나타내며, 예를 들어 P(A)한국어는 사건 A한국어의 확률을 나타낸다. 사건 A한국어와 B한국어가 독립임을 기호 A ⫫ B한국어로 나타내기도 한다. 만약 P(B) ≠ 0한국어이라면, 조건부 확률 P(A {{!}} B) {{coloneqq}} P(A ∩ B)/P(B)한국어를 사용하여 정의식을
:
로 바꿔 쓸 수도 있다. 이는 사건 A한국어와 B한국어가 독립이라는 것은, 사건 B한국어가 일어나는 것이 사건 A한국어의 확률에 아무런 영향을 주지 않는다는 것을 의미한다. 위의 정의는 P(B) {{=}} 0한국어일 때에도 대응하므로, 일반적으로 위의 정의를 사용한다. 사건이 독립이 아닌 것을 종속이라고 한다.
일반적으로, (유한하지 않은) 사건의 족 {{mset한국어가 독립이라는 것은, 그 부분 유한족 {{mset한국어에 대해
:
가 성립하는 것을 말한다.
2.2. 확률 변수의 독립
두 확률 변수 ${\displaystyle X}$와 ${\displaystyle Y}$가 독립이라는 것은, 모든 실수 ${\displaystyle a,b}$에 대하여 다음 식이 성립하는 것을 의미한다.
:
2.3. 시그마 대수의 독립
확률 공간
* 모든 유한 집합
:
그리고 σ-대수의 무한족은 모든 유한 부분족이 독립일 경우 독립이라고 한다.
3. 성질
사건
:
따라서 사건은 거의 확실히 일어나거나, 그 여집합이 거의 확실히 일어날 경우에만 자기 자신과 독립적이다. 이 사실은 0-1 법칙을 증명할 때 유용하다.
만약
:
그리고 공분산
:
역은 성립하지 않는다. 두 확률 변수의 공분산이 0이라고 해서 반드시 독립적인 것은 아니다.
마찬가지로 두 확률 과정
두 개의 확률 변수
:
특히, 두 변수의 합의 특성 함수는 각 변수의 주변 특성 함수의 곱이다.
:
하지만 역은 성립하지 않는다. 후자의 조건을 만족하는 확률 변수는 준독립이라고 한다.
두 확률 변수
* 함수
* 곱셈과 기댓값은 교환 가능하다. 즉,
:
* 동시 누적 분포 함수와 동시 확률 밀도 함수가 곱으로 분리된다.
:
* 합과 분산은 교환 가능하다. 즉,
:
다음 조건을 만족할 때 확률 변수
* 임의의 유계 함수
:
* 특성 함수가 곱으로 분리된다.
:
4. 독립성의 검정
두 사건 또는 확률 변수의 독립성은 카이 제곱 검정, 분할표 등 다양한 통계적 방법을 통해 검정할 수 있다. 그러나 독립성 검정은 두 변수 간의 종속성을 확인하는 데는 유용하지만, 독립성을 확정적으로 증명하는 것은 어렵다.
5. 조건부 독립
사건
:
직관적으로, 두 확률 변수
조건부 독립의 공식적인 정의는 조건부 분포의 개념에 기반한다. 만약
:
여기서
:
여기서
만약 이산
:
는
독립은 조건 없는 사건이 주어졌을 때 확률이 일종의 조건부 확률로 간주될 수 있으므로 조건부 독립의 특별한 경우로 볼 수 있다.
6. 예시
확률론에서 독립의 예시는 다음과 같다.
* 주사위를 두 번 던질 때, 첫 번째 던지기에서 6이 나오는 사건과 두 번째 던지기에서 6이 나오는 사건은 서로 독립이다.
* 카드 한 벌에서 카드를 한 장 뽑고 다시 넣는 경우(복원 추출)에는 첫 번째 시행에서 빨간색 카드를 뽑는 사건과 두 번째 시행에서 빨간색 카드를 뽑는 사건은 서로 독립이다. 반대로 카드를 한 장 뽑고 다시 넣지 않는 경우(비복원 추출)에는 첫 번째 시행에서 빨간색 카드를 뽑는 사건과 두 번째 시행에서 빨간색 카드를 뽑는 사건은 서로 독립이 아니다. 왜냐하면 빨간색 카드가 제거된 덱에는 상대적으로 더 적은 수의 빨간색 카드가 남아있기 때문이다.
* 세 사건
예를 들어, 두 확률 공간에서
쌍별 독립의 경우, 어떤 하나의 사건이 다른 두 사건 각각과는 독립적이지만, 다른 두 사건의 교집합과는 독립적이지 않다.
:
:
:
그러나 상호 독립의 경우,
:
:
:
와 같이 조건부 확률과 무조건부 확률이 같아진다.
6.1. 주사위 던지기
주사위를 두 번 던질 때, 첫 번째 던지기에서 6이 나오는 사건과 두 번째 던지기에서 6이 나오는 사건은 서로 독립이다.
6.2. 카드 뽑기
카드 한 벌에서 카드를 한 장 뽑고 다시 넣는 경우(복원 추출)에는 첫 번째 시행에서 빨간색 카드를 뽑는 사건과 두 번째 시행에서 빨간색 카드를 뽑는 사건은 서로 독립이다. 반대로 카드를 한 장 뽑고 다시 넣지 않는 경우(비복원 추출)에는 첫 번째 시행에서 빨간색 카드를 뽑는 사건과 두 번째 시행에서 빨간색 카드를 뽑는 사건은 서로 독립이 아니다. 왜냐하면 빨간색 카드가 제거된 덱에는 상대적으로 더 적은 수의 빨간색 카드가 남아있기 때문이다.
6.3. 쌍별 독립과 상호 독립
세 사건
유한 개의 사건 집합
:
유한 개의 사건 집합은 모든 사건이 다른 사건들의 교집합과 독립일 때 상호 독립이라고 한다. 즉, 모든
:
이를 독립 사건에 대한 곱셈 규칙이라고 한다.
사건이 세 개 이상일 때, 상호 독립인 사건 집합은 (정의에 따라) 쌍별 독립이지만, 그 역은 반드시 참인 것은 아니다.
예를 들어, 두 확률 공간에서
쌍별 독립의 경우, 어떤 하나의 사건이 다른 두 사건 각각과는 독립적이지만, 다른 두 사건의 교집합과는 독립적이지 않다.
:
:
:
그러나 상호 독립의 경우,
:
:
:
와 같이 조건부 확률과 무조건부 확률이 같아진다.
7. 역사
확률론에서 1933년 이전에는 독립은 언어적으로 정의되었다. 예를 들어, 드 무아브르는 "두 사건은 서로 아무런 관련이 없고, 하나의 발생이 다른 하나의 발생을 촉진하거나 방해하지 않을 때 독립이다."라고 정의했다. 만약 n개의 독립 사건이 있다면, 이들 모두가 일어날 사건의 확률은 이 n개 사건들의 확률의 곱으로 계산되었다.
이 문서에서 제시된 독립의 정의는 1933년 콜모고로프의 확률 공리화의 일부로 등장한 후 표준 정의(현재 모든 책에서 사용됨)가 되었다. 콜모고로프는 이를 S.N. 베르스타인의 공로로 돌리고, 1927년에 러시아어로 출판된 간행물을 인용했다.
불행히도, 베르스타인과 콜모고로프는 모두 게오르그 볼만의 연구를 알지 못했다. 볼만은 1901년에 두 사건에 대한 동일한 정의를, 1908년에는 n개의 사건에 대한 동일한 정의를 제시했다. 후자의 논문에서 그는 자신의 개념을 자세히 연구했다. 예를 들어, 그는 쌍별 독립성이 상호 독립성을 의미하지 않는다는 것을 보여주는 첫 번째 예를 제시했다.
오늘날에도 볼만은 거의 인용되지 않는다. 그의 작업에 대한 더 많은 정보는 :de:Ulrich Krengel의 "확률론에 대한 게오르그 볼만의 기여에 관하여"에서 찾을 수 있다.