확률론에서 독립은 여러 사건 또는 확률 변수 간의 관계를 설명하는 중요한 개념이다. 사건의 독립은 두 사건의 결합 확률이 각 사건의 확률의 곱과 같을 때 성립하며, 한 사건의 발생이 다른 사건의 발생에 영향을 미치지 않음을 의미한다. 확률 변수의 독립은 결합 누적 분포 함수가 각 확률 변수의 누적 분포 함수의 곱으로 분해될 때 정의된다. 독립은 쌍별 독립, 상호 독립, 조건부 독립 등의 형태로 확장되며, 독립성은 카이 제곱 검정, 분할표 등 다양한 통계적 방법을 통해 검정할 수 있다. 독립의 개념은 주사위 던지기, 카드 뽑기 등의 예시를 통해 쉽게 이해할 수 있으며, 1933년 안드레이 콜모고로프의 확률 공리화 이후 표준 정의로 자리 잡았다.
더 읽어볼만한 페이지
확률론 - 확률 밀도 함수 확률 밀도 함수는 연속 확률 변수의 확률 분포를 나타내는 함수로, 특정 구간에서 확률 변수가 값을 가질 확률은 해당 구간에 대한 함수의 적분으로 계산되며, 통계적 특성 계산 및 변수 변환 등에 활용되어 불확실성 모델링 및 분석에 중요한 역할을 한다.
확률론 - 체비쇼프 부등식 체비쇼프 부등식은 확률 변수가 평균에서 얼마나 멀리 떨어져 있는지에 대한 확률의 상한을 제공하는 부등식으로, 이레네-쥘 비네메가 처음 공식화하고 체비쇼프와 안드레이 마르코프에 의해 일반화 및 증명되었으며, 확률론적 표현 외에도 측도 공간에 대한 명제로 확장될 수 있다.
독립 (확률론)
확률론의 독립
정의
두 사건의 발생이 서로에게 영향을 주지 않는 관계
기호
P(A∩B) = P(A)P(B)
설명
사건 A와 B가 독립이면, A가 일어났을 때 B가 일어날 확률은 A가 일어나지 않았을 때 B가 일어날 확률과 같다.
수학적 정의
확률 공간
(Ω, F, P)
독립
두 사건 A와 B가 다음을 만족하면 독립이다: P(A ∩ B) = P(A)P(B)
조건부 확률
사건 A가 일어났을 때 사건 B가 일어날 조건부 확률 P(B|A) = P(B) (단, P(A) > 0)
독립의 일반화
n개의 사건 A₁, A₂, ..., Aₙ이 모두 독립일 필요충분조건은 모든 k (2 ≤ k ≤ n)와 모든 1 ≤ i₁ < i₂ < ... < iₖ ≤ n에 대해 다음이 성립하는 것이다: P(Aᵢ₁ ∩ Aᵢ₂ ∩ ... ∩ Aᵢₖ) = P(Aᵢ₁)P(Aᵢ₂) ... P(Aᵢₖ)
예시
동전 던지기
동전을 두 번 던질 때, 첫 번째 던지기 결과와 두 번째 던지기 결과는 독립이다.
주사위 굴리기
주사위를 두 번 굴릴 때, 첫 번째 굴리기 결과와 두 번째 굴리기 결과는 독립이다.
카드 뽑기
카드 덱에서 카드를 한 장 뽑고 다시 넣은 후 다시 뽑을 때, 첫 번째 뽑기와 두 번째 뽑기는 독립이다. 하지만 카드를 다시 넣지 않으면 독립이 아니다.
확률 공간 $(\Omega, \mathcal{F}, P)$에서 정의되는 사건, 확률 변수, 시그마 대수의 독립성은 각각 다음과 같이 정의된다.
사건의 독립: 두 사건 $A$와 $B$가 독립이라는 것은 $P(A \cap B) = P(A)P(B)$가 성립하는 것을 의미한다. 여기서 $A \cap B$는 $A$와 $B$가 모두 일어나는 사건(곱사건)을 나타낸다. $P(B) \neq 0$이라면, 조건부 확률을 사용하여 $P(A|B) = P(A)$로 표현할 수 있는데, 이는 사건 $B$가 일어나는 것이 사건 $A$의 확률에 영향을 주지 않는다는 것을 의미한다. 사건 $A$와 $B$가 독립임을 나타내는 기호는 $A$ ⫫ $B$이다.[18] 사건이 독립이 아닌 경우 종속이라고 한다. 일반적으로, 사건의 족 $\{A_\lambda\}$가 독립이라는 것은, 그 부분 유한족 $\{ A_{\lambda_1}, A_{\lambda_2}, ..., A_{\lambda_n} \}$에 대해 $P(A_{\lambda_1} \cap A_{\lambda_2} \cap \dotsb \cap A_{\lambda_n}) = P(A_{\lambda_1})P(A_{\lambda_2}) \dotsm P(A_{\lambda_n})$가 성립하는 것을 의미한다.
확률 변수의 독립: 두 확률 변수 $X$와 $Y$가 독립이라는 것은, 임의의 실수 $a, b$에 대해 $P(X누적 분포 함수가 주변 누적 분포 함수의 곱으로 분해될 때 독립이라고 한다. 확률 변수 $X$와 $Y$가 독립임을 나타내는 기호는 $X$ ⫫ $Y$이다.[19] 일반적으로, 확률 변수의 족 $\{ X_\lambda | \lambda \in \Lambda \}$가 독립이라는 것은, 임의의 실수 $a_\lambda$에 대해 사건의 족 $\bigl\{ \{\, X_\lambda < a_\lambda \} \mathrel{\big|} \lambda \in \Lambda \, \bigr\}$가 독립임을 의미한다.
시그마 대수의 독립: 완전 가법족의 족 $\{F_\lambda\}$가 독립이라는 것은, 임의의 유한 부분족 $\{ \mathcal{F}_{\lambda_1}, \mathcal{F}_{\lambda_2}, \dotsc, \mathcal{F}_{\lambda_n} \}$에 대해, $P(A_1 \cap A_2 \cap \dotsb \cap A_n) = P(A_1)P(A_2) \dotsm P(A_n),\quad {}^\forall A_1 \in \mathcal{F}_{\lambda_1}, {}^\forall A_2 \in \mathcal{F}_{\lambda_2}, \dotsc, {}^\forall A_n \in \mathcal{F}_{\lambda_n}$이 성립하는 것을 의미한다.
2. 1. 사건의 독립
확률 공간 위의 사건들의 집합 가 다음 조건을 만족시킨다면, 가 서로 '''독립'''이라고 한다.
두 사건 와 는 독립적이며(종종 또는 로 표기하며, 후자의 기호는 종종 조건부 독립에도 사용됨), 이는 두 사건의 결합 확률이 각 확률의 곱과 같을 경우에만 해당된다.[2]
:
는 두 독립 사건 와 가 표본 공간에서 공통 요소를 가지고 있어 상호 배타적이지 않음을 나타낸다(상호 배타적인 경우는 ).
이 정의가 독립성을 어떻게 정의하는지는 조건부 확률 를 사용하여, 사건 가 발생했거나 발생했다고 가정했을 때 사건 가 발생할 확률로 다시 작성하면 명확해진다.
:
유사하게 다음이 성립한다.
:
따라서, 의 발생은 의 확률에 영향을 미치지 않으며, 그 반대도 마찬가지이다. 즉, 와 는 서로 독립적이다. 파생된 표현이 더 직관적으로 보일 수 있지만, 또는 가 0이면 조건부 확률이 정의되지 않을 수 있으므로 선호되는 정의는 아니다. 또한, 선호되는 정의는 대칭성을 통해 가 와 독립적일 때 도 와 독립적이라는 것을 명확하게 보여준다.
오즈의 관점에서 말하면, 두 사건 A영어와 B영어의 오즈비가 1일 때 두 사건은 독립이다. 확률과 유사하게, 이는 조건부 오즈가 무조건부 오즈와 같다는 것과 같다.
:
또는 한 사건의 오즈가 다른 사건이 주어졌을 때 다른 사건이 발생하지 않았을 때의 오즈와 같다는 것과 같다.
:
오즈비는 다음과 같이 정의될 수 있다.
:
또는 A영어가 주어졌을 때 B영어의 오즈에 대해 대칭적으로 정의되며, 따라서 사건이 독립일 때 1이다.
유한 개의 사건 집합 는 모든 사건의 쌍이 독립일 때, 즉, 서로 다른 모든 쌍의 인덱스 에 대해 다음과 같을 때 쌍별 독립이라고 한다.[3]
:
유한 개의 사건 집합은 모든 사건이 다른 사건들의 교집합과 독립일 때 '''상호 독립'''이라고 한다.[4] 즉, 모든 과 모든 k개의 인덱스 에 대해 다음이 성립한다.
:
이것을 독립 사건에 대한 ''곱셈 규칙''이라고 한다. 이것은 모든 단일 사건의 모든 확률의 곱만을 포함하는 단일 조건이 아니며, 사건의 모든 부분 집합에 대해 참이어야 한다.
사건이 세 개 이상일 때, 상호 독립인 사건 집합은 (정의에 따라) 쌍별 독립이지만, 그 역은 반드시 참인 것은 아니다.[2]
로그 확률로 표현하면, 두 사건은 결합 사건의 로그 확률이 개별 사건의 로그 확률의 합과 같을 때, 즉 다음과 같을 때 독립이다.
:
정보 이론에서, 음의 로그 확률은 정보량으로 해석되며, 따라서 두 사건은 결합 사건의 정보량이 개별 사건의 정보량의 합과 같을 때 독립이다.
:
자세한 내용은 생략한다.
사건의 독립을 정의하는 데 가장 기본적인 것은 사건의 독립이다. 두 사건 A한국어와 B한국어가 '''독립'''이라는 것은
:
가 성립하는 것이다. 여기서, 좌변의 ''A'' ∩ ''B''한국어는 사건 A한국어와 B한국어가 모두 일어나는 사건(곱사건)을 나타내며, 예를 들어 ''P''(''A'')한국어는 사건 A한국어의 확률을 나타낸다. 사건 A한국어와 B한국어가 독립임을 기호 ''A'' ⫫ ''B''한국어로 나타내기도 한다.[18] 만약 ''P''(''B'') ≠ 0한국어이라면, 조건부 확률 ''P''(''A'' ''P''(''A'' ∩ ''B'')/''P''(''B'')}}를 사용하여 정의식을
:
로 바꿔 쓸 수도 있다. 이는 사건 A한국어와 B한국어가 독립이라는 것은, 사건 B한국어가 일어나는 것이 사건 A한국어의 확률에 아무런 영향을 주지 않는다는 것을 의미한다. 위의 정의는 ''P''(''B'') 일 때에도 대응하므로, 일반적으로 위의 정의를 사용한다. 사건이 독립이 아닌 것을 '''종속'''이라고 한다.
일반적으로, (유한하지 않은) 사건의 족 }}가 '''독립'''이라는 것은, 그 부분 유한족 , ''A''}},..., ''A}}''}}}}에 대해
:
가 성립하는 것을 말한다.
2. 2. 확률 변수의 독립
두 확률 변수 ${\displaystyle X}$와 ${\displaystyle Y}$가 독립이라는 것은, 모든 실수 ${\displaystyle a,b}$에 대하여 다음 식이 성립하는 것을 의미한다.[19]