맨위로가기

베르누이 과정

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

베르누이 과정은 독립적인 확률 변수들의 유한 또는 무한 수열로, 각 변수가 0 또는 1의 값을 가지며, 1이 될 확률 p가 동일한 조건을 만족한다. 이는 독립적인 베르누이 시행의 나열이며, 각 시행에서 1은 성공, 0은 실패로 간주된다. 베르누이 과정은 확률 공간으로 형식화될 수 있으며, 큰 수의 법칙과 중심 극한 정리를 통해 성공 횟수의 비율이 p에 수렴하고, 시행 횟수가 충분히 클 때 성공 횟수의 분포가 정규 분포에 근사한다는 것을 보여준다. 또한, 베르누이 과정은 에르고딕 시스템의 예시로, 시프트 연산자를 통해 베르누이 맵을 구성할 수 있으며, 폰 노이만 추출기를 사용하여 무작위성을 추출할 수 있다. 베르누이 과정을 3개 이상의 값을 가지도록 일반화한 것을 베르누이 계열이라고 한다.

더 읽어볼만한 페이지

  • 확률 과정 - 마르코프 연쇄
    마르코프 연쇄는 현재 상태가 주어졌을 때 과거와 미래 상태가 독립적인 확률 변수 순서열로, 시간 동질성, 상태 공간 유형, 시간 매개변수 유형에 따라 다양한 유형으로 분류되며 여러 분야에서 활용되는 확률적 모델링 방법이다.
  • 확률 과정 - 브라운 운동
    브라운 운동은 액체나 기체 속 미세 입자가 매질 분자와 충돌하여 불규칙하게 움직이는 현상으로, 아인슈타인과 스몰루호프스키의 이론적 설명과 페랭의 실험적 검증을 통해 원자 존재 입증에 기여했으며, 확산/랑주뱅 방정식으로 모델링되어 다양한 분야에 응용된다.
  • 확률론 - 확률 밀도 함수
    확률 밀도 함수는 연속 확률 변수의 확률 분포를 나타내는 함수로, 특정 구간에서 확률 변수가 값을 가질 확률은 해당 구간에 대한 함수의 적분으로 계산되며, 통계적 특성 계산 및 변수 변환 등에 활용되어 불확실성 모델링 및 분석에 중요한 역할을 한다.
  • 확률론 - 체비쇼프 부등식
    체비쇼프 부등식은 확률 변수가 평균에서 얼마나 멀리 떨어져 있는지에 대한 확률의 상한을 제공하는 부등식으로, 이레네-쥘 비네메가 처음 공식화하고 체비쇼프와 안드레이 마르코프에 의해 일반화 및 증명되었으며, 확률론적 표현 외에도 측도 공간에 대한 명제로 확장될 수 있다.
베르누이 과정
확률론
분야확률론
명명 유래야코프 베르누이
일반 정보
유형확률 과정
분포베르누이 분포
과정독립적이고 동일하게 분포된 (i.i.d.) 베르누이 시행의 순서
속성
마르코프 성질만족함
정상성만족함
에르고딕성만족함
관련 항목
관련 분포이항 분포, 기하 분포, 음이항 분포
일반화마르코프 연쇄, 포아송 과정

2. 정의

베르누이 과정은 다음 조건을 만족하는 독립적인 확률 변수들의 유한 또는 무한 수열이다.[1]


  • 각 ''i''에 대해 ''X''''i''의 값은 0 또는 1이다.[1]
  • 모든 i에 대해, ''X''''i'' = 1일 확률 ''p''는 동일하다.[1]


다시 말해, 베르누이 과정은 독립 동일 분포(i.i.d.) 베르누이 시행의 수열이다.[1]

시행의 독립성은 이 과정이 무기억성임을 의미한다.[1] 확률 ''p''가 알려져 있다면, 과거의 결과는 미래의 결과에 대한 정보를 제공하지 않는다.[1] (하지만 ''p''가 알려져 있지 않다면, 과거는 ''p''에 대한 추론을 통해 간접적으로 미래에 영향을 미친다.)[1]

과정이 무한하다면, 임의의 지점으로부터 미래의 시행은 전체 과정과 동일한 베르누이 과정을 구성하며, 이는 초기화 속성이다.[1]

3. 형식적 정의

베르누이 과정은 확률 공간의 언어로 형식화될 수 있다. 베르누이 과정은 집합 {0, 1}에 대한 확률 변수 ''X''를 가지는 확률 공간 (\Omega, Pr)로 표현된다. 모든 \omega \in\Omega에 대해, 확률 ''p''에서 X_i(\omega)=1이고, 확률 1-''p''에서 X_i(\omega)=0이다.[1]

베르누이 과정을 더 엄밀하게 정의하기 위해, 2=\{H,T\}가산 무한 직접곱을 고려한다. 여기서 H는 앞면, T는 뒷면을 의미한다. 일반적으로 한쪽 집합 \Omega=2^\mathbb{N}=\{H,T\}^\mathbb{N} 또는 양쪽 집합 \Omega=2^\mathbb{Z}을 조사한다. 이 공간에는 곱 위상이라고 하는 자연스러운 위상이 있다. 이 위상의 집합은 유한 길이의 ''H''와 ''T''의 문자열로, 나머지(무한 길이) 시퀀스는 "상관 없음"으로 간주되는 동전 던지기의 유한 시퀀스이다. 이러한 유한 시퀀스의 집합을 곱 위상에서 원통 집합이라고 한다. 이러한 모든 문자열의 집합은 시그마 대수를 형성하며, 특히 보렐 대수를 형성한다. 이 대수는 일반적으로 (\Omega, \mathcal{B})로 표기되며, 여기서 \mathcal{B}의 요소는 동전 던지기의 유한 길이 시퀀스(원통 집합)이다.

만약 앞면 또는 뒷면이 나올 확률이 \{p,1-p\}로 주어진다면, 곱 공간에 자연스러운 측도를 정의할 수 있는데, 이는 P=\{p, 1-p\}^\mathbb{N}으로 주어진다(또는 양방향 과정의 경우 P=\{p, 1-p\}^\mathbb{Z}로 주어진다). 다시 말해, 이산 확률 변수 ''X''가 매개변수 ''p''를 갖는 ''베르누이 분포''를 가지고 (여기서 0 ≤ ''p'' ≤ 1), 그 확률 질량 함수는 다음과 같이 주어진다.

:pX(1)=P(X=1)=ppX(0)=P(X=0)=1-p.

이 분포를 Ber(''p'')로 표기한다.[1]

원통 집합, 즉 시간 1,2,\cdots,n에서 특정 동전 던지기 결과 시퀀스 [\omega_1, \omega_2,\cdots\omega_n]이 주어지면, 이 특정 시퀀스를 관찰할 확률은 다음과 같다.

:P([\omega_1, \omega_2,\cdots ,\omega_n])= p^k (1-p)^{n-k}

여기서 ''k''는 시퀀스에 ''H''가 나타나는 횟수이고, ''n''−''k''는 시퀀스에 ''T''가 나타나는 횟수이다. 위에는 몇 가지 다른 종류의 표기법이 있는데, 일반적인 표기법은 다음과 같다.

:P(X_1=x_1, X_2=x_2,\cdots, X_n=x_n)= p^k (1-p)^{n-k}

여기서 각 X_i아이버슨 괄호 표기법에서 x_i=[\omega_i=H]를 갖는 이진 값 확률 변수이며, 이는 \omega_i=H이면 1이고 \omega_i=T이면 0을 의미한다. 이 확률 P는 일반적으로 베르누이 측도라고 한다.[2]

결론적으로, 베르누이 과정은 위에서 정의된 확률 삼중항 (\Omega, \mathcal{B}, P)로 주어진다.

4. 관련 확률 분포

베르누이 과정에서 파생되는 여러 확률 분포는 다음과 같다.[1]


  • 처음 ''n''번의 시행에서 성공 횟수는 이항 분포 B(''n'', ''p'')를 따른다.
  • ''r''번의 성공을 얻는 데 필요한 실패 횟수는 음이항 분포 NB(''r'', ''p'')를 따른다.
  • 한 번의 성공을 얻는 데 필요한 실패 횟수는 기하 분포 NB(1, ''p'')를 따르며, 이는 음이항 분포의 특수한 경우이다.


음이항 변수는 무작위 대기 시간으로 해석할 수 있다.

5. 큰 수의 법칙과 중심 극한 정리

큰 수의 법칙에 따르면, 베르누이 시행에서 수열의 평균 \bar{X}_{n}:=\frac{1}{n}\sum_{i=1}^{n}X_{i}는 거의 확실하게 기댓값에 접근한다. 즉, 앞면이 나올 확률(p)에 수렴하지 않는 사건은 확률이 0이다. 각 시행의 기댓값은 다음과 같다.

:\mathbb{E}[X_i]=\mathbb{P}([X_i=1])=p,

''n''번의 베르누이 시행에서 ''k''번 성공할 확률은 이항 분포로 주어지며, 다음과 같이 나타낼 수 있다.

:N(k,n) = {n \choose k}=\frac{n!}{k! (n-k)!}

:\mathbb{P}([S_n=k]) = {n\choose k} p^k (1-p)^{n-k} ,

여기서 S_n=\sum_{i=1}^{n}X_i 이다.

스털링 근사를 사용하여 팩토리얼을 근사하고 위의 식에 대입하면 정규 분포를 얻는다. 이것은 중심 극한 정리의 가장 간단한 예시이다.

큰 수의 법칙과 중심 극한 정리를 조합하면 점근적 등분할 속성이 도출된다. 베르누이 과정에서 발생하는 가능한 무한히 긴 문자열 집합은 확률 1로 발생하는 문자열과 확률 0으로 발생하는 문자열로 분할된다. 이 분할은 콜모고로프 0-1 법칙이라고 한다.

이 집합의 크기는 베르누이 과정의 엔트로피와 관련이 있다. 길이 ''n''인 모든 문자열 집합의 크기는 2^n이고, 이 중 특정 하위 집합의 크기는 H\le 1에 대해 2^{nH}이다. 스털링 근사를 사용하여 엔트로피를 계산하면 다음과 같다.

:H=-p\log_2 p - (1-p)\log_2(1-p)

이 값은 베르누이 과정의 베르누이 엔트로피이다.

6. 에르고딕 시스템

베르누이 과정은 여러 가지 방식으로 에르고딕 시스템의 예시이자 특히 측도 보존 역학계의 예시로서, 역학계로 이해될 수 있다. 한 가지 방법은 시프트 공간으로, 다른 방법은 오도미터로 이해하는 것이다.

7. 베르누이 수열

베르누이 과정에서 각 $\omega$에 대해 $X_n(\omega) = 1$인 정수 $n$의 수열을 베르누이 수열이라고 한다.[1] 예를 들어, $x$가 동전 던지기 시퀀스를 나타낸다면, 관련된 베르누이 수열은 동전 던지기 결과가 앞면인 자연수 또는 시간 지점의 목록이다. 이와 같이 정의된 베르누이 수열 $\mathbb{Z}^x$는 인덱스 집합인 자연수 $\mathbb{N}$의 무작위 부분 집합이다. 대부분의 베르누이 수열 $\mathbb{Z}^x$는 에르고딕 수열이다.

8. 무작위성 추출

어떤 베르누이 과정에서든, 폰 노이만 추출기를 통해 ''p'' = 1/2인 베르누이 과정을 도출할 수 있으며, 이는 균등한 무작위성을 추출한다.[5]

입력 스트림을 0과 1의 시퀀스로 나타내고, 연속된 비트의 겹치지 않는 쌍으로 묶는다. (예: (11)(00)(10)...) 그런 다음 각 쌍에 대해 다음과 같이 처리한다.


  • 비트가 같으면 버린다.
  • 비트가 같지 않으면 첫 번째 비트를 출력한다.


이 과정을 표로 나타내면 다음과 같다.

입력출력
00버림
010
101
11버림



예를 들어, 8비트 입력 스트림 ''10011011''은 ''(10)(01)(10)(11)''로 묶인다. 이 쌍들은 위의 표에 따라 (1)(0)(1)() = ''101''로 변환된다.

출력 스트림에서 0과 1은 동일한 확률을 가지며, 이는 원본에서 10과 01이 동일한 확률 ''p''(1−''p'') = (1−''p'')''p''를 갖기 때문이다. 이러한 균일한 무작위성 추출은 입력이 독립적일 필요는 없으며, 상관관계가 없어야(uncorrelated) 한다. 즉, 비트의 모든 교환 가능한 시퀀스에 대해 작동한다.

폰 노이만 추출기는 두 개의 입력 비트를 사용하여 0 또는 1개의 출력 비트를 생성하므로 출력은 입력보다 최소 2배 짧다. 평균적으로 입력 쌍의 ''p''2 + (1 − ''p'')2 비율(00 및 11)을 버리는데, 이는 ''p''가 0 또는 1에 가까울 때 1에 가깝고, ''p'' = 1/2일 때 1/4로 최소화된다. (''p'' = 1/2인 경우, 출력 스트림은 평균적으로 입력 스트림 길이의 1/4이다.)

폰 노이만 추출기의 효율성을 개선하기 위해 알고리즘을 입력 데이터에 반복 적용할 수 있다. 이를 통해 출력을 "엔트로피 경계에 임의로 근접"하게 만들 수 있다.[5]

1992년 유발 페레스가 반복된 폰 노이만 알고리즘(고급 다단계 전략, AMLS)을 소개했다.[5] 이 알고리즘은 재귀적으로 작동하며, 폐기되지 않은 시퀀스와 폐기된 쌍의 값(00은 0, 11은 1) 두 소스에서 "낭비된 무작위성"을 재활용한다.

입력출력새로운 시퀀스 1(A)새로운 시퀀스 2(1)
00없음00
0101없음
1011없음
11없음01



입력 시퀀스에서 비트를 쌍으로 소비하여 출력을 생성하고, 두 개의 새로운 시퀀스를 생성한다. 입력의 길이가 홀수이면 마지막 비트는 폐기된다. 그런 다음 알고리즘은 입력이 비어 있을 때까지 두 개의 새로운 시퀀스 각각에 재귀적으로 적용된다.

예를 들어, 입력 스트림 ''11001011101110''은 다음과 같이 처리된다.

단계 번호입력출력새로운 시퀀스 1(A)새로운 시퀀스 2(1)
0(11)(00)(10)(11)(10)(11)(10)()()(1)()(1)()(1)(1)(1)(0)(1)(0)(1)(0)(1)(0)()(1)()(1)()
1(10)(11)(11)(01)(01)()(1)()()(0)(0)(0)(1)(1)(0)(0)()(1)(1)()()
2(11)(01)(10)()()(0)(1)(0)(1)(1)(1)()()
3(10)(11)(1)(1)(0)()(1)
4(11)()()(0)(1)
5(10)(1)(1)()
6()()()()



최종 출력은 ''1111000111''로, 14비트 입력에서 10비트 출력이 생성된다. 이는 폰 노이만 알고리즘만 사용한 3비트보다 개선된 결과이다. 또한, 비트 쌍당 2비트의 상수 출력을 통해 타이밍 공격에 저항하는 고정 시간 구현이 가능하다.

2016년에는 Sequence2 채널이 많은 처리량을 제공하지 않는다는 점을 바탕으로 개선된 알고리즘이 제시되었다.[7]

9. 베르누이 맵

각 시행이 두 값 중 하나를 취할 때, 시행의 열은 실수이진법으로 나타낸 것으로 볼 수 있다.[3] 확률 ''p''가 1/2이면, 모든 이진 수열이 동일한 확률로 생성되며, 베르누이 과정의 완전 가법족의 측도는 단위 구간에서의 균등 측도와 등가이다. 즉, 이들 실수는 단위 구간 위에 균등하게 분포한다.

시프트 연산자 ''T''는 각 확률 변수의 다음 확률 변수를 제공한다.

:TX_i=X_{i+1}

이는 다음의 베르누이 맵으로 주어진다.

:b(z)=2z-\lfloor 2z \rfloor

여기서 z\in[0,1]는 측정 열을 나타내고, \lfloor z \rfloor는 바닥 함수 (즉, ''z''를 넘지 않는 최대 정수)를 나타낸다. 베르누이 맵은 ''z''를 이진수 표현으로 보았을 때 소수점 이하에 해당한다.

베르누이 맵은 결정적 카오스의 정확한 가해 모델이다. 베르누이 맵의 전송 연산자는 가해적이다. 그 고유값은 1/2의 배수이며, 고유 함수는 베르누이 다항식이다.[3][4]

10. 베르누이 계

베르누이 계열이라고 부른다.

참조

[1] 서적 A modern introduction to probability and statistics
[2] 서적 Probability Theory Springer-Verlag
[3] 논문 "''r''-adic one-dimensional maps and the Euler summation formula"
[4] 서적 Fully Chaotic Maps and Broken Time Symmetry Kluwer Academic Publishers
[5] 간행물 Iterating Von Neumann's Procedure for Extracting Random Bits 1992-03
[6] 웹사이트 Tossing a Biased Coin http://www.eecs.harv[...] eecs.harvard.edu 2018-07-28
[7] 간행물 Iterating Von Neumann's post-processing under hardware constraints https://www.esat.kul[...] 2016-05-03



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com