맨위로가기

연속균등분포

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

연속균등분포는 특정 구간 내에서 모든 값이 동일한 확률을 갖는 확률 분포이다. 표준 균등 분포는 0과 1 사이의 값을 가지며, 확률 밀도 함수는 구간 [a, b]에서 1/(b-a)로 정의된다. 누적 분포 함수는 구간에 따라 0, (x-a)/(b-a), 1의 값을 가지며, 역함수를 통해 확률을 계산할 수 있다. 연속균등분포는 적률생성함수, 큐뮬런트생성함수 등을 가지며, 평균, 분산, 순서 통계량, 균일성 등의 성질을 갖는다. 최대값, 최소값, 중앙값 추정에 사용되며, 신뢰 구간을 설정할 수 있다. 응용 분야로는 가설 검정, 무작위 표본 추출, 경제학, 양자화 오차, 난수 생성 등이 있으며, 역변환 표본 추출, 베타 분포, 어윈-홀 분포 등 다른 분포와의 관계를 갖는다.

2. 정의

연속 균등 분포는 확률 밀도 함수누적 분포 함수를 통해 정의된다. 확률 밀도 함수는 특정 구간에서 균일한 확률을 나타내며, 누적 분포 함수는 특정 값 이하의 확률을 나타낸다.

2. 1. 확률 밀도 함수 (Probability density function)

특정 구간 [a, b]에서 연속 균등 분포의 확률 밀도 함수는 다음과 같이 정의된다.

:

f(x) = \begin{cases}

\frac{1}{b-a} & \text{for } a \le x \le b, \\[8pt]

0 & \text{for } x < a \ \text{ or } \ x > b.

\end{cases}



여기서 a와 b는 분포의 경계를 나타내는 매개변수이다.

두 경계 a와 b에서의 f(x) 값은 일반적으로 중요하지 않다. 왜냐하면 이 값들은 특정 구간에서의 적분 값이나 고차 모멘트 값을 변경시키지 않기 때문이다. 때로는 0으로, 때로는 tfrac|1|b-a영어로 설정되기도 한다. tfrac|1|b-a영어는 최대 우도 추정 방식에 의한 추정의 맥락에서 적절하다. 푸리에 분석의 맥락에서, f(a) 또는 f(b)의 값을 tfrac|1|2(b-a)영어로 취할 수 있다. 이는 균등 함수의 많은 적분 변환의 역변환이 "거의 모든 곳에서" 동일한 함수, 즉 측도가 0인 점 집합을 제외한 함수가 아닌, 함수 자체를 반환하도록 하기 위함이다. 또한, 부호 함수와도 일치한다.

모든 확률 밀도 함수는 적분하면 1이 되므로, 연속 균등 분포의 확률 밀도 함수는 밑변의 길이가 b-a영어이고 높이가 tfrac|1|b-a영어인 직사각형으로 묘사된다. 밑변의 길이가 증가함에 따라 높이(분포 경계 내의 특정 값에서의 밀도)는 감소한다.[4]

평균 μ와 분산 σ²으로 표현하면, 연속 균등 분포의 확률 밀도 함수는 다음과 같다.

:

f(x) = \begin{cases}

\frac{1}{2 \sigma \sqrt{3}} & \text{for } - \sigma \sqrt{3} \le x - \mu \le \sigma \sqrt{3} , \\

0 & \text{otherwise} .

\end{cases}



연속 균등 분포의 확률 밀도 함수는 헤비사이드 계단 함수를 사용하여 표현할 수도 있다.

:f(x) = \frac{ \operatorname{H} (x-a) - \operatorname{H} (x-b) }{b-a} ,

또는 구형파 함수를 사용하여 다음과 같이 표현할 수도 있다.

:f(x) = \frac{1}{b-a} \ \operatorname{rect} \left( \frac{x - \frac{a+b}{2}}{b-a} \right) .

부호 함수의 전환 지점에서는 모호성이 없다. 전환 지점에서 반-최대 규칙을 사용하면 연속 균등 분포를 부호 함수를 사용하여 다음과 같이 표현할 수 있다.

:f(x) = \frac{ \sgn{(x-a)} - \sgn{(x-b)} }{2(b-a)} .

2. 2. 누적 분포 함수 (Cumulative distribution function)

연속 균등 분포의 누적 분포 함수는 다음과 같다.

:

F(x) = \begin{cases}

0 & \text{for } x < a, \\[8pt]

\frac{x-a}{b-a} & \text{for } a \le x \le b, \\[8pt]

1 & \text{for } x > b.

\end{cases}



역함수는 다음과 같다.

:F^{-1} (p) = a + p (b - a) \quad \text{ for } 0 < p < 1.

평균 \mu와 분산 \sigma ^2 으로 표현하면, 연속 균등 분포의 누적 분포 함수는 다음과 같다.

:F(x) = \begin{cases}

0 & \text{for } x - \mu < - \sigma \sqrt{3} , \\

\frac{1}{2} \left( \frac{x - \mu}{ \sigma \sqrt{3} } + 1 \right) & \text{for } - \sigma \sqrt{3} \le x - \mu < \sigma \sqrt{3} , \\

1 & \text{for } x - \mu \ge \sigma \sqrt{3} ;

\end{cases}

역함수는 다음과 같다.

:F^{-1} (p) = \sigma \sqrt{3} (2p-1) + \mu \quad \text{ for } 0 \le p \le 1.

2. 3. 예제

확률 변수 X ~ U(0,23)에 대해, P(2 < X < 18)을 구하면 다음과 같다.

:P(2 < X < 18) = (18-2) * 1/(23-0) = 16/23.

연속 균등 분포 함수 f(x) vs x의 그래프에서, 확률을 나타내는 지정된 경계 내의 곡선 아래 면적은 직사각형이다. 위의 예시에서 밑변은 16이고 높이는 1/23이다.[5]

확률 변수 X ~ U(0,23)에 대해, P(X > 12 | X > 8)을 구하면 다음과 같다.

:P(X > 12 | X > 8) = (23-12) * 1/(23-8) = 11/15.

위 예시는 연속 균등 분포에 대한 조건부 확률의 경우이다. X > 8이 참일 때, X > 12일 확률은 무엇인가? 조건부 확률은 표본 공간을 변경하므로, 새로운 구간 길이 b-a'를 계산해야 한다. 여기서 b = 23이고 a' = 8이다.[5] 그래프 표현은 이전 예제를 따르며, 지정된 경계 내의 곡선 아래 면적이 확률을 나타낸다. 직사각형의 밑변은 11이고, 높이는 1/15이다.[5]

3. 생성 함수 (Generating functions)

이 섹션에서는 연속균등분포의 생성 함수에 대해 다룬다. 생성 함수에는 적률생성함수와 큐뮬런트생성함수가 있다.

3. 1. 적률생성함수 (Moment-generating function)

연속 균등 분포의 적률생성함수는 다음과 같다.[6]

:E|E영어(etX) = ∫ab etx (1/(b|b영어-a|a영어)) dx = (etb-eta) / (t(b|b영어-a|a영어))

이로부터 원점 적률 mk를 계산할 수 있다.

:m1 = (a|a영어+b|b영어)/2

:m2 = (a|a영어2+a|a영어b|b영어+b|b영어2)/3

:mk = (Σi=0k a|a영어i b|b영어k-i) / (k+1)

연속 균등 분포를 따르는 확률 변수의 경우, 기댓값은 m1 = (a|a영어+b|b영어)/2 이고 분산은 m2 - m12 = (b|b영어-a|a영어)2/12 이다.

a|a영어 = -b|b영어인 특수한 경우, 적률생성함수는 다음과 같이 단순한 형태로 축약된다.

:MX = (sinh b|b영어t) / (b|b영어t)

3. 2. 큐뮬런트생성함수 (Cumulant-generating function)

n ≥ 2일 때, 구간 -½, ½에서의 연속 균등 분포의 n번째 큐뮬런트는 \tfrac{B_n}{n}이며, 여기서 B_n는 n번째 베르누이 수이다.[7]

4. 성질

연속 균등 분포는 다양한 통계적 성질을 갖는다.

연속균등분포를 따르는 확률 변수가 특정 구간에 속할 확률은, 그 구간이 분포의 지지 집합 내에 포함되어 있다면, 구간의 위치와는 상관없이 구간의 크기에만 의존한다. 만약 X영어 ~ U(a,b)이고, [x, x+ℓ]가 고정된 ℓ > 0에 대해 [a,b]의 부분 구간이라면, 다음이 성립한다.

:P(X ∈ [x, x+ℓ]) = ℓ/b-a

이는 x와는 무관하며, 이러한 성질 때문에 이 분포는 '균등' 분포라는 이름을 가지게 되었다.

연속균등분포는 구간보다 더 일반적인 집합으로 일반화될 수 있다. 형식적으로, S를 양의 유한 르베그 측도 \lambda (S)를 갖는 보렐 집합이라고 하자. 즉, 0 < \lambda (S) < + \infty이다. S에서의 균등 분포는 확률 밀도 함수를 S 외부에서는 0으로, S에서는 \tfrac{1}{\lambda (S)}로 정의함으로써 지정할 수 있다.[8]

흥미로운 특수한 경우로, 집합 S가 '''단순체'''일 때가 있다. 동일한 지수 분포를 갖는 ''n''개의 독립적인 확률 변수를 사용하고, 이들을 X1,...,Xn으로 표기, Yi := Xi / (sumi Xi)로 두면, 벡터 Y1,...,Yn은 단순체에서 균등하게 분포된다.[8]

4. 1. 적률 (Moments)

연속균등분포의 적률생성함수는 다음과 같다.[6]

:M_X = \mathrm{E} ( \mathrm{e} ^{tX}) = \int_a^b \mathrm{e} ^{tx} \frac{dx}{b-a} = \frac{ \mathrm{e} ^{tb} - \mathrm{e} ^{ta} }{t(b-a)}

여기서 원점 적률 m_k :를 계산할 수 있다.

:m_1 = \frac{a+b}{2} ,

:m_2 = \frac{a^2+ab+b^2}{3} ,

:m_k = \frac{ \sum_{i=0}^k a^i b^{k-i} }{k+1} .

연속 균등 분포를 따르는 확률 변수의 경우, 기댓값m_1 = \tfrac{a+b}{2} 이고, 분산m_2 - m_1 ^2 = \tfrac{(b-a)^2}{12} 이다.

일반적으로, 이 분포의 n번째 원시 적률은 다음과 같다.

:E(X^n) = \int_a^b x^n \frac{dx}{b-a} = \frac{b^{n+1} - a^{n+1}}{(n+1)(b-a)} .

이 분포의 분산(두 번째 중심 모멘트)은 다음과 같다.

:V(X) = E \left( \big( X-E(X) \big) ^2 \right) = \int_a^b \left( x - \frac{a+b}{2} \right) ^2 \frac{dx}{b-a} = \frac{(b-a)^2}{12} .

4. 2. 순서 통계량 (Order statistics)

X_1, ..., X_nU(0,1)에서 추출한 독립적이고 동일한 분포의 표본이라고 하고, X_{(k)}를 이 표본의 k번째 순서 통계량이라고 하자.

X_{(k)}는 모수가 kn-k+1|n-k+1영어베타 분포를 따른다.

기댓값은 다음과 같다.

:\operatorname{E} \left(X_{(k)}\right) = {k \over n+1} .

이 사실은 Q-Q 플롯을 만들 때 유용하다.

분산은 다음과 같다.

:\operatorname{V} \left(X_{(k)}\right) = {k(n-k+1) \over (n+1)^2 (n+2)} .

4. 3. 균일성 (Uniformity)

연속 균등 분포를 따르는 확률 변수가 특정 구간에 속할 확률은, 그 구간이 분포의 지지 집합 내에 포함되어 있다면, 구간의 위치와는 상관없이 구간의 크기에만 의존한다.

만약 X영어 ~ U(a,b)이고, [x, x+ℓ]가 고정된 ℓ > 0에 대해 [a,b]의 부분 구간이라면, 다음과 같다.

:P(X ∈ [x, x+ℓ]) = ∫xx+ℓ dy/b-a = ℓ/b-a

이는 x와는 무관하다. 이러한 성질 때문에 이 분포는 '균등' 분포라는 이름을 가지게 되었다.

X1, …, Xn이 U(0, 1)에서 추출한 독립 동일 분포 (i.i.d.) 표본이라고 가정하자. X(k)를 이 표본에서의 k번째 순서 통계량이라고 할 때, X(k)의 확률 분포는 k와 n - k + 1을 모수로 하는 베타 분포이다.

기대값은 다음과 같다.

:E(X(k)) = k/n+1

이 사실은 Q-Q 플롯을 그릴 때 유용하다.

분산은 다음과 같다.

:Var(X(k)) = k(n-k+1)/(n+1)2 (n+2)

4. 4. 일반적인 집합으로의 확장

연속균등분포는 구간보다 더 일반적인 집합으로 일반화될 수 있다.

형식적으로, S를 양의 유한 르베그 측도 \lambda (S)를 갖는 보렐 집합이라고 하자. 즉, 0 < \lambda (S) < + \infty이다. S에서의 균등 분포는 확률 밀도 함수를 S 외부에서는 0으로, S에서는 \tfrac{1}{\lambda (S)}로 정의함으로써 지정할 수 있다.[8]

흥미로운 특수한 경우로, 집합 S가 '''단순체'''일 때가 있다. 다음과 같은 방법으로 표준 ''n''-정점 단순체에서 균등 분포를 얻을 수 있다.[8] 동일한 지수 분포를 갖는 ''n''개의 독립적인 확률 변수를 사용한다. 이들을 X1,...,Xn으로 표기하고, Yi := Xi / (sumi Xi)로 둔다. 그러면 벡터 Y1,...,Yn은 단순체에서 균등하게 분포된다.

5. 다른 분포와의 관계


  • ''X''가 표준 균등 분포를 따르는 경우, 역변환 표본 추출 방법을 사용하여 ''Y'' = − ''λ''−1 ln(''X'')는 (비율) 매개변수 ''λ''를 갖는 지수 분포를 갖는다.
  • ''X''가 표준 균등 분포를 따르는 경우, ''Y'' = ''X''''n''은 매개변수 (1/''n'',1)을 갖는 베타 분포를 갖는다.
  • 표준 균등 분포는 매개변수 (1,1)을 갖는 베타 분포의 특수한 경우이다.
  • 어윈-홀 분포는 ''n''개의 독립 동일 분포 ''U''(0,1) 분포의 합이고, 베이츠 분포는 그 평균이다.
  • 두 독립적인 균등 분포의 합은 사다리꼴 분포나 삼각 분포를 생성할 수 있다.
  • ''U''1(a,b)+''U''2(c,d)의 합은 [a+c,b+d]를 지지하는 평균에 대해 대칭적인 사다리꼴 분포를 생성한다. (고원은 ''U''1과 ''U''2 너비의 절대차와 같고, 기울어진 부분의 너비는 가장 좁은 균등 분포의 너비와 같다.)
  • 균등 분포가 동일한 너비 w를 갖는 경우, [a+c,a+c+2w]를 지지하는 평균에 대해 대칭적인 삼각 분포가 된다.
  • 두 독립적이고 동일하게 분포된 균등 분포 ''U''1(a,b)+''U''2(a,b)의 합은 [2a,2b]를 지지하는 대칭적인 삼각 분포를 생성한다.
  • 두 독립 동일 분포 균등 확률 변수 사이의 거리 |''U''1(a,b)-''U''2(a,b)|는 [0,b-a]를 지지하는 삼각 분포를 갖지만 대칭적이지 않다.

5. 1. 역변환 표본 추출 (Inverse transform sampling)

표준 균등 분포는 역변환 표본 추출에 사용될 수 있다. 어떤 분포의 누적 분포 함수(CDF)를 F라고 할 때, 표준 균등 분포 U(0,1)을 따르는 확률 변수 u에 대해, x = F-1(u)는 F를 누적 분포 함수로 갖는 확률 변수 x를 생성한다.[4]

예를 들어, 확률 변수 ''X''가 표준 균등 분포를 따를 때, ''Y'' = − ''λ''−1 ln(''X'')는 (비율) 매개변수 ''λ''를 갖는 지수 분포를 갖는다.[4]

5. 2. 베타 분포 (Beta distribution)

표준 균등 분포는 매개변수 (1,1)을 갖는 베타 분포의 특수한 경우이다.[4]

5. 3. 어윈-홀 분포 (Irwin-Hall distribution) & 베이츠 분포 (Bates distribution)

어윈-홀 분포는 ''n''개의 독립 동일 분포 ''U''(0,1) 분포의 합이다.[1] 베이츠 분포는 ''n''개의 독립 동일 분포 ''U''(0,1) 분포의 평균이다.[1]

5. 4. 삼각 분포 (Triangular distribution) & 사다리꼴 분포 (Trapezoidal distribution)

두 개의 독립적인 균등 분포 ''U''1(a,b) + ''U''2(c,d)의 합은 [a+c, b+d]를 지지하는 평균에 대해 대칭적인 사다리꼴 분포를 생성한다. 이때 고원은 ''U''1과 ''U''2 너비의 절대차와 같은 너비를 가지며, 기울어진 부분의 너비는 가장 좁은 균등 분포의 너비에 해당한다.

만약 두 균등 분포가 동일한 너비 w를 갖는 경우, 그 합은 [a+c, a+c+2w]를 지지하는 평균에 대해 대칭적인 삼각 분포가 된다.

두 개의 독립적이고 동일하게 분포된 균등 분포 ''U''1(a,b) + ''U''2(a,b)의 합은 [2a, 2b]를 지지하는 대칭적인 삼각 분포를 생성한다.

두 개의 독립 동일 분포 균등 확률 변수 |''U''1(a,b) - ''U''2(a,b)| 사이의 거리는 [0, b-a]를 지지하는 삼각 분포를 갖지만, 대칭적이지는 않다.

6. 통계적 추론

연속 균등 분포의 모수를 추정하는 방법은 다음과 같다.


  • 최대값 추정: 구간 $[0,N]$ 상의 균등 분포에서 미지수 $N$의 최소 분산 불편 추정량(UMVU) 추정은 $\hat{N} =\frac{k+1}{k} m=m+\frac{m}{k}$이다. 여기서 $m$은 표본의 최대값, $k$는 표본의 크기이다. 이는 이산 분포에서의 추정과 같은 이유로, 최대 간격 추정의 간단한 예시이다. 이 문제는 독일 전차 문제라고도 불리며, 제2차 세계 대전 중 독일 전차 생산 대수의 최대값을 추정하는 문제에서 유래했다.
  • 최소값 추정: 구간 $[a, b]$에서 미지의 $a$에 대한 최대우도추정량은 표본 최솟값인 $\hat a_{ML}=\min\{X_1,\dots,X_n\}$이다.
  • 중앙값 추정: 연속 균등 분포의 중앙값 $\tfrac{a+b}{2}$는 균등 분포의 평균이자 중앙값이다. 표본 평균과 표본 중앙값 모두 중앙값의 불편 추정량이지만, 표본 중간 범위(표본 최댓값과 표본 최솟값의 산술 평균)보다 효율적이지 않다. 중간 범위는 중앙값의 UMVU 추정량(이자 최대 우도 추정량)이다.[1]
  • 신뢰 구간: 구간 $U_{[0,L]}$에서 추출한 표본 $X_1 , X_2 , X_3 , ..., X_n$이 있을 때, $L$은 모집단의 최댓값이다. $X_{(n)} = \max ( X_1 , X_2 , X_3 , ..., X_n )$는 르베그-보렐 밀도 $f(t) = n \frac{ t^{n-1} }{ L^n } 1 \! \! 1 _{[0,L]} (t)$를 갖는다. 여기서 $1 \! \! 1 _{[0,L]}$은 $[0,L]$의 지시 함수이다.[10] 모집단 최댓값 $\theta$에 대한 신뢰 구간은 $\Pr \big( [ \hat{\theta}, \hat{\theta} (1 + \varepsilon) ] \ni \theta \big) \ge 1 - \alpha$ (단, $\varepsilon \ge (1 - \alpha) ^{-1/n} - 1$)로 표현할 수 있다.

6. 1. 최대값 추정 (Estimation of maximum)

구간 상의 균등 분포에 대해, 이 미지수인 경우, 최대값의 최소 분산 불편 추정량(UMVU) 추정은 다음과 같다.

:\hat{N} =\frac{k+1}{k} m=m+\frac{m}{k}

여기서 은 표본의 최대값, 는 표본의 크기(수)이며, 표본의 순서는 바꾸지 않는다(단, 연속 분포에서는 이 제한은 거의 의미가 없다). 이는 이산 분포에서의 추정과 같은 이유로, 최대 간격 추정의 매우 단순한 예로 볼 수 있다. 이러한 문제를 일반적으로 독일 전차 문제라고 부르며, 제2차 세계 대전 중 독일에서의 전차 생산 대수의 최대값을 추정하는 문제에서 유래한다.

6. 2. 최소값 추정 (Estimation of minimum)

구간 [a, b]에서 미지의 ''a''에 대한 연속균등분포가 주어졌을 때, ''a''의 최대우도추정량은 다음과 같다.

:\hat a_{ML}=\min\{X_1,\dots,X_n\}

이는 표본 최솟값이다.[9]

6. 3. 중앙값 추정 (Estimation of midpoint)

연속균등분포의 중앙값 \tfrac{a+b}{2}는 균등분포의 평균이자 중앙값이다. 표본 평균과 표본 중앙값 모두 중앙값의 불편 추정량이지만, 표본의 효율성 측면에서 표본 중간 범위, 즉 표본 최댓값과 표본 최솟값의 산술 평균보다 효율적이지 않다. 중간 범위는 중앙값의 UMVU 추정량(이자 최대 우도 추정량)이다.[1]

분포의 중점 \tfrac{a+b}{2}는 균등 분포의 기대값이며 중앙값이다. 표본 평균과 표본 중앙값은 모집단의 중점에 대한 불편 추정량이지만, 둘 다 표본의 범위 중앙 (표본의 최댓값과 최솟값의 평균)만큼 효율적이지 않다. 이는 중점의 UMVU 추정량이다 (또한 최대 우도 추정값이다).[1]

6. 4. 신뢰 구간 (Confidence interval)

X_1 , X_2 , X_3 , ..., X_n을 구간 U_{[0,L]}에서 추출한 표본이라고 할 때, L은 모집단의 최댓값이다. X_{(n)} = \max ( X_1 , X_2 , X_3 , ..., X_n )는 다음과 같은 르베그-보렐 밀도 f를 갖는다.[10]

:f(t) = n \frac{1}{L} \left( \frac{t}{L} \right) ^{n-1} \! = n \frac{ t^{n-1} }{ L^n } 1 \! \! 1 _{[0,L]} (t), 여기서 1 \! \! 1 _{[0,L]}[0,L]지시 함수이다.

모집단 최댓값 θ에 대한 신뢰 구간은 다음과 같이 표현할 수 있다.

:\Pr \big( [ \hat{\theta}, \hat{\theta} (1 + \varepsilon) ] \ni \theta \big) \ge 1 - \alpha는 모든 \theta에 대해 \varepsilon \ge (1 - \alpha) ^{-1/n} - 1을 만족하면 성립한다.

위 조건을 만족하는 가장 작은 \varepsilon를 선택한다. 이 구간의 길이는 확률 변수 \hat{\theta}에 의존한다.

7. 응용

연속균등분포는 함수 형태가 단순하여 확률 계산이 쉽다.[2] 이러한 특성으로 가설 검정, 무작위 표본 추출, 금융 등 다양한 분야에서 활용된다. 방사성 입자 방출과 같은 물리적 현상도 균등 분포를 따르는 경우가 많다.[1] 단, 균등 분포를 응용할 때는 특정 구간 내 확률이 일정하다는 가정이 전제되어야 한다.[2]

통계학에서 단순 귀무 가설을 검정할 때 검정 통계량의 분포가 연속적이면, 귀무 가설이 참일 때 검정 통계량(p값)은 0과 1 사이에서 균등 분포한다.

7. 1. 경제학 (Economics)

경제학 분야에서, 일반적으로 수요와 보충은 예상되는 정규 분포를 따르지 않을 수 있다. 결과적으로, 베르누이 과정과 같이 확률과 추세를 더 잘 예측하기 위해 다른 분포 모델이 사용된다.[11] 그러나 Wanke (2008)에 따르면, 완전히 새로운 제품을 분석하는 수명 주기 초기에 재고 관리의 리드 타임을 조사하는 특별한 경우에 균등 분포가 더 유용하다는 것이 입증되었다.[11] 이 상황에서는 새 제품에 대한 기존 데이터가 없거나 수요 이력이 없어 적절하거나 알려진 분포가 없기 때문에 다른 분포가 실행 가능하지 않을 수 있다.[11] 균등 분포는 새 제품의 리드 타임 (수요와 관련)의 확률 변수가 알려져 있지 않지만 결과가 두 값의 그럴듯한 범위 내에 있을 가능성이 높기 때문에 이 상황에 이상적이다.[11] 따라서 리드 타임은 확률 변수를 나타낸다. 균등 분포 모델에서 리드 타임과 관련된 다른 요인, 예를 들어 사이클 서비스 레벨 및 사이클당 부족량을 계산할 수 있었다. 또한 균등 분포는 계산의 단순성으로 인해 사용되었다고 언급되었다.[11]

7. 2. 양자화 오차 (Quantization error)

아날로그-디지털 변환 과정에서 양자화 오차가 발생한다. 이 오차는 반올림 또는 절단으로 인해 발생한다. 원래 신호가 1 최하위 비트(LSB)보다 훨씬 클 때, 양자화 오차는 신호와 크게 상관관계가 없으며, 대략 균등 분포를 갖는다. 따라서 RMS 오차는 이 분포의 분산에서 파생된다.[1]

7. 3. 난수 생성 (Random variate generation)

균등 분포는 임의의 분포에서 표본을 추출하는 데 유용하게 사용된다. 일반적인 방법으로는 대상 누적 분포 함수(CDF)를 사용하는 역변환 표본 추출 방법이 있다. 이 방법은 이론적인 연구에 매우 유용하다. 그러나 이 방법을 시뮬레이션에 사용하려면 대상 변수의 CDF를 반전시켜야 하는데, CDF가 닫힌 형태로 알려지지 않은 경우에는 대안적인 방법이 필요하다. 이러한 방법 중 하나가 기각 표본 추출이다.

정규 분포는 역변환 방법이 효율적이지 않은 대표적인 예이다. 하지만 박스-뮬러 변환이라는 정확한 방법을 통해 두 개의 독립적인 균등 확률 변수를 두 개의 독립적인 정규 분포를 따르는 확률 변수로 변환할 수 있다.

많은 프로그래밍 언어는 표준 균등 분포에 따라 효과적으로 분포되는 의사 난수를 생성하는 기능을 제공한다. 이러한 균등 분포 숫자는 비균등 난수 생성의 기반으로 자주 사용된다.

표준 균등 분포에서 샘플링된 값 u가 있다면, a+(b-a)u 값은 ab로 매개변수화된 균등 분포를 따른다.

통계학에서 단순한 귀무 가설의 검정 통계량으로 p값을 사용하는 경우, 검정 통계량의 분포가 연속적이라면 귀무 가설이 참일 때 검정 통계량(p값)은 0과 1 사이에서 균등 분포한다.

8. 역사 (History)

균등 분포 개념의 역사적 기원은 불확실하지만, "균등"이라는 용어는 주사위 게임에서 동등 확률 개념에서 유래된 것으로 추정된다(주사위 게임은 이산이며 연속 균등 표본 공간이 아니다). 동등 확률은 16세기 제롤라모 카르다노의 저서 ''도박의 책''에 언급되었으며, 주사위와 관련한 고급 확률 계산법에 대해 상세히 설명하고 있다.[12]

참조

[1] 서적 A modern introduction to probability and statistics : understanding why and how https://archive.org/[...] Springer
[2] 서적 Probability & Statistics for Engineers and Scientists Prentice Hall
[3] 논문 Maximum entropy autoregressive conditional heteroskedasticity model
[4] 웹사이트 Uniform Distribution (Continuous) https://www.mathwork[...] 2019-11-22
[5] 서적 Introductory Statistics https://archive.org/[...] OpenStax College
[6] 서적
[7] 웹사이트 Cumulants https://galton.uchic[...] University of Chicago 2001-01-11
[8] 서적 Non-Uniform Random Variate Generation https://link.springe[...]
[9] 문서 수학적 증명
[10] 논문 Constructing shortest-length confidence intervals https://www.research[...]
[11] 논문 The uniform distribution as a first practical approach to new product inventory management https://www.research[...] 2008
[12] 논문 Decoding Cardano's Liber de Ludo 2005-05



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com