맨위로가기

F 분포

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

F 분포는 두 개의 독립적인 카이제곱 분포의 비율로 정의되는 확률 분포이다. 확률 변수 X는 자유도가 d1과 d2인 F 분포를 따르며, 확률 밀도 함수와 누적 분포 함수를 가진다. F 분포는 베타 분포와 밀접한 관련이 있으며, 카이제곱 분포, 감마 분포, 베타 분포 등 다양한 분포와의 관계를 통해 정의될 수 있다. F 분포는 분산 분석 등 다양한 통계적 검정에 활용된다.

2. 정의

자유도가 각각 ''d''1과 ''d''2인 ''F''-분포는 다음과 같은 분포를 따른다.

: X = \frac{U_1/d_1}{U_2/d_2}

여기서 U_1U_2는 자유도가 각각 d_1d_2카이제곱 분포를 따르는 독립 확률 변수이다.

확률 밀도 함수 (pdf)는 다음과 같다.

:

\begin{align}

f(x; d_1,d_2) &= \frac{\sqrt{\frac{(d_1x)^{d_1}\,\,d_2^{d_2}} {(d_1x+d_2)^{d_1+d_2}}}} {x\operatorname{B}\left(\frac{d_1}{2},\frac{d_2}{2}\right)} \\[5pt]

&=\frac{1}{\operatorname{B}\left(\frac{d_1}{2},\frac{d_2}{2}\right)} \left(\frac{d_1}{d_2}\right)^{\frac{d_1}{2}} x^{\frac{d_1}{2} - 1} \left(1+\frac{d_1}{d_2} \, x \right)^{-\frac{d_1+d_2}{2}}

\end{align}



실수 ''x'' > 0에 대해 정의된다. 여기서 \mathrm{B}베타 함수이다. 많은 응용 분야에서, 매개변수 ''d''1과 ''d''2는 양의 정수이지만, 이 분포는 이러한 매개변수의 양의 실수 값에 대해서도 잘 정의된다.

누적 분포 함수는 다음과 같다.

:F(x; d_1,d_2)=I_{d_1 x/(d_1 x + d_2)}\left (\tfrac{d_1}{2}, \tfrac{d_2}{2} \right) ,

여기서 ''I''는 정규화된 불완전 베타 함수이다.

3. 성질

F(''d''1, ''d''2) 분포에 대한 기댓값, 분산 및 기타 세부 정보는 사이드 박스에 제공되어 있다. ''d''2 > 8인 경우, 초과 첨도는 다음과 같다.

:\gamma_2 = 12\frac{d_1(5d_2-22)(d_1+d_2-2)+(d_2-4)(d_2-2)^2}{d_1(d_2-6)(d_2-8)(d_1+d_2-2)}.

F(''d''1, ''d''2) 분포의 ''k''차 모멘트는 2''k'' < ''d''2일 때만 존재하고 유한하며, 다음과 같다.[6]

:\mu _X(k) =\left( \frac{d_2}{d_1}\right)^k \frac{\Gamma \left(\tfrac{d_1}{2}+k\right) }{\Gamma \left(\tfrac{d_1}{2}\right)} \frac{\Gamma \left(\tfrac{d_2}{2}-k\right) }{\Gamma \left( \tfrac{d_2}{2}\right) }.

''F''-분포는 베타 소수 분포의 특정 매개변수화이며, 이는 제2종 베타 분포라고도 한다.

특성 함수는 많은 표준 참고 문헌에서 잘못 나열되어 있다.[3] 올바른 식은 다음과 같다.[7]

:\varphi^F_{d_1, d_2}(s) = \frac{\Gamma\left(\frac{d_1+d_2}{2}\right)}{\Gamma\left(\tfrac{d_2}{2}\right)} U \! \left(\frac{d_1}{2},1-\frac{d_2}{2},-\frac{d_2}{d_1} \imath s \right)

여기서 ''U''(''a'', ''b'', ''z'')는 제2종 합류 초기하 함수이다.

4. 관련 분포

F 분포는 다음과 같은 다른 분포들과 관련이 있다.


  • X \sim \chi^2_{d_1}(카이제곱 분포)이고 Y \sim \chi^2_{d_2}독립이면, \frac{X / d_1}{Y / d_2} \sim \mathrm{F}(d_1, d_2)이다.
  • X_k \sim \Gamma(\alpha_k,\beta_k)\,(감마 분포)가 독립이면, \frac{\alpha_2\beta_1 X_1}{\alpha_1\beta_2 X_2} \sim \mathrm{F}(2\alpha_1, 2\alpha_2)이다.
  • X \sim \operatorname{Beta}(d_1/2,d_2/2)(베타 분포)이면, \frac{d_2 X}{d_1(1-X)} \sim \operatorname{F}(d_1,d_2)이다.
  • X \sim F(d_1, d_2)이면, \frac{d_1 X/d_2}{1+d_1 X/d_2} \sim \operatorname{Beta}(d_1/2,d_2/2)이다.
  • X \sim F(d_1, d_2)이면, \frac{d_1}{d_2}X는 베타 소수 분포를 가지며, \frac{d_1}{d_2}X \sim \operatorname{\beta^\prime}\left(\tfrac{d_1}{2},\tfrac{d_2}{2}\right)이다.
  • X \sim F(d_1, d_2)일 때, Y = \lim_{d_2 \to \infty} d_1 X카이제곱 분포 \chi^2_{d_1}를 가진다.
  • F(d_1, d_2)는 스케일링된 호텔링의 T 제곱 분포 \frac{d_2}{d_1(d_1+d_2-1)} \operatorname{T}^2 (d_1, d_1 +d_2-1) 와 동일하다.
  • X \sim F(d_1, d_2)이면, X^{-1} \sim F(d_2, d_1)이다.
  • X\sim t_{(n)}(스튜던트 t-분포)이면, X^{2} \sim \operatorname{F}(1, n) 이고 X^{-2} \sim \operatorname{F}(n, 1)이다.
  • ''F''-분포는 유형 6 피어슨 분포의 특수한 경우이다.
  • XY가 독립이고, X,Y\sim 라플라스(''μ'', ''b'')이면, \frac

    \sim \operatorname{F}(2,2) 이다.
  • X\sim F(n,m)이면, \tfrac{\log{X}}{2} \sim \operatorname{FisherZ}(n,m)(피셔의 z-분포)이다.
  • 비중심 ''F''-분포는 \lambda=0이면 ''F''-분포로 단순화된다.
  • 이중 비중심 ''F''-분포는 \lambda_1 = \lambda_2 = 0 이면 ''F''-분포로 단순화된다.
  • \operatorname{Q}_X(p)X\sim F(d_1,d_2)에 대한 분위수 ''p''이고 \operatorname{Q}_Y(1-p)Y\sim F(d_2,d_1)에 대한 분위수 1-p이면, \operatorname{Q}_X(p)=\frac{1}{\operatorname{Q}_Y(1-p)}이다.
  • ''F''-분포는 비율 분포의 예시이다.
  • W-분포[9]는 F-분포의 고유한 매개변수화이다.
  • 4. 1. 카이제곱 분포와의 관계

    F 분포는 분산 분석에서 사용될 수 있는데, 예를 들어 U_1U_2(위에서 정의됨)의 독립성은 코크란의 정리를 적용하여 입증할 수 있다.

    카이제곱 분포독립적인 표준 정규 분포 확률 변수의 제곱 합이므로, F 분포의 확률 변수는 다음과 같이 쓸 수 있다.

    :X = \frac{s_1^2}{\sigma_1^2} \div \frac{s_2^2}{\sigma_2^2},

    여기서 s_1^2 = \frac{S_1^2}{d_1}s_2^2 = \frac{S_2^2}{d_2}이고, S_1^2은 정규 분포 N(0,\sigma_1^2)에서 d_1개의 확률 변수의 제곱 합이며, S_2^2는 정규 분포 N(0,\sigma_2^2)에서 d_2개의 확률 변수의 제곱 합이다.

    빈도주의 맥락에서, 스케일링된 F 분포는 확률 p(s_1^2/s_2^2 \mid \sigma_1^2, \sigma_2^2)을 제공하며, F 분포 자체는 \sigma_1^2\sigma_2^2와 같다고 가정되는 경우에 적용된다. 이것이 F 분포가 F-검정에서 가장 일반적으로 나타나는 맥락이다. 즉, 귀무 가설이 두 개의 독립적인 정규 분산이 같다는 것이고, 적절하게 선택된 제곱의 관측된 합의 비율이 이 귀무 가설과 유의하게 일치하지 않는지 검사하는 것이다.

    X는 베이즈 통계에서, 비정보적이고 스케일링 불변인 제프리스 사전 확률이 \sigma_1^2\sigma_2^2사전 확률에 대해 취해지는 경우 동일한 분포를 갖는다.[8] 이 맥락에서, 스케일링된 F 분포는 관측된 합 s^2_1s^2_2가 알려진 것으로 간주되는 경우 사후 확률 p(\sigma^2_2 /\sigma_1^2 \mid s^2_1, s^2_2)을 제공한다.

    4. 2. 일반적인 관계


    • X \sim \chi^2_{d_1}이고 Y \sim \chi^2_{d_2} (카이 제곱 분포)가 독립이면, \frac{X / d_1}{Y / d_2} \sim \mathrm{F}(d_1, d_2)이다.
    • X_k \sim \Gamma(\alpha_k,\beta_k)\, (감마 분포)가 독립이면, \frac{\alpha_2\beta_1 X_1}{\alpha_1\beta_2 X_2} \sim \mathrm{F}(2\alpha_1, 2\alpha_2)이다.
    • X \sim \operatorname{Beta}(d_1/2,d_2/2) (베타 분포)이면, \frac{d_2 X}{d_1(1-X)} \sim \operatorname{F}(d_1,d_2)이다.
    • 만약 X \sim F(d_1, d_2)이면, \frac{d_1 X/d_2}{1+d_1 X/d_2} \sim \operatorname{Beta}(d_1/2,d_2/2)이다.
    • X \sim F(d_1, d_2)이면, \frac{d_1}{d_2}X는 베타 소수 분포를 가지며, \frac{d_1}{d_2}X \sim \operatorname{\beta^\prime}\left(\tfrac{d_1}{2},\tfrac{d_2}{2}\right)이다.
    • X \sim F(d_1, d_2)이면, Y = \lim_{d_2 \to \infty} d_1 X는 카이 제곱 분포 \chi^2_{d_1}를 가진다.
    • F(d_1, d_2)는 스케일링된 호텔링의 T 제곱 분포 \frac{d_2}{d_1(d_1+d_2-1)} \operatorname{T}^2 (d_1, d_1 +d_2-1) 와 동일하다.
    • X \sim F(d_1, d_2)이면, X^{-1} \sim F(d_2, d_1)이다.
    • X\sim t_{(n)} (스튜던트 t-분포)이면, X^{2} \sim \operatorname{F}(1, n) 이고 X^{-2} \sim \operatorname{F}(n, 1)이다.
    • ''F''-분포는 유형 6 피어슨 분포의 특수한 경우이다.
    • XY가 독립이고, X,Y\sim 라플라스(''μ'', ''b'')이면, \frac

    \sim \operatorname{F}(2,2) 이다.
  • X\sim F(n,m)이면, \tfrac{\log{X}}{2} \sim \operatorname{FisherZ}(n,m) (피셔의 z-분포)이다.
  • 비중심 ''F''-분포는 \lambda=0이면 ''F''-분포로 단순화된다.
  • 이중 비중심 ''F''-분포는 \lambda_1 = \lambda_2 = 0 이면 ''F''-분포로 단순화된다.
  • \operatorname{Q}_X(p)X\sim F(d_1,d_2)에 대한 분위수 ''p''이고 \operatorname{Q}_Y(1-p)Y\sim F(d_2,d_1)에 대한 분위수 1-p이면, \operatorname{Q}_X(p)=\frac{1}{\operatorname{Q}_Y(1-p)}이다.
  • ''F''-분포는 비율 분포의 예시이다.
  • W-분포[9]는 F-분포의 고유한 매개변수화이다.
  • 참조

    [1] 논문 On the entropy of continuous probability distributions IEEE
    [2] 서적 Continuous Univariate Distributions, Volume 2 (Second Edition, Section 27) Wiley
    [3] 간행물 Abramowitz Stegun ref
    [4] 웹사이트 Engineering Statistics Handbook – F Distribution http://www.itl.nist.[...] NIST 2006
    [5] 서적 Introduction to the Theory of Statistics McGraw-Hill
    [6] 웹사이트 The F distribution http://www.statlect.[...]
    [7] 뉴스 The true characteristic function of the F distribution
    [8] 서적 Bayesian Inference in Statistical Analysis Addison-Wesley
    [9] 논문 Probabilistic Approach to Multi-Stage Supplier Evaluation: Confidence Level Measurement in Ordinal Priority Approach 2022-10
    [10] 논문 The Modified-Half-Normal distribution: Properties and an efficient sampling scheme https://figshare.com[...] 2021-06-22



    본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
    모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
    하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
    따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

    문의하기 : help@durumis.com