맨위로가기

파레토 분포

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

파레토 분포는 확률변수 X가 특정 조건을 만족하는 확률분포로, 두 개의 매개변수, 즉 X의 최솟값 xm과 파레토 지표 α를 갖는다. α가 클수록 불평등 정도가 커지며, 누적 분포 함수, 확률 밀도 함수, 모멘트 및 특성 함수 등의 속성을 갖는다. 파레토 분포는 사회의 부의 분포, 소득 분포 등을 설명하는 데 사용되며, 80 대 20 법칙, 로렌츠 곡선, 지니 계수 등과 관련이 있다. 또한, 지수 분포, 로그 정규 분포, 일반화 파레토 분포 등과 밀접한 관계를 가지며, 다양한 분야에서 응용된다. 통계적 추론을 통해 파레토 분포의 모수를 추정할 수 있으며, 역변환 표본 추출법을 사용하여 난수를 생성할 수 있다.

더 읽어볼만한 페이지

  • 멱법칙 - 슈테판-볼츠만 법칙
    슈테판-볼츠만 법칙은 흑체 복사 에너지와 절대 온도의 관계를 나타내는 물리 법칙으로, 흑체가 방출하는 에너지는 절대 온도의 네제곱에 비례하며, 이 비례 상수를 슈테판-볼츠만 상수라고 한다.
  • 멱법칙 - 감마 보정
    감마 보정은 영상 시스템에서 빛의 강도를 비선형적으로 인코딩 및 디코딩하여 인간 시각의 비선형적 밝기 반응을 보완하고, 디스플레이 장치의 출력 특성을 조정하여 시각적으로 정확한 이미지를 얻는 데 사용되는 기술이다.
  • 연속분포 - 로그 정규 분포
    로그 정규 분포는 확률 변수 X의 로그가 정규 분포를 따르며, 양의 실수 값을 갖고 평균 μ와 표준 편차 σ를 매개변수로 갖는 확률 분포이다.
  • 연속분포 - 연속균등분포
    특정 구간 내 모든 값이 동일한 확률을 갖는 연속 균등 분포는 통계학, 금융, 물리 등에서 활용되며 난수 생성과 표본 추출에 유용하다.
  • 확률분포 - 베르누이 분포
    베르누이 분포는 성공 확률 p를 가지며, 단 한 번의 시행에서 성공 또는 실패 두 가지 결과를 나타내는 이산 확률 분포로, 기댓값은 p, 분산은 p(1-p)이며 다른 여러 확률 분포와 관련되어 불확실성과 정보량을 측정할 수 있다.
  • 확률분포 - 로그 정규 분포
    로그 정규 분포는 확률 변수 X의 로그가 정규 분포를 따르며, 양의 실수 값을 갖고 평균 μ와 표준 편차 σ를 매개변수로 갖는 확률 분포이다.
파레토 분포
분포
종류밀도
다양한 α에 대한 파레토 1형 확률 밀도 함수
파레토 1형 확률 밀도 함수 (다양한 α 값, xm = 1). α가 ∞에 가까워질수록 분포는 δ(x - xm)에 접근 (δ는 디랙 델타 함수)
다양한 α에 대한 파레토 1형 누적 분포 함수
파레토 1형 누적 분포 함수 (다양한 α 값, xm = 1)
모수xm > 0 (척도, 실수)
지지 구간x ∈ [xm, ∞)
확률 밀도 함수 (PDF)α * xm^α / x^(α+1) (x >= xm)
누적 분포 함수 (CDF)1 - (xm / x)^α (x >= xm)
평균존재하지 않음 (α <= 1)
중앙값xm * 2^(1/α)
분산존재하지 않음 (α <= 2)
왜도(2 * (1 + α)) / (α - 3) * sqrt((α - 2) / α) (α > 3)
첨도6 * (α^3 + α^2 - 6 * α - 2) / (α * (α - 3) * (α - 4)) (α > 4)
엔트로피ln(xm / α) + 1 / α + 1
특징 함수α * (-I * xm * t)^α * Gamma(-α, -I * xm * t)

2. 정의

확률변수 X가 다음 성질을 만족시킬 때, X는 파레토 분포를 따른다고 정의한다.

:\Pr(X>x) = \begin{cases}\left(\frac{x_\mathrm{m}}{x}\right)^\alpha & x\ge x_\mathrm{m}, \\

1 & x < x_\mathrm{m}\end{cases}



파레토 분포는 두 개의 매개변수 x_\text{m},\alpha를 가진다. 여기서 x_m>0X의 최솟값이며, \alpha>0파레토 지표라고 불리는 매개변수이다. \alpha 값이 클수록 분포는 더 큰 불평등을 나타낸다. 즉, \alpha가 0에 가까울수록 균등분포에 가깝고, \alpha가 클수록 디랙 델타 함수에 가까워진다.[7]

확률 변수 ''X''가 파레토 (제1종) 분포를 따른다면, ''X''가 어떤 수 ''x''보다 클 확률, 즉 생존 함수(꼬리 함수라고도 함)는 다음과 같이 주어진다.

:\overline{F}(x) = \Pr(X>x) = \begin{cases}

\left(\frac{x_\mathrm{m}}{x}\right)^\alpha & x\ge x_\mathrm{m}, \\

1 & x < x_\mathrm{m},

\end{cases}



여기서 ''x''m은 ''X''의 (필수적으로 양수인) 최소 가능 값이고, ''α''는 양의 매개변수이다. 제1종 파레토 분포는 척도 매개변수 ''x''m과 꼬리 지수라고 알려진 모양 매개변수 ''α''로 특징지어진다. 부의 분포를 모델링할 때, 매개변수 ''α''는 파레토 지수라고 불린다.

''a'', ''b'' (''a'' > 0, ''b'' > 0)를 파라미터로, 실수 ''x'' (''x'' ≥ ''b'')를 확률 변수로 하는 파레토 분포의 확률 밀도 함수는 다음과 같다.

:\frac{a/b}{(x/b)^{a+1}}

이때, 기대값은 \frac{ab}{a-1} \mbox{ for } a>1, 분산은 \frac{ab^2}{(a-1)^2 (a-2)}\mbox{ for } a>2 이다.

일반화 파레토 분포(GPD)는 확률 변수 X가 특정 임계값을 초과할 확률 P(X>a)를 추정하는 데 사용된다. 예를 들어 풍속, 홍수, 진도 등이 일정 값 이상이 될 확률 모델링 등에 적용된다. 이 분포는 위치 모수 \mu, 척도 모수 \sigma, 모양 모수 \xi의 세 가지 매개변수를 가지며, \xi를 파레토 지수라고 한다.

누적 분포 함수는 다음과 같다.

(단, 모양 매개변수를 \kappa = -\xi로 하는 책도 있다.)

:F_{(\xi ,\mu ,\sigma )} (x)=1-\left( 1+\frac{\xi (x-\mu )}{\sigma} \right)^{-1/\xi}

지지 집합은 지수부 1+\frac{\xi (x-\mu )}{\sigma} \geq 0으로 제한된다.

확률 밀도 함수는 다음과 같다.

:f_{(\xi,\mu,\sigma)} (x)=\frac{1}{\sigma} \left( 1+\frac{\xi (x-\mu)}{\sigma} \right)^{(-1/\xi -1)}

3. 누적 분포 함수

파라미터 ''α''와 ''x''m을 갖는 파레토 확률 변수의 누적 분포 함수는 다음과 같다.

:F_X(x) = \begin{cases}

1-\left(\frac{x_\mathrm{m}}{x}\right)^\alpha & x \ge x_\mathrm{m}, \\

0 & x < x_\mathrm{m}.

\end{cases}

일반화 파레토 분포(generalized Pareto distributions, GPD)는 확률 변수가 특정 임계값을 초과할 확률을 추정하는 데 사용되는 모델이다. 예를 들어, 풍속, 홍수, 진도 등이 일정 값 이상이 될 확률 모델링 등에 적용된다. 이 분포는 위치 모수, 척도 모수, 모양 모수의 세 가지 매개변수를 가지며, 를 파레토 지수라고 한다.

누적 분포 함수는 다음 식으로 나타낸다.

(단, 모양 매개변수를 로 하는 책도 있다.)

:F_{(\xi ,\mu ,\sigma )} (x)=1-\left( 1+\frac{\xi (x-\mu )}{\sigma} \right)^{-1/\xi}

지지 집합은 지수부 1+\frac{\xi (x-\mu )}{\sigma} \geq 0으로 제한된다.

4. 확률 밀도 함수

미분에 의해, 확률 밀도 함수는 다음과 같다.

:f_X(x)= \begin{cases} \frac{\alpha x_\mathrm{m}^\alpha}{x^{\alpha+1}} & x \ge x_\mathrm{m}, \\ 0 & x < x_\mathrm{m}. \end{cases}

선형 축에 플롯하면 이 분포는 친숙한 J자 모양의 곡선을 띠며, 이는 각 직교 축에 점근적으로 접근한다. 곡선의 모든 세그먼트는 자체 유사성을 띈다(적절한 스케일링 요소를 적용). 로그-로그 플롯에 플롯하면 분포는 직선으로 표현된다.

파라미터로 ''a'', ''b'' (''a'' > 0, ''b'' > 0)를 가지고, 실수 ''x'' (''x'' ≥ ''b'')를 확률 변수로 하는 파레토 분포의 확률 밀도 함수는 다음 식으로 정의된다.

:\frac{a/b}{(x/b)^{a+1}}

이때, 기대값은 \frac{ab}{a-1} \mbox{ for } a>1, 분산은 \frac{ab^2}{(a-1)^2 (a-2)}\mbox{ for } a>2 이다.

5. 속성

'''파레토 분포'''는 확률변수 X가 다음 성질을 만족시키는 확률분포이다.

:\Pr(X>x) = \begin{cases}\left(\frac{x_\mathrm{m}}{x}\right)^\alpha & x\ge x_\mathrm{m}, \\

1 & x < x_\mathrm{m}\end{cases}



즉, 파레토 분포는 두 개의 매개변수 x_m>0 (X의 최솟값)와 \alpha>0 ('''파레토 지표''')를 가진다. \alpha가 클수록 불평등이 심하며, 0에 가까울수록 균등분포에, 반대로 클수록 디랙 델타 함수에 가까워진다.

일반화 파레토 분포(GPD)는 확률 변수 X가 특정 임계값을 초과할 확률을 추정하는 데 사용되며, 풍속, 홍수, 진도 등이 일정 값 이상이 될 확률 모델링 등에 적용된다. 이 분포는 위치 모수, 척도 모수, 모양 모수(파레토 지수)의 세 가지 매개변수를 가진다.

누적 분포 함수는 다음 식으로 나타낸다.

:F_{(\xi ,\mu ,\sigma )} (x)=1-\left( 1+\frac{\xi (x-\mu )}{\sigma} \right)^{-1/\xi}

확률 밀도 함수는 다음과 같다.

:f_{(\xi,\mu,\sigma)} (x)=\frac{1}{\sigma} \left( 1+\frac{\xi (x-\mu)}{\sigma} \right)^{(-1/\xi -1)}

선형 축에 플롯하면 J자 모양의 곡선을 띠며, 모든 세그먼트는 자체 유사성을 띈다. 로그-로그 그래프에서는 음의 기울기를 갖는 직선으로 표현된다.

5. 1. 모멘트 및 특성 함수

파레토 분포를 따르는 확률 변수기댓값은 다음과 같다.

:\operatorname{E}(X)= \begin{cases} \infty & \alpha\le 1, \\

\frac{\alpha x_{\mathrm{m}}}{\alpha-1} & \alpha>1.

\end{cases}

파레토 분포를 따르는 확률 변수분산은 다음과 같다.

:\operatorname{Var}(X)= \begin{cases}

\infty & \alpha\in(1,2], \\

\left(\frac{x_\mathrm{m}}{\alpha-1}\right)^2 \frac{\alpha}{\alpha-2} & \alpha>2.

\end{cases}

만약 \alpha \le 2이면, 분산은 존재하지 않는다.

원점 모멘트는 다음과 같다.

:\mu_n'= \begin{cases} \infty & \alpha\le n, \\ \frac{\alpha x_\mathrm{m}^n}{\alpha-n} & \alpha>n. \end{cases}

적률생성함수는 음수가 아닌 값 t \le 0에 대해서만 정의된다.

:M\left(t;\alpha,x_\mathrm{m}\right) = \operatorname{E} \left [e^{tX} \right ] = \alpha(-x_\mathrm{m} t)^\alpha\Gamma(-\alpha,-x_\mathrm{m} t)

:M\left(0,\alpha,x_\mathrm{m}\right)=1.

따라서 기댓값이 t=0을 포함하는 열린구간에서 수렴하지 않으므로, 적률생성함수는 존재하지 않는다고 말한다.

특성 함수는 다음과 같다.

:\varphi(t;\alpha,x_\mathrm{m})=\alpha(-ix_\mathrm{m} t)^\alpha\Gamma(-\alpha,-ix_\mathrm{m} t),

여기서 Γ(''a'', ''x'')는 불완전 감마 함수이다.

매개변수는 적률법을 사용하여 구할 수 있다.

파라미터로 ''a'', ''b'' (''a'' > 0, ''b'' > 0)를 가지고, 실수 ''x'' (''x'' ≥ ''b'')를 확률 변수로 하는 파레토 분포의 확률 밀도 함수는 다음 식으로 정의된다.

:\frac{a/b}{(x/b)^{a+1}}

이때, 기대값은 \frac{ab}{a-1} \mbox{ for } a>1, 분산은 \frac{ab^2}{(a-1)^2 (a-2)}\mbox{ for } a>2 이다.

5. 2. 조건부 분포

파레토 분포를 따르는 임의 변수의 조건부 확률 분포는, 특정 숫자 x_\text{m}을 초과하고 x_1보다 크거나 같다는 조건에서, 파레토 지수 \alpha는 같지만 최소값 x_\text{m} 대신 x_1을 갖는 파레토 분포이다.

:

\text{Pr}(X \geq x | X \geq x_1) =

\begin{cases}

\left(\frac{x_1}{x}\right)^\alpha & x \geq x_1, \\

1 & x < x_1.

\end{cases}



이는 조건부 기대값(유한한 경우, 즉 \alpha>1일 경우)이 x_1에 비례한다는 것을 의미한다.

:\text{E}(X | X \geq x_1) \propto x_1.

객체의 수명을 설명하는 임의 변수의 경우, 이는 기대 수명이 나이에 비례한다는 것을 의미하며, 이를 린디 효과 또는 린디의 법칙이라고 한다.[9]

5. 3. 특징 정리

만약 X_1, X_2, X_3, \dotsc가 어떤 x_\text{m}>0에 대해 구간 [x_\text{m},\infty)에서 지원되는 독립적이고 동일하게 분포된 확률 변수라고 가정하자. 모든 n에 대해 두 확률 변수 \min\{X_1,\dotsc,X_n\}(X_1+\dotsb+X_n)/\min\{X_1,\dotsc,X_n\}가 서로 독립이라고 가정하면, 공통 분포는 파레토 분포이다.

5. 4. 기하 평균

파레토 분포의 기하 평균(''G'')은 다음과 같다.[10]

: G = x_\text{m} \exp \left( \frac{1}{\alpha} \right).

5. 5. 조화 평균

조화 평균(''H'')은 다음과 같다.[10]

:H = x_\text{m} \left( 1 + \frac{ 1 }{ \alpha } \right).

5. 6. 그래프 표현



선형 축에 플롯하면 이 분포는 각 직교 축에 점근적으로 접근하는 친숙한 J자 모양의 곡선을 띤다. 곡선의 모든 세그먼트는 (적절한 스케일링 요소를 적용하면) 자체 유사성을 띈다. 로그-로그 플롯에 플롯하면 분포는 직선으로 표현된다.

선형 척도로 그렸을 때는 파레토 분포의 특징적인 '긴 꼬리' 분포가 나타나지만, 로그-로그 그래프로 그리면 함수의 기본적인 단순성이 드러나며 음의 기울기를 갖는 직선 형태를 띤다. 확률 밀도 함수 공식에 따르면 ''x'' ≥ ''x''m에 대해 다음과 같다.

:\log f_X(x)= \log \left(\alpha\frac{x_\mathrm{m}^\alpha}{x^{\alpha+1}}\right) = \log (\alpha x_\mathrm{m}^\alpha) - (\alpha+1) \log x.

''α''는 양수이므로, 기울기 −(''α'' + 1)는 음수이다.

6. 관련 분포

파레토 분포는 다음과 같은 여러 분포들과 관련이 있다.


  • '''지수 분포와의 관계''': ''X''가 최솟값 ''x''m과 지수 ''α''를 갖는 파레토 분포를 따르면, Y = \log\left(\frac{X}{x_\mathrm{m}}\right) 는 율(rate) 모수 ''α''를 갖는 지수 분포를 따른다. 반대로, ''Y''가 율 ''α''를 갖는 지수 분포를 따르면, x_\mathrm{m} e^Y는 최솟값 ''x''m과 지수 ''α''를 갖는 파레토 분포를 따른다.
  • '''로그 정규 분포와의 관계''': 파레토 분포와 로그 정규 분포는 둘 다 지수 분포정규 분포에 따라 분포된 무작위 변수의 지수 분포라는 점에서 관련이 있다.
  • '''일반화 파레토 분포와의 관계''': 파레토 분포는 일반화 파레토 분포의 특수한 경우이며, 로맥스 분포는 일반화 파레토 분포의 특수한 경우이다. 척도 x_m 및 형태 \alpha를 갖는 파레토 분포는 위치 \mu=x_m, 척도 \sigma=x_m/\alpha, 형태 \xi=1/\alpha를 갖는 일반화 파레토 분포와 동일하다.
  • '''역 파레토 분포 / 멱 분포''': 확률 변수 Y가 파레토 분포를 따르면, 그 역수 X=1/Y는 역 파레토 분포를 따르며, 이는 멱 분포와 동일하다.[16]
  • '''제한된 파레토 분포''': 세 개의 매개변수 ''α'', ''L'', ''H''를 가지며, ''α''는 모양, ''L''은 최솟값, ''H''는 최댓값을 나타낸다.
  • '''대칭 파레토 분포''': 날카로운 확률 피크와 대칭적인 긴 확률 꼬리를 갖는 분포로, 파레토 분포에서 파생되었다.
  • '''다변량 파레토 분포''': 단변량 파레토 분포를 확장한 분포이다.[20]

6. 1. 일반화 파레토 분포

일반화 파레토 분포(Generalized Pareto Distribution, GPD)는 특정 임계값을 초과하는 확률 변수의 확률을 추정하는 데 사용되는 모델이다. 예를 들어 풍속, 홍수, 진도 등이 일정 값 이상이 될 확률을 모델링하는 데 적용된다. 이 분포는 위치 모수, 척도 모수, 모양 모수의 세 가지 매개변수를 가지며, 를 파레토 지수라고 한다.

누적 분포 함수는 다음 식으로 나타낸다.

:F_{(\xi ,\mu ,\sigma )} (x)=1-\left( 1+\frac{\xi (x-\mu )}{\sigma} \right)^{-1/\xi}

(단, 모양 매개변수를 로 하는 책도 있다.)

지지 집합은 지수부 1+\frac{\xi (x-\mu )}{\sigma} \geq 0으로 제한된다.

확률 밀도 함수는 다음과 같다.

:f_{(\xi,\mu,\sigma)} (x)=\frac{1}{\sigma} \left( 1+\frac{\xi (x-\mu)}{\sigma} \right)^{(-1/\xi -1)}

일반화 파레토 분포(GPD)는 일반화 극치 분포(GEV)와 마찬가지로 3가지 유형으로 분류된다.
:\begin{align}

F_{(\xi ,\mu ,\sigma )}(x) &=1-\exp \left( -\frac{(x-\mu )}{\sigma} \right) \\

f_{(\xi ,\mu ,\sigma )}(x) &=\frac{1}{\sigma} \exp \left( -\frac{(x-\mu )}{\sigma} \right)

\end{align}

  • 일 때, 제2종 파레토 분포

6. 1. 1. 파레토 I–IV형

파레토 분포에는 파레토 I형, II형, III형, IV형 및 펠러-파레토 분포[7][11][12]로 알려진 계층 구조가 존재한다. 파레토 IV형은 파레토 I형~III형을 특수한 경우로 포함하며, 펠러-파레토 분포[11][13]는 파레토 IV형을 일반화한다.

''μ'' = 0일 때, 파레토 분포 II형은 로맥스 분포로도 알려져 있다.[14]

아래 표에서는 ''x''의 최솟값을 나타내기 위해 이전에 사용된 기호 ''x''m 대신  ''σ''를 사용한다.

파레토 분포
\overline{F}(x)=1-F(x)지원 범위매개변수
I형\left[\frac x \sigma \right]^{-\alpha}x \ge \sigma\sigma > 0, \alpha
II형\left[1 + \frac{x-\mu} \sigma \right]^{-\alpha}x \ge \mu\mu \in \mathbb R, \sigma > 0, \alpha
로맥스\left[1 + \frac x \sigma \right]^{-\alpha}x \ge 0\sigma > 0, \alpha
III형\left[1 + \left(\frac{x-\mu} \sigma \right)^{1/\gamma}\right]^{-1} x \ge \mu \mu \in \mathbb R, \sigma, \gamma > 0
IV형\left[1 + \left(\frac{x-\mu} \sigma \right)^{1/\gamma}\right]^{-\alpha}x \ge \mu\mu \in \mathbb R, \sigma, \gamma > 0, \alpha



형상 매개변수 ''α''는 꼬리 지수이고, ''μ''는 위치, ''σ''는 척도, ''γ''는 부등식 매개변수이다. 파레토 IV형의 몇 가지 특수한 경우는 다음과 같다.


  • P(IV)(\sigma, \sigma, 1, \alpha) = P(I)(\sigma, \alpha)
  • P(IV)(\mu, \sigma, 1, \alpha) = P(II)(\mu, \sigma, \alpha)
  • P(IV)(\mu, \sigma, \gamma, 1) = P(III)(\mu, \sigma, \gamma)


평균의 유한성과 분산의 존재 및 유한성은 꼬리 지수 ''α'' (부등식 지수 ''γ'')에 따라 달라진다. 특히, 분수 ''δ''-모멘트는 아래 표와 같이, 어떤 ''δ'' > 0에 대해 유한하며, 여기서 ''δ''는 반드시 정수는 아니다.

파레토 I–IV 분포의 모멘트 (경우 ''μ'' = 0)
\operatorname{E}[X]조건\operatorname{E}[X^\delta]조건
I형\frac{\sigma \alpha}{\alpha-1}\alpha > 1\frac{\sigma^\delta \alpha}{\alpha-\delta} \delta < \alpha
II형 \frac{ \sigma }{\alpha-1}+\mu\alpha > 1 \frac{ \sigma^\delta \Gamma(\alpha-\delta)\Gamma(1+\delta)}{\Gamma(\alpha)}0 < \delta < \alpha
III형\sigma\Gamma(1-\gamma)\Gamma(1 + \gamma) -1<\gamma<1\sigma^\delta\Gamma(1-\gamma \delta)\Gamma(1+\gamma \delta)-\gamma^{-1}<\delta<\gamma^{-1}
IV형\frac{\sigma\Gamma(\alpha-\gamma)\Gamma(1+\gamma)}{\Gamma(\alpha)} -1<\gamma<\alpha\frac{\sigma^\delta\Gamma(\alpha-\gamma \delta)\Gamma(1+\gamma \delta)}{\Gamma(\alpha)}-\gamma^{-1}<\delta<\alpha/\gamma


6. 1. 2. 펠러-파레토 분포

파레토 분포에는 파레토 I형, II형, III형, IV형, 펠러-파레토 분포[7][11][12]로 알려진 계층 구조가 존재한다. 파레토 IV형은 파레토 I형~III형을 특수한 경우로 포함한다. 펠러-파레토 분포[11][13]는 파레토 IV형을 일반화한다.

펠러[11][13]는 확률 밀도 함수가 다음과 같은 베타 분포베타 확률 변수 ''Y''의 변환 ''U'' = ''Y''−1 − 1를 통해 파레토 변수를 정의한다.

: f(y) = \frac{y^{\gamma_1-1} (1-y)^{\gamma_2-1}}{B(\gamma_1, \gamma_2)}, \qquad 00,

여기서 ''B''( )는 베타 함수이다. 만약

: W = \mu + \sigma(Y^{-1}-1)^\gamma, \qquad \sigma>0, \gamma>0,

이면 ''W''는 펠러–파레토 분포 FP(''μ'', ''σ'', ''γ'', ''γ''1, ''γ''2)를 따른다.[7]

만약 U_1 \sim \Gamma(\delta_1, 1)U_2 \sim \Gamma(\delta_2, 1)이 독립적인 감마 분포 감마 변수이면, 펠러–파레토 (FP) 변수의 또 다른 구성은 다음과 같다.[15]

:W = \mu + \sigma \left(\frac{U_1}{U_2}\right)^\gamma

그리고 우리는 ''W'' ~ FP(''μ'', ''σ'', ''γ'', ''δ''1, ''δ''2)로 표기한다. 펠러–파레토 분포의 특수한 경우는 다음과 같다.

:FP(\sigma, \sigma, 1, 1, \alpha) = P(I)(\sigma, \alpha)

:FP(\mu, \sigma, 1, 1, \alpha) = P(II)(\mu, \sigma, \alpha)

:FP(\mu, \sigma, \gamma, 1, 1) = P(III)(\mu, \sigma, \gamma)

:FP(\mu, \sigma, \gamma, 1, \alpha) = P(IV)(\mu, \sigma, \gamma, \alpha).

6. 2. 역 파레토 분포 / 멱 분포

확률 변수 Y가 파레토 분포를 따르면, 그 역수 X=1/Y는 역 파레토 분포를 따른다.

역 파레토 분포는 멱 분포와 동일하다.[16]

:Y\sim \mathrm{Pa}(\alpha, x_m) = \frac{\alpha x_m^\alpha}{y^{\alpha+1}} \quad (y \ge x_m) \quad \Leftrightarrow \quad X\sim \mathrm{iPa}(\alpha, x_m) = \mathrm{Power}(x_m^{-1}, \alpha) = \frac{\alpha x^{\alpha-1}}{(x_m^{-1})^\alpha} \quad (0< x \le x_m^{-1})

6. 3. 지수 분포와의 관계

''X''가 최솟값 ''x''m과 지수 ''α''를 갖는 파레토 분포를 따른다면,

: Y = \log\left(\frac{X}{x_\mathrm{m}}\right)

는 율(rate) 모수 ''α''를 갖는 지수 분포를 따른다. 이와 동등하게, ''Y''가 율 ''α''를 갖는 지수 분포를 따른다면,

: x_\mathrm{m} e^Y

는 최솟값 ''x''m과 지수 ''α''를 갖는 파레토 분포를 따른다.

이는 표준 변수 변환 기법을 사용하여 보일 수 있다.[17]

:

\begin{align}

\Pr(Y
& = \Pr(X
\end{align}



마지막 식은 율 ''α''를 갖는 지수 분포의 누적 분포 함수이다.

파레토 분포는 계층적 지수 분포에 의해 구성될 수 있다.[17] 다음을 보자.

:\phi | a \sim \text{Exp}(a) 그리고

:\eta | \phi \sim \text{Exp}(\phi) . 그러면 p(\eta | a) = \frac{a}{(a+\eta)^2}이고 결과적으로 a+\eta \sim \text{Pareto}(a, 1)이다.

더 일반적으로, 만약 \lambda \sim \text{Gamma}(\alpha, \beta) (형상-율 모수화)이고 \eta | \lambda \sim \text{Exp}(\lambda) 이면, \beta + \eta \sim \text{Pareto}(\beta, \alpha)이다.

이와 동등하게, 만약 Y \sim \text{Gamma}(\alpha,1) 이고 X \sim \text{Exp}(1)이면, x_{\text{m}} \! \left(1 + \frac{X}{Y}\right) \sim \text{Pareto}(x_{\text{m}}, \alpha)이다.

6. 4. 로그 정규 분포와의 관계

파레토 분포와 로그 정규 분포는 같은 종류의 양을 설명하기 위한 대안적인 분포이다. 이 둘 사이의 한 가지 관계는 둘 다 다른 일반적인 분포, 즉 각각 지수 분포정규 분포에 따라 분포된 무작위 변수의 지수 분포라는 것이다. (이전 섹션 참조)

6. 5. 일반화 파레토 분포와의 관계

파레토 분포는 일반화 파레토 분포의 특수한 경우이며, 로맥스 분포는 일반화 파레토 분포의 특수한 경우이다. 파레토 분포군은 이동되지 않은 지수 분포와 이동된 지수 분포를 모두 포함한다.

척도 x_m 및 형태 \alpha를 갖는 파레토 분포는 위치 \mu=x_m, 척도 \sigma=x_m/\alpha, 형태 \xi=1/\alpha를 갖는 일반화 파레토 분포와 동일하다. 반대로 \xi > 0인 경우 x_m = \sigma/\xi\alpha=1/\xi를 사용하여 일반화 파레토 분포(GPD)에서 파레토 분포를 얻을 수 있다.[7][11][12]

6. 6. 제한된 파레토 분포

제한된 파레토 분포는 세 개의 매개변수 ''α'', ''L'', ''H''를 가진다. 표준 파레토 분포와 같이 ''α''는 모양을 결정한다. ''L''은 최솟값을, ''H''는 최댓값을 나타낸다.

확률 밀도 함수는 다음과 같다.

:\frac{\alpha L^\alpha x^{-\alpha - 1}}{1-\left(\frac{L}{H}\right)^\alpha}

여기서 ''L'' ≤ ''x'' ≤ ''H''이고, ''α'' > 0이다.

6. 6. 1. 제한된 파레토 난수 생성

''U''가 (0, 1)에서 연속 균등 분포를 따르면, 역변환 방법[18]을 적용하여 다음이 성립한다.

:U = \frac{1 - L^\alpha x^{-\alpha}}{1 - (\frac{L}{H})^\alpha}

:x = \left(-\frac{U H^\alpha - U L^\alpha - H^\alpha}{H^\alpha L^\alpha}\right)^{-\frac{1}{\alpha}}

위 식은 경계가 있는 파레토 분포를 따른다.

6. 7. 대칭 파레토 분포

대칭 파레토 분포와 영대칭 파레토 분포는 날카로운 확률 피크와 대칭적인 긴 확률 꼬리를 갖는 특별한 통계적 분포를 포착하기 위한 것이다. 이 두 분포는 파레토 분포에서 파생되었다. 긴 확률 꼬리는 일반적으로 확률이 느리게 감소한다는 것을 의미하며 다양한 데이터 세트에 적합하게 사용할 수 있다. 그러나 분포가 두 개의 느리게 감소하는 꼬리를 갖는 대칭 구조를 갖는 경우 파레토 분포는 이를 수행할 수 없다. 이 경우 대칭 파레토 분포 또는 영대칭 파레토 분포를 대신 적용한다.[19]

대칭 파레토 분포의 누적 분포 함수(CDF)는 다음과 같이 정의된다.[19]

:F(X) = P(x < X ) = \begin{cases}

\tfrac{1}{2}({b \over 2b-X}) ^a & X
1- \tfrac{1}{2}(\tfrac{b}{X})^a& X\geq b

\end{cases}

해당 확률 밀도 함수(PDF)는 다음과 같다.[19]

:p(x) = {ab^a \over 2(b+\left\vert x-b \right\vert)^{a+1}},X\in R

이 분포는 두 개의 매개변수 a와 b를 갖는다. b에 대해 대칭이다. 수학적 기대값은 b이다. 분산은 다음과 같다.

:E((x-b)^2)=\int_{-\infty}^{\infty} (x-b)^2p(x)dx={2b^2 \over (a-2)(a-1) }



영대칭 파레토(ZSP) 분포의 CDF는 다음과 같이 정의된다.

:F(X) = P(x < X ) = \begin{cases}

\tfrac{1}{2}({b \over b-X}) ^a & X<0 \\

1- \tfrac{1}{2}(\tfrac{b}{b+X})^a& X\geq 0

\end{cases}

해당 PDF는 다음과 같다.

:p(x) = {ab^a \over 2(b+\left\vert x \right\vert)^{a+1}},X\in R

이 분포는 0에 대해 대칭이다. 매개변수 a는 확률의 감소율과 관련이 있으며 (a/2b)는 확률의 피크 크기를 나타낸다.[19]

6. 8. 다변량 파레토 분포

단변량 파레토 분포는 다변량 파레토 분포로 확장되었다.[20]

7. 통계적 추론

파레토 분포의 모수에 대한 통계적 추론에서는 독립적인 표본들을 바탕으로 가능도 함수와 로그 가능도 함수를 사용하여 모수를 추정한다. 최대 우도 추정량을 통해 ''α''와 ''x''m을 추정하는데, ''x''m의 추정량은 표본의 최솟값이며, ''α''의 추정량은 표본 값과 ''x''m 추정량의 로그를 이용한 식으로 계산된다.

7. 1. 모수 추정

파레토 분포의 모수 ''α''와 ''x''m에 대한 가능도 함수는 독립적인 표본 ''x'' = (''x''1, ''x''2, ..., ''xn'')가 주어질 때 다음과 같다.

:L(\alpha, x_\mathrm{m}) = \prod_{i=1}^n \alpha \frac {x_\mathrm{m}^\alpha} {x_i^{\alpha+1}} = \alpha^n x_\mathrm{m}^{n\alpha} \prod_{i=1}^n \frac {1}{x_i^{\alpha+1}}.

따라서 로그 가능도 함수는 다음과 같다.

:\ell(\alpha, x_\mathrm{m}) = n \ln \alpha + n\alpha \ln x_\mathrm{m} - (\alpha + 1) \sum_{i=1} ^n \ln x_i.

\ell(\alpha, x_\mathrm{m})이 ''x''m에 대해 단조 증가한다. 즉, ''x''m의 값이 클수록 가능도 함수의 값도 커진다. ''x'' ≥ ''x''m이므로 다음이 성립한다.

:\widehat x_\mathrm{m} = \min_i {x_i}.

''α''에 대한 추정량을 찾기 위해 해당 편미분을 계산하고 0이 되는 지점을 결정한다.

:\frac{\partial \ell}{\partial \alpha} = \frac{n}{\alpha} + n \ln x_\mathrm{m} - \sum _{i=1}^n \ln x_i = 0.

따라서 ''α''에 대한 최대 우도 추정량은 다음과 같다.

:\widehat \alpha = \frac{n}{\sum _i \ln (x_i/\widehat x_\mathrm{m}) }.

예상되는 통계적 오차는 다음과 같다.

:\sigma = \frac {\widehat \alpha} {\sqrt n}.

Malik (1970)은 (\hat{x}_\mathrm{m},\hat\alpha)의 정확한 결합 분포를 제공한다. \hat{x}_\mathrm{m}\hat\alpha독립이며 \hat{x}_\mathrm{m}은 척도 모수 ''x''m과 모양 모수 ''nα''를 갖는 파레토 분포를 따르고, \hat\alpha는 모양과 척도 모수가 각각 ''n'' − 1과 ''nα''인 역감마 분포를 따른다.

8. 발생 및 응용

빌프레도 파레토는 사회에서 부의 불평등한 분배를 나타내기 위해 파레토 분포를 사용했다. 대부분의 부가 소수에 의해 소유되는 현상(파레토 법칙)을 효과적으로 설명한다.[38] 파레토 분포는 부나 소득뿐만 아니라 "작은" 것에서 "큰" 것의 분포에서 평형이 발견되는 다양한 상황에 적용된다.
파레토 분포를 따르는 예시:

분야예시
경제원유 매장량 가치 (소수의 대형 유전, 많은 소형 유전)[2]
도시인구 정착지의 크기 (소수의 도시, 많은 촌락/마을)[26][27]
IT인터넷 트래픽의 파일 크기 분포 (많은 작은 파일, 소수의 큰 파일)[2], 하드 디스크 드라이브 오류율[28], 슈퍼컴퓨터 작업 길이 분포 (소수의 큰 작업, 많은 작은 작업)[30]
과학모래 입자 크기[2], 운석 크기
보험대규모 사상자 손실의 심각성[31][32]
기타수문학에서 극한 현상 (연간 최대 일일 강수량, 하천 방류)[33], 전력 유틸리티 분배 신뢰성



CumFreq를 사용하여 최대 일일 강수량에 맞는 누적 파레토(Lomax) 분포

8. 1. 일반적인 경우

빌프레도 파레토는 사회에서 부의 불평등한 분배를 나타내기 위해 파레토 분포를 사용했다. 대부분의 부가 소수에 의해 소유되는 현상(파레토 법칙)을 효과적으로 설명한다.[38] 그는 이 분포를 소득 분배 설명에도 사용했다.[23]

파레토 분포를 따르는 임의 변수의 조건부 확률 분포는 특정 숫자 x_\text{m}을 초과하고 x_1보다 크거나 같다는 조건 하에서, 파레토 지수 \alpha는 같지만 최소값 x_\text{m} 대신 x_1을 갖는 파레토 분포를 따른다. 조건부 기대값(유한한 경우, 즉 \alpha>1일 경우)은 x_1에 비례한다. 객체의 수명을 설명하는 임의 변수의 경우, 이는 기대 수명이 나이에 비례한다는 것을 의미하며, 린디 효과라고도 한다.[9]

"80-20 규칙"은 인구의 20%가 부의 80%를 통제한다는 파레토 법칙을 단순하게 표현한 것이다.[24] 그러나 실제 데이터는 이보다 더 복잡한 양상을 보인다. 예를 들어, 파레토의 연구에 따르면 영국의 소득세 데이터는 인구의 약 30%가 소득의 약 70%를 가지고 있음을 보여준다.

파레토 분포는 하위 부분의 부에 대해서는 현실적이지 않을 수 있다. 순자산은 음수가 될 수도 있기 때문이다. 이 분포는 부나 소득뿐만 아니라 "작은" 것에서 "큰" 것의 분포에서 평형이 발견되는 다양한 상황에 적용된다.
파레토 분포를 따르는 예시:

분야예시
경제가계 예산 제약 (소비, 노동 소득, 자본 소득, 부)[25], 원유 매장량 가치 (소수의 대형 유전, 많은 소형 유전)[2]
도시인구 정착지의 크기 (소수의 도시, 많은 촌락/마을)[26][27]
IT인터넷 트래픽의 파일 크기 분포 (많은 작은 파일, 소수의 큰 파일)[2], 하드 디스크 드라이브 오류율[28], 슈퍼컴퓨터 작업 길이 분포 (소수의 큰 작업, 많은 작은 작업)[30], Steam 사용자의 게임 플레이 시간 분포
과학절대 영도 근처의 보스-아인슈타인 응축 클러스터[29], 모래 입자 크기[2], 운석 크기
보험대규모 사상자 손실의 심각성[31][32]
기타수문학에서 극한 현상 (연간 최대 일일 강수량, 하천 방류)[33], 전력 유틸리티 분배 신뢰성, 표준화된 주식 가격 수익률[26]


참고: 파라미터 ''a'', ''b'' (''a'' > 0, ''b'' > 0)를 가지고, 실수 ''x'' (''x'' ≥ ''b'')를 확률 변수로 하는 파레토 분포의 확률 밀도 함수\frac{a/b}{(x/b)^{a+1}}로 정의된다. 이때, 기대값은 \frac{ab}{a-1} \mbox{ for } a>1, 분산은 \frac{ab^2}{(a-1)^2 (a-2)}\mbox{ for } a>2 이다.

8. 2. 지프의 법칙과의 관계

파레토 분포는 연속 확률 분포이다. 지프의 법칙(제타 분포라고도 불림)은 값을 간단한 순위로 구분하는 이산 분포이다. 둘 다 음의 지수를 갖는 간단한 멱함수 법칙이며, 누적 분포가 1이 되도록 조정된다. 지프의 법칙은 x 값(소득)이 N개의 계급으로 묶여 각 빈의 사람 수가 1/계급 패턴을 따르는 경우 파레토 분포에서 파생될 수 있다. 분포는 x_m\alpha x_\mathrm{m}^\alpha = \frac{1}{H(N,\alpha-1)}로 정의하여 정규화되며, 여기서 H(N,\alpha-1)은 일반화된 조화수이다. 이를 통해 지프의 확률 밀도 함수는 파레토 분포에서 파생될 수 있다.

:f(x) = \frac{\alpha x_\mathrm{m}^\alpha}{x^{\alpha+1}} = \frac{1}{x^s H(N,s)}

여기서 s = \alpha-1이고 x는 1에서 N까지의 순위를 나타내는 정수이며, N은 최고 소득 구간이다. 따라서 모집단(또는 언어, 인터넷 또는 국가)에서 무작위로 선택된 사람(또는 단어, 웹사이트 링크 또는 도시)은 f(x)의 확률로 x의 순위를 가진다.

8. 3. "파레토 법칙"과의 관계

빌프레도 파레토는 파레토 분포를 사용하여 사회에서 부의 불공평한 분배를 나타냈다. 대부분의 부가 소수에 의해 소유되는 현상(파레토 법칙)을 파레토 분포로 효과적으로 설명할 수 있다.[38]

"80 대 20 법칙"에 따르면, 전체 인구의 20%가 전체 소득의 80%를 차지한다. 파레토 지수가 \alpha = \log_4 5 = \cfrac{\log_{10} 5}{\log_{10} 4} \approx 1.161일 때 이 법칙이 정확하게 성립하며, 이는 로렌츠 곡선 공식에서 파생될 수 있다. 다음은 수학적으로 동일한 내용이다.[34]

  • 소득은 지수 ''α'' > 1을 갖는 파레토 분포에 따라 분배된다.
  • 0 ≤ ''p'' ≤ 1/2인 어떤 수가 존재하여, 전체 인구의 100''p''%가 전체 소득의 100(1 − ''p'')%를 차지하고, 마찬가지로 모든 실수(정수일 필요는 없음) ''n'' > 0에 대해서, 전체 인구의 100''pn''%가 전체 소득의 100(1 − ''p'')''n''%를 차지한다. ''α''와 ''p''는 다음 관계를 갖는다.


::1-\frac{1}{\alpha}=\frac{\ln(1-p)}{\ln(p)}=\frac{\ln((1-p)^n)}{\ln(p^n)}

이는 소득뿐만 아니라 재산 등 파레토 분포로 모델링할 수 있는 다른 모든 것에도 적용된다. 무한한 기댓값을 가지므로 소득 분포를 합리적으로 모델링할 수 없는 0 < ''α'' ≤ 1인 파레토 분포는 제외된다.

8. 4. 프라이스 법칙과의 관계

프라이스의 제곱근 법칙은 파레토 분포의 속성으로 제시되거나, 파레토 분포와 유사한 것으로 여겨지기도 한다. 그러나 이 법칙은 \(\alpha=1\)인 경우에만 성립한다. 이 경우, 전체 부와 기대되는 부의 양은 정의되지 않으며, 이 규칙은 무작위 표본에만 점근적으로 적용된다. 위에 언급된 확장된 파레토 원리는 훨씬 더 일반적인 규칙이다.[1]

8. 5. 로렌츠 곡선과 지니 계수

빌프레도 파레토는 파레토 분포를 사용하여 사회에서 부가 불공평하게 분배되는 현상을 설명하고자 했다. 파레토 법칙에 따르면, 소수가 대부분의 부를 소유하는 경향이 있는데, 파레토 분포는 이러한 현상을 잘 나타낸다.[38]

로렌츠 곡선은 소득 및 자산 분포를 나타내는 데 사용된다. 로렌츠 곡선 *L*( *F*)는 확률 밀도 함수(PDF) *f* 또는 누적 분포 함수(CDF) *F*를 사용하여 다음과 같이 표현할 수 있다.

:L(F)=\frac{\int_{x_\mathrm{m}}^{x(F)}xf(x)\,dx}{\int_{x_\mathrm{m}}^\infty xf(x)\,dx} =\frac{\int_0^F x(F')\,dF'}{\int_0^1 x(F')\,dF'}

여기서 *x*( *F*)는 CDF의 역함수이다. 파레토 분포의 경우,

:x(F)=\frac{x_\mathrm{m}}{(1-F)^{\frac{1}{\alpha}}}

이며, 이를 통해 로렌츠 곡선은 다음과 같이 계산된다.

:L(F) = 1-(1-F)^{1-\frac{1}{\alpha}},

0<\alpha\le 1일 때는 분모가 무한대가 되어 *L*=0이 된다. 오른쪽 그림은 여러 파레토 분포에 대한 로렌츠 곡선을 보여준다.

325px


옥스팜(Oxfam)의 2016년 보고에 따르면, 세계에서 가장 부유한 62명이 가진 자산은 세계 인구 중 가장 가난한 절반이 가진 자산과 같다고 한다.[35] 이를 파레토 분포로 분석하면, *α* 값은 약 1.15로 추정되며, 두 그룹 각각이 약 9%의 부를 소유한다는 결론이 나온다. 그러나 실제로는 세계 성인 인구의 가장 가난한 69%가 약 3%의 부를 소유하고 있는 것으로 나타났다.[36]

지니 계수는 로렌츠 곡선이 얼마나 균등하게 분포되어 있는지를 나타내는 척도이다. 이는 로렌츠 곡선과 균등 분배선(오른쪽 그림에서 검은색 선, *α* = ∞) 사이의 면적을 두 배 한 값으로 계산된다. 파레토 분포에서 지니 계수는 다음과 같이 계산된다( \alpha\ge 1의 경우).

:G = 1-2 \left (\int_0^1L(F) \, dF \right ) = \frac{1}{2\alpha-1}

9. 난수 생성

역변환 표본 추출법을 사용하면 파레토 분포를 따르는 난수를 생성할 수 있다. 단위 구간 [0, 1]에서 균등 분포를 따르는 난수 ''U''가 주어졌을 때, 다음 식으로 주어지는 변수 ''T''는 파레토 분포를 따른다.[37]

:T=\frac{x_\mathrm{m}}{U^{1/\alpha}}

참조

[1] 논문 Calculating CVaR and bPOE for common probability distributions with application to portfolio optimization and density estimation http://uryasev.ams.s[...] Springer 2023-02-27
[2] 논문 VILFREDO PARETO 1938
[3] 논문 Cours d'economie politique https://zenodo.org/r[...] 1898
[4] 논문 The Generalized Pareto distribution applied to rainfall depths 1986
[5] 논문 Income inequality in Romania: The exponential-Pareto distribution 2017
[6] 논문 Pareto Distribution https://www.academia[...]
[7] 서적 Pareto Distributions International Co-operative Publishing House
[8] 간행물 Parameter estimation of Pareto distribution: Some modified moment estimators https://www.research[...]
[9] 논문 Lindy's Law 2017-11
[10] 문서 Continuous univariate distributions Vol 1
[11] 문서
[12] 서적 Statistical Size Distributions in Economics and Actuarial Sciences https://books.google[...] Wiley
[13] 서적 An Introduction to Probability Theory and its Applications Wiley
[14] 논문 Business failures. Another example of the analysis of failure data
[15] 서적 Modeling Income Distributions and Lorenz Curves Springer 2008-09-16
[16] 논문 Characterizing the Pareto and power distributions.
[17] 학위논문 Bayesian semiparametric spatial and joint spatio-temporal modeling https://mospace.umsy[...] University of Missouri--Columbia 2006
[18] 웹사이트 Inverse Transform Method http://www.cs.bgu.ac[...] 2012-08-27
[19] 논문 A Multiscale Model for MPEG-4 Varied Bit Rate Video Traffic 2004
[20] 논문 Multivariate generalized Pareto distributions
[21] 논문 Power laws, Pareto distributions and Zipf's law
[22] 논문 Estimation of the Parameters of the Pareto Distribution
[23] 문서 Cours d'Économie Politique: Nouvelle édition par G.-H. Bousquet et G. Busino https://web.archive.[...] Librairie Droz, Geneva
[24] 문서
[25] 웹사이트 Consumption, Wealth, and Income Inequality: A Tale of Tails https://ssrn.com/abs[...] 2023
[26] 논문 The Double Pareto-Lognormal Distribution – A New Parametric Model for Size Distributions
[27] 논문 On the rank-size distribution for human settlements
[28] 논문 Understanding latent sector error and how to protect against them http://www.usenix.or[...] 2010-09-10
[29] 논문 Some Distributions Associated with Bose–Einstein Statistics 1975-05
[30] 논문 Exploiting Process Lifetime Distributions for Dynamic Load Balancing https://users.soe.uc[...] 1997-08
[31] 문서
[32] 논문 Survival probabilities based on Pareto claim distributions
[33] 웹사이트 CumFreq, software for cumulative frequency analysis and probability distribution fitting https://www.waterlog[...]
[34] 논문 Pareto's Law
[35] 웹사이트 62 people own the same as half the world, reveals Oxfam Davos report https://www.oxfam.or[...] Oxfam 2016-01
[36] 웹사이트 Global Wealth Report 2013 https://publications[...] Credit Suisse 2013-10
[37] 서적 Computational Methods in Statistics and Econometrics https://books.google[...] CRC Press
[38] 서적 Cours d’Économie Politique: Nouvelle édition par G.-H. Bousquet et G. Busino Librairie Droz, Geneva 1964



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com