로 주어질 때, 확률변수 X는 로그정규분포를 따른다고 한다.
2. 3. 누적 분포 함수
로그 정규 분포의 누적 분포 함수(CDF)는 다음과 같다. [2] : F_X(x) = \Phi\left( \frac{(\ln x) - \mu} \sigma \right) 여기서 \ \Phi\ 는 표준정규분포(\ \operatorname\mathcal{N}(\ 0,\ 1 )\ )의 누적분포함수이다. 다음과 같이 표현할 수도 있다. [2] : \frac12 \left[ 1 + \operatorname{erf} \left(\frac{\ln x - \mu}{\sigma\sqrt{2}}\right) \right] = \frac12 \operatorname{erfc} \left(-\frac{\ln x - \mu}{\sigma\sqrt{2}}\right) 여기서 erfc영어 는 보어 함수이다. 위 식에서 erfc는 상보 오차 함수 , \Phi 는 표준정규분포의 분포함수이다.
2. 4. 다변량 로그 정규 분포
만약 \boldsymbol X \sim \mathcal{N}(\boldsymbol\mu,\,\boldsymbol\Sigma) 가 다변량 정규 분포를 따르면, Y_i=\exp(X_i) 는 다변량 로그정규 분포를 따른다. [5] [6] 지수 함수는 확률 벡터 \boldsymbol X 에 원소별로 적용된다. \boldsymbol Y 의 평균은 다음과 같다. :\operatorname{E}[\boldsymbol Y]_i=e^{\mu_i+\frac{1}{2}\Sigma_{ii}} , 그리고, 공분산 행렬 은 다음과 같다. :\operatorname{Var}[\boldsymbol Y]_{ij}=e^{\mu_i+\mu_j + \frac{1}{2}(\Sigma_{ii}+\Sigma_{jj}) }( e^{\Sigma_{ij}} - 1) .
2. 5. 특성 함수 및 적률 생성 함수
로그 정규 분포의 모든 적률은 존재하며, 다음과 같다. :\operatorname{E}[X^n]= e^{n\mu+n^2\sigma^2/2} 이는 적분 내에서 z=\tfrac{\ln(x) - (\mu+n\sigma^2)}{\sigma} 로 치환하여 유도할 수 있다. 그러나 로그 정규 분포는 그 적률로 결정되지 않는다. [7] 이는 로그 정규 분포가 0 근방에서 정의된 적률 생성 함수를 가질 수 없음을 의미한다. [8] 실제로, 기댓값 \operatorname{E}[e^{t X}] 는 인수 t 의 양의 값에 대해 정의되지 않는데, 정의 적분이 발산하기 때문이다. 특성 함수 \operatorname{E}[e^{i t X}] 는 실수 값의 ''t''|t영어 에 대해 정의되지만, 음의 허수 부분을 갖는 임의의 복소수 값 ''t''|t영어 에 대해서는 정의되지 않는다. 따라서 특성 함수는 원점에서 해석적 이지 않다. 결과적으로, 로그 정규 분포의 특성 함수는 수렴하는 무한 급수로 표현될 수 없다. [9] 특히, 그 테일러 형식적 급수는 발산한다. :\sum_{n=0}^\infty \frac{(it)^n}{n!}e^{n\mu+n^2\sigma^2/2} 그러나 여러 대안적인 발산 급수 표현이 얻어졌다. [9] [10] [11] [12] 수렴 영역 내의 t 에 대한 특성 함수 \varphi(t) 의 닫힌 형식 공식은 알려져 있지 않다. 비교적 간단한 근사 공식이 닫힌 형식으로 제공되며, [13] 다음과 같다. :\varphi(t)\approx\frac{\exp\left(-\frac{W^2(-it\sigma^2e^\mu) + 2W(-it\sigma^2e^\mu)}{2\sigma^2} \right)}{\sqrt{1+W(-it\sigma^2e^\mu)}} 여기서 W 는 람베르트 W 함수 이다. 이 근사는 점근적 방법을 통해 유도되었지만, \varphi 의 수렴 영역 전체에서 정확하게 유지된다.
3. 성질
로그 정규 분포는 다음과 같은 성질을 갖는다.
확률 계산 : 임의 구간에서 로그 정규 분포의 확률은 변수를 정규 분포로 변환한 다음 광선 추적법을 사용하여 수치적으로 계산할 수 있다. [14] 로그 정규 분포의 확률은 어떤 영역에서든 계산할 수 있으므로, 로그 정규 변수의 함수에 대한 누적분포함수(CDF)와 확률밀도함수(PDF)도 계산할 수 있다. [14]기하 평균 및 기하 표준 편차 : 로그 정규 분포의 기하 평균 은 \mu 이며, 이는 중앙값 과 같다. 기하 표준 편차는 e^{\sigma} 이다. [15] [16] 기하 분산은 e^{\sigma^2} 으로 정의할 수 있다.산술 평균 및 산술 표준 편차 : 로그 정규 분포를 따르는 변수 X의 산술 평균, 기댓값 제곱, 산술 분산, 산술 표준 편차는 아래 표와 같다. [2]값 산술 평균(\operatorname{E}[X] ) e^{\mu + \tfrac{1}{2}\sigma^2} 기댓값 제곱(\operatorname{E}[X^2] ) e^{2\mu + 2\sigma^2} 산술 분산(\operatorname{Var}[X] ) e^{2\mu + \sigma^2} (e^{\sigma^2} - 1) 산술 표준 편차(\operatorname{SD}[X] ) e^{\mu + \tfrac{1}{2}\sigma^2}\sqrt{e^{\sigma^2} - 1}
최빈값, 중앙값 : 최빈값은 e^{\mu - \sigma^2} 이다. [2] 로그 변환된 변수가 정규분포를 따르고, 단조 변환 하에서 분위수가 보존되므로, 중앙값은 e^\mu 이다. [20]곱셈 및 나눗셈 : 독립적인 로그 정규 분포 변수를 곱하거나 나누면, 그 결과 역시 로그 정규 분포를 따른다.기타 성질 : 로그 정규 분포에서 나온 데이터 집합은 대칭인 로렌츠 곡선 을 갖는다. [31] 이 분포의 조화 평균 , 기하 평균 및 산술 평균 은 서로 관련이 있으며, 관계식은 H = \frac{G^2} A 이다. [32] 로그 정규 분포는 무한히 분할 가능하지만, 안정 분포는 아니다. [89] [87]
3. 1. 확률 계산
임의 구간에서 로그 정규 분포의 확률은 변수를 정규 분포로 변환한 다음 광선 추적법을 사용하여 수치적으로 적분하여 원하는 정밀도까지 계산할 수 있다. [14] (https://www.mathworks.com/matlabcentral/fileexchange/84973-integrate-and-classify-normal-distributions Matlab 코드 ) 로그정규분포의 확률은 어떤 영역에서든 계산할 수 있으므로, 로그정규 변수의 함수에 대한 누적분포함수(CDF), 그리고 결과적으로 확률밀도함수(PDF)와 역누적분포함수(inverse CDF)도 계산할 수 있다. [14] (https://www.mathworks.com/matlabcentral/fileexchange/84973-integrate-and-classify-normal-distributions Matlab 코드 )
3. 2. 기하 평균 및 기하 표준 편차
로그정규분포의 기하 평균 은 \operatorname{GM}[X] = e^\mu = \mu^* 이며, 이는 중앙값 과 같다. 기하 표준 편차는 \operatorname{GSD}[X] = e^{\sigma} = \sigma^* 이다. [15] [16] 산술 통계량과 유사하게 기하 분산 \operatorname{GVar}[X] = e^{\sigma^2} 을 정의할 수 있으며, 기하 변동 계수 [15] \operatorname{GCV}[X] = e^{\sigma} - 1 이 제안되었다. 이 용어는 로그정규 데이터의 승법적 변동을 설명하기 위해 변동 계수와 ''유사하게'' 의도되었지만, 이 GCV 정의는 \operatorname{CV} 자체에 대한 추정치로서 이론적 근거가 없다(변동 계수 참조). 기하 평균은 산술-기하 평균 부등식 에 의해 산술 평균보다 작다.
3. 3. 산술 평균 및 산술 표준 편차
로그 정규 분포를 따르는 변수 X의 산술 평균, 기댓값 제곱, 산술 분산, 산술 표준 편차는 아래 표와 같다. [2]값 산술 평균(E[X]) \operatorname{E}[X] = e^{\mu + \tfrac{1}{2}\sigma^2} 기댓값 제곱(E[X²]) \operatorname{E}[X^2] = e^{2\mu + 2\sigma^2} 산술 분산(Var[X]) \operatorname{Var}[X] = \operatorname{E}[X^2] - \operatorname{E}[X]^2 = (\operatorname{E}[X])^2(e^{\sigma^2} - 1) = e^{2\mu + \sigma^2} (e^{\sigma^2} - 1) 산술 표준 편차(SD[X]) \operatorname{SD}[X] = \sqrt{\operatorname{Var}[X]} = \operatorname{E}[X] \sqrt{e^{\sigma^2} - 1} = e^{\mu + \tfrac{1}{2}\sigma^2}\sqrt{e^{\sigma^2} - 1}
산술 변동 계수 \operatorname{CV}[X] 는 \tfrac{\operatorname{SD}[X]}{\operatorname{E}[X]} 의 비율이다. [3] 로그 정규 분포의 경우, \operatorname{CV}[X] = \sqrt{e^{\sigma^2} - 1} 이다. 이 추정치는 기하 분산의 사용으로 인해 때때로 "기하학적 CV"(GCV)라고 불린다. [18] [19] 산술 표준 편차와 달리, 산술 변동 계수는 산술 평균과 독립적이다. 산술 평균과 산술 분산이 알려진 경우, 매개변수 μ와 σ는 다음과 같이 구할 수 있다. :\begin{align} \mu &= \ln \left(\frac{\operatorname{E}[X]^2}{\sqrt{\operatorname{E}[X^2]}}\right) = \ln \left( \frac{\operatorname{E}[X]^2}{\sqrt{\operatorname{Var}[X] + \operatorname{E}[X]^2}} \right), \\[4pt] \sigma^2 &= \ln \left(\frac{\operatorname{E}[X^2]}{\operatorname{E}[X]^2}\right) = \ln \left(1 + \frac{\operatorname{Var}[X]}{\operatorname{E}[X]^2}\right). \end{align}
3. 4. 최빈값, 중앙값, 분위수
최빈값은 확률밀도함수의 전역 최댓값 지점이다. 특히, 방정식 (\ln f)'=0 을 풀면 다음을 얻는다. [2] :\operatorname{Mode}[X] = e^{\mu - \sigma^2}. 로그 변환된 변수 Y = \ln X 가 정규분포를 따르고, 단조 변환 하에서 분위수가 보존되므로, X 의 분위수는 다음과 같다. :q_X(\alpha) = e^{\mu+\sigma q_\Phi(\alpha)} =\mu^* (\sigma^*)^{q_\Phi(\alpha)}, 여기서 q_\Phi(\alpha) 는 표준정규분포의 분위수이다. 특히, 로그정규분포의 중앙값은 그 곱셈 평균과 같다. [20] :\operatorname{Med}[X] = e^\mu = \mu^* ~.
3. 5. 부분 기댓값
임계값 ''k''에 대한 확률 변수 ''X''의 부분 기댓값은 다음과 같이 정의된다. : g(k) = \int_k^\infty x f_X(x \mid X > k)\, dx . 또는, 조건부 기댓값의 정의를 사용하여 g(k)=\operatorname{E}[X\mid X>k] P(X>k) 로 나타낼 수 있다. 로그 정규 분포 확률 변수의 경우, 부분 기댓값은 다음과 같다. :g(k) = \int_k^\infty x f_X(x \mid X > k)\, dx = e^{\mu+\tfrac{1}{2} \sigma^2}\, \Phi\!\left(\frac{\mu+\sigma^2-\ln k} \sigma \right) 여기서 \Phi 는 정규 누적 분포 함수이다. 공식의 유도 과정은 토론 페이지에 나와 있다. 부분 기댓값 공식은 보험 및 경제학 에서 응용되며, 블랙-숄즈 공식으로 이어지는 편미분 방정식을 푸는 데 사용된다.
3. 6. 조건부 기댓값
로그정규 분포를 따르는 확률 변수 X의 조건부 기댓값(임계값 k에 대한)은 해당 범위에 속할 누적 확률로 나눈 부분 기댓값이다. :\begin{align} E[X\mid X E[X\mid X\geqslant k] &=e^{\mu +\frac{\sigma^2}{2}}\cdot \frac{\Phi \left[\frac{\mu +\sigma^2-\ln(k)} \sigma \right]}{1-\Phi \left[\frac{\ln(k)-\mu}{\sigma}\right]} \\ [8pt] E[X\mid X\in [k_1,k_2]] &=e^{\mu +\frac{\sigma^2}{2}}\cdot \frac{ \Phi \left[\frac{\ln(k_2)-\mu -\sigma^2} \sigma \right]-\Phi \left[\frac{\ln(k_1)-\mu -\sigma^2} \sigma \right] }{ \Phi \left[\frac{\ln(k_2)-\mu}{\sigma}\right]-\Phi \left[\frac{\ln(k_1)-\mu}{\sigma}\right] } \end{align}
3. 7. 다른 매개변수화
로그 정규 분포는 μ, σ 또는 μ*, σ*를 사용한 특징 외에도 여러 가지 방법으로 매개변수화될 수 있다. 확률 분포 의 지식 기반 및 온톨로지인 ProbOnto [23] [24] 는 그러한 형태를 일곱 가지 나열한다.로그 정규 분포의 매개변수화 개요 종류 설명 LogNormal1(μ,σ) 로그 스케일에서의 평균 , μ, 및 표준 편차 , σ [25] LogNormal2(μ,υ) 로그 스케일에서의 평균, μ, 및 분산, υ LogNormal3(m,σ) 자연 스케일에서의 중앙값 , m, 및 로그 스케일에서의 표준 편차, σ [25] LogNormal4(m,cv) 자연 스케일에서의 중앙값, m, 및 변동 계수 , cv LogNormal5(μ,τ) 로그 스케일에서의 평균, μ, 및 정밀도, τ [26] LogNormal6(m,σg ) 자연 스케일에서의 중앙값, m, 및 기하 평균 표준 편차, σg [27] LogNormal7(μN ,σN ) 자연 스케일에서의 평균, μN , 및 표준 편차, σN [28]
두 가지 서로 다른 최적 설계 도구(예: PFIM [27] 및 PopED [28] )를 사용하여 모델을 실행하려는 경우를 생각해 보자. 전자는 LN2 매개변수화를, 후자는 LN7 매개변수화를 각각 지원한다. 따라서 두 도구가 서로 다른 결과를 생성하지 않도록 재매개변수화가 필요하다. LN2(μ, v)를 LN7(μN , σN )으로 변환하는 공식은 다음과 같다. μN = exp(μ+v/2) 및 σN = exp(μ+v/2)√(exp(v)-1). LN7(μN , σN )을 LN2(μ, v)로 변환하는 공식은 다음과 같다. μ = ln( μN / √(1+σN 2 /μN 2 ) ) 및 v = ln(1+σN 2 /μN 2 ). 나머지 모든 재매개변수화 공식은 프로젝트 웹사이트의 사양 문서 [29] 에서 찾을 수 있다.
3. 8. 곱셈 및 나눗셈
독립적인 로그정규 분포 변수 X_1 과 X_2 를 곱하거나 나누면, 그 결과(곱, 비율) 역시 로그정규 분포를 따른다. 이때 매개변수는 곱셈의 경우 \mu=\mu_1+\mu_2 , 나눗셈의 경우 \mu=\mu_1-\mu_2 이며, \sigma^2=\sigma_1^2+\sigma_2^2 이다. 이 성질은 n 개의 변수의 곱으로 쉽게 일반화할 수 있다. 더 일반적으로, X_j \sim \operatorname{Lognormal} (\mu_j, \sigma_j^2) 가 n 개의 독립적인 로그정규 분포 변수라면, Y = \textstyle\prod_{j=1}^n X_j \sim \operatorname{Lognormal} \Big(\textstyle \sum_{j=1}^n\mu_j,\ \sum_{j=1}^n \sigma_j^2 \Big). 이다.
3. 9. 기타 성질
로그정규분포에서 나온 데이터 집합은 대칭인 로렌츠 곡선 을 갖는다(로렌츠 비대칭 계수 참조). [31] 이 분포의 조화평균 H , 기하평균 G 및 산술평균 A 는 서로 관련이 있다. [32] 이러한 관계는 다음과 같다. :H = \frac{G^2} A. 로그정규분포는 무한히 분할 가능하지만, [89] 안정 분포는 아니다. [87]
4. 통계적 추론
로그정규분포를 따르는 데이터를 통계적으로 추론하는 방법은 다음과 같다. 로그정규분포의 모수 μ와 σ를 추정하기 위해, 로그 변환된 데이터에 대해 정규분포의 최대우도추정량을 사용한다. 즉, 데이터의 로그값에 대한 평균과 분산을 계산하여 추정한다. 유한한 표본 크기에서 μ의 추정량은 불편추정량이지만, σ의 추정량은 편향추정량이므로, σ에 대한 불편추정량을 얻기 위해 분모를 n-1로 조정한다. 표본의 평균과 표준편차만 주어진 경우, 모멘트 방법을 사용하여 μ와 σ를 추정할 수 있다. 로그정규분포 자료의 구간 추정을 위해서는 로그 변환된 자료에 정규분포 기반 방법을 적용한 후, 역변환하여 신뢰구간을 얻는 것이 효율적이다. 예를 들어, 중앙값에 대한 신뢰구간을 계산할 수 있다. 로그정규분포의 평균에 대한 신뢰구간을 계산하는 방법에는 콕스 방법, 수정된 콕스 방법, 부트스트래핑 등이 있다. 콕스 방법은 로그 변환된 데이터의 평균과 분산을 이용하여 근사 신뢰구간을 제공하며, 수정된 콕스 방법은 작은 표본 크기에 대해 더 나은 결과를 제공한다. 두 로그정규분포를 비교하는 경우(예: A/B 테스트 ), 각 표본에 로그를 취한 후 신뢰구간을 구성하고 역변환하여 중앙값 또는 기댓값의 비율에 대한 신뢰구간을 계산할 수 있다. 이러한 신뢰구간은 역학에서 상대 위험도와 오즈비의 신뢰구간을 계산하는 데 사용될 수 있다. [44]
4. 1. 모수 추정
로그정규분포의 모수 μ와 σ에 대한 최대우도추정량을 구하기 위해, 정규분포와 같은 절차를 사용할 수 있다. :L(\mu, \sigma) = \prod_{i=1}^n \frac 1 {x_i} \varphi_{\mu,\sigma} (\ln x_i), 여기서 \varphi 는 정규분포 \mathcal N(\mu,\sigma^2) 의 확률밀도함수이다. 따라서 로그우도함수는 다음과 같다. : \ell (\mu,\sigma \mid x_1, x_2, \ldots, x_n) = - \sum _i \ln x_i + \ell_N (\mu, \sigma \mid \ln x_1, \ln x_2, \dots, \ln x_n). 첫 번째 항은 μ와 σ에 대해 상수이므로, 두 로그우도함수 \ell 과 \ell_N 는 같은 μ와 σ에서 최댓값에 도달한다. 따라서 최대우도추정량은 관측값 \ln x_1, \ln x_2, \dots, \ln x_n 에 대한 정규분포의 최대우도추정량과 동일하며, 다음과 같다. :\widehat \mu = \frac {\sum_i \ln x_i}{n}, \qquad \widehat \sigma^2 = \frac {\sum_i \left( \ln x_i - \widehat \mu \right)^2} {n}. 유한한 n에 대해, μ에 대한 추정량은 불편추정량이지만, σ에 대한 추정량은 편향추정량이다. 정규분포의 경우와 마찬가지로, \widehat\sigma^2 의 식에서 분모 n을 n-1로 바꿈으로써 σ에 대한 불편추정량을 얻을 수 있다. 개별 값 x_1, x_2, \ldots, x_n 을 사용할 수 없지만 표본의 평균 \bar x 와 표준편차 s를 알고 있다면, 모멘트 방법을 사용할 수 있다. μ와 σ에 대한 기댓값 \operatorname{E}[X] 과 분산 \operatorname{Var}[X] 의 방정식을 풀어 얻은 다음 공식을 사용하여 해당 모수를 결정한다. : \mu = \ln\left(\frac{ \bar x} {\sqrt{1+\widehat\sigma^2/\bar x^2} } \right), \qquad \sigma^2 = \ln\left(1 + {\widehat\sigma^2} / \bar x^2 \right).
4. 2. 구간 추정
로그 정규 분포를 따르는 자료를 분석할 때, 로그 변환된 자료에 정규 분포 기반의 방법을 적용한 후 역변환하여 구간 추정치를 얻는 것이 효율적이다. 정규 분포에서 구간 [\mu-\sigma,\mu+\sigma] 는 약 68%의 확률을, [\mu-2\sigma,\mu+2\sigma] 는 95%의 확률을 포함한다. 로그 정규 분포에서는 다음과 같다.[\mu^*/\sigma^*,\mu^*\cdot\sigma^*]=[\mu^* {}^\times\!\!/ \sigma^*] 는 68%의 확률을 포함한다.[\mu^*/(\sigma^*)^2,\mu^*\cdot(\sigma^*)^2] = [\mu^* {}^\times\!\!/ (\sigma^*)^2] 는 95%의 확률을 포함한다. μ에 대한 신뢰구간은 \widehat\mu \pm q \cdot \widehat{se} 로 주어지며, 여기서 se = \widehat\sigma / \sqrt{n} 은 표준오차, ''q''는 자유도 ''n-1''인 t-분포의 97.5% 분위수이다. 역변환을 통해 \mu^* = e^\mu (중앙값)에 대한 신뢰구간은 다음과 같다.[\widehat\mu^* {}^\times\!\!/ (\operatorname{sem}^*)^q] 여기서 \operatorname{sem}^*=(\widehat\sigma^*)^{1/\sqrt{n}} 이다. 로그 정규 분포의 평균 μ에 대한 신뢰구간을 계산하는 방법에는 부트스트래핑 등이 있다. [40] [41] 콕스 방법은 다음과 같은 추정량을 사용한다. [42] [43] [4]\widehat \mu = \frac {\sum_i \ln x_i}{n}, \qquad S^2 = \frac {\sum_i \left( \ln x_i - \widehat \mu \right)^2} {n-1} 이를 통해 다음과 같은 근사 신뢰구간을 구성한다.CI(E(X)):e^{\left(\hat \mu + \frac{S^2}{2} \pm z_{1-\frac{\alpha}{2}} \sqrt{\frac{S^2}{n} + \frac{S^4}{2(n-1)}} \right)} Olsson은 작은 표본 크기에 대해 더 나은 결과를 제공하는 "수정된 콕스 방법"을 제안했는데, z_{1-\frac{\alpha}{2}} 를 t_{n-1, 1-\frac{\alpha}{2}} 로 대체한다. [4] 두 로그 정규 분포를 비교하는 경우(예: A/B 테스트 ), 각 표본에 로그를 취한 후 신뢰 구간을 구성하고 역변환하여 중앙값을 비교할 수 있다.CI(e^{\mu_1-\mu_2}):e^{\left(\hat \mu_1 - \hat \mu_2 \pm z_{1-\frac{\alpha}{2}} \sqrt{\frac{S_1^2}{n} + \frac{S_2^2}{n} } \right)} 이러한 신뢰 구간은 역학에서 상대 위험도와 오즈비의 신뢰 구간을 계산하는 데 사용된다. [44] 두 표본의 기댓값(평균) 비율에 대한 신뢰구간은 다음과 같이 Cox 방법을 유사하게 사용하여 구할 수 있다.CI\left( \frac{E(X_1)}{E(X_2)} = \frac{e^{\mu_1 + \frac{\sigma_1^2}{2}}}{e^{\mu_2 + \frac{\sigma_2^2}{2}}} \right):e^{\left((\hat \mu_1 - \hat \mu_2 + \frac{1}{2}S_1^2 - \frac{1}{2}S_2^2) \pm z_{1-\frac{\alpha}{2}} \sqrt{ \frac{S_1^2}{n_1} + \frac{S_2^2}{n_2} + \frac{S_1^4}{2(n_1-1)} + \frac{S_2^4}{2(n_2-1)} } \right)}
5. 응용
로그 정규 분포는 자연 현상을 설명하는 데 중요하며, 여러 작은 백분율 변화가 축적되는 자연 성장 과정에서 주로 나타난다. 이러한 현상은 기브라 법칙으로도 알려져 있으며, 기업의 성장에 적용된다. [48] 시간이 지남에 따라 성장하는 것들의 크기 분포는 로그 정규 분포를 따르는 경향이 있어, 건강한 개인의 측정에 대한 기준 범위를 추정하는 데 유용하다. 기본적인 자연 법칙이 양의 변수의 곱셈과 나눗셈을 포함한다는 점 또한 로그 정규 분포의 또 다른 근거를 제공한다. 예를 들어, 만유인력 법칙이나 용액 내 화학 물질의 평형 농도를 계산하는 공식 등이 이에 해당한다. 로그 정규 분포는 지질학, 생물학, 의학, 식품, 생태학 등 다양한 분야에서 활용된다. [49] 신경 과학 분야에서도 로그 정규 분포에 대한 연구가 진행되고 있다. [61]
5. 1. 인간 행동
인터넷 토론 포럼에 게시된 댓글의 길이, 사용자가 온라인 기사(농담, 뉴스 등)를 읽는 데 머무르는 시간, 체스 게임의 지속 시간은 로그 정규 분포를 따르는 경향을 보인다. [50] [51] [52] 표준 자극과 일치하는 음향 비교 자극의 시작 지속 시간도 로그 정규 분포를 따른다. [17]
5. 2. 생물학 및 의학
생체 조직의 크기 측정(길이, 피부 면적, 무게)과 질병의 잠복기는 로그 정규 분포를 따른다. [53] [54] 바나나 잎 반점, 보리의 흰가루병 직경도 마찬가지이다. [49] 2003년 SARS와 같이 전염성이 높은 유행병의 경우, 공공 개입 통제 정책이 포함되면 엔트로피를 가정하고 최대 엔트로피 생성률의 원리에 따라 표준 편차가 결정될 때 입원 환자 수는 자유 매개변수가 없는 로그 정규 분포를 만족하는 것으로 나타났다. [55] 생물 표본의 비활성 부속물(머리카락, 발톱, 손톱, 이빨)의 길이(성장 방향)도 로그 정규 분포를 따를 수 있다. 임의의 게놈 영역에 대한 정규화된 RNA-Seq 판독 수는 로그 정규 분포로 잘 근사화될 수 있다. PacBio 시퀀싱 판독 길이 역시 로그 정규 분포를 따른다. [56] 성인 남성/여성 하위 집단으로 분류한 후 혈압과 같은 특정 생리적 측정값, [57] 약물동력학 변수 중 Cmax , 제거 반감기 및 제거 속도 상수 등 여러 변수도 로그 정규 분포를 따른다. [58] 신경 과학에서 뉴런 집단 전체의 발화율 분포는 종종 로그 정규 분포에 가깝다. 이는 처음으로 피질과 선조체에서 관찰되었고 [59] 나중에 해마와 내후각 피질 [60] , 그리고 뇌의 다른 곳에서도 관찰되었다. [61] [62] 또한 본질적 이득 분포와 시냅스 가중치 분포도 로그 정규 분포를 따르는 것으로 보인다. [63] 신경 발생 과정 중 세포 분열 과정의 노이즈로 인한 대뇌 피질의 뉴런 밀도 역시 로그 정규 분포를 따른다. [64] 수술실 관리에서 수술 시간 분포도 로그 정규 분포를 따른다. 살아있는 세포의 세포 골격에서 골절 사태의 크기는 로그 정규 분포를 보이며, 암세포에서 건강한 세포보다 크기가 훨씬 크다. [65]
5. 3. 화학
로그 정규 분포는 다음과 같은 곳에 적용된다.입자 크기 분포 및 몰 질량 분포. 광물에서 희토류 원소의 농도. [66] 아이스크림의 결정 직경, 마요네즈의 기름 방울, 코코아 프레스 케이크의 기공. [49] 적합된 누적 로그 정규 분포는 연간 최대 1일 강우량에 적용된다. 분포 적합 참조
5. 4. 수문학
수문학 에서 로그정규분포는 일일 강우량 및 강수량의 월 최대값 및 연 최대값과 같은 변수의 극값을 분석하는 데 사용된다. [67] 오른쪽 그림은 CumFreq를 사용하여 만든 것으로, 연 최대 일일 강우량 순위에 로그정규분포를 적합시킨 예를 보여주며, 이항분포를 기반으로 한 90% 신뢰구간도 보여준다. [68] 강우량 데이터는 누적빈도 분석의 일부로 위치도표로 표현된다.
5. 5. 사회 과학 및 인구 통계
경제학 에서 인구의 97~99%의 소득은 로그 정규 분포를 따른다는 증거가 있다. [69] (고소득 개인의 소득 분포는 파레토 분포 를 따른다.) [70]소득 분포가 표준 편차가 \sigma 인 로그 정규 분포를 따른다면, 소득 불평등을 평가하는 데 일반적으로 사용되는 지니 계수 는 G = \operatorname{erf}\left(\frac{\sigma }{2 }\right) 로 계산할 수 있다. 여기서 \operatorname{erf} 는 오차 함수 이고, G=2 \Phi \left(\frac{\sigma }{\sqrt{2}}\right)-1 이며 \Phi(x) 는 표준 정규 분포의 누적 분포 함수이다. 과학계량학 에서 학술지 논문과 특허에 대한 인용 횟수는 이산 로그 정규 분포를 따른다. [74] [75]도시 규모(인구)는 기브라 법칙을 만족한다. [76] 도시 규모의 성장 과정은 비례적이며 규모에 따라 불변하므로, 중심 극한 정리 에 의해 도시 규모의 로그값은 정규 분포를 따른다. 성 파트너 수는 로그 정규 분포로 가장 잘 설명되는 것으로 보인다. [77]
5. 6. 기술
신뢰성 분석에서 로그 정규 분포는 유지 보수 가능한 시스템의 수리 시간을 모델링하는 데 자주 사용된다. [78] 무선 통신 에서 "dB 또는 네퍼와 같은 로그 값으로 표현된 국부 평균 전력은 정규(즉, 가우스) 분포를 갖습니다." [79] 또한, 높은 건물과 언덕으로 인한 무선 신호의 무작위적인 차단 현상인 섀도잉 은 종종 로그 정규 분포로 모델링된다.볼 밀링과 같이 무작위 충격으로 분쇄하여 생성된 입자 크기 분포. [80] 공개적으로 사용 가능한 오디오 및 비디오 데이터 파일(MIME 유형)의 파일 크기 분포는 5개의 차수 에 걸쳐 로그 정규 분포를 따른다. [81] 컴퓨터 네트워크 및 인터넷 트래픽 분석에서 로그 정규 분포는 단위 시간당 트래픽량을 나타내는 좋은 통계적 모델로 제시된다. 이는 대규모의 실제 인터넷 추적 데이터에 대해 강력한 통계적 접근 방식을 적용하여 입증되었다. 이러한 맥락에서 로그 정규 분포는 (1) 트래픽이 특정 수준을 초과할 시간의 비율 예측(서비스 수준 계약 또는 링크 용량 추정을 위해), 즉 대역폭 프로비저닝 기반 링크 크기 조정 및 (2) 95번째 백분위수 가격 예측의 두 가지 주요 사용 사례에서 우수한 성능을 보였다. [83] 지정된 조건에서 항목의 고장까지의 시간을 생성하는 물리적 시험에서 데이터는 종종 로그 정규 분포를 사용하여 분석하는 것이 가장 좋다. [84] [85]
참조
[1]
논문
Calculating CVaR and bPOE for common probability distributions with application to portfolio optimization and density estimation
http://uryasev.ams.s[...]
Springer
2023-02-27
[2]
웹사이트
Log Normal Distribution
https://mathworld.wo[...]
2020-09-13
[3]
웹사이트
1.3.6.6.9. Lognormal Distribution
https://www.itl.nist[...]
U.S. National Institute of Standards and Technology (NIST)
2020-09-13
[4]
논문
Maximum entropy autoregressive conditional heteroskedasticity model
http://www.wise.xmu.[...]
2011-06-02
[5]
학회
Multivariate Log–Normal Distribution
http://isi.cbs.nl/ia[...]
[6]
학회
The Lognormal Random Multivariate
http://www.casact.or[...]
[7]
논문
On a Property of the Lognormal Distribution
2010
[8]
서적
Probability and Measure
https://www.worldcat[...]
Wiley
2012
[9]
논문
The lognormal characteristic function, vol. 18, pp. 4539–4548, 1989
[10]
논문
Sums of independent lognormally distributed random variables
[11]
논문
On sums of lognormal random variables
http://dspace.mit.ed[...]
[12]
논문
On Lognormal Random Variables: I – The Characteristic Function
https://www.cambridg[...]
1991-01
[13]
논문
On the Laplace transform of the Lognormal distribution
https://link.springe[...]
[14]
논문
A method to integrate and classify normal distributions
[15]
논문
Geometric means and measures of dispersion
1979-12
[16]
논문
Lognormal distributions across the sciences: keys and clues
[17]
논문
Onset-Duration Matching of Acoustic Stimuli Revisited: Conventional Arithmetic vs. Proposed Geometric Measures of Accuracy and Precision
[18]
간행물
FAQ: Issues with Efficacy Analysis of Clinical Trial Data Using SAS
http://pharmasug.org[...]
[19]
논문
Head-to-head, randomised, crossover study of oral versus subcutaneous methotrexate in patients with rheumatoid arthritis: drug-exposure limitations of oral methotrexate at doses >=15 mg may be overcome with subcutaneous administration
[20]
서적
Interpretation and Uses of Medical Statistics
Wiley-Blackwell
[21]
웹사이트
ProbOnto
http://www.probonto.[...]
2017-07-01
[22]
논문
ProbOnto: ontology and knowledge base of probability distributions
[23]
서적
Probability Distributions
John Wiley & Sons, Inc.
[24]
서적
The BUGS book: a practical introduction to Bayesian analysis
CRC Press
[25]
논문
Log-normal distributions across the sciences: Keys and clues
[26]
논문
PopED - An extended, parallelized, population optimal design tool
[27]
논문
Development and implementation of the population Fisher information matrix for the evaluation of population pharmacokinetic designs
[28]
문서
PopED Manual, Release version 2.13
[29]
웹사이트
ProbOnto
http://probonto.org
[30]
논문
Modelling Heavy Tailed Phenomena Using a LogNormal Distribution Having a Numerically Verifiable Infinite Variance
2023-04-06
[31]
논문
Describing inequality in plant size or fecundity
[32]
논문
Design stream flows based on harmonic means
1990-07
[33]
논문
Asymptotics of Sums of Lognormal Random Variables with Gaussian Copula
https://hal.archives[...]
[34]
논문
A normal limit theorem for power sums of independent normal random variables
1967-11
[35]
학회
Accurate computation of the right tail of the sum of dependent log-normal variates
IEEE
[36]
arXiv
Orthonormal polynomial expansions and lognormal sum densities
2016
[37]
journal
The 3-Parameter Lognormal Distribution Applications in Hydrology
[38]
journal
Systems of Frequency Curves Generated by Methods of Translation
1949
[39]
journal
Near Lognormal Distribution
[40]
journal
Confidence intervals for the mean of a log-normal distribution
https://www.tandfonl[...]
[41]
웹사이트
How do I calculate a confidence interval for the mean of a log-normal data set?
https://stats.stacke[...]
2022-12-18
[42]
journal
Confidence intervals for linear functions of the normal mean and variance
[43]
journal
Confidence intervals for the log-normal mean
[44]
웹사이트
Confidence Intervals for Risk Ratios and Odds Ratios
https://sphweb.bumc.[...]
[45]
journal
Scaling Relations of Lognormal Type Growth Process with an Extremal Principle of Entropy
[46]
journal
Modelling the spreading rate of controlled communicable epidemics through an entropy-based thermodynamic model
[47]
journal
Using predictive Bayesian Monte Carlo- Markov Chain methods to provide a probabilistic solution for the Drake equation
[48]
journal
Gibrat's Legacy
1997-03
[49]
journal
Log-normal Distributions across the Sciences: Keys and Clues
2001
[50]
journal
Lognormal distributions of user post lengths in Internet discussions - a consequence of the Weber-Fechner law?
[51]
conference
Silence is also evidence: interpreting dwell time for recommendation from psychological perspective
http://mldm.ict.ac.c[...]
[52]
웹사이트
What is the average length of a game of chess?
http://chess.stackex[...]
2018-04-14
[53]
book
Problems of relative growth
London
[54]
journal
The distribution of incubation periods of infectious disease
[55]
journal
Modelling SARS data using threshold geometric process
2006
[56]
journal
PBSIM: PacBio reads simulator—toward accurate genome assembly
https://academic.oup[...]
2013-01-01
[57]
journal
Justification for the lognormal distribution as a model for blood pressure
[58]
journal
Common noncompartmental pharmacokinetic variables: are they normally or log-normally distributed?
https://www.tandfonl[...]
1997-01-01
[59]
conference
Diversity and stability in neuronal output rates
2006-10-08
[60]
journal
Preconfigured, skewed distribution of firing rates in the hippocampus and entorhinal cortex
2013-09-12
[61]
journal
The log-dynamic brain: how skewed distributions affect network operations
2017-01-06
[62]
journal
Population-wide distributions of neural activity during perceptual decision-making
2013-04-01
[63]
journal
Logarithmic distributions prove that intrinsic learning is Hebbian
2017-07-28
[64]
journal
Ubiquitous lognormal distribution of neuron densities in mammalian cerebral cortex
[65]
journal
A minimal rupture cascade model for living cell plasticity
https://iopscience.i[...]
2018-05-29
[66]
journal
The lognormal distribution of the elements (A fundamental law of geochemistry and its subsidiary)
https://dx.doi.org/1[...]
1954-02-01
[67]
book
Drainage Principles and Applications, Publication 16
https://archive.org/[...]
International Institute for Land Reclamation and Improvement (ILRI)
[68]
웹사이트
CumFreq, free software for distribution fitting
https://www.waterlog[...]
[69]
웹사이트
Pareto's law of income distribution: Evidence for Germany, the United Kingdom, and the United States
http://ideas.repec.o[...]
EconWPA
[70]
conference
Physics of Personal Income
Springer
2002-02-22
[71]
논문
The Pricing of Options and Corporate Liabilities
[72]
서적
The (mis-)Behaviour of Markets
https://books.google[...]
Basic Books
[73]
간행물
Advanced Option Pricing
University of Sydney
[74]
논문
Regression for citation data: An evaluation of different methods
[75]
논문
A Preferential Attachment Paradox: How Preferential Attachment Combines with Growth to Produce Networks with Log-normal In-degree Distributions
[76]
논문
Gibrat's Law for (All) Cities
https://www.jstor.or[...]
2004-00-00
[77]
논문
The Shape of the Distribution of the Number of Sexual Partners
https://onlinelibrar[...]
[78]
서적
Practical Reliability Engineering
John Wiley & Sons
[79]
웹사이트
Shadowing
http://wireless.per.[...]
[80]
논문
Packing Densities of Mixtures of Spheres with Log-normal Size Distributions
https://www.nature.c[...]
1972-07-00
[81]
논문
Neuropsychological constraints to human data production on a global scale
[82]
논문
A large-scale study of file-system contents
1999-05-01
[83]
논문
On the Distribution of Traffic Volumes in the Internet and its Implications
[84]
문서
Standard Test Method for Shear Adhesion on Pressure-Sensitive Tapesw
ASTM
[85]
문서
Standard Test Method for Compression Resistance of a container Under Constant Load
ASTM
[86]
서적
Continuous univariate distributions. Vol. 1
John Wiley & Sons
[87]
논문
Asymptotic Behavior of Tail Density for Sum of Correlated Lognormal Variables
[88]
논문
Prediction of the size distribution of secondary ejected droplets by crown splashing of droplets impinging on a solid wall
[89]
논문
On the infinite divisibility of the lognormal distribution
[90]
서적
エアロゾル学の基礎
森北出版
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com