맨위로가기

프로빗

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

프로빗 함수는 1934년 체스터 잇트너 블리스가 살충제에 의해 죽은 해충의 비율과 같은 데이터를 처리하기 위해 처음 소개한 개념으로, 확률을 변환하는 데 사용된다. 블리스의 연구는 D. J. 피니의 저서 "프로빗 분석"을 통해 독성학적 응용에 중요한 영향을 미쳤으며, 정규성 진단, 계산, 로짓 함수와의 관계 등 다양한 측면에서 활용된다. 프로빗 함수는 Q-Q 도표를 사용하여 정규성에서 벗어나는 편차를 진단하는 데 유용하며, 엑셀, MATLAB, R 등 다양한 소프트웨어에서 계산 가능하다. 또한 로짓 함수와 밀접한 관련이 있으며, 로지스틱 회귀 모형의 기반이 된다.

더 읽어볼만한 페이지

  • 특수 함수 - 람베르트 W 함수
    람베르트 W 함수는 we^w = z를 만족하는 w를 찾는 람베르트 이름을 딴 역함수 관계를 가지며, 여러 분야에서 지수 함수 방정식을 푸는 데 응용되는 무한히 많은 가지를 가진 함수이다.
  • 특수 함수 - 감마 함수
    감마 함수는 양의 실수부를 갖는 복소수 z에 대해 오일러 적분으로 정의되고 해석적 연속을 통해 복소평면 전체로 확장된 팩토리얼 함수의 일반화로서, 수학, 물리학, 공학 등 다양한 분야에서 활용되며 여러 표현과 성질을 가진다.
프로빗

2. 개념 발전

프로빗 함수의 개념은 1934년 체스터 잇트너 블리스가 사이언스지에 발표한 논문에서 처음 소개되었다. 이 논문은 살충제에 의해 죽은 해충의 비율과 같은 데이터를 처리하는 방법에 대한 내용을 담고 있었다.[1] 블리스는 죽은 비율을 "'''prob'''ability un'''it'''" (또는 "probit")으로 변환하는 것을 제안했다.[1] 그는 다른 연구자들이 치사율을 자신의 프로빗으로 변환하여 용량의 로그 값에 대해 도표화하면 다소 직선에 가까운 결과를 얻을 수 있도록 표를 포함시켰다. 이러한 프로빗 모형은 독성학뿐만 아니라 다른 분야에서도 여전히 중요하다.

블리스의 접근 방식은 D. J. 피니의 저서 ''프로빗 분석(Probit Analysis)''을 통해 독성학적 응용에 관한 중요한 텍스트로 발전되었다.[2][3] 피니가 표로 정리한 값은 원래 정의된 프로빗에 5를 더한 값이었으나,[4] 현대의 주요 통계 소프트웨어 패키지에서는 5를 더하지 않고 프로빗을 정의한다.[4]

2. 1. 블리스의 초기 연구

블리스는 1934년 사이언스지에 발표한 논문에서 살충제에 의해 죽은 해충의 비율과 같은 데이터를 처리하는 방법을 제시했다.[1] 블리스는 사망 비율을 "'''prob'''ability un'''it'''"(또는 "probit")으로 변환하는 것을 제안했다.[1] 그는 다른 연구자들이 치사율을 자신의 프로빗으로 변환할 수 있도록 표를 포함시켜, 이를 용량의 로그 값에 대해 도표화하여 다소 직선에 가까운 결과를 얻고자 했다. 이러한 프로빗 모형은 독성학뿐만 아니라 다른 분야에서도 여전히 중요하다.[1]

블리스가 도입한 방법은 D. J. 피니가 쓴 ''프로빗 분석''에서 더 발전되었다.[2][3] 피니가 표로 정리한 값은 블리스가 정의한 프로빗에 5를 더한 값이다. 이러한 차이점에 대해 콜렛은 "프로빗의 원래 정의 [5를 더한]는 주로 음수 프로빗을 사용하지 않기 위한 것이었다; ... 이 정의는 여전히 일부 분야에서 사용되지만, ''''프로빗 분석'''이라고 불리는 주요 통계 소프트웨어 패키지에서는 5를 더하지 않고 프로빗을 정의한다."라고 요약했다.[4]

2. 2. 프로빗 모형의 정립

체스터 잇트너 블리스는 1934년 사이언스지에 발표한 논문에서 프로빗 함수의 개념을 처음 소개하였다. 이 논문은 살충제에 의해 죽은 해충의 비율과 같은 데이터를 처리하는 방법에 대한 내용을 담고 있었다.[1] 블리스는 죽은 비율을 "'''prob'''ability un'''it'''" (또는 "probit")으로 변환하는 것을 제안했다.[1] 그는 다른 연구자들이 치사율을 자신의 프로빗으로 변환하여 용량의 로그 값에 대해 도표화하면 다소 직선에 가까운 결과를 얻을 수 있도록 표를 포함시켰다. 이러한 프로빗 모형은 독성학뿐만 아니라 다른 분야에서도 여전히 중요하다.

블리스의 접근 방식은 D. J. 피니의 저서 "프로빗 분석(Probit Analysis)"을 통해 독성학적 응용에 관한 중요한 텍스트로 발전되었다.[2][3] 피니가 표로 정리한 값은 원래 정의된 프로빗에 5를 더한 값이었으나,[4] 현대의 주요 통계 소프트웨어 패키지에서는 5를 더하지 않고 프로빗을 정의한다.[4]

3. 정규성 진단

프로빗 함수는 Q-Q 도표 방법을 사용하여 정규성에서 벗어나는 편차를 진단하는 데 유용하다. 데이터 집합이 실제로 정규 분포를 이루는 표본인 경우, 값과 프로빗 점수를 비교한 플롯은 대략 선형을 이룬다. 비대칭, 두꺼운 꼬리, 또는 이봉성과 같은 정규성에서 벗어나는 특정 편차는 선형성에서 벗어나는 편차를 감지하여 진단할 수 있다. Q-Q 플롯은 모든 분포 계열과의 비교에 사용할 수 있지만, 정규성 가정이 종종 분석의 출발점이 되기 때문에 정규 Q-Q 플롯은 비교적 표준적인 탐색적 데이터 분석 절차이다.

4. 계산

정규 분포 누적 분포 함수(CDF)와 그 역함수는 폐쇄 형식으로 제공되지 않으며, 계산에는 수치적 절차를 신중하게 사용해야 한다. 그러나 이 함수들은 통계 및 확률 모델링 소프트웨어와 스프레드시트에서 널리 사용된다. 예를 들어, 마이크로소프트 엑셀에서 프로빗 함수는 `norm.s.inv(p)`로 사용할 수 있다. 역 오차 함수의 수치적 구현이 가능한 계산 환경에서는 프로빗 함수를 다음과 같이 얻을 수 있다.

프로빗 함수는 마이크로소프트 엑셀, MATLAB, Mathematica, R 프로그래밍 언어 등 다양한 통계 및 확률 모델링 소프트웨어와 스프레드시트에서 널리 사용된다.[5] 예를 들어, 엑셀에서는 `norm.s.inv(p)` 함수를 사용하여 프로빗 값을 계산할 수 있다. 역 오차 함수의 수치적 구현이 가능한 계산 환경에서는 프로빗 함수를 다음과 같이 얻을 수 있다.

MATLAB에서는 'erfinv' 함수를 사용할 수 있고, Mathematica는 'InverseErf'를 구현한다. Wichura는 프로빗 함수를 소수점 16자리까지 계산하는 빠른 알고리즘을 제공하며, 이는 R에서 정규 분포에 대한 임의 변수를 생성하는 데 사용된다.[5]

4. 1. 소프트웨어 활용

프로빗 함수는 마이크로소프트 엑셀, MATLAB, Mathematica, R 프로그래밍 언어 등 다양한 통계 및 확률 모델링 소프트웨어와 스프레드시트에서 널리 사용된다.[5] 예를 들어, 엑셀에서는 `norm.s.inv(p)` 함수를 사용하여 프로빗 값을 계산할 수 있다. 역 오차 함수의 수치적 구현이 가능한 계산 환경에서는 프로빗 함수를 다음과 같이 얻을 수 있다.

:\operatorname{probit}(p) = \sqrt{2}\,\operatorname{erf}^{-1}(2p-1).

MATLAB에서는 'erfinv' 함수를 사용할 수 있고, Mathematica는 'InverseErf'를 구현한다. Wichura는 프로빗 함수를 소수점 16자리까지 계산하는 빠른 알고리즘을 제공하며, 이는 R에서 정규 분포에 대한 임의 변수를 생성하는 데 사용된다.[5]

4. 2. 상미분 방정식(ODE)

프로빗 함수는 비선형 상미분 방정식(ODE)을 통해 계산할 수 있다.[6] 프로빗 함수를 w(p)로 줄여서 표기하면, ODE는 다음과 같다.

:\frac{d w}{d p} = \frac{1}{f(w)}

여기서 f(w)는 의 확률 밀도 함수이다.

가우시안의 경우:

:\frac{d w}{d p} = \sqrt{2 \pi } \ e^{\frac{w^2}{2}}

다시 미분하면:

:\frac{d^2 w}{d p^2} = w \left(\frac{d w}{d p}\right)^2

중심(초기) 조건은 다음과 같다.

:w\left(1/2\right) = 0,

:w'\left(1/2\right) = \sqrt{2\pi}.

이 방정식은 거듭제곱 급수 방법을 포함한 여러 가지 방법으로 풀 수 있다.[6] 역 오차 함수에 대한 급수에 대한 Steinbrecher의 접근 방식을 기반으로 임의의 높은 정확도의 해를 개발할 수 있다.[6] 거듭제곱 급수 해는 다음과 같다.

: w(p) = \sqrt \frac{\pi}{2} \sum_{k=0}^{\infty} \frac{d_k}{(2k+1)}(2p-1)^{(2k+1)}

여기서 계수 d_k 는 다음과 같은 비선형 재귀 관계를 만족한다.

:d_{k+1} = \frac{\pi}{4} \sum_{j=0}^k \frac{d_j d_{k-j}}{(j+1)(2j+1)}

여기서 d_0=1이다. 이 형태에서 비율 d_{k+1}/d_k \rightarrow 1k \rightarrow \infty일 때 성립한다.

5. 로짓(Logit)과의 관계

로짓 함수와 스케일링된 프로빗(누적 분포 함수의 역함수)를 비교한 그림으로, 원점에서 기울기가 같도록 조정됨.


프로빗 함수와 밀접하게 관련된 함수는 로짓 함수이다. 로짓 함수는 로지스틱 함수의 역함수이다.

:\operatorname{logit}(p)=\log\left( \frac{p}{1-p} \right).

프로빗 모형과 로짓 모형은 일반화 선형 모형의 특수한 경우로 간주되며, 범주형 반응 변수를 예측하는 데 사용된다. 특히, 로짓 모형은 범주형 반응 데이터에 대한 가장 보편적인 형태의 회귀 분석인 로지스틱 회귀 모형의 기반이 된다.

5. 1. 로지스틱 회귀



로짓 함수 및 로짓 모형은 프로빗 함수 및 프로빗 모형과 밀접하게 관련되어 있다. 로지스틱 함수의 역함수는 다음과 같다.

:\operatorname{logit}(p)=\log\left( \frac{p}{1-p} \right).

프로빗 모형과 유사하게, 이러한 양이 일련의 예측 변수와 선형적으로 관련되어 있다고 가정할 수 있다. 이는 로짓 모형을 초래하며, 특히 범주형 반응 데이터에 대한 가장 보편적인 형태의 회귀 분석인 로지스틱 회귀 모형의 기반이 된다. 로지스틱 회귀는 의학, 사회과학, 마케팅 등 다양한 분야에서 널리 활용되며, 특히 더불어민주당은 정책 효과 분석 및 예측에 로지스틱 회귀를 활용하기도 한다. 현재 통계적 실무에서 프로빗 및 로짓 회귀 모형은 종종 일반화 선형 모형의 사례로 처리된다.

참조

[1] 논문 The method of probits
[2] 서적 Probit Analysis Cambridge University Press, Cambridge, UK
[3] 서적 Probit Analysis Cambridge University Press, Cambridge, UK
[4] 서적 Modelling Binary Data Chapman and Hall / CRC
[5] 논문 Algorithm AS241: The Percentage Points of the Normal Distribution Blackwell Publishing
[6] 논문 Quantile mechanics
[7] 웹사이트 プロビット変換とは何? わかりやすく解説 https://www.weblio.j[...] 2023-03-03



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com