최대 사후 확률
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
최대 사후 확률(MAP)은 베이즈 정리를 사용하여 모수의 사후 확률 분포를 계산하고, 사후 확률 분포의 최빈값을 해당 모수의 추정치로 사용하는 방법이다. 관측된 데이터를 기반으로 미지의 모수를 추정할 때, MAP 추정은 사전 확률과 우도 함수를 결합하여 추정치를 구한다. 최대 우도 추정(MLE)과 비교하여, MAP는 사전 확률을 고려하여 추정의 정확성을 높일 수 있다. MAP 추정은 해석적 방법, 수치적 최적화, EM 알고리즘 또는 몬테카를로 방법을 사용하여 계산될 수 있다. MAP 추정은 베이즈 추정의 특수한 경우이며, 다중 모드 사후 분포, 재매개변수화의 문제, 그리고 특정 손실 함수에 대한 최적성이 부족하다는 한계를 갖는다. 정규 분포의 예시를 통해 MAP 추정의 계산 과정을 이해할 수 있다.
더 읽어볼만한 페이지
- 베이즈 추정 - 신용 구간
신용 구간은 확률 분포에서 계산되는 구간으로, 베이즈 신용 구간은 모수가 특정 값을 가질 확률을, 빈도주의 신뢰 구간은 신뢰 구간이 모수를 포함할 비율을 나타내며, 불필요한 변수 처리 방식 등에서 차이를 보인다. - 베이즈 추정 - 마르코프 연쇄 몬테카를로
마르코프 연쇄 몬테카를로(MCMC) 방법은 알려진 함수에 비례하는 확률 밀도를 가진 확률 변수에서 표본을 추출하는 알고리즘으로, 수치 해석, 베이즈 통계, 계산 물리학 등 다양한 분야에서 활용된다. - 추정 이론 - 기댓값 최대화 알고리즘
- 추정 이론 - 델파이 기법
델파이 기법은 전문가들의 의견을 반복적인 피드백을 통해 수렴하여 문제를 해결하는 하향식 의견 도출 방법으로, 익명성, 정보 흐름의 구조화, 정기적인 피드백을 특징으로 하며 다양한 분야에서 활용된다. - 베이즈 통계학 - 주관주의
주관주의는 현실이 인식에 의존한다는 철학적 입장으로, 형이상학에서는 궁극적 실재가 인식에 달려있다고 보며, 윤리학에서는 윤리적 판단이 개인의 태도에 따라 달라진다고 보고, 확률론에서는 확률을 개인의 신념으로 해석한다. - 베이즈 통계학 - 사후 확률
사후 확률은 베이즈 통계학에서 증거가 주어졌을 때 모수의 확률을 나타내며, 베이즈 정리를 통해 계산하고, 사전 확률을 갱신하여 사후 확률 분포를 얻는 데 활용된다.
최대 사후 확률 | |
---|---|
개요 | |
최대 사후 확률 추정 | |
유형 | 점추정 |
모수적/비모수적 | 모수적 |
관련 항목 | 최대가능도 추정 베이즈 추정 |
2. 방식
어떤 모수 의 사전 확률 분포가 로 주어져 있고, 그 모수에 기반한 조건부 확률분포 와 그 분포에서 수집된 값 가 주어져 있다고 하자. 이때 모수의 사후 확률분포는 베이즈 정리에 의해 다음과 같이 계산할 수 있다.
:
여기에서 가 주어져 있기 때문에 분모는 에 대해 상수가 된다. 최대 사후 확률 모수는 다음과 같이 정의된다.
:
최대우도의 정의 와 비교해보면, 최대 사후 확률은 사전 확률 가 추가되었다는 것을 볼 수 있다.
의 관측을 기반으로 미지의 모집단 파라미터 를 추정하려 한다. 의 표본 분포를 라고 하면, 모집단 파라미터를 로 했을 때 의 확률은 가 된다. 그러면
:
라는 함수는 우도 함수이며,
:
는 의 최대 우도 추정이다.
여기서, 의 사전 분포를 라고 한다. 그러면, 를 베이즈 추정에서의 확률 변수로 취급할 수 있다. 의 사후 확률은 베이즈 정리에 의해 다음과 같이 구할 수 있다.
:
여기서 는 의 밀도 함수, 는 의 정의역이다.
최대 사후 확률 추정 방법에서는, 를 이 확률 변수의 사후 분포의 최빈값으로 추정한다.
:
사후 분포의 분모는 에 의존하지 않으므로, 최적화에 아무런 역할도 하지 않는다. 의 MAP 추정에서 사전 분포 가 균등 분포인 경우의 결과는 최대 우도 추정에 일치한다. MAP 추정은 균등 손실 함수에서의 베이즈 추정 함수이다.
MAP 추정의 계산은 해석적으로 풀거나 수치적으로 계산할 수 있다.
- 폐형식으로 사전 분포의 최빈값이 주어질 때, 해석적으로 풀 수 있다. 이 경우, 공액 사전 분포를 사용한다.
- 수치적 최적해를 얻기 위해서는
- 범용 최적화 문제의 알고리즘을 사용한다. 예를 들어, 경사 하강법 ( 켤레 기울기법이나 준 뉴턴법 등)이 있다. 경사 하강법의 경우에는 도함수가 필요하며, 그것을 해석적 또는 수치적으로 계산할 필요가 있다.
- EM 알고리즘을 변형하여 사용한다. 이 경우, 사후 분포의 도함수는 불필요하다.
- 마르코프 연쇄 몬테카를로법 등의 샘플링법을 사용한다.
3. 설명
어떤 모수 의 사전 확률 분포가 로 주어져 있고, 그 모수에 기반한 조건부 확률분포 와 그 분포에서 수집된 값 가 주어져 있다고 가정한다. 이때 모수의 사후 확률분포는 베이즈 정리에 의해 다음과 같이 계산할 수 있다.[1]
:
여기에서 가 주어져 있기 때문에 분모는 에 대해 상수가 된다. 최대 사후 확률 모수는 다음과 같이 정의된다.[1]
:
최대우도의 정의 와 비교해보면, 최대 사후 확률은 사전 확률 가 추가되었다는 것을 볼 수 있다.[1]
의 관측을 기반으로 미지의 모집단 파라미터 를 추정하려 할 때, 의 표본 분포를 라고 하면, 모집단 파라미터를 로 했을 때 의 확률은 가 된다. 그러면
:
라는 함수는 우도 함수이며,
:
는 의 최대 우도 추정이다.[1]
여기서, 의 사전 분포를 라고 하고, 를 베이즈 추정에서의 확률 변수로 취급하면, 의 사후 확률은 베이즈 정리를 통해 다음과 같이 구할 수 있다.[1]
:
여기서 는 의 밀도 함수, 는 의 정의역이다.[1]
최대 사후 확률 추정 방법에서는, 를 이 확률 변수의 사후 분포의 최빈값으로 추정한다.[1]
:
사후 분포의 분모는 에 의존하지 않으므로, 최적화에 아무런 역할도 하지 않는다. 의 MAP 추정에서 사전 분포 가 균등 분포인 경우의 결과는 최대 우도 추정에 일치한다. MAP 추정은 균등 손실 함수에서의 베이즈 추정 함수이다.[1]
4. 계산
최대 사후 확률(MAP) 추정은 해석적 방법과 수치적 방법으로 계산할 수 있다.
- 해석적 방법: 사후 밀도의 최빈값이 폐쇄 형식으로 주어질 때 사용하며, 주로 켤레 사전 확률이 사용되는 경우이다.
- 수치적 방법:
- 켤레 기울기 방법이나 뉴턴 방법과 같은 수치적 최적화 방법을 사용한다. 이 방법들은 일반적으로 1차 또는 2차 도함수를 필요로 하며, 분석적 또는 수치적으로 평가해야 한다.
- EM 알고리즘을 수정하여 사용한다. 이 방법은 사후 밀도의 도함수를 필요로 하지 않는다.
- 모의 담금질을 이용한 몬테카를로 방법을 사용한다.
의 관측을 기반으로 미지의 모집단 파라미터 를 추정하려 할 때, 의 표본 분포를 라고 하면, 모집단 파라미터를 로 했을 때 의 확률은 가 된다. 그러면
:
라는 함수는 우도 함수이며,
:
는 의 최대 우도 추정이다.
의 사전 분포를 라고 하면, 를 베이즈 추정에서의 확률 변수로 취급할 수 있다. 의 사후 확률은 다음과 같다.
:
여기서 는 의 밀도 함수, 는 의 정의역이다. 이것은 베이즈 정리의 직접적인 응용이다.
최대 사후 확률 추정에서는 를 이 확률 변수의 사후 분포의 최빈값으로 추정한다.
:
사후 분포의 분모는 에 의존하지 않으므로 최적화에 영향을 주지 않는다. 의 MAP 추정에서 사전 분포 가 균등 분포인 경우의 결과는 최대 우도 추정에 일치한다. MAP 추정은 균등 손실 함수에서의 베이즈 추정 함수이다.
4. 1. 해석적 방법
어떤 모수 의 사전 확률 분포가 로 주어져 있고, 그 모수에 기반한 조건부 확률분포 와 그 분포에서 수집된 값 가 주어져 있을 때, 베이즈 정리를 통해 모수의 사후 확률분포를 계산할 수 있다.:
가 주어져 있으므로 분모는 에 대해 상수가 된다. 최대 사후 확률 모수는 다음과 같이 정의된다.
:
최대우도의 정의 와 비교하면, 최대 사후 확률은 사전 확률 가 추가된 것을 알 수 있다.
최대 사후 확률(MAP) 추정은 사후 밀도의 최빈값이 폐쇄 형식으로 주어질 수 있을 때 해석적 방법으로 계산할 수 있다. 주로 켤레 사전 확률이 사용될 때 해당된다.
4. 2. 수치적 방법
최대 사후 확률(MAP) 추정은 다음과 같은 방법으로 계산할 수 있다.- 해석적 방법: 사후 밀도의 최빈값이 폐쇄 형식으로 주어질 때 사용한다. 주로 켤레 사전 확률이 사용되는 경우이다.
- 수치적 방법:
- 켤레 기울기 방법이나 뉴턴 방법과 같은 수치적 최적화 방법을 사용한다. 이 방법들은 일반적으로 1차 또는 2차 도함수를 필요로 하며, 분석적 또는 수치적으로 평가해야 한다.
- EM 알고리즘을 수정하여 사용한다. 이 방법은 사후 밀도의 도함수를 필요로 하지 않는다.
- 모의 담금질을 이용한 몬테카를로 방법을 사용한다.
4. 2. 1. 켤레 기울기 방법
최대 사후 확률(MAP) 추정은 켤레 기울기 방법과 같은 수치적 최적화 방법으로 계산할 수 있다. 이 방법은 일반적으로 첫 번째 또는 두 번째 도함수를 필요로 하며, 이는 분석적 또는 수치적으로 평가해야 한다.[1]4. 2. 2. 뉴턴 방법
MAP 추정은 수치적 최적화를 이용하여 계산할 수 있다. 예를 들어 켤레 기울기 방법 또는 뉴턴 방법을 사용한다. 이 방법은 일반적으로 1차 또는 2차 도함수가 필요하며, 이는 분석적 또는 수치적으로 평가해야 한다.4. 2. 3. 기대값 최대화 알고리즘 (EM 알고리즘)
EM 알고리즘을 변형하는 것은 최대 사후 확률(MAP) 추정을 계산하는 방법 중 하나이다. 이 방법을 사용하면 사후 밀도의 도함수가 필요하지 않다.4. 2. 4. 몬테카를로 방법
모의 담금질을 이용한 몬테카를로 방법으로 최대 사후 확률(MAP) 추정을 계산할 수 있다.5. 한계
MAP 추정은 베이즈 추정의 극한적인 경우에 해당하지만,[1] 일반적으로 베이즈 방법론을 대표하지는 않는다. MAP 추정은 점 추정치이고, 기준 척도의 임의적인 선택에 의존하는 반면, 베이즈 방법은 분포를 사용하여 데이터를 요약하고 추론을 도출하기 때문이다. 베이즈 방법은 사후 평균 또는 중앙값을 신뢰 구간과 함께 보고하는 경향이 있다. 이러한 추정기는 제곱 오차와 선형 오차 손실 하에서 각각 최적이며, 연속적인 사후 분포의 경우 MAP가 최적의 점 추정치임을 시사하는 손실 함수가 없다. 또한, 사후 밀도는 종종 간단한 분석적 형식을 갖지 못하여, 마르코프 연쇄 몬테카를로 기법을 사용해야 할 수 있지만, 최빈값을 찾기 위한 최적화는 어렵거나 불가능할 수 있다.
혼합 모델과 같은 많은 유형의 모델에서 사후는 다중 모드일 수 있다. 이 경우 가장 높은 최빈값을 선택하는 것이 일반적이지만, 이는 항상 실행 가능하거나 가능한 것은 아니다. 또한, 가장 높은 최빈값은 특히 많은 차원에서 사후의 대부분을 특징짓지 않을 수 있다.
MAP 추정은 재매개변수화에 불변하지 않다. 하나의 매개변수화에서 다른 매개변수화로 전환하면 최대값의 위치에 영향을 미치는 야코비안이 도입된다.[2] 반대로, 베이즈 사후 기대값은 재매개변수화에 불변하다.
베이즈 추정기 (평균 및 중앙값 추정기)와 MAP 추정치를 사용하는 것의 차이점을 예로 들어보자. 입력 를 양성 또는 음성으로 분류해야 하는 경우, 세 가지 가능한 가설 , , 이 있고, 각각 사후 확률이 0.4, 0.3, 0.3이라고 가정한다. 새로운 인스턴스 가 주어지면, 은 양성, 나머지 두 개는 음성으로 분류한다. MAP 추정치를 사용하면 는 양성으로 분류되지만, 베이즈 추정기는 모든 가설에 대해 평균을 내어 를 음성으로 분류한다.
6. 정규 분포에서의 예
의 독립 동일 분포 확률 변수 시퀀스와 의 사전 분포가 로 주어졌다고 가정한다. 이때, 의 최대 사후 확률(MAP) 추정값을 구하는 과정은 다음과 같다. 정규 분포는 자체 켤레 사전 분포이므로, 폐쇄형 해를 분석적으로 찾을 수 있다.
최대화할 함수는 다음과 같다.[3]
:
이는 의 다음 함수를 최소화하는 것과 같다.
:
따라서, μ에 대한 MAP 추정량은 다음과 같다.[3]
:
이는 사전 평균과 표본 평균 사이의 선형 보간법이며, 각 분산으로 가중치가 부여된다.
의 경우를 비정보적 사전 분포라고 하며, 이는 부적절한 확률 분포로 이어진다. 이 경우
참조
[1]
논문
Maximum a posteriori estimators as a limit of Bayes estimators
2018-01-30
[2]
서적
Machine learning : a probabilistic perspective
MIT Press
2012
[3]
서적
Essentials of Statistical Inference
https://www.cambridg[...]
Cambridge University Press
2005
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com