기댓값
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
기댓값은 확률 변수의 르베그 적분으로 정의되며, 이산 확률 변수의 경우 각 사건의 값과 확률을 곱한 값의 합으로, 연속 확률 변수의 경우 확률 밀도 함수를 사용하여 계산된다. 기댓값은 표본 평균의 무편향 추정, 의사 결정 이론에서의 효용 함수 기댓값 최대화, 사건의 확률 계산, 몬테카를로 방법, 고전 역학의 질량 중심, 양자 역학의 연산자 기댓값 등 다양한 분야에서 활용된다.
더 읽어볼만한 페이지
- 확률론 - 확률 밀도 함수
확률 밀도 함수는 연속 확률 변수의 확률 분포를 나타내는 함수로, 특정 구간에서 확률 변수가 값을 가질 확률은 해당 구간에 대한 함수의 적분으로 계산되며, 통계적 특성 계산 및 변수 변환 등에 활용되어 불확실성 모델링 및 분석에 중요한 역할을 한다. - 확률론 - 체비쇼프 부등식
체비쇼프 부등식은 확률 변수가 평균에서 얼마나 멀리 떨어져 있는지에 대한 확률의 상한을 제공하는 부등식으로, 이레네-쥘 비네메가 처음 공식화하고 체비쇼프와 안드레이 마르코프에 의해 일반화 및 증명되었으며, 확률론적 표현 외에도 측도 공간에 대한 명제로 확장될 수 있다.
기댓값 | |
---|---|
통계적 측도 | |
위치 측도 | 기댓값 |
확률 변수 X | |
표기 | E(X) |
정의 | 이산 확률 변수: E(X) = ∑ [x * P(x)] 연속 확률 변수: E(X) = ∫ [x * f(x) dx] |
관련 개념 | |
관련 개념 | 중심 경향치 평균 분산 적률 생성 함수 |
2. 정의
확률공간 위의 실수값 확률 변수 의 '''기댓값''' 은 르베그 적분으로 정의된다.
:
- 이산 확률 변수의 경우, 기댓값은 가능한 모든 사건에 대해 사건의 값과 확률을 곱한 값의 합으로 계산된다.
:
- 여기서 는 가능한 모든 사건, 는 사건이 일어날 확률을 의미한다.
- 연속 확률 변수의 경우, 기댓값은 확률밀도함수를 사용하여 적분으로 계산된다.
:
- 이 때 는 확률밀도함수를 나타낸다.
확률 공간 에서,
:
- 확률 변수 가 실수 등 연속값을 취할 때 (비가산 무한) (연속형 확률 변수), 적분 가능한 확률 변수 의 기댓값은 다음과 같이 정의된다.
:
- 단, 확률 변수 가 적분 가능하다는 것은 다음을 만족하는 것을 의미한다.
:
사건 에 대해, 기댓값을 취하는 범위를 로 제한할 수 있다.
:
- 여기서 는 지시 함수이다.
일본 산업 규격(JIS)에서는 이산 확률 분포와 연속 확률 분포에 대한 기댓값을 정의하고 있다.
다수의 측정을 수행하여 측정값의 평균을 구하면 기댓값에 가까운 값이 된다. 함수 의 기댓값 도 마찬가지로 정의하고 있다. 또한, 조건부 분포의 기댓값을 조건부 기대값이라고 하며, 의 결합 분포에 관해, 조건 하에서의 의 조건부 기대값이 의 함수가 된다는 것, 확률 변수 의 기댓값을 의 모평균이라고 소개하고 있다.[14]
3. 역사
기댓값 개념은 17세기 중반, 게임이 끝나기 전에 판돈을 "공정하게" 나누는 방법을 찾는 점 문제 연구에서 비롯되었다.[4] 이 문제는 수 세기 동안 논쟁거리였으며, 1654년 프랑스 작가이자 아마추어 수학자인 슈발리에 드 메레가 블레즈 파스칼에게 이 문제를 제기하면서, 이전까지 여러 다른 제안과 해결책이 나왔지만, 현실 세계에 적용했을 때 수학에 결함이 있다고 주장하였다. 파스칼은 피에르 드 페르마와 함께 이 문제를 논의하며, 미래 이득의 가치는 그것을 얻을 확률에 비례한다는 원칙에 따라 문제를 해결했다. 그러나 이들은 결과를 출판하지 않고, 파리의 소규모 과학자들에게만 알렸다.[5]
크리스티안 하위헌스는 1657년에 출판한 확률 이론에 관한 논문 "''De ratiociniis in ludo aleæ''"에서 파스칼과 페르마의 해결책과 같은 원칙에 기초하여 점 문제를 해결하고, 세 명 이상의 플레이어와 같이 더 복잡한 상황에서도 기댓값을 계산하는 방법을 제시하여 기댓값의 개념을 확장했다. 이는 확률 이론의 기초를 마련하려는 최초의 성공적인 시도로 평가받는다. 하위헌스는 자신의 논문 서문에서, 이 계산법이 자신만의 고유한 것이 아니라 프랑스의 여러 수학자들이 이미 연구해 온 내용임을 밝혔다.
19세기 중반, 파프누티 체비쇼프는 확률 변수의 기댓값 관점에서 체계적으로 사고한 최초의 인물이다.[6]
3. 1. 어원
피에르시몽 라플라스는 1814년에 발표한 "확률의 해석적 이론"(Théorie analytique des probabilités프랑스어)이라는 논문에서 기댓값의 개념을 명시적으로 정의했다.[8]하위헌스는 현대적인 의미의 "기댓값"이라는 용어를 사용하지 않았다.[7]
3. 2. 표기법
"기댓값"을 나타내기 위해 문자 E를 사용하는 것은 1901년 윌리엄 앨런 휘트워스로 거슬러 올라간다.[9] 이 기호는 그 이후 영어권 작가들에게 널리 사용되게 되었다. 독일어에서는 E가 'Erwartungswert'(기대값)를, 스페인어에서는 'esperanza matemática'(수학적 기대)를, 프랑스어에서는 'espérance mathématique'(수학적 기대)를 의미한다.[10]"E"가 "기댓값"을 나타내는 데 사용될 때, 저자들은 다양한 스타일을 사용한다. 기대값 연산자는 E (정체), *E* (이탤릭체) 또는 (블랙보드 볼드체)로 스타일화될 수 있으며, E(*X*), E[*X*], E*X*와 같은 다양한 괄호 표기법이 모두 사용된다.
또 다른 인기 있는 표기법은 μ*X*이다. ⟨*X*⟩, ⟨*X*⟩av 및 는 물리학에서 일반적으로 사용된다. M(*X*)는 러시아어 문헌에서 사용된다.
4. 성질
기댓값은 선형 연산자이며, 다음과 같은 성질을 갖는다.[12]
- 선형성: 임의의 확률 변수 ''X'', ''Y''와 상수 ''a''에 대해 다음이 성립한다.
:: (가산성)
:: (동차성)
- : 수학적 귀납법에 의해, 유한 개의 확률 변수 와 상수 (1≤i≤N)에 대해 다음이 성립한다.
::
- 단조성: (a.s.)이고, 와 가 모두 존재한다면, 이다.
- 비퇴화성: 이면, (a.s.)이다.
- 독립 확률 변수의 곱: 두 확률 변수 ''X''와 ''Y''가 독립이면, 가 성립한다.
또한, 기댓값과 관련하여 다음과 같은 부등식들이 성립한다.
5. 계산법
확률공간 \((P,\mathcal P,\mu)\) 위의 실수값 확률 변수 \(X\colon P\to\mathbb R\)의 기댓값 \(\operatorname{E}[X]\)은 르베그 적분으로 정의된다.
:\(\operatorname E[X]=\int_PX\,d\mu\)
이산 확률 변수의 경우, 기댓값은 다음과 같이 계산된다.
:\(\operatorname{E}[X] = \sum_i p_i x_i\)
여기서 \(x_i\)는 가능한 모든 사건, \(p(x_i)\)는 \(x_i\) 사건이 일어날 확률을 의미한다.
연속 확률 변수의 경우, 기댓값은 다음과 같이 계산된다.
:\(\operatorname{E}[X] = \int_{-\infty}^\infty x f(x)\ \operatorname{d}x\)
이 때 \(f(x)\)는 확률밀도함수를 나타낸다.
연속형 확률 변수의 기댓값은 르베그 적분으로 정의되지만, 실제 계산에서는 확률 변수의 분포로 적분하는 변수 변환을 사용한다. 확률 변수 \(X\)의 분포를 \(P_X\)라고 하면, 임의의 가측 함수 \(f\)에 대해 다음이 성립한다.
:\(E[f(X)] = \int_{\Omega} f(X( \omega ))\, dP( \omega ) = \int_{\mathbb{R}} f(x)\, P_X (dx)\)
\(P_X\)가 확률 밀도 함수 \(p\)를 가질 때는 다음과 같이 르베그 측도로 계산할 수 있다.[11]
:\(E[f(X)] = \int_{\mathbb{R}} f(x)p(x)\, dx\)
6. 예
예를 들어, 주사위를 한 번 던졌을 때, 각 눈의 값이 나올 확률은 1/6이고, 주사위값의 기댓값은 각 눈의 값에 그 확률을 곱한 값의 합인 3.5가 된다.[14]
좀 더 구체적으로 설명하면, 가 공정한 6면 주사위를 던진 결과를 나타낸다고 할 때, 는 주사위를 던진 후 주사위 윗면에 나타나는 눈금의 숫자가 된다. 의 가능한 값은 1, 2, 3, 4, 5, 6이며, 이들은 모두 1/6의 확률로 동일하게 나타날 가능성이 있다. 이때 기댓값은 다음과 같다.
:
만약 주사위를 번 던져 그 결과의 평균(산술 평균)을 계산하면, 이 증가함에 따라 평균은 거의 확실하게 기대값으로 수렴하게 되는데, 이는 대수의 강한 법칙으로 알려진 사실이다.
다음과 같은 게임을 생각해 볼 수 있다.
- 100엔을 지불하면 6면체 주사위 1개를 1회 던질 수 있다.
- 주사위 눈에 따라 다음 금액을 받는다.
나온 눈 | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
받는 금액 (엔) | 20 | 50 | 100 | 100 | 150 | 150 |
이때 받을 수 있는 금액의 기댓값은 다음과 같다.
:
따라서, 참가비 100JPY보다 적다. 이로부터, 이 게임은 시행 횟수를 늘려갈수록 평균적으로 1회당 5JPY의 손해를 보며, 횟수를 늘릴수록 손해라고 할 수 있다. (대수의 법칙)
7. 활용
통계학에서 표본 평균은 기댓값의 추정치로 사용되며, 무편향 추정량으로서 중요한 역할을 한다. 즉, 추정치의 기댓값은 기본 모수의 참값과 같다.[1] 표본 평균은 한국의 여론 조사, 인구 조사 등에서 활용될 수 있다.
의사 결정 이론에서 불완전한 정보 하에서 최적의 선택을 위해 효용 함수의 기댓값을 최대화하는 방법이 사용된다.[1] 이는 한국의 투자 결정, 정책 결정 등에서 활용될 수 있다.
사건의 지시 함수를 이용하여 확률을 기댓값으로 표현하고, 대수의 법칙을 통해 확률을 빈도로 추정할 수 있다.[1] 이는 한국의 보험료 산정, 위험 평가 등에서 활용될 수 있다.
몬테카를로 방법을 통해 통계적 추정 및 기계 학습에서 기댓값을 추정할 수 있다.[1] 이는 한국의 인공지능 개발, 데이터 분석 등에서 활용될 수 있다.
고전 역학에서 질량 중심은 기댓값과 유사한 개념이다.[1] 예를 들어, ''X''가 값 ''xi''와 해당 확률 ''pi''를 갖는 이산 랜덤 변수라고 가정할 때, 가중치가 없는 막대에 무게를 놓고, 막대 위의 위치 ''xi''에 무게 ''pi''(그 합이 1)를 놓으면 막대가 균형을 이루는 지점은 E[''X'']이다.
양자 역학에서 양자 역학적 연산자 가 양자 상태 벡터 에 작용하는 기댓값은 로 작성된다.[1]
8. 흔히 사용되는 분포의 기댓값
다음은 몇 가지 흔히 사용되는 확률 분포의 기댓값 표이다.
9. 확률 변수의 수렴과 기댓값
확률 변수 수열이 점별 수렴하더라도, 그 극한의 기댓값과 기댓값의 극한이 항상 일치하는 것은 아니다. 예를 들어, 구간 [0,1]에서 균등 분포를 따르는 확률 변수 U에 대해 확률 변수 수열을 와 같이 정의할 수 있다. 여기서 는 사건 A의 지시 함수이다. 이 경우, X_n은 0으로 점별 수렴하지만, 각 n에 대해 E[X_n]은 1이므로, 극한과 기댓값의 순서를 바꿀 수 없다.
일반적인 확률 변수 수열 Y_n에 대해서도 기댓값 연산자는 σ-가산적이지 않다. 즉, 다음 식이 항상 성립하지는 않는다.
그러나 극한과 기댓값의 순서를 바꿀 수 있는 조건을 제시하는 여러 정리들이 존재한다.
- 단조 수렴 정리: X_n이 각 n에 대해 0 ≤ X_n ≤ X_{n+1} (a.s.)를 만족하는 확률 변수 수열이고, X_n → X가 점별 수렴하면, lim_nE[X_n]=E[X]가 성립한다.
- 파투 보조정리: X_n이 음이 아닌 확률 변수 수열이면, 다음 부등식이 성립한다.
E[liminf_n X_n] ≤ liminf_n E[X_n].
- 지배 수렴 정리: X_n이 확률 변수 수열이고, X_n→ X가 점별로 수렴하며, |X_n|≤ Y ≤ +∞ (a.s.)이고, E[Y]<∞이면, 다음이 성립한다.
- E|X| ≤ E[Y] <∞
- lim_nE[X_n]=E[X]
- lim_nE|X_n - X| = 0
- 균등 적분 가능성: 확률 변수 수열 {X_n}이 균등 적분 가능하면, lim_nE[X_n]=E[lim_n X_n]이 성립한다.
10. 특성 함수와의 관계
확률 밀도 함수 는 스칼라 확률 변수 의 특성 함수 와 다음 역변환 공식을 통해 관련되어 있다.
:
가 보렐 함수일 때, 의 기댓값을 구하기 위해 다음 역변환 공식을 사용할 수 있다.
:
만약 가 유한하다면, 적분 순서를 바꿀 수 있으며, 이는 푸비니-토넬리 정리에 따라 다음과 같이 표현할 수 있다.
:
여기서 는 의 푸리에 변환이다. 에 대한 이 식은 플랑셰렐 정리로부터 직접 유도될 수도 있다.
참조
[1]
웹사이트
Expectation {{!}} Mean {{!}} Average
https://www.probabil[...]
2020-09-11
[2]
웹사이트
PROBABILITY AND STATISTICS FOR ECONOMISTS
https://web.archive.[...]
2021-07-20
[3]
서적
All of Statistics: a concise course in statistical inference
Springer texts in statistics
2010-12
[4]
서적
History of Probability and Statistics and Their Applications before 1750
[5]
간행물
Ore, Pascal and the Invention of Probability Theory
[6]
간행물
HARMONIC ANALYSIS AS THE EXPLOITATION OF SYMMETRY - A HISTORICAL SURVEY
1980-07
[7]
웹사이트
The Value of Chances in Games of Fortune. English Translation
https://math.dartmou[...]
[8]
서적
A philosophical essay on probabilities
Dover Publications
1952
[9]
문서
Choice and Chance with One Thousand Exercises
Deighton Bell, Cambridge
[10]
웹사이트
Earliest uses of symbols in probability and statistics
http://jeff560.tripo[...]
[11]
서적
Charakterisierung des Erwartungswertes am Graphen der Verteilungsfunktion
https://opus4.kobv.d[...]
Technische Hochschule Brandenburg
2023
[12]
웹사이트
Expectation Value
https://mathworld.wo[...]
2020-09-11
[13]
웹사이트
"確率変数 X,ある関数 g(·) とするとき,g(X) の期待"
http://www2.econ.osa[...]
大阪大学 「計量経済基礎」
[14]
웹사이트
JIS Z 8101-1 1999 統計−用語と記号−第1部:確率及び一般統計用語
http://kikakurui.com[...]
일본규격협회
[15]
웹사이트
"a + bX の期待値は,E(a + bX) = a + bE(X) ... となる。"
http://www2.econ.osa[...]
大阪大学 「計量経済基礎」
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com