몬티 홀 문제
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
몬티 홀 문제는 세 개의 문 뒤에 자동차 한 대와 염소 두 마리가 숨겨져 있는 상황에서, 참가자가 문을 선택한 후 사회자가 염소가 있는 문을 열어 정보를 제공할 때, 선택을 바꾸는 것이 유리한지 여부를 묻는 확률 문제입니다. 이 문제에서 대부분의 사람들은 선택을 바꾸는 것이 무의미하다고 생각하지만, 실제로는 선택을 바꾸면 자동차를 얻을 확률이 높아집니다. 몬티 홀 문제는 직관에 어긋나는 확률적 딜레마를 보여주며, 조건부 확률과 베이즈 정리를 통해 정확하게 풀이할 수 있습니다. 또한 게임 이론과 연결되어 전략적 우위 개념을 설명하는 데 활용되며, 문의 개수를 늘리거나 양자 역학을 적용하는 등 다양한 변형이 존재합니다.
더 읽어볼만한 페이지
- 확률론의 역설 - 생일 문제
생일 문제는 임의의 집단에서 생일이 같은 두 사람이 존재할 확률을 계산하는 문제로, 23명만 되어도 생일이 같은 사람이 있을 확률이 50%를 넘으며, 암호 시스템 등 다양한 분야에 응용된다. - 확률론의 역설 - 상트페테르부르크의 역설
상트페테르부르크의 역설은 기대값이 무한대인 도박 게임에서 사람들이 기대값보다 훨씬 적은 금액을 지불하려 하는 현상을 보이는 확률론의 역설로, 동전 던지기 게임을 통해 설명되며, 기대 효용 이론, 유한한 상트페테르부르크 복권, 확률 가중치 등의 개념으로 설명하려는 시도가 있다. - 의사결정의 역설 - 애로의 불가능성 정리
애로의 불가능성 정리는 3개 이상의 선택지에서 약한 파레토, 무관한 대안으로부터의 독립성, 비독재성을 모두 만족하는 사회 후생 함수는 존재하지 않음을 증명한 정리이다. - 의사결정의 역설 - 투표의 역설
투표의 역설은 다수결 투표에서 개인의 합리적 선호와 달리 집단 전체의 선호가 순환적인 형태를 띠어 사회적 선호가 이행성을 갖지 못하게 되는 현상으로, 선거 결과가 투표 절차에 따라 달라질 수 있고 스포일러 효과를 초래할 수 있다는 함의를 지닌다. - 퍼즐 - 다른 그림 찾기
다른 그림 찾기는 거의 동일한 두 그림에서 시각적 비교 등을 통해 서로 다른 부분을 찾아내는 퍼즐이다. - 퍼즐 - 스도쿠
스도쿠는 9x9 칸에 1부터 9까지의 숫자를 채워 넣는 퍼즐로, 각 가로줄, 세로줄, 3x3 칸에 숫자가 중복 없이 들어가야 하며, 레온하르트 오일러의 라틴 방진을 기반으로 다양한 변형과 응용 연구가 진행되고 있다.
몬티 홀 문제 | |
---|---|
몬티 홀 문제 | |
![]() | |
다른 이름 | 몬티 홀 역설 |
유형 | 확률 퍼즐 |
내용 | |
문제 | 참가자는 세 개의 문 중 하나를 선택한다. 문 뒤에는 자동차가 있거나 염소가 있다. 참가자가 문을 선택하면, 진행자는 다른 문을 열어 염소를 보여준다. 진행자는 항상 염소가 있는 문을 열어준다. 그 후, 진행자는 참가자에게 원래 선택을 유지할지, 다른 문으로 바꿀지 제안한다. 이때, 참가자는 선택을 바꾸는 것이 유리한가? |
정답 | 선택을 바꾸는 것이 유리하다. 처음 선택을 유지할 경우 자동차를 얻을 확률은 1/3이지만, 선택을 바꿀 경우 자동차를 얻을 확률은 2/3이다. |
해법 | |
직관적 설명 | 처음 선택할 때, 자동차가 있는 문을 고를 확률은 1/3이고, 염소가 있는 문을 고를 확률은 2/3이다. 진행자가 염소가 있는 문을 열어주면, 처음 선택이 틀렸을 경우 남은 문에 자동차가 있을 확률은 2/3으로 증가한다. |
조건부 확률을 이용한 설명 | A: 참가자가 처음에 자동차가 있는 문을 선택하는 사건 B: 진행자가 특정한 문을 열어 염소를 보여주는 사건 P(A|B): 진행자가 특정한 문을 열어 염소를 보여줬을 때, 참가자가 처음에 자동차가 있는 문을 선택했을 확률 P(A|B) = P(B|A) * P(A) / P(B) P(A) = 1/3 P(B|A) = 1/2 (진행자는 남은 두 문 중 임의로 선택하므로) P(B) = 1/3 * 1/2 + 2/3 * 1 = 5/6 P(A|B) = (1/2 * 1/3) / (5/6) = 1/5 따라서, 선택을 바꾸는 것이 유리하다. |
역사 | |
최초 언급 | 마틴 가드너 (1959년) |
논쟁 촉발 | 매릴린 보스 사반트(1990년) |
관련 인물 | |
인물 | 마틴 가드너 매릴린 보스 사반트 스티브 셀빈 |
같이 보기 | |
관련 항목 | 확률 조건부 확률 역설 인지 편향 몬티 홀 거래를 하자! |
2. 몬티 홀 문제의 딜레마적 상황
대부분의 사람들은 사회자가 염소가 있는 문을 열어주었기 때문에 정답을 맞힐 확률이 1/3에서 1/2로 늘어났다고 생각하여 자신의 선택을 바꾸지 않는다. 하지만 이러한 생각은 옳지 않으며, 선택을 바꾸는 것이 자신이 처음에 한 선택을 유지하는 것보다 유리하다. 몬티 홀 문제에서 딜레마를 유발하는 생각은 다음과 같다.
몬티 홀 문제에서 참가자는 자신의 선택을 바꾸는 것이 유리하다. 처음 선택을 유지하면 자동차를 얻을 확률은 1/3이지만, 선택을 바꾸면 그 확률은 2/3로 증가한다.[1]
# 남은 문은 두 개이니, 선택을 바꾸든 바꾸지 않든 동일한 확률을 가진다. (이지선다를 반복할 경우, 50% : 66.66%+33.33%=100% => 100%÷2지선다 반복=50%)
# 선택을 바꾸는 것이 퀴즈에서 이겨 자동차를 상품으로 받을 가능성을 높게 만든다. (선택 변경 시 승률은 66.66%)
# 선택을 바꾸지 않는 편이 더 낫다. (선택 고수 시 승률은 33.33%)
3. 풀이
X를 자동차가 있는 문의 번호, Y를 참가자가 처음 고른 문의 번호, M을 진행자가 연 문의 번호라고 하자. 참가자가 1번 문을 골랐고 사회자가 3번 문을 열었다고 가정하면, 선택을 바꾸었을 때 2번 문 뒤에 자동차가 있을 확률은 조건부 확률과 베이즈 정리를 이용하여 계산할 수 있다.
:
::
처음에는 자동차를 고를 확률이 1/3이지만, 사회자가 문을 열어주면 참가자가 선택하지 않은 문에 자동차가 있을 확률은 2/3가 된다.자동차가 1번 문 뒤에 있을 때 자동차가 2번 문 뒤에 있을 때 자동차가 3번 문 뒤에 있을 때 참가자가 1번 문을 선택했을 때 사회자는 두 문 모두 열 수 있다. 사회자는 3번 문을 열 수밖에 없다. 사회자는 2번 문을 열 수밖에 없다. 선택을 바꿔서 꽝 1/3 선택을 바꿔서 당첨 2/3
위 표는 각 경우의 수를 그림으로 나타낸 것이다. 참가자가 1번 문을 선택했을 때, 자동차가 1번 문 뒤에 있으면 사회자는 어떤 문이든 열 수 있으므로 선택을 바꾸면 꽝이다. 하지만 자동차가 2번 문 뒤에 있으면 사회자는 3번 문을, 자동차가 3번 문 뒤에 있으면 사회자는 2번 문을 열 수밖에 없으므로 선택을 바꾸면 항상 자동차를 얻게 된다. 따라서 선택을 바꾸는 것이 유리함을 직관적으로 알 수 있다.
이 문제는 역으로 생각해도 풀이를 이해할 수 있다. 3개의 문 중 2개를 참가자가 선택하고, 사회자는 참가자가 선택한 문 중 꽝인 문을 보여준다. 이때 선택을 바꾸지 않는 것이 유리하며, 승률은 66.66%이다. 최초에 2개의 문을 선택했을 때 이미 66.66%의 승률을 확보한 상태에서 꽝인 문이 열린 것이므로, 선택을 바꾸는 순간 승률은 33.33%로 감소한다.
3. 1. 오해의 해소
많은 사람들이 사회자가 문을 하나 열어주면 남은 두 문의 확률이 각각 50%가 된다고 오해한다. 하지만 참가자가 문을 고른 뒤 사회자가 문을 여는 경우, 사회자가 남은 문 중 염소가 있는 문을 '선별'하여 열어주기 때문에 처음에 고른 문이 정답일 확률은 1/3, 바꾸는 문이 정답일 확률은 2/3가 된다.
이 문제는 역설이라고 불리기도 한다. 처음부터 문이 하나 열린 상태에서 두 개의 문 중 하나를 선택하는 문제였다면 확률은 1/2이다. 반면에 이 게임처럼 문이 하나 열린 상태가 되면 확률은 1/3과 2/3이 된다. 이처럼 확률이 달라지는 것이 역설이라고 불리는 이유이다. (이와 비슷한 문제로 두 아이의 성별 문제가 있다.)
그러나 이것은 확률 계산에 모순이 있는 것은 아니므로 의사 역설이다. 문이 두 개로 좁혀진 경위를 알고 있는지 모르는지에 따른 정보 차이가 문의 평가에 영향을 미칠 뿐이다.
4. 몬티 홀 딜레마와 행동 경제학
몬티 홀 딜레마는 인간이 합리적인 선택을 한다는 전통 경제학의 가정에 대한 반례로 제시된다. 전통 경제학에 따르면, 사람들은 모두 선택을 바꾸어야 하지만, 실제로는 그렇지 않다.
5. 몬티 홀 문제의 역사와 논란
몬티 홀 문제는 1975년 스티브 셀빈이 아메리칸 통계학자(The American Statistician)에 보낸 편지에서 처음 제기되었다.[7] 셀빈은 이 문제를 "몬티 홀 문제"라고 명명했으며, 이는 마틴 가드너가 《사이언티픽 아메리칸》(Scientific American)에 기고한 세 죄수 문제와 수학적으로 동일하다.[7]
마릴린 보스 사반트가 자신의 칼럼 "마릴린에게 물어보세요"에서 몬티 홀 문제에 대해 "참가자가 바꿔야 한다"고 답하면서 문제는 대중적으로 알려졌다.[7] 그러나 이 답변에 대해 수많은 독자들이 반박했는데, 그 중에는 박사 학위 소지자들도 포함되어 있었다. 플로리다 대학교의 스콧 스미스 박사는 "세계 최고 IQ"를 언급하며 사반트를 비난하는 편지를 보냈다.[7]
이 논쟁은 세실 아담스의 칼럼 "The Straight Dope"와 뉴욕 타임스 등 주요 언론에서도 다루어졌다.[7] 사반트는 자신의 답변을 명확히 하기 위해 세 개의 껍데기 놀이를 예로 들며 설명을 덧붙였다.[7]
폴 에르되시도 처음에는 오답을 주장했지만, 시뮬레이션 결과를 통해 사반트의 답이 옳음을 인정했다.[7] 칼 세이건 등 다른 유명 인사들도 몬티 홀 문제를 해설하며 사반트의 정답을 지지했다.
몬티 홀 자신도 뉴욕 타임스와의 인터뷰에서 문제의 규칙과 실제 게임 쇼의 차이점을 설명했다.[7] 그는 게임 진행 방식을 제어하여 참가자의 심리를 이용하기 때문에, 이론적인 해결책이 실제 게임 플레이에 항상 적용되지는 않는다고 지적했다.
5. 1. 게임의 규칙
몬티 홀 문제의 표준적인 게임 규칙은 다음과 같다.[9]1. 참가자는 3개의 문 중 하나를 선택한다. 각 문 뒤에는 자동차나 염소가 무작위로 배치되어 있다.
2. 사회자(몬티)는 참가자가 선택하지 않은 문 중 염소가 있는 문 하나를 반드시 연다.
3. 사회자는 참가자에게 처음 선택을 유지할지, 아니면 남은 닫힌 문으로 바꿀지 선택권을 반드시 제공한다.
여기서 중요한 점은 몬티가 항상 염소가 있는 문을 열어야 하며(2번 규칙), 참가자에게 문을 바꿀 기회를 제공해야 한다는 것이다(3번 규칙).[9] 이러한 조건이 변경되면 문제의 성격이 달라진다.[9] 예를 들어, 몬티가 문을 열지 않거나, 염소 대신 자동차가 있는 문을 열 수 있다면, 문제는 더 이상 몬티 홀 문제가 아니게 된다.
6. 다양한 해법
몬티 홀 문제는 다양한 방법으로 해결할 수 있다.
- 단순한 해법: 선택을 바꾸지 않으면 자동차를 얻을 확률은 1/3이지만, 선택을 바꾸면 그 확률은 2/3으로 증가한다. 자세한 내용은 #단순한 해법을 참고.
- 조건부 확률을 이용한 해법: 조건부 확률과 베이즈 정리를 통해 선택을 바꾸었을 때 자동차를 얻을 확률을 정확하게 계산할 수 있다. 자세한 내용은 #조건부 확률을 이용한 해법을 참고.
- 전략적 우위 해법: 게임 이론적 분석에 따르면, 참가자는 항상 선택을 바꾸는 전략을 사용하는 것이 최적이다. 자세한 내용은 #전략적 우위 해법을 참고.
- 시뮬레이션: 컴퓨터 시뮬레이션을 통해 선택을 바꾸는 전략이 더 높은 확률로 자동차를 얻는다는 것을 확인할 수 있다.
카드 놀이를 이용하여 게임을 시뮬레이션할 수 있다.[1] 세 장의 카드를 사용하여 세 개의 문을 나타내는데, 한 장은 자동차, 다른 두 장은 염소를 나타낸다. 플레이어가 카드 한 장을 고르면, '진행자'는 남은 두 장 중 염소 카드를 보여준다. 진행자 손에 자동차 카드가 남으면 플레이어가 바꿨을 때 이기는 것이고, 염소 카드가 남으면 바꾸지 않았을 때 이기는 것이다. 이 실험을 반복하면, 대수의 법칙에 따라 각 전략의 승률은 이론적 확률에 가까워진다.
반복된 플레이는 바꾸는 것이 왜 더 나은 전략인지 보여준다. 플레이어가 카드를 고른 후, 바꾸어 이길지 여부는 이미 결정된다. 전체 카드 덱으로 시뮬레이션하면, 자동차 카드는 52번 중 51번 진행자에게 가고, 몇 장의 자동차가 아닌 카드가 버려지든 진행자에게 남는다.
간단한 프로그램으로 시뮬레이션을 수행하여 답을 도출할 수도 있다 (위 그림 참고). 그래프에서 문을 변경했을 때 경품을 얻는 횟수가, 변경하지 않은 경우의 약 2배이다.
대부분의 사람들은 바꾸는 것이 중요하지 않다고 결론을 내린다. 열리지 않은 두 개의 문 중 하나 뒤에 차가 있을 확률이 50%이기 때문이다. 호스트가 무작위로 열 문을 선택하면 이것이 사실이지만, 그렇지 않다. 호스트가 여는 문은 플레이어의 초기 선택에 따라 달라지므로 독립 가정이 성립하지 않는다. 호스트가 문을 열기 전에 차가 각 문 뒤에 있을 확률은 1/3이다. 차가 1번 문 뒤에 있으면 호스트는 2번 문 또는 3번 문을 열 수 있으므로 차가 1번 문 뒤에 ''있고'' 호스트가 3번 문을 열 확률은 1/3 × 1/2 = 1/6이다. 차가 2번 문 뒤에 있으면 – 플레이어가 1번 문을 선택한 경우 – 호스트는 ''반드시'' 3번 문을 열어야 하므로 차가 2번 문 뒤에 ''있고'' 호스트가 3번 문을 열 확률은 1/3 × 1 = 1/3이다. 호스트가 3번 문을 여는 유일한 경우는 이 경우이므로 플레이어가 1번 문을 선택하고 호스트가 3번 문을 열면 차가 1번 문보다 2번 문 뒤에 있을 가능성이 두 배 더 높다. 핵심은 차가 2번 문 뒤에 있으면 호스트가 ''반드시'' 3번 문을 열어야 하지만 차가 1번 문 뒤에 있으면 호스트가 어느 문이든 열 수 있다는 것이다.
해결책을 이해하는 또 다른 방법은 플레이어가 처음에 선택하지 않은 두 개의 문을 함께 고려하는 것이다. 세실 아담스는 "몬티는 사실상 이렇게 말하고 있다. 네가 선택한 한 개의 문을 가질 수도 있고, 다른 두 개의 문을 가질 수도 있다."라고 말했다. 이 문 중 하나가 열린 것으로 인해 차를 찾을 확률 2/3이 변경되지 않았다. 몬티는 차의 위치를 알기 때문에 염소를 확실히 공개하기 때문이다. 호스트가 문을 연 후 플레이어의 선택은 호스트가 원래 선택한 문에서 ''두'' 개의 남은 문 세트로 바꿀 수 있는 옵션을 플레이어에게 제공한 것과 다르지 않다. 이 경우 바꾸면 플레이어가 차를 선택할 확률이 2/3이 된다.
키스 데블린은 "몬티는 문을 열면서 참가자에게 '당신이 선택하지 않은 두 개의 문이 있고, 그중 하나 뒤에 상품이 있을 확률은 2/3입니다. 상품이 어디에 있는지 아는 것을 이용하여 두 개의 문 중 하나를 열어 상품이 숨겨져 있지 않다는 것을 보여드리겠습니다. 이제 이 추가 정보를 활용할 수 있습니다. 문 A를 선택하면 1/3의 확률로 당첨됩니다. 저는 그것을 바꾸지 않았습니다. 하지만 문 C를 제거함으로써 문 B가 상품을 숨길 확률이 2/3임을 보여드렸습니다.'"라고 말했다.
사반트는 3개가 아닌 1,000,000개의 문으로 해결책이 더 직관적일 것이라고 제안한다. 이 경우 염소가 있는 문이 999,999개, 상품이 있는 문이 하나 있다. 플레이어가 문을 선택한 후 호스트는 나머지 문 중 999,998개를 연다. 평균적으로 1,000,000번 중 999,999번은 남은 문에 상품이 있을 것이다. 직관적으로 플레이어는 백만 개의 문이 주어졌을 때 처음에 올바른 문을 선택할 가능성이 얼마나 되는지 질문해야 한다. 스티벨 등은 몬티 홀 문제 해결 과정에서 작업 기억 요구가 부과되어 사람들이 선택을 두 개의 동등하게 가능한 옵션으로 "축소"하도록 강요한다고 제안했다. 그들은 옵션 수가 7개 이상으로 증가하면 사람들이 더 자주 바꾸는 경향이 있다고 보고한다. 그러나 대부분의 참가자는 여전히 성공 확률을 50%로 잘못 판단한다.
역 몬티홀 문제를 통한 풀이도 가능하다. 3개의 문 중 2개의 문을 참가자가 선택하고, 참가자가 선택한 문 중 꽝인 문을 사회자가 확인시켜준다(사회자는 꽝의 위치를 아는 상태). 사회자가 선택의 변경을 질문했을 때, 어떤 선택이 유리한가? 이때의 해답은 변경하지 않는 쪽이 반대로 66.66% 승률이다. 최초 2개의 문을 선택할 때 이미 66.66% 승률인 상태에서, 꽝인 문을 열어줬을 뿐이니, 선택을 바꾸지 않는다. 선택을 바꾸는 순간 33.33% 승률로 바뀐다. 100개의 문으로 확장하면, 99개의 문을 선택한 상태에서 사회자가 꽝 98개의 문을 열어준 상태에서, 바꾸지 않았을 때의 승률은 99%이다.
6. 1. 단순한 해법
몬티 홀 문제에서 참가자는 선택을 바꾸는 것이 유리하다. 처음 선택한 번호를 바꾸지 않을 때 자동차가 있는 문을 선택할 확률은 1/3이지만, 처음 선택한 번호를 바꾸면 확률은 2/3으로 증가한다.이를 직관적으로 이해하기 위해, 가능한 모든 경우의 수를 나열해 볼 수 있다.
1번 문 뒤 | 2번 문 뒤 | 3번 문 뒤 | 1번 문에 머물 경우 결과 | 제공된 문으로 바꿀 경우 결과 |
---|---|---|---|---|
염소 | 염소 | 자동차 | 염소 획득 | 자동차 획득 |
염소 | 자동차 | 염소 | 염소 획득 | 자동차 획득 |
자동차 | 염소 | 염소 | 자동차 획득 | 염소 획득 |
처음 선택을 고수한 플레이어는 세 가지 경우 중 하나에서만 승리하지만, 선택을 바꾸는 플레이어는 세 가지 경우 중 두 가지에서 승리한다.[1]
또 다른 방법은 플레이어가 처음에 선택하지 않은 두 개의 문을 함께 고려하는 것이다. 몬티는 차의 위치를 알고 있기 때문에, 염소가 있는 문을 확실하게 열 수 있다. 따라서, 선택을 바꾸는 것은 플레이어가 처음에 염소를 선택했을 경우(2/3 확률) 반드시 자동차를 얻게 된다는 것을 의미한다.
6. 2. 조건부 확률을 이용한 해법
몬티 홀 문제에서 참가자는 선택을 바꾸는 것이 유리하다. 처음 선택한 번호를 바꾸지 않을 때 자동차가 있는 문을 선택할 확률은 1/3이지만, 처음 선택한 번호를 바꾸면 확률은 2/3으로 증가한다.[1] 조건부 확률과 베이즈 정리를 이용하여 선택을 바꾸었을 때 자동차를 얻을 확률을 정확하게 계산할 수 있다.X를 자동차가 있는 문의 번호, Y를 참가자가 처음 고른 문의 번호, 진행자가 연 문의 번호를 M이라고 하자. 참가자가 1번 문을 골랐을 때 사회자가 3번 문을 열었다고 가정하면, 선택을 바꾸었을 경우 2번 문 뒤에 자동차가 있을 확률은 다음과 같이 계산할 수 있다.
:
::
처음에는 자동차를 고를 확률이 1/3이지만, 사회자가 문을 열어주면 내가 선택하지 않은 문에 자동차가 있을 확률은 2/3이 된다.
이를 그림으로 나타내면 다음과 같다.
자동차가 1번 뒤에 있을 때 | 자동차가 2번 뒤에 있을 때 | 자동차가 3번 뒤에 있을 때 | |
---|---|---|---|
참가자가 1번 문을 선택했을 때 | |||
사회자는 두 문 모두 열 수 있다. | 사회자는 3번 문을 열 수밖에 없다. | 사회자는 2번 문을 열 수밖에 없다. | |
선택을 바꿔서 꽝 1/6 (1/3 X 1/2) | 선택을 바꿔서 꽝 1/6 (1/3 X 1/2) | 선택을 바꿔서 당첨 1/3 | 선택을 바꿔서 당첨 1/3 |
선택을 바꿔서 꽝 1/3 | 선택을 바꿔서 당첨 2/3 |
6. 3. 전략적 우위 해법
몬티 홀 문제에서 참가자는 선택을 바꾸는 것이 유리하다. 처음 선택한 번호를 바꾸지 않을 때 자동차가 있는 문을 선택할 확률은 1/3이지만, 처음 선택한 번호를 바꾸면 확률은 2/3으로 증가한다.X를 자동차가 있는 문의 번호, Y를 참가자가 처음 고른 문의 번호, 진행자가 연 문의 번호를 M이라고 하자. 참가자가 1번 문을 골랐을 때 사회자가 3번 문을 열었다고 가정하자. 선택을 바꾸었을 경우, 2번 문 뒤에 자동차가 있을 확률은 조건부 확률과 베이즈 정리를 이용하여 계산할 수 있다.
:
처음에는 자동차를 고를 확률이 1/3이지만 사회자가 문을 열어주면 내가 선택하지 않은 문에 자동차가 있을 확률은 2/3이다. 그리고 이 문제는 확률을 구하는 것이기 때문에 선택을 바꾸어야 한다.
::
이를 그림으로 나타내면 다음과 같다.
자동차가 1번 뒤에 있을 때 | 자동차가 2번 뒤에 있을 때 | 자동차가 3번 뒤에 있을 때 | |
---|---|---|---|
참가자가 1번 문을 선택했을 때 | |||
사회자는 두 문 모두 열 수 있다. | 사회자는 3번 문을 열 수밖에 없다. | 사회자는 2번 문을 열 수밖에 없다. | |
선택을 바꿔서 꽝 1/6(1/3X1/2) | 선택을 바꿔서 당첨 1/3 | 선택을 바꿔서 당첨 1/3 |
게임 이론적 분석에 따르면, 참가자는 항상 선택을 바꾸는 전략을 사용하는 것이 최적이다. 참가자의 ''전략''에는 문을 처음 선택하는 것과, 전환 또는 유지를 결정하는 두 가지 행동이 포함된다. 이때, 어떤 전략을 사용하더라도 "항상 전환한다"는 전략이 다른 전략을 지배한다. 즉, 차가 어떻게 숨겨져 있든, 진행자가 어떤 규칙을 사용하든, 항상 전환하는 전략이 자동차를 얻을 확률을 최대화한다.
이는 몬티 홀 문제를 제로섬 게임으로 단순화하여 설명할 수 있다. 진행자는 차를 숨길 문을 결정하고, 참가자는 두 개의 문을 선택한다. 참가자는 자신이 선택한 두 문 중 하나에 차가 있으면 승리한다. 이 경우, 비전환 전략을 제거하면 항상 전환하는 전략이 최적의 전략이 된다.
6. 4. 시뮬레이션
컴퓨터 시뮬레이션을 통해 몬티 홀 문제에서 선택을 바꾸는 전략이 더 높은 확률로 자동차를 얻는다는 것을 확인할 수 있다.카드 놀이를 이용하여 게임을 시뮬레이션할 수 있다.[1] 세 장의 카드를 사용하여 세 개의 문을 나타내는데, 한 장은 자동차, 다른 두 장은 염소를 나타낸다. 플레이어가 카드 한 장을 고르면, '진행자'는 남은 두 장 중 염소 카드를 버린다. 진행자 손에 자동차 카드가 남으면 바꾸어 이긴 것이고, 염소 카드가 남으면 바꾸지 않아 이긴 것이다. 이 실험을 반복하면, 대수의 법칙에 따라 각 전략의 승률은 이론적 확률에 가까워진다.
반복된 플레이는 바꾸는 것이 왜 더 나은 전략인지 보여준다. 플레이어가 카드를 고른 후, 바꾸어 이길지 여부는 이미 결정된다. 전체 카드 덱으로 시뮬레이션하면, 자동차 카드는 52번 중 51번 진행자에게 가고, 몇 장의 자동차가 아닌 카드가 버려지든 진행자에게 남는다.
간단한 프로그램으로 시뮬레이션을 수행하여 답을 도출할 수도 있다(그림 참고). 그래프에서 문을 변경했을 때 경품을 얻는 횟수가, 변경하지 않은 경우의 약 2배이다.
7. 변형 문제
확률 관련 자료에서는 참가자가 처음에 문 1을 선택하고 사회자가 문 3을 열었을 때, 자동차가 문 1과 문 2 뒤에 있을 조건부 확률을 각각 1/3과 2/3로 계산한다.[12][13] 이 절에서는 플레이어가 문 1을 선택하고 사회자가 문 3을 연 경우만 고려한다.
일반적인 변형 문제에서는 사회자가 문을 열 때 반드시 균일한 확률로 선택해야 한다는 가정을 하지 않고, 다른 전략을 사용하기도 한다. 이러한 변형에서 플레이어는 사회자가 어떤 문을 열었는지에 따라 승리할 확률이 달라질 수 있다. 하지만 어떤 경우에도 문을 바꾸어 승리할 확률은 최소 1/2 (최대 1)이며, 바꾸어서 승리할 전체 확률은 여전히 정확히 2/3이다. 이러한 변형들은 확률 이론과 게임 이론의 기초를 가르치는 교과서나 기사에서 종종 다루어진다.
몬티 홀 문제의 규칙을 변경하면 예제를 통해 통계학의 다른 개념을 설명하는 데 도움이 될 수 있다.
7. 1. 사회자의 행동에 따른 변형
사회자가 염소를 공개하는 규칙을 변경하면 문제의 결과가 달라질 수 있다. 표준적인 몬티 홀 문제에서는 사회자가 다음과 같은 규칙을 따른다.[12]# 사회자는 항상 참가자가 선택하지 않은 문을 열어야 한다.
# 사회자는 항상 염소를 드러내도록 문을 열어야 하며, 자동차는 절대 드러내면 안 된다.
# 사회자는 항상 처음에 선택한 문과 남은 닫힌 문 사이에서 바꿀 기회를 제공해야 한다.
하지만 이러한 가정 중 하나라도 변경되면, 문을 바꿈으로써 이길 확률이 달라질 수 있다. 예를 들어, 사회자가 염소가 아닌 자동차를 공개할 수도 있는 경우, 문을 바꾸는 것이 항상 유리하지는 않다.
다음은 사회자의 행동에 따른 다양한 변형과 그 결과를 나타낸 표이다.
진행자 행동 | 결과 |
---|---|
진행자는 문제의 특정 버전에 명시된 대로 행동한다. | 전환은 2/3의 확률로 자동차를 얻는다. |
진행자는 항상 염소를 공개하고 항상 전환을 제안한다. 유일하게 선택의 여지가 있는 경우 진행자는 확률 p (플레이어의 초기 선택에 따라 달라질 수 있음)로 가장 왼쪽의 염소를 선택하고 확률 q = 1 - p로 가장 오른쪽의 문을 선택한다. | 진행자가 가장 오른쪽 문을 열면 전환은 1/(1+q)의 확률로 승리한다. 반대로, 진행자가 가장 왼쪽 문을 열면 전환은 1/(1+p)의 확률로 승리한다. 항상 전환하는 것은 이들의 합이다: (1/3 + q/3) / (1+q) + (1/3 + p/3) / (1+p) = 2/3. |
"지옥에서 온 몬티": 진행자는 플레이어의 초기 선택이 당첨 문인 경우에만 전환 옵션을 제공한다. | 전환은 항상 염소를 얻는다. |
"마음 읽는 몬티": 진행자는 손님이 어쨌든 계속 머물기로 결정했거나 손님이 염소로 전환할 경우에 전환 옵션을 제공한다. | 전환은 항상 염소를 얻는다. |
"천사 몬티": 진행자는 플레이어가 잘못 선택한 경우에만 전환 옵션을 제공한다. | 전환은 항상 자동차를 얻는다. |
"몬티 폴" 또는 "무지한 몬티": 진행자는 문 뒤에 무엇이 있는지 모르고 자동차가 나오지 않는 문을 무작위로 연다. | 전환은 1/2의 확률로 자동차를 얻는다. |
진행자는 문 뒤에 무엇이 있는지 알고 있으며(플레이어의 선택 전) 어떤 염소를 공개할지 무작위로 선택한다. 진행자는 플레이어의 선택이 진행자의 선택과 다른 경우에만 전환 옵션을 제공한다. | 전환은 1/2의 확률로 자동차를 얻는다. |
진행자는 문을 열고 참가자가 처음에 자동차를 선택한 경우 항상 전환 제안을 하고, 그렇지 않은 경우 50%의 확률로 전환 제안을 한다. | 전환은 내쉬 균형에서 1/2의 확률로 승리한다. |
4단계 2인 플레이어 게임 이론적. 플레이어는 진행자를 포함한 쇼 기획자(TV 방송국)와 경쟁한다. 첫 번째 단계: 기획자는 문을 선택한다(선택은 플레이어에게 비밀로 유지됨). 두 번째 단계: 플레이어는 예비 문을 선택한다. 세 번째 단계: 진행자는 문을 연다. 네 번째 단계: 플레이어는 최종 선택을 한다. 플레이어는 자동차를 얻고 싶어하고, TV 방송국은 자동차를 유지하고 싶어한다. 이것은 제로섬 2인 게임이다. 게임 이론의 폰 노이만의 정리에 따르면, 양 당사자가 완전히 무작위화된 전략을 허용하면 미니맥스 솔루션 또는 내쉬 균형이 존재한다. | 미니맥스 솔루션(내쉬 균형): 자동차는 처음에 균일하게 무작위로 숨겨지고 진행자는 나중에 자동차를 공개하지 않고 플레이어의 문과 다른 문을 열기 위해 균일한 무작위 문을 선택한다. 플레이어는 처음에 균일한 무작위 문을 선택하고 나중에 항상 다른 닫힌 문으로 전환한다. 그의 전략으로 플레이어는 TV 방송국이 어떻게 플레이하든 최소한 2/3의 승리 기회를 갖는다. TV 방송국의 전략으로 TV 방송국은 플레이어가 어떻게 플레이하든 최대 2/3의 확률로 질 것이다. 이 두 전략이 일치한다는 사실(최소 2/3, 최대 2/3)은 그것들이 미니맥스 솔루션을 형성한다는 것을 증명한다. |
이전과 같지만 이제 진행자는 문을 전혀 열지 않을 수 있다. | 미니맥스 솔루션(내쉬 균형): 자동차는 처음에 균일하게 무작위로 숨겨지고 진행자는 나중에 문을 절대 열지 않는다. 플레이어는 처음에 문을 균일하게 무작위로 선택하고 나중에 절대 전환하지 않는다. 플레이어의 전략은 최소 1/3의 승리 기회를 보장한다. TV 방송국의 전략은 최대 1/3의 패배 기회를 보장한다. |
딜 오어 노 딜 사례: 진행자는 플레이어에게 문을 열도록 요청한 다음 자동차가 공개되지 않은 경우 전환을 제안한다. | 전환은 1/2의 확률로 자동차를 얻는다. |
이처럼 사회자의 행동 규칙에 따라 몬티 홀 문제의 결과는 다양하게 나타날 수 있다.
7. 2. 문의 개수를 늘린 변형
100개의 문이 사용되는 게임을 가정해 보자. 플레이어가 첫 번째 문을 선택했을 때, 이 문이 정답일 확률은 1/100이다. 몬티는 남은 99개의 문 중에서 98개를 열어 염소를 보여준다. 플레이어는 이제 두 번째 선택을 한다.처음에 플레이어가 선택한 1개의 문과 "남은 99개 중에서 정답을 알고 있는 몬티가 열지 않은 단 하나의 문"의 확률이 다르다는 것을 직관적으로 이해할 수 있을 것이다.
7. 3. 양자 버전
양자 역학의 원리를 적용한 몬티 홀 문제의 양자 버전도 존재한다. 양자 버전의 역설은 고전적 또는 비양자적 정보와 양자 정보 간의 관계에 대한 몇 가지 요점을 보여주며, 이는 양자 역학적 시스템의 상태로 인코딩된다. 이 공식은 양자 게임 이론을 기반으로 한다. 세 개의 문은 세 가지 대안을 허용하는 양자 시스템으로 대체된다. 문을 열고 그 뒤를 살펴보는 것은 특정 측정을 하는 것으로 번역된다. 규칙은 이 언어로 표현될 수 있으며, 다시 한번 플레이어의 선택은 초기 선택을 고수하거나 다른 "직교" 옵션으로 변경하는 것이다. 후자의 전략은 고전적인 경우와 마찬가지로 기회를 두 배로 늘린다. 그러나 쇼 호스트가 상품의 위치를 완전한 양자 역학적 방식으로 무작위화하지 않은 경우, 플레이어는 훨씬 더 나은 결과를 얻을 수 있으며 때로는 확실하게 상품을 얻을 수도 있다.참조
[1]
논문
concluding remarks
2005
[2]
뉴스
An "easy" answer to the infamous Monty Hall problem
https://www.washingt[...]
2021-06-17
[3]
논문
emphasis in the original
1992
[4]
서적
Mr Mee
https://archive.org/[...]
Picador USA
2001
[5]
서적
Mr Mee
https://archive.org/[...]
Picador USA
2001
[6]
서적
The Curious Incident of the Dog in the Night-Time
https://books-librar[...]
Jonathan Cape
2003
[7]
논문
p=71
2009
[8]
논문
pp=5-16
2002
[9]
논문
pp=183ff
2002
[10]
간행물
確率判断の認知心理(1)
https://www.tsu.ac.j[...]
東京成徳大学
1998
[11]
간행물
確率判断の認知心理(2)
https://www.tsu.ac.j[...]
東京成徳大学
1999
[12]
웹사이트
英語版
:en:Monty Hall probl[...]
2010-07-04
[13]
웹인용
몬티홀 문제
https://m.terms.nave[...]
수학백과
2021-04-18
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com