동시적 게임
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
동시적 게임은 모든 플레이어가 다른 플레이어의 선택을 알지 못한 채 동시에 전략을 선택하는 게임 유형이다. 가위바위보나 선거와 같이 플레이어가 서로의 선택을 볼 수 없는 상황을 예시로 들 수 있으며, 각 플레이어는 다른 사람의 최적 선택을 고려하여 자신의 선택을 결정해야 한다. 동시적 게임은 정규형 또는 확장형으로 표현될 수 있으며, Bimatrix Game은 두 명의 플레이어가 참여하는 동시적 게임을 나타내는 데 사용된다. 주요 전략으로는 순수 전략, 혼합 전략, 우월 전략, 열등 전략, Maximin 전략, 내쉬 균형 등이 있으며, 죄수의 딜레마, 성 대결 게임, 사슴 사냥과 같은 다양한 게임 이론 모델을 통해 분석된다. 동시적 게임은 경쟁적이고 비협력적인 환경에서 전략적 선택에 대한 정보를 제공하며, 파레토 효율성과 같은 사회적으로 바람직한 결과를 분석하는 데 사용된다.
더 읽어볼만한 페이지
동시적 게임 | |
---|---|
개요 | |
유형 | 게임 이론 |
플레이어 행동 시점 | 플레이어가 동시에 행동하거나, 다른 플레이어의 행동을 알지 못한 채 행동을 선택하는 게임 |
정보 | 불완전 정보 게임 |
분석 | 정규형 게임 표현을 사용하여 분석 |
예시 | |
게임 종류 | 죄수의 딜레마 가위바위보 닭싸움 게임 조정 게임 |
2. 특징
동시적 게임(Simultaneous game)은 게임에 참여하는 플레이어들이 서로 상대방이 어떤 행동을 선택할지 알지 못한 상태에서 자신의 행동을 결정해야 하는 게임을 말한다.[5] 여기서 '동시에 선택한다'는 것은 반드시 모든 플레이어가 문자 그대로 같은 시간에 행동해야 한다는 의미는 아니다. 각 플레이어가 다른 플레이어의 선택에 대한 정보를 얻을 수 없는 상황에서 행동한다면 동시적 게임으로 간주된다.[5] 플레이어는 경쟁자가 과거에 무엇을 했는지 관찰하지 않으며, 모든 플레이어는 경쟁자의 선택을 보지 않고 자신의 전략을 선택한다.[5]
예를 들어, 가위바위보는 모든 플레이어가 정확히 같은 시간에 자신의 패를 내므로 동시적 게임의 대표적인 사례이다.[5]
또 다른 예시로는 선거가 있다. 모든 유권자가 문자 그대로 동시에 투표하는 것은 아니지만, 각 유권자는 다른 유권자가 누구에게 투표했는지 알지 못하는 상태에서 자신의 투표권을 행사하므로 동시적 게임의 조건을 만족한다.[5] 게임 이론에서 유명한 죄수의 딜레마 역시 동시적 게임의 한 종류이다.
동시적 게임에서 의사 결정자가 합리적이라고 가정할 때, 게임의 결과는 각 플레이어에게 최소한 자신의 보안 수준(security level)을 보장하는 개별 합리성(individual rationality)을 만족해야 한다.[6] 플레이어 i의 보안 수준이란, 다른 플레이어들이 어떤 행동을 하든 상관없이 플레이어 i가 자신에게 최소한으로 보장할 수 있는 보수(payoff)의 최댓값(maximin)을 의미한다.[6] 즉, 플레이어는 최악의 경우를 상정했을 때 얻을 수 있는 최소한의 이득을 확보하려 한다.
2. 1. 믿음의 역할
동시적 게임에서 각 플레이어는 다른 플레이어가 어떤 선택을 할지 정확히 알 수 없다. 하지만 모든 플레이어는 서로가 각자의 상황에서 가장 유리한, 즉 최적 선택을 할 것이라고 가정한다. 또한, 다른 플레이어들도 자신이 최적의 선택을 할 것이라고 예상한다는 점을 인지하고 있다.플레이어들이 동시에 선택한다는 것은 서로의 실제 선택을 확인할 수 없다는 의미이다.[5] 이러한 정보의 부재 속에서 플레이어는 합리적으로 행동할 수밖에 없다. 따라서 각 플레이어는 상대방이 가능한 모든 선택지 중에서 자신에게 최선이 되는 선택을 할 것이라고 믿게 된다. 이러한 믿음이 형성되면, 각 플레이어는 이 가정을 바탕으로 자신의 기댓값을 가장 높이는 선택을 하게 된다. 이 과정은 게임에 참여하는 모든 플레이어에게 동일하게 적용된다.
3. 표현
동시적 게임은 플레이어들이 상대방의 선택을 알지 못한 채 동시에 행동(수)을 결정하고 그 결과에 따라 보수를 받는 게임이다.[4]
동시적 게임을 표현하는 가장 일반적인 방식은 정규형(Normal form) 또는 행렬 형식이다. 2인 게임의 경우, 한 플레이어는 행을 선택하고 다른 플레이어는 열을 선택하며, 각 셀에는 두 플레이어의 선택 조합에 따른 보수가 표시된다. 일반적으로 셀 안의 첫 번째 숫자는 행 플레이어의 보수, 두 번째 숫자는 열 플레이어의 보수를 나타낸다.[4] 각 플레이어는 자신의 보수를 극대화하는 선택을 하려 한다. 널리 알려진 가위바위보 게임이 대표적인 동시적 게임의 예시이다.[4]
또 다른 표현 방식은 확장형(Extensive form) 또는 게임 트리이다. 확장형은 일반적으로 순차적 게임을 나타내는 데 사용되지만, 정보 집합(Information set) 개념을 이용하여 동시적 선택을 모델링할 수 있다. 게임 트리에서 점선으로 연결된 노드들은 정보 집합을 나타내며, 이는 해당 노드에 도달한 플레이어가 자신이 정확히 어떤 노드에 있는지 구별할 수 없음을 의미한다. 즉, 상대방이 어떤 선택을 했는지 알 수 없는 정보 비대칭 상황을 표현하는 것이다.[7] 확장형 표현은 특히 2명 이상의 플레이어가 참여하는 복잡한 게임 분석에 유용할 수 있다.[4]
체스의 변형 게임 중 동기식 체스(Synchronous chess)나 패리티 체스(Parity chess) 등도 동시적 게임의 특징을 가진다.[8]
3. 1. Bimatrix Game
Bimatrix Game은 플레이어가 두 명인 동시적 게임을 나타내는 데 사용되는 표현 방식이다. 이는 게임을 정규형(행렬 형식)으로 나타낼 때 특히 유용하다.[4]이 표현 방식에서 한 플레이어는 행을 선택하고 다른 플레이어는 열을 선택하며, 두 플레이어는 동시에 자신의 수를 결정한다. 행렬의 각 셀에는 두 플레이어의 선택 조합에 따른 결과, 즉 각 플레이어가 얻는 보수가 표시된다. 일반적으로 셀 안의 첫 번째 숫자는 행 플레이어의 보수, 두 번째 숫자는 열 플레이어의 보수를 나타낸다.[4] 각 플레이어는 자신의 보수를 극대화하는 선택을 하려 한다.
이러한 Bimatrix 표현은 가위바위보와 같은 간단한 2인 게임부터 다양한 경제적, 사회적 상호작용을 분석하는 데 활용된다. 자세한 게임 표현 방식과 예시는 2인 게임 섹션에서 다룬다.
3. 1. 1. 2인 게임
동시적 게임에서 2인 게임은 가장 기본적인 형태로, 두 명의 플레이어가 동시에 자신의 행동(수)을 선택하여 게임의 결과를 결정하고 그에 따른 보수를 받는다.이러한 2인 동시 게임을 표현하는 가장 일반적인 방법은 정규형(Normal form) 또는 전략형(Strategic form)이라고 불리는 행렬 형식을 사용하는 것이다. 이 형식에서는 한 플레이어(보통 '행 플레이어'라고 함)가 행을 선택하고, 다른 플레이어('열 플레이어')가 열을 선택한다. 두 플레이어는 상대방이 어떤 선택을 할지 모르는 상태에서 동시에 자신의 선택을 결정한다. 행렬의 각 셀(칸)은 두 플레이어의 선택 조합에 따른 결과를 나타내며, 일반적으로 셀 안의 첫 번째 숫자는 행 플레이어의 보수, 두 번째 숫자는 열 플레이어의 보수를 의미한다.[4] 각 플레이어는 자신의 보수를 가장 크게 만드는 선택을 하려고 한다.
대표적인 2인 동시 게임의 예시로는 가위바위보가 있다. 두 플레이어는 '가위', '바위', '보' 중 하나를 동시에 내며 승패를 결정한다. 각 플레이어는 상대방의 선택을 알 수 없다. 이를 정규형으로 표현하면 다음과 같은 보수 행렬을 만들 수 있다. 여기서 첫 번째 숫자는 플레이어 1(행)의 보수, 두 번째 숫자는 플레이어 2(열)의 보수를 나타낸다 (승리: 1, 무승부: 0, 패배: -1).[4]
플레이어 1 \ 플레이어 2 | 바위 | 가위 | 보 |
---|---|---|---|
바위 | (0, 0) | (1, -1) | (-1, 1) |
가위 | (-1, 1) | (0, 0) | (1, -1) |
보 | (1, -1) | (-1, 1) | (0, 0) |
또 다른 예시로, 어떤 마을에 A와 B 두 회사가 광고를 할지 말지를 동시에 결정하는 상황을 들 수 있다. 각 회사는 현재 800만달러의 이익을 얻고 있으며, 광고 여부에 따라 이익이 달라진다. 다음 표는 각 회사의 선택에 따른 보수(이익)를 나타낸다 (단위: 백만 달러).[9]
회사 A \ 회사 B | B 광고함 | B 광고 안 함 |
---|---|---|
A 광고함 | (2, 2) | (5, 1) |
A 광고 안 함 | (1, 5) | (8, 8) |
동시적 게임은 정규형 외에도 확장형(Extensive form) 또는 게임 트리 형태로 표현될 수도 있다. 확장형은 일반적으로 순차적 게임을 나타내는 데 사용되지만, 정보 집합(Information set) 개념을 이용하여 동시적 선택을 모델링할 수 있다. 정보 집합은 특정 플레이어가 자신의 선택 시점에 상대방이 어떤 선택을 했는지 알 수 없다는 정보 비대칭 상황을 나타낸다. 즉, 게임 트리 상에서 어떤 노드들이 동일한 정보 집합에 속해 있다면, 해당 노드에 도달한 플레이어는 자신이 정확히 어떤 노드에 있는지 구별할 수 없다는 의미이다.[7] 2명 이상의 플레이어가 참여하는 복잡한 게임에서는 확장형 표현이 더 유용할 수 있다.[4]
체스의 변형 게임 중 동기식 체스(Synchronous chess)나 패리티 체스(Parity chess) 등도 동시적 게임의 특징을 가진다.[8]
3. 1. 2. 제로섬 2인 게임
제로섬 게임은 모든 결과에 대해 참여자들의 보수(payoff) 합이 0이 되는 게임을 말한다. 즉, 한 플레이어의 이득은 반드시 다른 플레이어의 손실과 동일한 크기를 가지며, 이는 마치 승자가 패자로부터 이득만큼을 빼앗아 오는 것과 같다.[9]특히 두 명이 참여하는 제로섬 게임에서는 한 플레이어의 보수가 다른 플레이어 보수의 음수 값과 같기 때문에, 일반적으로 한쪽 플레이어의 보수만 표시해도 게임의 구조를 파악하는 데 문제가 없다.[9]
예를 들어, 두 친구 A와 B가 10USD를 걸고 가위바위보 게임을 하는 상황을 생각해 볼 수 있다. 아래 표는 플레이어 A의 관점에서 얻거나 잃는 금액을 보여준다. A가 이기면 10USD를 얻고(+10), 비기면 아무런 변화가 없으며(0), 지면 10USD를 잃는다(-10). 플레이어 B의 보수는 이와 정확히 반대가 된다.
A \ B | 바위 | 보 | 가위 |
---|---|---|---|
바위 | 0 | -10 | 10 |
보 | 10 | 0 | -10 |
가위 | -10 | 10 | 0 |
3. 1. 3. 3인 이상 게임
세 명 이상의 플레이어가 참여하는 게임은 두 명의 플레이어가 참여하는 게임보다 상호작용이 더 복잡해질 수 있다. 2인 게임은 주로 정규형(행렬 형식)으로 표현되지만, 플레이어 수가 늘어나면 확장형(게임 트리) 표현이 더 유용할 수 있다. 확장형 게임은 특히 플레이어 간의 정보 비대칭 상황을 나타내는 데 효과적이다.[4]다음은 동시적으로 진행되는 3인 게임의 예시이다. 수업 시간에 자유 시간을 늘릴지 여부에 대해 세 명의 플레이어(A, B, C)가 투표를 한다고 가정하자. 플레이어 A는 전체 상황(아래의 두 표 중 하나)을 선택하고, 플레이어 B는 행을 선택하며, 플레이어 C는 열을 선택한다. 세 플레이어는 동시에 자신의 선택을 결정한다.[9] 각 플레이어의 선택 조합에 따른 보수(A의 보수, B의 보수, C의 보수 순서)는 다음과 같다.
플레이어 A가 자유 시간 증가에 찬성할 경우
플레이어 B 선택 | 플레이어 C 선택 | |
---|---|---|
자유 시간 증가 찬성 | 자유 시간 증가 반대 | |
자유 시간 증가 찬성 | 1, 1, 1 | 1, 1, 2 |
자유 시간 증가 반대 | 1, 2, 1 | -1, 0, 0 |
플레이어 A가 자유 시간 증가에 반대할 경우
플레이어 B 선택 | 플레이어 C 선택 | |
---|---|---|
자유 시간 증가 찬성 | 자유 시간 증가 반대 | |
자유 시간 증가 찬성 | 2, 1, 1 | 0, -1, 0 |
자유 시간 증가 반대 | 0, 0, -1 | 0, 0, 0 |
4. 대칭 게임
모든 플레이어가 동일한 선택지를 가지는 게임을 '''대칭 게임'''이라고 한다. 이 게임에서는 한 플레이어가 다른 플레이어의 행동을 선택했을 경우, 원래 그 행동을 선택했던 플레이어와 동일한 보상을 받게 된다. 즉, 플레이어들이 서로 행동을 바꾸면 보상도 서로 바뀌는 특징이 있다. 이러한 특성 때문에 대칭 게임은 모든 플레이어에게 공평한 기회를 제공하는 공정한 게임으로 여겨진다.[9]
5. 전략
동시적 게임에서 각 플레이어는 상대방이 어떤 선택을 할지 정확히 알지 못한 채 동시에 자신의 행동을 결정해야 한다. 모든 플레이어는 서로가 합리적이며 각자의 이익을 극대화하는 최선의 선택을 할 것이라고 예상한다.[5] 따라서 각 플레이어는 상대방의 가능한 모든 선택과 그에 따른 자신의 결과를 고려하여, 상대방이 최선의 선택을 한다는 가정 하에 자신의 보상을 최대화하는 전략을 선택해야 한다.
게임 이론은 이러한 상황에서 플레이어에게 어떤 행동이 가장 유리한지, 즉 최적 반응 전략을 찾는 데 도움을 준다.[10] 플레이어는 상대방의 전략을 예측하고 그 예측에 기반하여 자신의 기댓값을 가장 높이는 선택을 하게 된다. 이는 상대방 플레이어에게도 동일하게 적용된다.
동시에 선택한다는 것은 문자 그대로 같은 시간에 행동하는 것만을 의미하지는 않는다. 예를 들어 가위바위보처럼 동시에 패를 내는 경우도 있지만, 선거처럼 유권자들이 각자 다른 시간에 투표하더라도 다른 사람의 선택을 알 수 없는 상태에서 투표하는 경우도 동시적 게임에 해당한다.[5]
합리적인 의사 결정자는 최소한 자신의 보안 수준을 확보하는 선택을 고려할 수 있다. 보안 수준이란 다른 플레이어의 행동과 관계없이 자신이 최소한 확보할 수 있는 보상의 크기(maximin)를 의미한다.[6] 이는 플레이어가 상대방의 선택을 고려하지 않고 일방적으로 자신에게 보장할 수 있는 최소한의 이익이다.
5. 1. 순수 전략 vs 혼합 전략
순수 전략은 플레이어가 최적의 대응을 할 때 단 하나의 전략만을 선택하는 것을 의미한다. 이는 게임에서 가능한 모든 수를 결정하며, 플레이어의 완전한 계획이라고 할 수 있다. 반면, 혼합 전략은 플레이어가 최적의 대응이 될 수 있는 여러 전략 중에서 무작위로 하나를 선택하는 방식이다. 각 전략에는 선택될 확률이 부여된다.동시적 게임에서는 플레이어들이 일반적으로 혼합 전략을 선택하며, 순수 전략을 선택하는 경우는 상대적으로 드물다. 이는 상대방이 어떤 선택을 할지 모르는 상황에서, 상대방의 모든 가능한 선택을 고려했을 때 가장 낮은 위험으로 가장 큰 이익을 얻을 수 있는 방법을 찾는 것이 합리적이기 때문이다. 즉, 자신이 최적의 선택을 하더라도 상대방 또한 최적의 선택을 할 경우, 누군가는 손해를 볼 수 있기 때문에 확률적인 접근인 혼합 전략이 선호되는 경향이 있다.
5. 2. 우월 전략 vs 열등 전략
우월 전략은 상대방이 어떤 전략을 선택하든 상관없이 자신에게 항상 가장 높은 보수를 가져다주는 전략을 의미한다. 동시적 게임에서 플레이어에게 우월 전략이 존재한다면, 그 전략을 선택하는 것이 최선의 결정이다.[11]반면, 열등 전략은 다른 특정 전략에 비해 항상 더 낮은 보수를 제공하는 전략으로, 다른 전략에 의해 지배되는 전략이라고도 불린다. 동시적 게임을 분석할 때는 우선 각 플레이어에게 우월 전략이 있는지 확인한다. 만약 우월 전략이 없다면, 열등 전략, 즉 다른 전략에 의해 지배되는 전략들을 식별하여 제거한다. 이렇게 열등 전략을 제외하고 남은 전략들 중에서 플레이어는 자신의 선택을 결정하게 된다.[11]
5. 3. Maximin 전략
Maximin 전략은 각 선택지가 가져올 수 있는 결과 중 최악의 경우, 즉 자신이 받을 수 있는 가장 작은 보상에 집중하여 그중 가장 높은 값을 보장하는 선택을 하는 전략이다. 이는 가능한 최소 보상을 최대화(maximize the minimum)한다는 의미에서 '최소최대(Maximin)' 전략이라고 불린다.일부 플레이어는 다른 플레이어들이 자신에게 불리하게 행동할 것이라고 가정하며 최악의 상황을 대비하려 할 수 있다. 실제로는 다른 플레이어들도 각자 자신의 보상을 극대화하려 할 뿐이지만, Maximin 전략을 선택하는 플레이어는 이러한 최악 상황 가정 하에 자신의 최소 보장을 높이는 데 집중한다.
이 전략의 주요 특징은 상대방이 어떤 선택을 하든 상관없이 자신에게 최소한 '최소최대 값' 이상의 보상을 보장한다는 점이다. 따라서 상대방의 보상 구조나 정확한 선택을 알 필요 없이, 동시적 게임 상황에서도 자신의 선택을 내릴 수 있다.[10] 동시적 게임에서는 각 플레이어가 서로의 선택을 알지 못한 채 동시에 결정을 내려야 하므로, 이러한 보수적인 접근 방식이 하나의 합리적인 선택지가 될 수 있다. 각 플레이어는 상대방이 자신에게 최선의 선택을 할 것이라고 가정하고, 그 가정하에서 자신의 최대 이익을 추구하게 되는데, Maximin 전략은 이 과정에서 발생할 수 있는 최악의 결과를 회피하려는 접근 방식으로 이해할 수 있다.
5. 4. 내쉬 균형
동시적 게임에서 각 플레이어는 상대방이 어떤 선택을 할지 정확히 알지 못한 채 동시에 행동을 결정해야 한다. 하지만 모든 플레이어는 서로가 각자의 입장에서 가장 유리한, 즉 최적의 선택을 할 것이라고 예상하며, 이러한 예상을 바탕으로 자신의 선택을 내린다. 각 플레이어는 상대방의 가능한 모든 선택지를 고려하고, 그중 상대가 자신에게 최선이라고 판단할 행동을 할 것이라 믿으며 자신의 최대 이익을 추구하는 선택을 하게 된다.내쉬 균형은 이러한 동시적 게임 상황에서 중요한 개념으로, 게임에 참여하는 모든 플레이어들이 상대방의 전략을 주어진 것으로 보고 자신의 전략을 바꿀 유인이 없는 상태를 의미한다. 즉, 다른 모든 플레이어가 현재 전략을 유지하는 한, 어떤 플레이어도 자신만 전략을 변경해서 더 나은 결과를 얻을 수 없는 안정적인 상태이다. 이는 마치 게임 전에 협상이 이루어져 각자 합의된 행동을 따르는 것이 최선이 되는 '자기-강제적 합의'와 유사하다. 내쉬 균형 상태에서 각 플레이어의 전략은 다른 모든 플레이어의 전략에 대한 최적의 대응이 된다.[11][12]
게임 이론에서 가장 널리 알려진 예시 중 하나인 죄수의 딜레마는 내쉬 균형의 개념을 잘 보여준다. 또한, 플레이어 간의 조정이 중요하게 작용하는 성 대결 게임 역시 내쉬 균형을 통해 분석될 수 있다. 이러한 게임들은 각 플레이어가 자신의 이익을 추구하는 합리적인 선택을 하지만, 그 결과가 반드시 전체에게 최선이 아닐 수도 있음을 보여주기도 한다.
5. 4. 1. 죄수의 딜레마

죄수의 딜레마는 메릴 플러드와 멜빈 드레셔가 처음 소개한 게임 이론의 유명한 예시이다.[12] 이 게임은 개인의 합리적인 선택이 오히려 집단 전체에는 더 나쁜 결과를 가져오는 상황을 보여준다.
일반적으로 다음과 같은 상황으로 설명된다. 한 범죄 조직의 두 구성원이 경찰에 체포되어 서로 격리된 독방에 갇혔다. 검찰은 이들을 가벼운 혐의로는 기소할 증거를 가지고 있지만, 더 중한 주된 혐의를 입증할 증거는 부족하다. 그래서 검찰은 두 죄수에게 동시에 다음과 같은 제안을 한다.
- 협력 (침묵): 다른 죄수와의 의리를 지켜 침묵한다.
- 배신 (자백): 동료의 죄를 증언하고 감형을 받는다.
두 죄수는 서로 의사소통을 할 수 없으며, 각자의 선택에 따른 결과는 다음과 같은 보수 행렬로 나타낼 수 있다.[12]
죄수 A \ 죄수 B | 죄수 B가 침묵 (협력) | 죄수 B가 자백 (배신) |
---|---|---|
죄수 A가 침묵 (협력) | 각자 1년 복역 | 죄수 A: 3년 죄수 B: 3개월 |
죄수 A가 자백 (배신) | 죄수 A: 3개월 죄수 B: 3년 | 각자 2년 복역 |
이 게임의 결과는 명확하다. 각 죄수는 상대방이 어떤 선택을 하든 상관없이 배신(자백)하는 것이 자신에게 더 유리하다. 이를 지배 전략이라고 한다.
- 만약 상대방이 침묵(협력)한다면, 자신은 배신(자백)해서 3개월만 복역하는 것이 침묵해서 1년을 복역하는 것보다 낫다.
- 만약 상대방이 배신(자백)한다면, 자신도 배신(자백)해서 2년을 복역하는 것이 침묵해서 3년을 복역하는 것보다 낫다.
두 죄수 모두 합리적으로 자신의 이익만을 고려한다고 가정하면, 둘 다 서로를 배신하여 자백하는 선택을 하게 된다. 이 결과, 즉 (배신, 배신)은 이 게임의 유일한 내쉬 균형이다. 내쉬 균형 상태에서는 어느 누구도 자신만 선택을 바꿔서 더 나은 결과를 얻을 수 없다.[12]
흥미로운 점은 두 죄수 모두에게 최선의 결과는 둘 다 침묵(협력)하여 각각 1년씩, 총 2년만 복역하는 것이다. 이는 둘 다 배신했을 때의 총 복역 기간인 4년보다 훨씬 짧다. 하지만 서로를 신뢰할 수 없고 각자의 이익을 극대화하려는 합리적 선택이 결국 두 사람 모두에게 더 나쁜 결과(각각 2년 복역)를 가져오는 딜레마 상황이 발생하는 것이다. 이는 개인의 합리성이 반드시 집단의 합리성으로 이어지지 않음을 보여주는 대표적인 사례이다.
5. 4. 2. 성 대결 게임
성 대결 게임은 두 플레이어가 서로 다른 것을 선호하지만, 각자 다른 행동을 하는 것보다는 함께 행동하는 것에서 더 큰 만족을 얻는 상황을 나타내는 게임이다. 예를 들어, 아내와 남편이 저녁에 무엇을 할지 각자 결정한다고 가정해 보자. 선택지는 축구 경기 관람과 발레 공연 관람 두 가지이다. 남편은 축구를 더 좋아하고 아내는 발레를 더 좋아하지만, 둘 다 혼자 시간을 보내는 것보다는 함께 있는 것을 선호한다.이 상황에서는 두 가지 내쉬 균형이 존재한다. 하나는 남편과 아내 모두 축구 경기를 보러 가는 것이고 (축구, 축구), 다른 하나는 둘 다 발레 공연을 보러 가는 것이다 (발레, 발레). 내쉬 균형 상태에서는 어떤 플레이어도 상대방이 현재의 선택을 유지하는 한, 자신의 선택을 바꾸어서 더 나은 결과를 얻을 수 없다. 즉, 만약 둘 다 축구를 보기로 했다면, 아내는 혼자 발레를 보러 가는 것보다 남편과 함께 축구를 보는 것을 선호하므로 선택을 바꾸지 않을 것이다. 마찬가지로 남편도 선택을 바꾸지 않는다. 둘 다 발레를 보기로 한 경우에도 마찬가지이다.[11]
아래의 표는 각 선택 조합에 따른 남편과 아내의 보상(만족도)을 보여준다. 숫자가 클수록 더 만족도가 높다는 것을 의미한다.
colspan="2" rowspan="2" | | 아내 | ||
---|---|---|---|
축구 | 발레 | ||
남편 | 축구 | 3, 2 | 1, 1 |
발레 | 0, 0 | 2, 3 |
표에서 볼 수 있듯이, 남편은 (축구, 축구)에서 가장 높은 보상(3)을 얻고, 아내는 (발레, 발레)에서 가장 높은 보상(3)을 얻는다. 하지만 (축구, 발레)나 (발레, 축구)처럼 서로 다른 선택을 하면 보상이 낮아지거나 전혀 얻지 못한다(각각 1, 1과 0, 0). 따라서 두 사람은 서로 조율하여 같은 활동을 선택하는 것이 유리하며, 이것이 내쉬 균형으로 나타난다.
6. 사회적으로 바람직한 결과
동시적 게임은 주로 경쟁적이고 비협력적인 상황에서 참가자들이 어떻게 전략적인 선택을 하는지 분석하는 데 사용된다. 이러한 게임에서 중요한 개념 중 하나가 내쉬 균형인데, 이는 각 참가자가 다른 참가자들의 선택이 주어진 상태에서 자신의 선택을 바꿀 유인이 없는 상태를 의미한다.
하지만 개별 참가자들이 자신의 이익을 극대화하는 선택을 하여 도달하게 되는 내쉬 균형이 항상 사회 전체적으로 볼 때 가장 바람직한 결과로 이어지는 것은 아니다. 즉, 개인의 합리적인 선택이 때로는 집단 전체의 관점에서는 비효율적이거나 최선이 아닌 결과를 낳을 수 있다는 점에 유의해야 한다. 이는 게임 이론의 중요한 시사점 중 하나이다.
6. 1. 파레토 효율성

파레토 효율성(Pareto efficiency)은 다른 사람의 후생 수준을 낮추지 않으면서 최소한 한 사람 이상의 후생 수준을 높이는 것이 불가능한 자원 배분 상태를 의미한다. 이 개념은 이탈리아의 경제학자이자 사회학자인 빌프레도 파레토의 이름에서 유래했으며, 주로 완전 경쟁 시장의 이론적 분석에서 중요하게 다루어진다. 파레토 효율성은 자원이 가장 효율적으로 배분된 상태를 나타내며, 후생 경제학에서는 이를 파레토 최적성(Pareto optimality)이라는 이상적인 상태로 간주하기도 한다. 파레토 최적성은 종종 윤리적인 고려를 포함하는 개념으로 이해된다.
동시적 게임 이론의 맥락에서 어떤 결과가 파레토 효율적이거나 파레토 최적이라는 것은, 다른 모든 참가자의 보수를 현재 상태보다 나쁘게 만들지 않으면서 최소한 한 명 이상의 참가자 보수를 더 좋게 만들 수 있는 다른 결과가 존재하지 않음을 뜻한다. 이러한 결과는 사회 전체적으로 볼 때 바람직한 상태로 여겨질 수 있다.
그러나 동시적 게임에서 나타나는 내쉬 균형이 항상 파레토 효율적인 것은 아니다. 즉, 각 개인이 자신의 이익을 극대화하는 선택을 한 결과(내쉬 균형)가 사회 전체적으로는 비효율적인 상태에 머무를 수 있다는 점에 유의해야 한다. 이는 개인의 합리적 선택이 반드시 집단의 최선으로 이어지지 않을 수 있음을 보여준다.
6. 1. 1. 사슴 사냥
사슴 사냥(Stag Hunt) 게임은 철학자 장 자크 루소가 제시한 개념으로, 두 명의 참가자가 동시에 행동을 결정하는 게임이다. 각 참가자는 사슴을 사냥할지, 아니면 토끼를 사냥할지를 선택해야 한다.
사슴을 잡으면 토끼보다 더 큰 만족(보수)을 얻을 수 있지만, 여기에는 조건이 따른다. 바로 두 참가자가 함께 협력해야만 사슴을 잡을 수 있다는 점이다. 반면, 토끼는 각자 혼자서도 잡을 수 있다. 이 게임의 핵심적인 딜레마는 상대방이 어떤 선택을 할지 확실히 알 수 없다는 데 있다. 만약 한 명이 사슴 사냥을 선택했는데 다른 한 명이 토끼 사냥을 선택하면, 사슴 사냥을 택한 사람은 아무것도 얻지 못하게 될 위험이 있다.[14] 이러한 상황은 다음의 보수 표로 나타낼 수 있다.
colspan="2" rowspan="2"| | 참가자 2 | ||
---|---|---|---|
사슴 | 토끼 | ||
참가자 1 | 사슴 | 3,3 | 0,1 |
토끼 | 1,0 | 1,1 |
이 표에서 각 칸의 숫자는 (참가자 1의 보수, 참가자 2의 보수)를 의미한다. 둘 다 사슴 사냥을 선택하면 가장 높은 보수(3, 3)를 얻지만, 한 명이라도 토끼 사냥을 선택하면 결과가 달라진다.
사슴 사냥 게임은 두 참가자가 협력하여 사슴을 잡는 것이 모두에게 가장 이득이 되는, 즉 파레토 최적 상태임을 명확히 보여준다. 하지만 게임에 내재된 불확실성과 위험 때문에 항상 최적의 결과가 나타나는 것은 아니다. 상대방을 믿지 못하면, 더 낮은 보수를 얻더라도 안전한 토끼 사냥을 선택할 유인이 생기기 때문이다. 이는 상호 신뢰가 부족하여 잠재적인 이익을 실현하지 못하는 현실의 여러 상황에서 왜 협력이 어려운지를 설명하는 데 유용하다. 파레토 최적 상태가 반드시 게임의 전략적 결과(예: 내쉬 균형)가 되는 것은 아니지만, 참가자들에게 더 나은 결과의 가능성을 보여주고, 시간이 지남에 따라 어떻게 서로를 신뢰하고 협력하는 법을 배울 수 있는지에 대한 통찰을 제공한다.[15]
참조
[1]
서적
Industrial organization : contemporary theory and empirical applications
2014-01-28
[2]
문서
The Path to Equilibrium in Sequential and Simultaneous Games
http://www-bcf.usc.e[...]
2016
[3]
서적
Managerial Economics: 3 edition
McGraw Hill Education (India) Private Limited
[4]
간행물
Extensive Form Reasoning in Normal Form Games
https://www.jstor.or[...]
1993
[5]
문서
Simultaneous and Sequential Choice in a Symmetric Two‐Player Game with Canyon‐Shaped Payoffs
https://www.research[...]
2019
[6]
서적
U-M Weblogin
https://weblogin.umi[...]
2020
[7]
서적
Strategy : an introduction to game theory
2013-05-09
[8]
웹사이트
Parity Chess
http://paritychess.b[...]
Blogger
2014-10-07
[9]
문서
Game Theory Through Examples
https://www.maa.org/[...]
Mathematical Association of America Inc.
2014
[10]
문서
Game Theory
https://plato.stanfo[...]
2019
[11]
문서
Pure Strategy Nash Equilibrium and Simultaneous-Move Games with Complete Information
https://link.springe[...]
2016
[12]
서적
Prisoners of reason : game theory and neoliberal political economy
http://worldcat.org/[...]
Cambridge University Press
2016
[13]
간행물
Pareto-Optimality or Pareto-Efficiency: Same Concept, Different Names? An Analysis Over a Century of Economic Literature
http://dx.doi.org/10[...]
Emerald Group Publishing Limited
2014-10-10
[14]
간행물
In a Weakly Dominated Strategy Is Strength: Evolution of Optimality in Stag Hunt Augmented with a Punishment Option
http://dx.doi.org/10[...]
2016
[15]
간행물
Achieving Socially Optimal Outcomes in Multiagent Systems with Reinforcement Social Learning
http://dx.doi.org/10[...]
2013
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com