베이즈 게임
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
베이즈 게임은 불완전 정보 상황을 모델링하는 데 사용되는 게임 이론의 한 유형으로, 플레이어의 유형에 대한 불확실성을 특징으로 한다. 베이즈 게임은 (N, A, T, p, u)로 정의되며, 플레이어 집합(N), 각 플레이어의 행동 집합(A), 유형 집합(T), 사전 확률(p), 보수 함수(u)로 구성된다. 베이즈 게임은 사전, 중간, 사후 단계로 분석되며, 각 단계는 플레이어의 유형에 대한 지식을 나타낸다. 베이즈 게임의 균형은 베이즈 내시 균형과 완전 베이즈 균형으로 정의되며, 이는 각 플레이어가 상대방의 유형에 대한 자신의 믿음을 바탕으로 기대 보수를 극대화하는 전략 조합을 의미한다. 베이즈 게임은 시그널링 게임, 레몬 시장, 보안관의 딜레마, 독점 시장 진입 게임, 경매, 집단적 행위 주체성, 확률적 베이즈 게임 등 다양한 분야에 응용된다.
베이즈 게임은 불완전정보 게임을 분석하기 위한 모델로, 경기자, 행동, 유형, 보수, 사전 확률 등의 요소로 구성된다. 미비정보 게임은 가상의 경기자인 자연법칙을 도입하여 불완전정보 게임으로 변환할 수 있다.[33]
베이즈 게임은 사전 단계, 중간 단계, 사후 단계의 세 단계로 분석할 수 있다.[7] 미비정보 게임은 가상의 경기자인 자연법칙이 확률적으로 움직이는 형태의 불완전정보 게임으로 변환할 수 있다.[33]
2. 베이즈 게임의 구성 요소
베이즈 게임은 튜플 로 표현할 수 있는데,[33] 각 요소는 다음과 같다:요소 설명 경기자 집합 경기자 의 행동 집합 경기자 의 유형 집합 경기자의 유형에 관한 결합확률 경기자 의 보수함수
경기자의 전략은 자신의 유형에 따른 행동 계획으로 정의된다.[33] 순수전략은 함수 이고, 혼합전략은 함수 이다.
완비 정보 게임의 정규형 표현은 플레이어들의 전략 공간과 효용 함수로 나타난다. 베이즈 게임에서는 각 플레이어에 대해 전략 공간, 타입 공간, 효용 함수 및 신념을 특정화해야 한다. 신념은 다른 플레이어의 타입에 관한 불확실성을 나타내며, 조건부 확률 ''p''(다른 플레이어의 타입 | 자신의 타입)로 표현된다.
베이즈 게임 는 다음과 같이 정의된다.
:
여기서,
순수 전략 는 모든 에 대해 를 만족해야 한다. 순수 전략의 집합 는 다음과 같이 정의된다.
:
게임 의 베이지안 균형은, 게임 의 내쉬 균형으로 정의된다. 유한 게임 에 대해서는, 베이지안 균형은 항상 존재한다.
2. 1. 플레이어 (N)
베이즈 게임에서 플레이어 집합 ''N''은 게임에 참여하는 의사 결정 주체들을 의미한다.[33] 플레이어는 각자 선택할 수 있는 행동 집합, 가질 수 있는 유형 집합, 그리고 유형과 행동에 따른 보수 함수를 가진다.
2. 2. 행동 집합 (A)
는 경기자 의 행동 집합이다.[33] 행동 집합은 게임 내에서 경기자가 선택할 수 있는 행동의 집합을 의미한다.[33] 예를 들어, 카드 게임에서 카드의 임의 정렬 순서와 같은 것들이 해당될 수 있다.
2. 3. 유형 집합 (T)
Bayes영어 게임에서 각 플레이어가 가질 수 있는 사적인 정보의 집합을 유형 집합이라고 하며, 로 표시한다. 이는 기업의 생산 비용, 개인의 능력, 제품의 품질 등 다양한 정보가 될 수 있다.[33]
베이즈 게임은 (N, A, T, p, u)로 정의되며, 여기서 T는 유형 집합을 나타낸다. 구체적으로, 는 경기자 i의 유형 집합을 의미한다.
는 플레이어 i의 타입 집합이며, 함수 에 의해 결정된다. 이는 자연의 각 상태에 따라 플레이어들이 다른 타입을 가지며, 플레이어들의 귀결이 타입을 결정한다는 것을 의미한다. 같은 귀결을 가진 플레이어는 같은 타입에 속한다.
2. 4. 보수 함수 (u)
Utility function|보수 함수영어는 각 플레이어의 행동과 유형에 따라 결정되는 효용 또는 이익을 나타내는 함수이다.[33] 베이즈 게임에서, 플레이어 ''i''의 보수 함수 ''ui''는 ''ui : A × T → ℝ'' 와 같이 표현된다. 여기서 ''A''는 행동 집합, ''T''는 유형 집합을 의미한다. 즉, 보수 함수는 플레이어의 행동과 유형의 조합에 따라 효용값을 결정한다.
보다 형식적으로, 베이즈 게임 ''G = ⟨N, Ω, ⟨Ai, ui, Ti, τi, pi, Ci⟩i∈N⟩'' 에서,
여기서,
순수 전략 ''si: Ti → Ai''는 모든 ''ti''에 대해 ''(si(ti), ti) ∈ Ci''를 만족해야 한다. 플레이어 ''i''의 기대 효용은 ''ui(S) = Eω∼pi[ui(ω, s1(τ1(ω)), ..., sN(τN(ω)))]''로 주어진다.
2. 5. 사전 확률 (p)
사전 확률(p)은 다른 플레이어의 유형에 대한 각 플레이어의 초기 믿음을 나타내는 확률 분포이다. 모든 가능한 유형 프로필에 대한 확률 분포이며, 여기서 ''p(t) = p(t1, . . . ,tN)''는 플레이어 1이 유형 ''t1''을 갖고 플레이어 ''N''이 유형 ''tN''을 가질 확률이다.[1]
3. 베이즈 게임의 단계
3. 1. 사전 단계
플레이어들은 자신의 유형이나 다른 플레이어들의 유형을 알지 못한다. 플레이어들은 가능한 모든 유형에 대한 사전 분포를 기반으로 보수를 기대값으로 인식한다.[7]
3. 2. 중간 단계
플레이어는 자신의 유형은 알지만, 다른 플레이어의 유형은 확률 분포로만 안다. 플레이어는 보수를 고려할 때 다른 플레이어의 유형에 대한 기대값을 연구한다.[7]
3. 3. 사후 단계
플레이어들은 자신의 유형과 다른 플레이어들의 유형을 모두 알게 된다. 보수는 플레이어들에게 알려져 있다.[7]
4. 베이즈 게임의 균형
일반 게임에서 상대방의 전략이 주어졌다고 가정할 때 최적반응은 내시 균형이다. 즉, 다른 모든 경기자의 전략이 주어져 있는 상태에서 경기자가 일방적으로 행동을 바꿈으로써 더 높은 보수를 얻을 수 없다. 베이즈 게임에서도 유사한 개념을 정의할 수 있는데, 일반 게임과의 차이점은 상대방의 유형에 대한 믿음 체계(beliefs)를 바탕으로 자신의 기대 보수를 극대화한다는 점이다.
유한 베이즈 게임(행동 공간과 유형 공간 모두 유한한 경우)에서는 에이전트 형태 게임이나 유도된 정규형이라는 두 가지 동등한 표현으로 베이즈 내시 균형(BNE)을 계산할 수 있다.[9][10] 제로섬 목적 함수를 가진 두 명의 플레이어를 고려할 때, 선형 계획법을 구성하여 BNE를 계산할 수 있다.[11]
4. 1. 베이즈 내시 균형 (Bayesian Nash Equilibrium)
내시 균형은 다른 모든 경기자의 전략이 주어져 있는 상태에서, 경기자가 일방적으로 행동을 바꿈으로써 더 높은 보수를 얻을 수 없는 상태를 의미한다. 베이즈 게임에서도 이와 유사한 개념을 정의할 수 있는데, 일반 게임과의 차이점은 상대방의 유형에 대한 믿음 체계(beliefs)를 바탕으로 자신의 기대 보수를 극대화한다는 점이다.'''베이즈 내시 균형'''은 각 경기자가 상대방의 유형에 대한 자신의 믿음 체계와 상대방의 전략이 주어졌다고 가정할 때, 자신의 기대 보수를 극대화하는 전략 조합으로 정의된다. 모든 경기자 i에 대해서 다음 조건을 만족할 때 전략조합 은 베이즈 내시 균형이 된다.[34] 여기서 는 개별 경기자의 유형이다.
:
베이즈 게임의 베이즈-내시 균형은 관련된 사전적 정규형 게임의 내시 균형이다. 비베이즈 게임에서, 전략 프로파일은 프로파일 내의 모든 전략이 프로파일 내의 다른 모든 전략에 대한 최적 반응인 경우, 즉 다른 플레이어들이 사용하는 모든 전략을 고려할 때, 플레이어가 더 높은 보상을 얻을 수 있는 전략이 없는 경우 내시 균형이다.
베이즈 게임에서도 유사한 개념을 정의할 수 있는데, 차이점은 모든 플레이어의 전략이 자연 상태에 대한 그들의 믿음을 고려하여 기대 보상을 최대화한다는 것이다. 플레이어의 자연 상태에 대한 믿음은 베이즈 규칙에 따라 플레이어 자신의 유형에 대한 사전 확률 를 조건화하여 형성된다.
''베이즈-내시 균형(BNE)''은 각 플레이어가 자신의 믿음과 다른 플레이어들이 사용하는 전략을 고려할 때 기대 보상을 최대화하는 전략 프로파일로 정의된다. 즉, 모든 플레이어 에 대해, 다른 모든 플레이어의 전략을 고정하고, 전략 가 해당 플레이어의 믿음에 따라 플레이어 의 기대 보상을 최대화하는 경우에만 전략 프로파일 는 베이즈-내시 균형이다.[5]
유한 베이즈 게임, 즉 행동 공간과 유형 공간 모두가 유한한 경우, 두 가지 동등한 표현이 있다. 첫 번째는 에이전트 형태 게임이라고 하며 (게임 이론 책의 정리 9.51 참조[9]), 플레이어의 수를 에서