죄수의 딜레마

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요
2. 게임의 기본
3. 균형
4. 게임의 확장
5. 현실에서의 죄수의 딜레마
6. 반복 게임
- 6.1. 불완전 관측
7. 관련 개념
8. 비판
참조

1. 개요

죄수의 딜레마는 게임 이론의 기본 개념으로, 두 명의 용의자가 서로 협력하거나 배신하는 상황을 묘사한다. 이 게임은 각자의 이익을 추구하는 개인들이 협력하면 더 나은 결과를 얻을 수 있음에도 불구하고, 서로를 배신하는 선택을 함으로써 최악의 결과를 초래할 수 있음을 보여준다. 죄수의 딜레마는 경제학, 정치학, 생물학 등 다양한 분야에서 활용되며, 현실 세계의 협력과 경쟁, 사회적 딜레마를 이해하는 데 중요한 도구로 사용된다. 반복되는 죄수의 딜레마는 협력의 가능성을 제시하며, 팃포탯 전략과 같은 전략을 통해 협력이 진화할 수 있음을 보여준다.

더 읽어볼만한 페이지

환경학 - 환경 연구
환경 연구는 환경과 인간의 상호작용을 연구하는 학문 분야이며, 과학, 사회과학, 인문학적 지식을 융합하여 환경 문제를 이해하고 해결책을 모색한다.
딜레마 - 고슴도치 딜레마
고슴도치 딜레마는 가까이 다가가면 상처를 주고 멀어지면 고립되는 인간관계의 어려움을 고슴도치에 비유한 개념으로, 쇼펜하우어가 처음 묘사하고 프로이트가 심리학에 도입했으며, 사회적 배제 경험이 사회적 유대 형성을 촉진한다는 연구 결과도 제시된다.
딜레마 - 무임승차 문제
무임승차 문제는 공공재의 혜택을 누리면서 비용을 지불하지 않으려는 현상으로, 경제적 비효율성을 초래하며 다양한 해결 방안이 존재한다.
비협력 게임 - 제로섬 게임
제로섬 게임은 한쪽의 이익이 다른 쪽의 손실을 의미하는 게임으로, 협상을 통해 이익을 늘릴 수 없으며, 바둑, 장기, 도박 등이 예시로 제시된다.
비협력 게임 - 베르트랑 모형
베르트랑 모형은 동종 상품을 생산하는 기업들이 가격을 전략 변수로 사용하여 경쟁하는 과점 시장 모형으로, 경쟁사의 가격을 고려하여 자신의 가격을 결정하고 경쟁적인 가격을 형성하여 완전 경쟁 시장과 유사한 결과를 낳는다는 특징을 가진다.

죄수의 딜레마

2. 게임의 기본

두 명의 사건 용의자가 체포되어 서로 다른 취조실에서 격리되어 심문을 받는다. 이들에게는 자백 여부에 따라 다음과 같은 선택이 가능하다.^[69]

둘 중 하나가 배신하여 죄를 자백하면 자백한 사람은 즉시 풀려나고 나머지 한 명은 10년을 복역해야 한다.
둘 모두 서로를 배신하여 죄를 자백하면 둘 모두 5년을 복역한다.
둘 모두 죄를 자백하지 않으면 둘 모두 6개월을 복역한다.

검사는 죄수들을 자백하게 만들기 위해 다음과 같은 거래를 제안했다.^[69]

원래 징역 5년이지만, 둘 다 묵비권을 행사하면 증거 불충분으로 감형하여 둘 다 징역 2년이다.
한 명만 자백하면 즉시 석방(징역 0년)해주고, 묵비권을 행사한 쪽은 징역 10년이다.
둘 다 자백하면 판결대로 둘 다 징역 5년이다.

이때, "두 죄수는 각각 묵비권을 행사해야 할까, 아니면 자백해야 할까?"라는 문제가 발생한다. 죄수들은 별실에 격리되어 서로 상의할 수 없다.

이익표는 다음과 같다. 표 안의 (○년, △년)은 두 죄수의 징역이 각각 ○년, △년임을 의미한다.

	죄수 B 묵비	죄수 B 자백
죄수 A 묵비	(2년, 2년)	(10년, 0년)
죄수 A 자백	(0년, 10년)	(5년, 5년)

"서로 자백"하여 5년 형을 받는 것보다 "서로 묵비권"을 행사하여 2년 형을 받는 것이 이득이지만, 각자 자신의 이익만을 추구하면 "서로 자백"하게 된다.

죄수 A의 입장에서 생각해보면,

죄수 B가 "묵비권 행사" 시, 자신은 "자백"을 선택하여 0년(석방)이 되는 것이 이득이다.
죄수 B가 "자백" 시, 자신도 "자백"을 선택하여 5년 형을 받는 것이 이득이다.

따라서 죄수 A는 죄수 B의 선택과 관계없이 "자백"이 최적의 선택이다. 죄수 B도 마찬가지로, 결국 둘 다 "자백"을 선택하게 된다.

"죄수 B가 자백할지도 모른다"는 우려 때문이 아니라, 죄수 B가 어떤 선택을 하든 죄수 A는 합리적으로 자백을 선택한다.

"서로 묵비권 행사"(협조)가 파레토 효율적임에도, "서로 자백"은 내시균형이지만 파레토 효율적이지 않다. 즉, 양쪽 모두 "배신"을 선택하게 된다.

3. 균형

이 게임의 죄수는 상대방의 결과는 고려하지 않고 자신의 이익만을 최대화한다는 가정 하에 움직이게 된다. 이때 언제나 협동(침묵)보다는 배신(자백)을 통해 더 많은 이익을 얻으므로 모든 참가자가 배신(자백)을 택하는 상태가 내쉬 균형이 된다. 참가자 입장에서는 상대방의 선택에 상관없이 자백을 하는 쪽이 언제나 이익이므로 합리적인 참가자라면 자백을 택한다. 결국 결과는 둘 모두 5년을 복역하는 것이고, 이는 둘 모두가 자백하지 않고 2년을 복역하는 것보다 나쁜 결과가 된다.^[69]

두 죄수 A와 B의 행동과 징역의 관계를 표로 정리하면 다음과 같다.

	죄수 B 묵비	죄수 B 자백
죄수 A 묵비	(2년, 2년)	(10년, 0년)
죄수 A 자백	(0년, 10년)	(5년, 5년)

두 죄수 A와 B에게는 "서로 자백"하여 서로 5년의 형을 받는 것보다 "서로 묵비권을 행사"하여 서로 2년, 합계 4년의 형을 받는 것이 이득이다. 그러나 두 죄수가 "서로 묵비권을 행사"하는 것이 전체적인 이익임을 인지한 상태에서 두 죄수 A와 B가 각자 자신의 이익만을 추구하는 한, "서로 묵비권을 행사"라는 결과가 아니라 "서로 자백"이라는 결과가 되어 버린다. 이것이 딜레마라고 불리는 이유이다.

먼저 죄수 A의 입장에서는 다음과 같이 생각할 것이다.

죄수 B가 "묵비권을 행사"를 선택한 경우, 자신(=죄수 A)의 징역은 2년("묵비권을 행사"를 선택한 경우) 또는 0년("자백"을 선택한 경우)이다. 따라서 "자백"을 선택하여 0년의 징역이 되는 것이 이득이다.
죄수 B가 "자백"을 선택한 경우, 자신(=죄수 A)의 징역은 10년("묵비권을 행사"를 선택한 경우) 또는 5년("자백"을 선택한 경우)이다. 따라서 역시 "자백"을 선택하여 5년의 징역이 되는 것이 이득이다.

따라서 죄수 A에게는, 죄수 B가 어떻게 행동하든 자백하는 것이 최적의 선택이 된다. 이것은 죄수 B에게도 마찬가지이므로, 죄수 B도 죄수 A와 같은 생각으로 자백하는 것이 최적의 선택이다. 이러한 이유로 두 죄수 A와 B는 결과적으로 "서로 자백"이라는 행동을 하게 된다.

"죄수 B가 자백할지도 모른다"는 우려나 공포 때문에 죄수 A가 자백하는 것이 아니라, 죄수 B가 묵비권을 행사하든 자백하든 죄수 A는 합리적으로 자백한다는 점이 중요하다.

두 죄수 A와 B에게 "서로 묵비권을 행사"하는 것이 파레토 효율적임에도 불구하고, 두 죄수 A와 B가 각각 합리적으로 자백한다는 "서로 자백"이라는 결과는 내쉬 균형이기는 하지만 파레토 효율적이지는 않다.

두 죄수 A와 B가 "서로 묵비권을 행사"하는 것을 "협조"라고 바꾸어 말하고, "한쪽이 묵비권을 행사하고 있다고 가정하여 자신만 자백하여 석방받으려고 한다"는 것을 "배신"이라고 바꾸어 말할 때, 결과적으로 양쪽 모두 "배신"을 선택하게 된다.

4. 게임의 확장

죄수의 딜레마 게임에서 두 죄수가 서로 의사소통을 할 수 있다면, 보통은 약속을 깨는 경우가 많지만, 일부는 둘 다 발설했을 때의 결과를 예측하고 약속을 지키기도 한다.

죄수의 딜레마 게임은 참가자가 두 명이 아니라 여러 명(N 명)인 경우에도 동일한 결과가 나타난다. 자신을 제외한 나머지 참가자가 어떤 선택을 하든, 개인 입장에서는 항상 자백하는 것이 유리하므로 결국 모든 참가자들이 자백을 선택하게 된다.

표준적인 죄수의 딜레마 게임에서는 두 명의 플레이어가 동시에 행동한다. 반면, 플레이어 간 행동의 타이밍이 어긋나는 게임은 일반적으로 신뢰 게임이라고 불리지만, '''일방향 죄수의 딜레마'''라고도 한다.^[96] 일방향 죄수의 딜레마는 동시 행동의 죄수의 딜레마와 마찬가지로 한 번만 진행하면 협력이 성립하지 않지만, 무기한 반복하면 협력이 성립할 수 있다.

사회학에서는 죄수의 딜레마를 3인 이상으로 확대한 것을 사회적 딜레마라고 부르기도 한다.^[97] 이 경우 사회적 딜레마는 다음 세 가지 조건으로 정의된다.^[98]

# 각 개인이 협력 또는 비협력을 선택한다.

# 각 개인에게는 비협력을 선택하는 것이 협력보다 더 나은 결과를 얻을 수 있다.

# 모든 사람이 비협력을 선택하면, 모두가 협력한 경우보다 모두에게 바람직하지 않은 결과가 나타난다.

하지만 사회적 딜레마를 다인 죄수의 딜레마로만 한정하는 것은 너무 좁다는 의견도 있다.^[99] 그래서 사회적 딜레마의 정의를 확장하여, 모든 내쉬균형이 파레토 비효율적인 게임으로 정의하거나,^[100] 더 나아가 내쉬균형이 파레토 효율적인 다인 치킨 게임도 사회적 딜레마에 포함시키기도 한다.^[101]

직접 상호 이익은 로버트 트라이버스(Robert Trivers)가 제시한 진화생물학 개념으로, 개체 간 협력이 진화하는 메커니즘 중 하나이다.^[102] 두 개체가 반복적으로 만나고, 만날 때마다 협력 또는 배신을 선택할 때, 자신이 협력하면 상대도 다음에 협력할 가능성이 있어 협력이 유리할 수 있다. 이는 게임 이론의 반복적인 죄수의 딜레마에 해당한다.

로버트 액셀로드(Robert Axelrod)의 죄수의 딜레마 컴퓨터 토너먼트에서는 단순한 앙갚음 전략이 우승했지만, 곧 약점이 발견되었다. "떨리는 손"이나 "애매한 마음"으로 인한 오작동이 있으면 앙갚음 전략의 성적이 나빠지기 때문이다. 실수로 배신하면 보복전에 빠져 실수를 복구할 수 없기 때문에, "관용적인 앙갚음" 전략이 등장한다. 이는 상대가 협력할 때는 항상 협력하지만, 상대가 배신해도 가끔 협력하는 전략이다.

더 단순한 "이기면 그대로, 지면 바꾼다" 전략도 등장했다. 이는 잘 되고 있을 때는 바꾸지 않지만, 그렇지 않으면 바꾸는 전략이다. 이 전략은 성적 측정 방식에 따라 "앙갚음"이나 "관용적인 앙갚음"보다 강하다. 앙갚음 전략은 배신자가 많은 사회에서 협력을 촉진하지만, 협력이 확립되면 "이기면 그대로, 지면 바꾼다" 전략이 협력을 더 잘 유지할 수 있다.

협력을 촉진하는 전략은 많지만, 일반 법칙은 다음과 같다. 같은 두 개체가 다시 만날 확률(w)이 협력 행동의 비용(c)과 이익(b)의 비율을 넘을 경우(w > c / b)에만 직접 상호 이익은 협력의 진화를 촉진한다.

5. 현실에서의 죄수의 딜레마

현실에서 죄수의 딜레마와 유사한 상황은 다양한 분야에서 나타난다.
국제 관계신자유주의, 특히 신자유제도주의는 죄수의 딜레마를 이용해 국제 관계에서 나타나는 문제들을 설명하려 한다. 개별 국가들이 세계적인 환경을 해치고, 자원을 남획하며, 분쟁 지역에 무기를 판매하는 이유를 죄수의 딜레마로 설명할 수 있다.^[2] 상위 정부가 없는 국제 체제에서, 상대 국가가 항상 협력적으로 나올 것이라고 기대하기 어렵기 때문에 각 국가는 자신의 이익을 추구한다. 신자유 제도주의자들은 이러한 상황이 국가 간 협력의 필요성을 강조하며, 국제 레짐과 같은 개별 국가를 초월하는 기구의 등장을 예측한다.

국제정치학 이론에서 죄수의 딜레마는 국가 간 협력이 집단적으로는 최적이지만 개별적으로는 비최적일 때 협력이 실패하는 이유를 보여주는 데 자주 사용된다.^[35]^[36] 전형적인 예로, 한 국가의 안보 증진(예: 군사력 증강)이 다른 국가들로 하여금 공격 행위에 대한 두려움으로 인해 자국의 안보를 우려하게 만드는 안보 딜레마가 있다.^[37] 결과적으로 안보 증진 조치는 한 개 이상의 다른 당사자와의 긴장, 고조 또는 갈등으로 이어져 어떤 당사자도 진정으로 바라지 않는 결과를 초래할 수 있다.^[38]^[37]^[39]^[40]^[41] 공격 무기를 방어 무기와 구별하기 어렵고 공격이 방어보다 유리한 상황에서는 안보 딜레마가 특히 심각하다.^[37]

죄수의 딜레마는 현실주의(Realism) 국제 관계 이론가들이 모든 국가가 (내부 정책이나 표방하는 이념에 관계없이) 국제 무정부 상태(anarchy) 하에서 협력으로부터 모든 국가가 이익을 얻을지라도 서로 협력하는 데 어려움을 겪을 것이라는 점을 보여주는 데 자주 사용해왔다.

현실주의 비판론자들은 반복과 미래의 그림자 확장이 죄수의 딜레마에 대한 해결책이라고 주장한다. 행위자들이 죄수의 딜레마를 한 번만 수행하는 경우에는 배신할 유인이 있지만, 반복적으로 수행할 것으로 예상하는 경우에는 협력할 유인이 더 커진다.^[42]
환경 문제환경학에서 죄수의 딜레마는 전 지구적 기후 변화와 같은 위기 상황에서 명확하게 나타난다. 모든 국가가 안정적인 기후로부터 이익을 얻지만, 개별 국가는 이산화탄소 배출량 감축을 망설인다. 이는 현재의 행동을 유지함으로써 얻는 즉각적인 이익이, 모든 국가가 행동을 바꿀 경우 얻게 될 최종적인 이익보다 크다고 여겨지기 때문이다.^[24]
경제광고는 죄수의 딜레마의 실제 사례로 종종 언급된다. 예를 들어, 미국에서 담배 광고가 합법이었을 때, 경쟁하는 담배 회사들은 광고비 지출 규모를 결정해야 했다. A사의 광고 효과는 B사의 광고에 따라 부분적으로 결정되었고, B사의 광고 이익도 A사의 광고에 영향을 받았다. 두 회사 모두 광고를 하면 서로의 광고 효과가 상쇄되어 매출은 일정하게 유지되고 광고 비용만 증가한다. 두 회사 모두 광고를 줄이면 이익을 얻을 수 있지만, B사가 광고하지 않으면 A사는 광고를 통해 큰 이익을 얻을 수 있다.

카르텔 구성원들도 죄수의 딜레마에 직면한다.^[33] "협력"은 최저가격에 동의하는 것이고, "배신"은 이보다 낮은 가격으로 판매하여 다른 구성원으로부터 사업을 가져가는 것이다. 반독점 당국은 카르텔 구성원들이 상호 배신하여 소비자에게 가능한 한 낮은 가격을 보장하기를 원한다.
사회 현상죄수의 딜레마는 공공재 공급, 공유 자원 관리, 자유 무역, 군축 등 다양한 사회 현상을 설명하는 데 사용된다.^[65]
생물학많은 동물들의 협동 행동은 반복되는 죄수의 딜레마의 예로 이해될 수 있다. 동물들은 종종 장기적인 파트너십을 맺는다. 예를 들어, 구피들은 무리 지어 포식자를 협력적으로 감시하며, 협력적이지 않은 감시자들을 처벌하는 것으로 여겨진다.^[27]

흡혈박쥐는 상호적인 먹이 교환에 참여하는 사회적 동물이다. 죄수의 딜레마에서 얻는 이득을 적용하면 이러한 행동을 설명하는 데 도움이 될 수 있다.^[28]
심리학중독 연구와 행동경제학에서 조지 에인슬리(George Ainslie)는 중독을 현재의 자아와 미래의 자아 사이의 시간적 죄수의 딜레마 문제로 볼 수 있다고 지적한다. 이 경우 "배신"은 재발을 의미하며, 오늘과 미래에 모두 재발하지 않는 것이 훨씬 더 나은 결과이다. 오늘은 절제하지만 미래에 재발하는 경우가 가장 나쁜 결과이다. 어떤 의미에서 오늘 절제하는 데 드는 훈련과 자기희생은 미래의 재발로 인해 "낭비"되었기 때문에 중독자는 처음 시작했던 지점으로 돌아가 다시 시작해야 한다. 오늘과 내일 모두 재발하는 것은 약간 "더 나은" 결과이다. 중독자는 여전히 중독되어 있지만 중단하려는 노력을 기울이지 않았기 때문이다. 마지막 경우, 즉 오늘은 중독 행위에 참여하지만 내일은 절제하는 경우에는 다른 죄수의 딜레마와 마찬가지로 "오늘" 배신하는 데 분명한 이점이 있지만, 내일 같은 죄수의 딜레마에 직면하고 같은 분명한 이점이 나타나므로 궁극적으로 끝없는 배신의 연속으로 이어진다.^[29]

존 갓먼(John Gottman)은 그의 저서 『신뢰의 과학(The Science of Trust)』에서 좋은 관계를 파트너들이 상호 배신 행동에 빠지지 않거나, 적어도 그러한 순환에 역동적으로 갇히지 않는 관계로 정의한다. 인지 신경과학에서는 서로 다른 라운드를 처리하는 것과 관련된 빠른 뇌 신호가 다음 라운드의 선택을 나타낼 수 있다. 상호 협력 결과는 사람이 다음 기회에 얼마나 빨리 친절하게 협력할지 예측하는 뇌 활동 변화를 수반한다.^[30] 이러한 활동은 기본적인 항상성 및 동기 부여 과정과 관련이 있을 수 있으며, 상호 협력으로 단축할 가능성을 높일 수 있다. 죄수의 딜레마는 사회심리학의 ''대장균''이라고 불리며, 과점 경쟁과 집단적 이익을 창출하기 위한 집단 행동과 같은 다양한 주제를 연구하는 데 널리 사용되어 왔다.^[31]
스포츠스포츠에서의 도핑은 죄수의 딜레마의 예로 제시된다. 두 명의 경쟁 선수가 불법 약물을 사용하여 성적을 향상시킬 수 있다. 둘 다 약물을 복용하지 않으면 이점을 얻지 못한다. 한 명만 복용하면 경쟁자보다 유리하지만, 법적/의학적 위험이 따른다. 둘 다 복용하면 이점은 상쇄되고 위험만 남아, 둘 다 복용하지 않은 경우보다 불리하다.^[34]

6. 반복 게임

두 명의 플레이어가 죄수의 딜레마를 연속적으로 여러 번 플레이하고, 상대방의 이전 행동을 기억하며 그에 따라 전략을 변경할 수 있는 경우, 이 게임을 반복 죄수의 딜레마라고 한다. 반복 죄수의 딜레마는 인간의 협력과 신뢰에 대한 일부 이론의 기본이 된다. 1975년 그로프만과 풀은 이와 관련한 학술 논문 수를 2,000편 이상으로 추산했다. 반복 죄수의 딜레마는 "평화-전쟁 게임"이라고도 불린다.^[3]^[4]

일반적인 형태 외에도, 반복 버전은 상호 협력보다 교차 협력과 배반이 더 큰 보상을 주는 것을 방지하기 위해 2R > T + S를 필요로 한다.

유한 번 반복되는 죄수의 딜레마 게임에서 두 참가자 모두 게임 횟수를 알고 있다면, 모든 회차에서 배반하는 것이 우월 전략이자 내쉬 균형이다. 이는 귀납적 증명으로 알 수 있다. 상대방이 보복할 기회가 없으므로 마지막 회차에는 배반하는 것이 이익이다. 따라서 두 참가자 모두 마지막 회차에 배반하며, 마지막에서 두 번째 회차에도 마찬가지로 배반한다. 이는 게임의 길이가 알려지지 않았지만 알려진 상한선이 있는 경우에도 동일하다.

합리적인 참가자들 사이에서 협력이 나타나려면 게임 회차 수가 알 수 없거나 무한해야 한다. 그 경우 "항상 배반"이 더 이상 우월 전략이 아닐 수 있다. 1959년 로버트 아우만의 논문^[5]은 무기한 반복 게임에서 합리적인 참가자들이 협력을 지속할 수 있음을 보여준다. 상대방이 여러 번 협력하지 않으면 협력 의향이 줄어들 수 있지만, 시간이 지나면서 "암묵적 합의"가 형성되어 협력 가능성이 높아지기도 한다. 실험 상황에서는 반복 횟수를 알더라도 협력이 발생할 수 있다.^[6]

로버트 액설로드(Robert Axelrod)는 1984년 저서 "협력의 진화(The Evolution of Cooperation)"에서 반복 죄수의 딜레마 토너먼트를 통해 이 문제를 탐구했다. 그는 전 세계 학자들에게 컴퓨터 전략을 고안하게 하여 경쟁시켰다.

액설로드는 장기간 많은 플레이어들이 반복적으로 게임을 할 때, 순전히 자기 이익만 고려하면 탐욕스러운 전략은 장기적으로 부진한 반면, 이타적인 전략은 더 나은 성과를 낸다는 것을 발견했다. 이는 자연선택을 통해 이기적인 메커니즘에서 이타적 행동이 진화할 수 있음을 보여준다.

우승한 결정론적 전략은 아나톨 라포포트(Anatol Rapoport)가 개발한 "받은 대로 돌려주기(tit for tat)"였다. 이 전략은 처음에는 협력하고, 이후에는 상대방의 이전 행동을 따라 한다. "용서하는 받은 대로 돌려주기" 전략이 약간 더 나을 수도 있다.

성공적인 전략은 다음 조건을 갖춰야 한다.

친절함(Nice): 먼저 배신하지 않는다.
보복(Retaliating): 때때로 보복한다.
관용(Forgiving): 보복하더라도 상대가 계속 배신하지 않으면 다시 협력한다.
비독점(Non-envious): 상대보다 더 많은 점수를 얻으려 하지 않는다.

일회성 게임과 달리, 반복 죄수의 딜레마에서 최적 전략은 상대방의 전략과 반응 방식에 따라 달라진다.

죄수의 딜레마 게임을 한 번만 하면 둘 다 "배신"을 선택하지만, 반복 게임에서는 게임 반복 횟수를 아는지 여부에 따라 행동이 달라진다.

반복 횟수를 알면 '''유한 반복 게임'''이며, 이 경우 항상 "배신"을 선택한다.^[70] 이는 귀납법으로 증명 가능하다('''후퇴 귀납법''').

마지막 게임은 결과가 이후에 영향을 주지 않으므로, 한 번만 하는 게임과 같아 모두 "배신"을 선택한다.
마지막 게임에서 모두 "배신"하므로, 그 전 게임에서도 "배신"을 선택한다.
이를 반복하면 모든 게임에서 "배신"을 선택한다.

반복 횟수를 모르면 '''무한 반복 게임'''이다. 유한 반복 게임과 달리 후퇴 귀납법을 적용할 수 없어 협조 가능성이 생긴다.

다음 이득표를 보자.^[71] ("수감자"는 "플레이어"로 대체)

$p_a \backslash p_b$	협조	배신
협조	$2 \backslash 2$	$0 \backslash 3$
배신	$3 \backslash 0$	$1 \backslash 1$

트리거 전략을 고려해 보자.

처음에는 협조, 상대가 배신하면 계속 배신, 아니면 협조.

서로 이 전략을 쓰면 벗어날 인센티브가 없어 내쉬 균형이 된다.

가장 간단한 경우는 미래를 할인하지 않는 경우다.^[72] 무한 반복 게임에서 평균 이득을 극대화한다고 가정한다.^[73] 서로 트리거 전략이면 협조하여 매번 이득 2, 평균 이득도 2다. 배신하면 한 번은 3을 얻지만 이후에는 1만 얻어 평균 이득은 1이 된다. 따라서 트리거 전략에서 벗어나면 장기적으로 손해이므로, 협조가 내쉬 균형이 된다.

보복 전략 등 다른 전략도 균형이 될 수 있다.^[74] 협조를 실현하는 균형은 무수히 많으며, 서로 배신하는 것도 균형이다. 이는 포크 정리에서 나타난다.^[75]

평균 이득 극대화는 플레이어가 미래를 할인하지 않는다는 비현실적인 가정이다.^[76] 미래를 할인하는 경우는 다음과 같다.^[77]

미래 이득을 할인율

\delta \in(0,1)

로 할인한 총합을 극대화한다고 가정하자. 서로 트리거 전략이면 매회 이득 2, 할인 이득 총합은

:

2+2\delta+2\delta^2+\ldots=\frac{2}{1-\delta}=S_1

이다. 배신하면 한 번은 3을 얻지만 이후에는 1만 얻어, 할인 이득 총합은

:

3+1\delta+1\delta^2+\ldots=3+\frac{1\delta}{1-\delta}=S_2

이다.

\delta\geq1/2

이면

S_1\ge S_2

이므로 배신할 인센티브가 없어 트리거 전략은 내쉬 균형이 된다. 즉, 할인율이 충분히 높으면 협조가 가능하다.

무한 반복 게임은 비현실적이므로, '''무기한''' 반복 게임을 고려한다.^[76] 확정적 기한은 없지만 확률적으로 끝날 가능성을 고려한다. 종료 확률이 충분히 작으면 트리거 전략이 내쉬 균형이 되어 협조가 가능하다.

6. 1. 불완전 관측

죄수의 딜레마에서 최적 전략을 찾는 일반적인 방법은 두 가지가 있다.

베이즈 내시균형: 상대방 전략의 통계적 분포를 알 수 있다면, 최적의 대응 전략을 분석적으로 찾을 수 있다.^[13]
몬테카를로 시뮬레이션: 점수가 낮은 개체는 제거하고, 높은 개체는 번식시키는 유전 알고리즘을 통해 최적 전략을 찾는다. 돌연변이를 도입하면 초기 개체군에 대한 의존성을 줄일 수 있다. 경험적 실험에 따르면, 이러한 시스템은 대체로 호혜적 전략을 사용하는 플레이어를 생성하지만, 항상 그렇다는 분석적 증명은 없다.^[14]

승리-유지, 패배-전환 전략은 협력에 실패하면 다음 턴에 전략을 바꾼다.^[15] 특정 상황에서는 파블로프 전략이 비슷한 전략을 사용하는 공동 플레이어에게 우선적인 대우를 함으로써 다른 모든 전략을 능가하기도 한다.

호혜적 전략이 가장 강력하다고 알려져 있지만, 2004년 죄수의 딜레마 토너먼트에서는 사우샘프턴 대학교 연구팀이 프로그램 간 공모를 통해 최고 점수를 얻는 전략을 소개했다. 이들은 처음 몇 번의 움직임을 통해 서로를 인식하고, 한 프로그램은 항상 협력, 다른 프로그램은 항상 배반하여 배반자에게 최대 점수를 보장했다.^[16] 비 사우샘프턴 플레이어와 게임할 때는 지속적으로 배반하여 경쟁자 점수를 최소화했다. 결과적으로 GRIM 전략보다 승리가 적고 패배가 많았음에도 상위권을 차지했다. 이는 참가 프로그램 수에 제한이 없고, 팀 성과가 최고 점수를 받은 플레이어 성과로 측정되었기 때문이다.

이러한 결과는 다중 에이전트 프레임워크에서, 특히 노이즈가 있을 때 협력 전략을 분석하는 기반을 제공했다.

이기적인 유전자의 저자 도킨스는 여러 참가가 허용되면 이러한 전략이 승리할 가능성이 있다고 지적했지만, 액설로드가 허용하지 않았을 것이라고 언급했다. 또한, 사우샘프턴 프로그램의 "10회 움직임 춤"은 프로그램 간 통신이 게임 균형을 바꿀 수 있음을 보여준다.

소프트웨어 전략 간 암묵적 공모가 없어도, 호혜적 전략이 항상 절대적 승자는 아니다. 장기적으로는 경쟁자보다 우수하지만, 단기적으로는 그렇지 않을 수 있다. 이는 관용을 베푸는 호혜적 전략 등 다른 최적 전략에도 적용된다.

ESS 시뮬레이션에서 호혜적 전략은 대개 우세하지만, 나쁜 전략은 개체군 내에서 변동한다. 호혜적 전략 개체군은 보복하지 않는 좋은 전략에 침투될 수 있고, 이는 다시 나쁜 전략의 먹잇감이 되기 때문이다. 도킨스는 전략의 정적 혼합이 안정된 평형을 이루지 못하고 시스템이 항상 경계 사이에서 진동한다고 보았다.

확률적 반복 죄수의 딜레마 게임에서 전략은 "협력 확률"로 나타낸다.^[17] 플레이어 X와 Y의 만남에서, X의 전략은 Y와 협력할 확률 P의 집합으로, 이전 만남 결과의 함수이다. P가 최근 n번의 만남에만 의존하면 "기억력-n" 전략이라고 한다. 기억력-1 전략은 네 가지 협력 확률

P=\{P_{cc},P_{cd},P_{dc},P_{dd}\}

로 표현된다. 여기서 P_cd는 이전 만남에서 X가 협력, Y가 배반한 경우 X가 현재 협력할 확률이다. 각 확률이 1 또는 0이면 결정론적 전략이다. 예를 들어,

P=\{1,0,1,0\}

은 눈에는 눈, 이에는 이 전략이고,

P=\{1,0,0,1\}

은 이기면 유지, 지면 전환 전략이다. 모든 기억력-n 전략에 대해 동일한 통계적 결과를 제공하는 기억력-1 전략이 존재하므로, 기억력-1 전략만 고려하면 된다.^[17]

X의 전략 벡터

P

와 Y의 전략 벡터

Q=\{Q_{cc},Q_{cd},Q_{dc},Q_{dd}\}

(Y 관점)가 주어지면, 전이 행렬 M을 정의할 수 있다. M의 ij번째 항목은 이전 만남 결과가 i였을 때 현재 만남 결과가 j일 확률이다. 예를 들어,

M_{cd,cd}=P_{cd}(1-Q_{dc})

이다. 반복 죄수의 딜레마는 확률 과정으로 분류되며, M은 확률 행렬이므로 확률 과정 이론을 적용할 수 있다.^[17]

확률 이론에 따르면,

v\cdot M=v

인 정상 벡터 v가 존재한다. v의 네 구성 요소 합이 1이 되도록 정규화하면,

M^n

의 ij번째 항목은 n 단계 전 만남이 i였을 때 결과가 j일 확률이다. n이 무한대로 갈 때 M은 고정된 값을 가진 행렬로 수렴, i와 관계없이 만남이 j를 생성할 장기 확률을 제공한다. 즉,

M^\infty

의 행은 동일하며, 반복 죄수의 딜레마의 장기 평형 결과 확률을 알 수 있다. v는

M^n

과

M^\infty

의 정상 벡터이므로,

M^\infty

의 각 행은 v와 같다. 따라서 정상 벡터는 X의 평형 결과 확률을 나타낸다.

S_x=\{R,S,T,P\}

및

S_y=\{R,T,S,P\}

를 {cc, cd, dc, dd} 결과에 대한 단기 지불 벡터(X 관점)로 정의하면, X와 Y의 평형 지불은

s_x=v\cdot S_x

,

s_y=v\cdot S_y

로 주어지며, 두 전략 P와 Q를 장기 지불로 비교할 수 있다.

지금까지는 상대방 행동을 완벽하게 관찰할 수 있다고 가정했지만, 현실에서는 불완전하게 관찰하는 경우가 많다. "상대방이 협조했는데 배신했다고 오해"하거나 "배신당했는데 눈치채지 못하는" 경우가 그 예이다. 이러한 '''불완전 관찰''' 하에서의 무한 반복 죄수의 딜레마 이론은 최근 크게 발전하고 있다.^[78]

불완전 관찰의 경우, 상대방 행동을 나타내는 '''신호'''를 관찰할 수 있다. 모두가 관찰하는 신호는 '''공적''' 불완전 관찰, 자신만 볼 수 있는 신호는 '''사적''' 불완전 관찰이라고 한다.^[79]

'''공적 불완전 관찰'''은 분석이 비교적 쉽다.^[80] 완전 관찰 하의 트리거 전략과 유사한 전략으로 협조가 가능하다.^[81] 포크 정리는 1994년에 느슨한 조건에서 증명되었다.^[82]

반면, '''사적 불완전 관찰'''은 분석이 어렵고 연구가 진행 중이다.^[80] 협력 전략을 찾는 것 자체가 난제였고, 오랫동안 게임 이론의 미해결 문제였다.^[83] 1997년에 높은 정확도로 사람 행동을 사적 관찰할 수 있는 경우 협력 전략이 발견되었고,^[83] 1998년에는 의사소통이 가능하면 느슨한 조건에서 포크 정리가 증명되었다.^[84] 의사소통이 불가능한 경우, 상대방이 본 것을 신경 쓸 필요 없는 특수 균형을 만드는 '''신념 무관 접근법'''이 성과를 거두고 있다.^[84] 2002년에는 신념 무관 접근법으로 죄수의 딜레마 균형을 간단히 만드는 방법이 발견되어 연구가 진전되기 시작했고,^[84] 2012년에는 사적 불완전 관찰 하의 포크 정리가 상당히 느슨한 조건에서 증명되었다.^[85]

7. 관련 개념

아담 스미스 등의 자유주의 시장 경제 이론에 따르면, 각 행위자들이 자신의 이익을 극대화하기 위해 행동하면 정부의 역할이 없더라도 '보이지 않는 손'에 의해 균형이 달성되어 사회적으로 바람직한 결과가 나온다. 하지만 죄수의 딜레마 게임에서는 각 행위자들이 자신의 이익을 극대화하려 할 때 모두에게 최악의 결과가 발생한다. 이는 자발적인 의사소통과 약속으로는 해결할 수 없고, 정부나 국가 같은 외부 행위자가 개입하여 법률, 제도, 세금 등으로 각 행위자의 행동을 강제해야만 사회적으로 바람직한 결과를 얻을 수 있다는 이론적 근거로 활용된다.

한편, '반복되는 죄수의 딜레마'(Iterated Prisoner's Dilemma)는 팃포탯 전략 실험을 통해 죄수의 딜레마가 지속적으로 반복될 경우 최적의 선택은 결국 협동이라는 것을 보여준다.

신자유주의, 특히 신자유제도주의론자들은 죄수의 딜레마를 이용해 국제 관계에서 나타나는 문제들을 이론적으로 정형화하려 했다. 예를 들어, 개별 국가들이 세계적인 환경을 해치고, 자원을 남획하며, 분쟁 지역에 무기를 판매하는 이유를 설명하는 데 활용되었다. 상위 정부가 없는 국제 체제에서 상대 국가의 협력을 기대하기 어렵기 때문에, 각 국가는 자신의 이익을 추구하게 된다. 신자유 제도주의자들은 이 결과 국가들이 협력의 필요성을 느끼고, 국제 레짐의 등장을 필요로 할 것이라고 전망한다.

더글러스 호프스태터^[49]는 죄수의 딜레마와 같은 문제를 간단한 게임이나 거래의 형태로 보여주면 사람들이 더 쉽게 이해한다고 제안하며, "닫힌 가방 교환"을 예시로 들었다.

프렌드 오어 포?는 죄수의 딜레마와 유사한 게임을 통해 상금을 나누는 게임쇼였다. 두 사람 모두 협력하면 상금을 50대 50으로 나누고, 한 사람이 배신하면 배신자가 모두 가져가며, 둘 다 배신하면 둘 다 아무것도 얻지 못한다.

이 보상 행렬은 영국 텔레비전 프로그램 ''Trust Me'', ''섀프티드'', ''더 뱅크 잡'', ''골든 볼스''와 미국 게임쇼 ''테이크 잇 올'' 등에서도 사용되었다. ''골든 볼스'' 게임 데이터 분석 결과, 실제 돈이 걸린 상황에서 협력은 "놀라울 정도로 높았다".^[50]

로잔대학교와 에든버러대학교 연구진은 "반복되는 눈더미 게임"(Iterated Snowdrift Game)이 실제 사회 상황을 더 잘 반영한다고 제안했다. 이 모델에서는 배신을 통해 착취당할 위험이 낮고, 개인은 항상 협력적인 선택을 통해 이득을 얻는다.

눈더미 게임의 예시 지불액 (A, B)
	협력	배신
협력	500, 500	200, 800
배신	800, 200	0, 0

죄수의 딜레마 예시 지불액 (A, B)
	협력	배신
협력	500, 500	−200, 1200
배신	1200, −200	0, 0

협력 게임에서는 플레이어들이 좋은 결과를 얻기 위해 전략을 조정해야 한다. 예를 들어, 눈보라 속에서 두 대의 자동차가 만나는 경우, 각 자동차는 좌회전 또는 우회전을 선택해야 한다. 지역 좌측통행 및 우측통행 관습은 그들의 행동을 조정하는 데 도움이 된다.

대칭적인 협력 게임에는 사슴 사냥 게임과 바흐 또는 스트라빈스키가 포함된다.

비대칭적인 게임도 있는데, 죄수의 딜레마처럼 최상의 결과는 협력이고 배신에 대한 동기가 있지만, 한 플레이어가 더 많이 잃거나 얻을 수 있다. 이러한 게임 중 일부는 한 명의 죄수가 알리바이를 가지고 있는 죄수의 딜레마로 설명되어 "알리바이 게임"이라고도 한다.^[53]

실험에서 반복 게임에서 불균등한 보상을 받는 플레이어는 이익을 극대화하려고 할 수 있지만, 두 플레이어 모두 동일한 보상을 받는다는 조건 하에서만 가능하다. 이는 불리한 플레이어가 X 게임마다 배신하고 다른 플레이어는 항상 협력하는 안정적인 균형 전략으로 이어질 수 있다. 이러한 행동은 공정성에 대한 실험의 사회적 규범에 따라 달라질 수 있다.^[54]

8. 비판

'죄수의 딜레마 게임'은 정부의 존재 이유를 정당화하는 근거로 사용되기도 하지만, '협동'이라는 사회적 진화 가능성을 설명하는 이론으로 제시되기도 한다. 아담 스미스 등의 자유주의 시장 경제 이론에서는 각 행위자들이 자신의 이익을 극대화하면 보이지 않는 손에 의해 사회적으로 바람직한 결과가 나온다고 주장한다. 하지만 죄수의 딜레마 게임에서는 각 행위자들이 자신의 이익을 극대화하면 모두에게 최악의 결과가 발생한다. 이는 자발적인 의사소통과 약속으로는 해결할 수 없으며, 정부나 국가의 개입이 필요하다는 이론이다.

반면 '반복되는 죄수의 딜레마'(Iterated Prisoner's Dilemma)에서는 팃포탯 전략 실험을 통해 죄수의 딜레마가 반복되면 최적의 선택은 협동이라는 결과가 나오기도 한다.

죄수의 딜레마는 개인의 이익과 공동체의 이익 간의 긴장을 보여주며 윤리철학에서 자주 사용된다. 일회성 및 반복적 죄수의 딜레마 모두 윤리철학에 응용되지만, 대량학살과 같은 상황은 반복하기 어렵고 이전 결과가 알려지지 않는 경우가 많다.^[61] 철학자 데이비드 고티에는 죄수의 딜레마를 통해 도덕성과 합리성의 상충을 보여주었다.^[62]

일부 게임 이론가들은 윤리철학에서 죄수의 딜레마를 사용하는 것을 비판한다.^[62] 케네스 빈모어는 죄수의 딜레마가 인류의 게임을 정확히 묘사하지 못하며, 협력 게임에 더 가깝다고 주장한다. 브라이언 스카름스도 동의한다. 스티븐 쿤은 도덕적 행동이 게임의 보상 행렬을 수정하여 죄수의 딜레마를 다른 게임으로 변형시킬 수 있다고 제안한다.^[62] 죄수의 딜레마는 혼합 전략이 순수 전략보다 더 나은 경우 "불순한" 것으로 간주되며, 이는 도덕적인 행동이 전략의 무작위화를 요구할 수 있다는 가능성을 제시한다.^[63]

정치학자 액셀로드는 무한 반복 죄수의 딜레마 대회를 통해 협력전략(tit-for-tat, 보복 전략)이 우승하고 진화 시뮬레이션에서도 살아남았다고 주장했다. 그는 보복 전략이 선량함, 보복, 관용, 명확성을 갖춘 인간 협력에 적합한 패러다임이라고 주장했지만, 많은 사회과학자들이 이를 무비판적으로 받아들였다.^[88]

액셀로드의 연구는 큰 반향을 일으켰지만, 게임 이론 연구자들과는 관련이 적다.^[89] 켄 빈모어 등은 액셀로드를 다음과 같이 비판한다.

보복 전략이 모든 환경에서 최적이라는 주장, 인류 사회 관계 및 생물학적 협력 진화를 설명한다는 주장은 터무니없다.^[90]
액셀로드는 장기적인 인간 관계에 대한 일반적인 교훈을 도출했지만, 이론적 근거를 제시하지 않았다.^[91]
유한 반복 죄수의 딜레마는 반드시 배신의 결과가 되므로 시뮬레이션이 필요 없다.^[92]
액셀로드의 결과는 시뮬레이션 환경에 의존적이며, 보복 전략의 비율은 1/6 정도에 불과하다. 전략의 초기 수를 바꾸면 결과가 달라진다.^[93]
보복 전략의 장점(선량함, 보복, 관용, 명확성)은 타당하지 않다.^[93]
무한 죄수의 딜레마에서 협력 가능성은 이미 포크 정리(Folk Theorem)로 증명되었다.^[94]

액셀로드는 게임 이론의 비판을 의도적으로 무시한다고 한다.^[94]

켄 빈모어에 따르면 액셀로드의 공헌은 포크 정리의 무수한 균형 중 특정 균형을 선택하는 것이 중요하다는 점을 깨닫게 해준 것이다. 진화 게임에 의한 균형 선택은 이제 게임 이론의 균형 선택 문제에서 표준적인 접근 방식이 되고 있다.^[94]

참조

_[1] 웹사이트 Prisoner's Dilemma http://plato.stanfor[...] 2024-03-10
_[2] 서적 ""
_[3] 논문 How to make cooperation the optimizing strategy in a two-person game http://dx.doi.org/10[...] 1977-01-01
_[4] 서적 Industrial Organization: Theory and Applications https://books.google[...] Massachusetts Institute of Technology Press 2013-02-27
_[5] 서적 Contributions to the Theory of Games (AM-40), Volume IV Princeton University Press 2024-05-14
_[6] 논문 Cooperation without Reputation: Experimental Evidence from Prisoner's Dilemma Games 1996
_[7] 논문 Strategy Choice in the Infinitely Repeated Prisoner's Dilemma https://www.aeaweb.o[...] 2019
_[8] 서적
_[9] 서적
_[10] 서적
_[11] 서적
_[12] 서적
_[13] 웹사이트 Bayesian Nash equilibrium; a statistical test of the hypothesis http://econ.hevra.ha[...] Tel Aviv University
_[14] 논문 Cooperation on the Monte Carlo Rule: Prisoner's Dilemma Game on the Grid Springer Singapore 2019
_[15] 논문 Human cooperation in the simultaneous and the alternating Prisoner's Dilemma: Pavlov versus Generous Tit-for-Tat 1996-04-02
_[16] 보도자료 University of Southampton team wins Prisoner's Dilemma competition http://www.southampt[...] University of Southampton 2004-10-07
_[17] 논문 Iterated Prisoner's Dilemma contains strategies that dominate any evolutionary opponent 2012-06-26
_[18] 논문 Evolutionary instability of Zero Determinant strategies demonstrates that winning isn't everything
_[19] 논문 Evolution of extortion in Iterated Prisoner's Dilemma games 2013-04-01
_[20] 논문 From extortion to generosity, evolution in the Iterated Prisoner's Dilemma
_[21] 논문 Stable Cooperative Solutions for the Iterated Prisoner's Dilemma
_[22] 논문 Evolutionary Dynamics of the Continuous Iterated Prisoner's Dilemma
_[23] 서적 Why is reciprocity so rare in social animals? A protestant appeal MIT Press
_[24] 뉴스 Markets & Data http://www.economist[...] 2007-09-27
_[25] 웹사이트 Game theory suggests current climate negotiations won't avert catastrophe https://www.sciencen[...] Society for Science & the Public 2012-10-29
_[26] 논문 Environmental Regulation of Polluting Firms: Porter's Hypothesis Revisited http://faculty.smu.e[...] 2003-08-01
_[27] 논문 Observational Learning and Predator Inspection in Guppies ( Poecilia reticulata ): Social Learning in Guppies 2003-10-01
_[28] 서적 The Selfish Gene Oxford University Press
_[29] 서적 Breakdown of Will Cambridge University Press
_[30] 논문 Neural processing of iterated prisoner's dilemma outcomes indicates next-round choice and speed to reciprocate cooperation https://doi.org/10.1[...]
_[31] 논문 Effective Choice in the Prisoner's Dilemma 1980
_[32] 논문 Comprehensive tobacco marketing restrictions: promotion, packaging, price and place 2012-03-01
_[33] 서적 Intermediate microeconomics and its application Dryden Press : Harcourt College Publishers
_[34] 잡지 Lance Armstrong and the Prisoners' Dilemma of Doping in Professional Sports https://www.wired.co[...] Wired.com 2012-10-29
_[35] 논문 "Prisoner's Dilemma" and "Chicken" Models in International Politics http://dx.doi.org/10[...] 1971
_[36] 논문 Cooperation under the Security Dilemma https://www.cambridg[...] 1978
_[37] 논문 Cooperation Under the Security Dilemma https://www.jstor.or[...] 1978
_[38] 서적 Idealist Internationalism and the Security Dilemma
_[39] 논문 The Security Dilemma in Alliance Politics https://www.jstor.or[...] 1984
_[40] 서적 Perception and Misperception in International Politics https://books.google[...] Princeton University Press 1976
_[41] 서적 Rational Theory of International Politics https://press.prince[...] Princeton University Press 2010
_[42] 논문 The Evolution of Cooperation https://www.science.[...] 1981
_[43] 논문 Evolutionary games in the multiverse 2010-03-23
_[44] 웹사이트 The Volokh Conspiracy " Elinor Ostrom and the Tragedy of the Commons http://volokh.com/20[...] Volokh.com 2009-10-12
_[45] 서적 Governing the Commons: The Evolution of Institutions for Collective Action Cambridge University Press 2015
_[46] 웹사이트 A look back at another successful final exam boycott https://www.insidehi[...] Inside Higher Ed 2013-02-21
_[47] 웹사이트 Gaming the System https://archive.nyti[...] 2013-02-14
_[48] 웹사이트 Johns Hopkins Students Boycott Final Exam - So Everyone Gets an A https://baltimorefis[...] Baltimore Fishbowl 2013-02-25
_[49] 서적 Metamagical Themas: questing for the essence of mind and pattern Bantam Dell Pub Group
_[50] 논문 Split or Steal? Cooperative Behavior When the Stakes Are Large https://nottingham-r[...] 2012-01
_[51] 웹사이트 'Snowdrift' game tops 'Prisoner's Dilemma' in explaining cooperation https://phys.org/new[...] 2007-10-09
_[52] 논문 Human cooperation in social dilemmas: comparing the Snowdrift game with the Prisoner's Dilemma Royal Society 2007-09-25
_[53] 간행물 Alibi games: the Asymmetric Prisoner' s Dilemmas https://economics.ca[...] 2004-05-05
_[54] 간행물 Max Planck Institute for Research on Collective Goods 2007-03-04
_[55] 웹사이트 http://www-personal.[...]
_[56] 웹사이트 https://web.archive.[...]
_[57] 웹사이트 https://github.com/A[...]
_[58] 웹사이트 https://evoplex.org/
_[59] 웹사이트 The Dark Knight's only redeemable character is the criminal who saves the ferries https://www.polygon.[...] 2018-07-18
_[60] 웹사이트 The Dark Knight: Game Theory : Networks Course blog for INFO 2040/CS 2850/Econ 2040/SOC 2090 https://blogs.cornel[...]
_[61] 논문 Reflections on Ethics and Game Theory https://doi.org/10.1[...] 2004-07-01
_[62] 논문 Gauthier and the Prisoner's Dilemma https://www.cambridg[...] 2016-12
_[63] 논문 Pure and Utilitarian Prisoner's Dilemmas https://www.cambridg[...] 1995-10
_[64] 문서
_[65] 문서
_[66] 문서
_[67] 문서
_[68] 문서
_[69] 문서
_[70] 문서
_[71] 書籍 undefined 2015
_[72] 書籍 undefined 2015
_[73] 書籍 undefined 2015
_[73] 書籍 undefined 2004
_[74] 書籍 undefined 2008
_[75] 書籍 undefined 2008
_[76] 書籍 undefined 2015
_[76] 書籍 undefined 2004
_[77] 書籍 undefined 2008
_[78] 書籍 undefined 2015
_[79] 書籍 undefined 2015
_[80] 書籍 undefined 2015
_[81] 書籍 undefined 2015
_[82] 書籍 undefined 2015
_[83] 書籍 undefined 2015
_[84] 書籍 undefined 2015
_[85] 書籍 undefined 2015
_[86] 書籍 undefined 1996
_[87] 書籍 undefined 2003
_[88] 書籍 undefined 2015
_[88] 書籍 undefined 2004
_[88] 書籍 undefined 1998
_[89] 書籍 undefined 2015
_[90] 書籍 undefined 1998
_[91] 書籍 undefined 2015
_[92] 書籍 undefined 1998
_[93] 書籍 undefined 2015
_[93] 書籍 undefined 2004
_[94] 웹사이트 アクセルロッド『対立と協調の科学』書評：「しっぺ返し」はそんなにすごいものではありません https://cruel.org/ca[...] 1998
_[95] 웹사이트 囚人のジレンマ選手権モデル https://mas.kke.co.j[...] 構造計画研究所 2016-09-16
_[96] 書籍 undefined 2009
_[97] 書籍 undefined 2000
_[98] 書籍 undefined 2000
_[99] 書籍 undefined 2005
_[100] 書籍 undefined 2005
_[101] 書籍 undefined 2005
_[102] 書籍 undefined 2006
_[103] 웹사이트 The Evolution of Cooperation http://www-personal.[...]

본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com