게임 이론: 상대방의 마음을 읽는 수학
안녕하세요, 보드게임 수학 시리즈 6일차입니다! 지난 5일 동안 우리는 확률, 기대값, 그리고 구체적인 게임 분석을 통해 수학적 사고의 기초를 다졌습니다. 오늘은 한 단계 더 나아가 '게임 이론(Game Theory)'의 세계로 들어가 보겠습니다.
게임 이론은 1944년 존 폰 노이만과 오스카 모르겐스턴이 체계화한 수학 분야로, "합리적인 의사결정자들이 상호작용하는 상황에서 어떻게 행동해야 하는가?"라는 질문에 답하는 학문입니다. 단순히 혼자만의 최적화가 아니라, 다른 사람들의 선택을 고려한 전략적 사고가 핵심입니다.
보드게임은 게임 이론의 완벽한 실험실입니다. 상대방이 무엇을 생각하고 있는지, 어떤 전략을 선택할지 예측하고, 그에 따라 자신의 최적 전략을 결정해야 합니다. 오늘은 이런 복잡한 상호작용을 수학적으로 분석하는 방법을 배워보겠습니다.
게임 이론의 기본 개념
게임의 구성요소
모든 게임은 다음 세 가지 요소로 구성됩니다:
1. 플레이어 (Players): 의사결정을 내리는 주체 2. 전략 (Strategies): 각 플레이어가 선택할 수 있는 행동들 3. 보상 (Payoffs): 전략 조합에 따른 각 플레이어의 결과
간단한 예시: 죄수의 딜레마
게임 이론의 가장 유명한 예시인 죄수의 딜레마를 보드게임 상황으로 변형해봅시다.
상황: 두 플레이어가 서로 공격할지 협력할지 결정 각자의 선택: 공격 또는 협력 보상 매트릭스:
상대방 협력 상대방 공격
| 내가 협력 | (3, 3) | (0, 5) |
| 내가 공격 | (5, 0) | (1, 1) |
이 표에서 (내 점수, 상대방 점수)를 의미합니다.
분석:
- 둘 다 협력하면 각각 3점 (서로에게 최선)
- 한 명만 공격하면 공격자 5점, 협력자 0점
- 둘 다 공격하면 각각 1점 (서로에게 최악)
딜레마: 개인적으로는 공격이 항상 유리하지만, 전체적으로는 협력이 더 좋은 결과를 만듭니다.
제로섬 게임과 비제로섬 게임
제로섬 게임 (Zero-Sum Game)
한 플레이어의 이득이 다른 플레이어의 손실과 정확히 일치하는 게임입니다.
보드게임 예시:
- 체스: 승리(+1), 무승부(0), 패배(-1)
- 바둑: 한 명이 이기면 다른 한 명은 집니다
- 포커: 한 플레이어가 따는 칩은 다른 플레이어들이 잃은 칩의 합
특징:
- 협력의 여지가 없음
- 순수한 경쟁 관계
- 상대방을 해치는 것이 나에게 직접적 이익
비제로섬 게임 (Non-Zero-Sum Game)
플레이어들의 이익의 합이 항상 0이 아닌 게임입니다.
보드게임 예시:
- 카탄의 개척자: 교역을 통해 모두가 이익을 볼 수 있음
- 판데믹: 모든 플레이어가 협력해야 승리
- 디플로마시: 동맹을 통해 상호 이익 추구 가능
특징:
- 협력을 통한 윈-윈 가능
- 상대방을 돕는 것이 나에게도 도움될 수 있음
- 더 복잡한 전략적 고려사항
내쉬 균형 (Nash Equilibrium)
내쉬 균형의 정의
모든 플레이어가 다른 플레이어들의 전략을 알고 있을 때, 누구도 자신의 전략을 바꿀 동기가 없는 상태를 내쉬 균형이라고 합니다.
수학적 정의: 각 플레이어 i에 대해, 다른 모든 플레이어의 전략이 고정되었을 때 플레이어 i의 현재 전략이 최적인 상태
보드게임에서의 내쉬 균형 사례
카탄의 교역 상황
상황: A가 양을 필요로 하고, B가 밀을 필요로 함. 각자 상대방이 원하는 자원을 보유.
전략:
- 교역 제안 vs 교역 거부
- 공정한 비율 vs 불공정한 비율
내쉬 균형: 서로 공정한 1:1 교역을 하는 것
- A가 불공정한 교역을 제안하면 B가 거부
- B가 거부하면 A도 거부
- 결국 둘 다 공정한 교역에서 합의
스몰 월드의 종족 선택
상황: 여러 플레이어가 동시에 종족을 선택하는 상황
내쉬 균형 분석:
- 모든 플레이어가 같은 '최강' 종족을 선택하려 하면, 실제로는 그 종족의 가치가 떨어짐
- 각자 다른 플레이어의 선택을 예상하고 그에 따라 최적 선택을 해야 함
- 결과적으로 각 플레이어가 다른 종족을 선택하는 균형 상태 도달
내쉬 균형 찾기: 실전 예시
킹 오브 도쿄에서 3인 게임 상황:
각 플레이어가 "공격적 플레이" vs "수비적 플레이" 중 선택한다고 가정합시다.
보상 매트릭스 (복잡하므로 간소화):
- 모두 공격적: 각자 2점 (서로 공격하며 평균적 결과)
- 2명 공격적, 1명 수비적: 공격자 각 1점, 수비자 4점
- 1명 공격적, 2명 수비적: 공격자 6점, 수비자 각 1점
- 모두 수비적: 각자 3점 (안전하지만 성장 제한)
분석:
- 다른 두 명이 공격적이라면, 나는 수비적으로 플레이하는 것이 유리
- 다른 두 명이 수비적이라면, 나는 공격적으로 플레이하는 것이 유리
- 혼합 전략 균형: 각자 일정 확률로 공격적/수비적 플레이를 섞어야 함
혼합 전략 (Mixed Strategy)
혼합 전략의 필요성
때로는 하나의 고정된 전략보다 여러 전략을 확률적으로 섞는 것이 더 유리할 수 있습니다.
가위바위보의 예:
- 항상 가위만 낸다면 상대방이 바위로 대응
- 최적 전략: 가위, 바위, 보를 각각 1/3 확률로 선택
포커에서의 블러핑 전략
상황: 강한 패와 약한 패를 어떤 비율로 베팅/폴드할지 결정
수학적 분석: 약한 패를 가졌을 때의 최적 블러핑 비율을 계산해봅시다.
- 팟 크기: P
- 베팅 크기: B
- 상대방이 폴드할 확률: f
블러핑의 기대값:
- 상대방 폴드 시: +P (팟을 따냄)
- 상대방 콜 시: -B (베팅 손실)
- 기대값: f × P - (1-f) × B
최적 블러핑 비율: 상대방이 무차별하도록 만드는 비율
- 복잡한 계산을 거쳐: 블러핑 비율 = B/(P+2B)
실제 적용: 팟이 100원, 베팅이 50원이라면
- 블러핑 비율 = 50/(100+100) = 25%
- 즉, 약한 패의 25%는 블러핑, 75%는 폴드가 최적
보드게임별 게임 이론 분석
레지스탕스: 아발론
게임 구조: 정보 비대칭 게임
- 악역은 서로를 알지만, 선역은 누가 악역인지 모름
- 각 라운드마다 팀 구성과 승인/거부 투표
게임 이론적 분석:
선역의 전략:
- 정보 수집을 통한 확률적 추론
- 다른 선역들과의 신호 교환
- 악역의 블러핑 패턴 분석
악역의 전략:
- 적절한 저항 비율 유지 (너무 많이 협력하면 의심받음)
- 선역 사이의 불신 유도
- 팀 구성에서 균형점 찾기
수학적 모델링: 베이지안 추론을 사용하여 각 플레이어가 악역일 확률을 지속적으로 업데이트:
P(악역|행동) = P(행동|악역) × P(악역) / P(행동)
디플로마시
게임 구조: 순수 협상 게임
- 동시 행동 결정
- 동맹과 배신의 연속
- 정보 공유와 속임수
게임 이론적 특징:
협력의 가치:
- 단기적: 상호 방어로 안정성 확보
- 장기적: 공동 목표 달성 후 배신 유혹
균형점 분석: 7명의 플레이어가 있을 때, 이론적으로는 3-4개의 동맹이 형성되는 것이 안정적입니다.
배신의 타이밍: 수학적으로 최적 배신 시점 = 상대방이 더 이상 필요 없어지는 시점 - 1턴
셰리프 오브 노팅엄
게임 구조: 블러핑과 협상의 결합
수학적 분석:
상인의 전략:
- 합법품만: 안전하지만 수익 제한
- 밀수품 포함: 위험하지만 높은 수익
- 뇌물: 적발 위험 감소, 비용 증가
최적 밀수 비율: 밀수 확률 = (뇌물 비용) / (적발 시 손실 + 뇌물 비용)
셰리프의 전략:
- 무작위 검사: 예측 불가능성 유지
- 플레이어별 패턴 파악: 적응적 대응
- 뇌물 수용 여부: 즉석 기대값 계산
정보 이론과 보드게임
완전정보 vs 불완전정보 게임
완전정보 게임:
- 체스, 바둑, 체커
- 모든 정보가 공개된 상태
- 이론적으로 최적해 존재
불완전정보 게임:
- 포커, 클루, 레지스탕스
- 숨겨진 정보 존재
- 확률적 추론과 블러핑 중요
정보의 가치 계산
클루에서의 정보 가치:
어떤 카드가 범인 카드인지에 대한 불확실성을 '엔트로피'로 측정할 수 있습니다.
초기 엔트로피: H = log₂(21) ≈ 4.39 (21장 중 3장이 범인)
질문 후 엔트로피 감소: 좋은 질문일수록 더 많은 정보(엔트로피 감소)를 제공합니다.
최적 질문 전략: 가능한 답변들이 균등하게 분포되도록 하는 질문이 가장 많은 정보를 제공합니다.
실전 적용: 게임 이론적 사고법
1단계: 게임 구조 파악
질문 목록:
- 이 게임은 제로섬인가, 비제로섬인가?
- 완전정보인가, 불완전정보인가?
- 동시 행동인가, 순차 행동인가?
- 협력의 여지가 있는가?
2단계: 상대방 모델링
상대방 분석:
- 리스크 선호도 (보수적 vs 공격적)
- 플레이 패턴 (규칙적 vs 예측 불가능)
- 게임 이해도 (초보자 vs 숙련자)
- 심리적 성향 (협력적 vs 경쟁적)
3단계: 전략 조정
적응적 전략:
- 상대방이 협력적이면 → 나도 협력하되 배신 대비
- 상대방이 공격적이면 → 방어 후 선제 공격 고려
- 상대방이 예측 가능하면 → 패턴 이용한 최적화
- 상대방이 예측 불가능하면 → 안전한 혼합 전략
4단계: 메타게임 고려
메타게임: 게임에 대한 게임
- 이 상대방과 앞으로도 많이 플레이할 예정인가?
- 내 평판이 다른 게임에 영향을 미치는가?
- 장기적 관계 vs 단기적 이익의 트레이드오프
심리학과 게임 이론의 만남
인지 편향의 활용
확증 편향: 사람들은 자신의 믿음을 확인하는 정보를 선호
- 활용법: 상대방이 원하는 정보를 제공하여 잘못된 결론 유도
손실 회피: 사람들은 이득보다 손실에 2배 더 민감
- 활용법: 상대방에게 손실 프레임으로 제안하여 협상력 확보
앵커링 효과: 처음 제시된 숫자가 기준점이 됨
- 활용법: 교역에서 첫 제안을 유리하게 설정
감정과 합리성의 균형
틸트(Tilt) 현상: 감정적 상태에서 비합리적 의사결정
- 대응법: 감정적 상대방의 실수 유도, 자신의 감정 관리
복수심: 합리적 이익보다 상대방 해치기 우선
- 활용법: 다른 플레이어들의 복수심을 이용한 동맹 형성
결론: 상대방의 마음을 읽는 수학적 사고
게임 이론은 단순히 수학 공식이 아닙니다. 그것은 인간의 상호작용을 이해하고 예측하는 강력한 도구입니다. 보드게임을 통해 게임 이론을 연습하면, 실생활의 다양한 상황에서도 더 나은 의사결정을 할 수 있게 됩니다.
핵심 교훈
- 상대방의 입장에서 생각하기: 내가 상대방이라면 어떤 선택을 할까?
- 균형점 찾기: 모든 플레이어가 현재 전략을 유지하려는 상태는?
- 예측 불가능성의 가치: 때로는 무작위성이 최고의 전략
- 협력과 경쟁의 균형: 언제 협력하고 언제 경쟁할 것인가?
실생활 적용
- 비즈니스: 경쟁사 대응, 파트너십 전략, 협상 기법
- 인간관계: 갈등 해결, 협력 구축, 신뢰 관리
- 투자: 시장 참여자들의 행동 예측, 리스크 관리
게임 이론을 마스터한다는 것은 단순히 게임에서 이기는 것을 넘어, 복잡한 인간 사회에서 현명하게 살아가는 방법을 배우는 것입니다.
다음 포스팅에서는 "포커에서 배우는 완벽한 블러핑 비율"이라는 주제로, 오늘 배운 혼합 전략과 게임 이론을 포커라는 구체적인 게임에 적용해보겠습니다. 수학적으로 정확한 블러핑 비율과 상대방 심리를 읽는 방법을 알아보겠습니다.
오늘의 핵심 개념:
내쉬 균형: 모든 플레이어가 전략을 바꿀 동기가 없는 상태
혼합 전략: 여러 전략을 확률적으로 섞어서 사용하는 전략
게임 분류: 제로섬 vs 비제로섬, 완전정보 vs 불완전정보
최적 블러핑 비율: B/(P+2B) (B=베팅크기, P=팟크기)
참고 자료:
- Von Neumann, J. & Morgenstern, O. (1944). "Theory of Games and Economic Behavior".
- Nash, J. (1950). "Equilibrium Points in N-Person Games".
- Binmore, K. (2007). "Game Theory: A Very Short Introduction".
다음 포스팅 예고: "포커에서 배우는 완벽한 블러핑 비율" - 게임 이론을 포커에 적용하여 수학적으로 정확한 블러핑 전략을 탐구합니다!
'2. 전략 및 팁 > 게임별 승률을 높이는 비법' 카테고리의 다른 글
| 카드 드로우의 수학: 운을 실력으로 바꾸는 법 (4) | 2025.05.28 |
|---|---|
| 포커에서 배우는 완벽한 블러핑 비율 (1) | 2025.05.27 |
| 리스크 전투 승률의 비밀 (0) | 2025.05.25 |
| 보드게임의 모든 선택은 계산이다: 기대값 이론 (6) | 2025.05.24 |
| 주사위 던지기의 과학: 확률 이론 기초 (0) | 2025.05.22 |