제한된 용량을 가진 비볼록 게임의 근사 최소극대 정리
본 논문은 신경망으로 파라미터화된 비볼록‑비볼록(zero‑sum) 게임에서, 파라미터 자체가 아니라 신경망이 구현하는 함수·분포(모델) 관점으로 보면 게임이 볼록‑볼록 구조를 갖는다는 사실을 이용해, 제한된 용량(네트워크 크기) 하에서 근사적인 최소극대 정리를 제시한다. 이를 통해 GAN, WGAN, 스타크래프트·블로또와 같은 복잡한 실전 게임에서도 단일 네트워크 쌍만으로도 의미 있는 균형을 찾을 수 있음을 이론적으로 설명한다.
저자: Gauthier Gidel, David Balduzzi, Wojciech Marian Czarnecki
본 논문은 “제한된 용량(mini‑capacity) 최소극대 정리”라는 새로운 이론적 프레임워크를 제시한다. 전통적인 최소극대 정리는 게임의 보상 함수 ϕ 가 플레이어 전략 집합 Ω, Θ에 대해 볼록‑볼록(concave‑convex)하고, 전략 집합이 컴팩트하고 볼록일 때만 적용 가능하다(Sion et al., 1958). 그러나 현대 머신러닝에서 흔히 다루는 GAN, WGAN, 자가 플레이 강화학습 등은 파라미터 w, θ에 대해 ϕ 가 비볼록‑비볼록(NC‑NC)이며, 파라미터 집합도 비컴팩트하고 비볼록이어서 기존 정리를 직접 적용할 수 없었다.
저자들은 이러한 딜레마를 해결하기 위해, 파라미터가 실제로 의미하는 “모델”—즉, 판별기 D_w 가 구현하는 함수 f_w 와 생성기 G_θ 가 정의하는 확률분포 q_θ—에 초점을 맞춘다. 이 모델 공간에서 보상 함수 \tilde{ϕ}(f, q) 는 로그의 볼록성 및 기대값의 선형성 때문에 자연스럽게 볼록‑볼록 구조를 갖는다. 즉,
\
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기