시간변화 파라콘트랙션을 이용한 협동게임 분산 보상 할당

본 논문은 협동게임(coalitional game) 이론에서 핵심적인 해인 CORE에 속하는 보상 벡터를 다중 에이전트가 분산적으로 합의하도록 설계된 알고리즘을 제안하고, 그 수렴성을 연산자 이론을 통해 엄밀히 증명한다. 1. **문제 설정 및 배경** - 협동게임은 N개의 에이전트가 연합(coalition)을 형성해 총 효용 v(S)를 창출하고, 이를 각 구성원에게 어떻게 배분할 것인가가 핵심이다. 효율성(전체 효용을 전부 배분)과 합리성(각 부분 연합이 최소 요구 효용을 만족)이라는 두 조건을 동시에 만족하는 배분 집합이 CORE이며, 이는 닫힌 볼록 집합으로 가정한다. - 중앙집중식 방법은 현실적인 자율 에이전트 간 상호작용을 반영하지 못하므로, 분산 방식이 필요하다. 기존 연구(Lehrer 2003, Bauso‑Notarstefano 2015 등)는 접근가능성 원리(approachability principle)를 이용해 평균 벡터가 목표 집합(CORE)으로 수렴하도록 설계했지만, 연산자 관점에서의 체계적인 해석은 부족했다. 2. **접근가능성 원리와 파라콘트랙션의 연계** - 접근가능성 원리는 “평균 벡터와 새로운 혁신 벡터가 목표 집합에 대해 서로 다른 반쪽 평면에 위치한다”는 기하학적 조건을 제시한다(식 3). 이를 기존 문헌에서는 직접적인 수렴 보증에만 활용했으나, 저자는 이를 연산자 형태로 재구성한다. - 핵심은 프로젝션 연산자 proj_C와 오버‑프로젝션 연산자 Q_C = 2 proj_C − Id를 이용해 혁신 벡터를 x_i(k+1) = (1 − β) proj_C(w_i(k)) + β Q_C(w_i(k)) + v⊥ + v− 로 표현한다. 여기서 v⊥와 v−는 각각 목표 집합에 대한 법선 방향과 그 반대 방향의 자유도이며, β∈

시간변화 파라콘트랙션을 이용한 협동게임 분산 보상 할당

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기