분산 희소 추정을 통한 선형‑이차 가우시안 게임

본 논문은 다중 에이전트 시스템에서 발생하는 선형‑이차‑가우시안(LQG) 게임을 대상으로, 각 에이전트가 제한된 관측 정보를 사용하도록 설계된 분산 희소 추정기를 제안한다. 기존 LQG 게임 연구는 일반적으로 모든 가용 관측을 이용해 상태를 추정하고, 그 추정값을 기반으로 피드백 내시 균형 전략을 도출한다. 그러나 대규모 로봇 군집, 센서 네트워크 등 자원 제약이 있는 실제 시스템에서는 모든 관측을 처리하거나 교환하는 것이 비현실적이다. 이를 해결하고자 저자는 다음과 같은 일련의 연구 과정을 전개한다. 1. **문제 설정 및 정보 구조** N명의 에이전트가 각각 선형 동역학 x_i,t+1 = A_i,t x_i,t + B_i,t u_i,t + w_i,t 를 갖고, 개별 관측 y_i,t = C_i,t x_t + v_i,t (v_i,t는 가우시안 잡음) 를 받는다. 각 에이전트는 공동 비용 J_i를 최소화하려는 목표를 가지고 있으며, 이는 상태와 제어에 대한 이차 비용을 포함한다. 정보 구조는 모든 시스템 매개변수와 피드백 내시 이득(Γ_t, α_t)이 공유되지만, 실제 관측 y_i,t와 추정값 ˆx_i,t, 제어 u_i,t는 비공유한다. 2. **분산 추정 및 오차 전파** 각 에이전트는 자신의 관측을 이용해 추정값 ˆx_i,t를 업데이트한다. 제어 입력은 u_i,t = –Γ_i,t ˆx_i,t – α_i,t 로 정의된다. 그러나 실제 시스템에 적용되는 전체 제어 u_t는 각 에이전트가 추정한 제어 ˆu_i,t와 차이가 발생한다. 이 차이는 추정 오차 e_i,t에 추가적인 동적 항을 만든다(식 8). 따라서 오차 공분산 Σ_t는 시스템 행렬 A_t, B_t, 추정 이득 K_t 등에 의해 복합적으로 진화한다(식 9). 3. **최적(비희소) 추정 이득 도출** 개별 에이전트 i에 대해, 추정 오차 공분산 Σ_i,t를 최소화하는 최적 이득 K_i,⋆^t를 칼만 필터와 유사한 형태로 도출한다(식 11). 이 이득은 모든 센서 데이터를 활용하므로 완전 관측 상황에서의 베이스라인이 된다. 4. **그룹 라소 기반 희소화** 실제 구현에서는 센서를 P_i개의 그룹으로 나누고, 각 그룹에 대응하는 K_i,t

분산 희소 추정을 통한 선형‑이차 가우시안 게임

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기