복잡하고 정보에 기반한 적대적 행동이 그래프 협조 게임에 미치는 영향

본 논문은 네트워크 기반 제어 시스템에서 에이전트들이 로그선형 학습(log-linear learning) 알고리즘을 사용해 협조 게임을 수행할 때, 적대자가 일부 에이전트를 조작함으로써 시스템 전체 성능을 얼마나 저하시킬 수 있는지를 체계적으로 분석한다. 연구는 크게 네 부분으로 구성된다. 첫 번째 부분에서는 문제 설정과 모델을 정의한다. 그래프 협조 게임은 두 가지 선택지(x, y)를 갖는 에이전트 집합 N이 무방향 그래프 G=(N,E) 위에서 상호작용하는 형태로, 각 에이전트는 이웃과 선택을 일치시킬 때 보상을 얻는다. 보상 행렬 V는 파라미터 α>0에 의해 정의되며, 전체 시스템 복지는 모든 에이전트 보상의 합 W(a)로 측정된다. 로그선형 학습은 무작위로 선택된 에이전트가 현재 이웃 상태에 따라 확률적으로 행동을 업데이트하는 분산 알고리즘이며, β→∞일 때 시스템은 복지 최적화 상태(모든 에이전트가 x 선택)로 수렴한다. 두 번째 부분에서는 적대자 모델을 도입한다. 적대자는 S개의 가짜 노드를 네트워크에 삽입해 특정 에이전트에게 x 또는 y를 강제한다. 적대자는 전체 에이전트 중 γ·n(0≤γ≤1)만큼을 조작할 수 있다. 적대자의 정책 π는 시간에 따라 S_x(t), S_y(t) 집합을 선택하는 방식으로 정의되며, 정적 정책은 시간에 따라 변하지 않고, 동적 정책은 현재 상태 a(t)에 따라 변한다. 또한, 적대자가 네트워크 구조를 사전에 알고 있는지(정보 인식) 여부에 따라 정책 집합을 Π_I, Π, Π_D, Π_I,D 로 구분한다. 성능 저하는 η(G,α,π)=min_{a∈LLL(G,α,π)} W(a)/W(a_opt) 로 측정한다. 세 번째 부분에서는 그래프 구조에 따른 취약성을 분석한다. k‑connected ring graph G_k^n을 정의하고, k=1인 최소 연결 원형 그래프가 가장 취약함을 정리 2.1, 2.2를 통해 증명한다. 정적·비정보형 적대자(Π)와 정적·비정보형 동적 적대자(Π_D)의 경우, 효율성 하한식이 각각 (γ

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기