다변량 신속 탐지를 위한 비협력 정지 게임 모델

본 논문은 다수의 센서가 관측하는 마코프 과정에서 침입자 존재에 따른 전이 확률 변화를 신속히 탐지하고, 서로 다른 센서들의 판단을 단순 게임 형태의 집계 규칙으로 결합하여 중앙 융합 센터가 최적의 정지 시점을 결정하도록 하는 비협력 정지 게임 모델을 제시한다. 각 센서는 개별 최적 정지 전략을 사용하고, 전체 시스템은 다수결·단순 게임 기반의 논리 함수를 통해 합의에 도달한다. 유한·무한 시간 지평선에 대한 균형 전략 존재와 계산 방법을 제시…

저자: Krzysztof Szajowski

본 논문은 다수의 센서가 구성하는 네트워크에서 침입자 존재에 따른 신호 변화(전이 확률의 변동)를 신속히 탐지하고, 이를 중앙 융합 센터가 최적의 결정을 내리도록 하는 수학적 모델을 제시한다. 첫 번째 섹션에서는 문제 설정을 소개한다. 각 센서는 m‑차원 마코프 과정을 관측하며, 정상 상태와 침입자 존재 시 두 가지 전이 확률을 가진다. 변화 시점 θ_r 은 기하분포(P(θ_r=j)=p_r^{j-1}q_r) 를 따르는 비관측 변수이며, 센서는 관측된 시퀀스 {X_n} 로부터 θ_r 를 추정한다. 정확도 파라미터 d 를 도입해 |θ_r−τ|≤d 를 만족하는 정지 시점 τ 를 찾는 것이 목표이며, 이는 Shiryaev‑형 변곡점 탐지 문제의 다변량 확장이다. 두 번째 섹션에서는 개별 센서의 최적 탐지 전략을 구성한다. 베이즈 사후 확률 Π_{r,n}=P(θ_r≤n|F_n) 를 이용해 확률 과정 ξ_r,n=(X_{r,n−d},…,X_{r,n},Π_{r,n}) 로 변환하고, 이를 마코프 체인으로 간주한다. 최적 정지 시점 τ*_r 는 ξ_r,n 에 대한 최적 정지 문제의 해로, 기대 보상 h_r(x,α) 를 최대화하는 τ 로 정의된다. 세 번째 섹션에서는 여러 센서의 판단을 결합하는 방법으로 ‘단순 게임(simple game)’을 도입한다. 연합 C⊂N 에 대해 특성 함수 φ(C)∈{0,1} 를 정의하고, 승리 연합 W={C:φ(C)=1} 를 지정한다. 각 센서는 0(침입자 없음) 또는 1(침입자 존재) 를 선언하고, 논리 함수 π(x_1,…,x_p)=∨_{C∈W}∧_{i∈C}x_i∧_{i∉C}(1−x_i) 로 최종 결정을 내린다. 이는 다수결, 단조 투표 등 기존 방식의 일반화이며, 연합 구조에 따라 탐지 민감도와 위양성률을 조절할 수 있다. 네 번째 섹션에서는 위의 집계 규칙을 비협력 정지 게임으로 형식화한다. 플레이어 i는 개별 정지 전략 σ_i^n∈{0,1} 를 선택하고, 전체 정지는 t(σ)=inf{n:π(σ_1^n,…,σ_p^n)=1} 로 정의된다. 각 플레이어의 보상은 f_i(X_{t(σ)}) 로 주어지며, 이는 정지 시점의 마코프 상태에 대한 실현값이다. 논문은 이 게임이 유한 지평선 N에 대해 역동적 프로그래밍 형태의 재귀식으로 균형값 v_{i,n}(x)와 최적 정지 집합 C_i^*를 도출한다. Lemma 1을 이용해 기대 보상이 최대가 되는 집합을 구하고, 이를 통해 균형 전략 σ^*를 구성한다. 구체적으로, v_{i,0}(x)=f_i(x) 로 시작해 v_{i,n}(x)=E_x

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기