다변량 신속 탐지를 위한 비협력 정지 게임 모델

본 논문은 다수의 센서가 구성하는 네트워크에서 침입자 존재에 따른 신호 변화(전이 확률의 변동)를 신속히 탐지하고, 이를 중앙 융합 센터가 최적의 결정을 내리도록 하는 수학적 모델을 제시한다. 첫 번째 섹션에서는 문제 설정을 소개한다. 각 센서는 m‑차원 마코프 과정을 관측하며, 정상 상태와 침입자 존재 시 두 가지 전이 확률을 가진다. 변화 시점 θ_r 은 기하분포(P(θ_r=j)=p_r^{j-1}q_r) 를 따르는 비관측 변수이며, 센서는 관측된 시퀀스 {X_n} 로부터 θ_r 를 추정한다. 정확도 파라미터 d 를 도입해 |θ_r−τ|≤d 를 만족하는 정지 시점 τ 를 찾는 것이 목표이며, 이는 Shiryaev‑형 변곡점 탐지 문제의 다변량 확장이다. 두 번째 섹션에서는 개별 센서의 최적 탐지 전략을 구성한다. 베이즈 사후 확률 Π_{r,n}=P(θ_r≤n|F_n) 를 이용해 확률 과정 ξ_r,n=(X_{r,n−d},…,X_{r,n},Π_{r,n}) 로 변환하고, 이를 마코프 체인으로 간주한다. 최적 정지 시점 τ*_r 는 ξ_r,n 에 대한 최적 정지 문제의 해로, 기대 보상 h_r(x,α) 를 최대화하는 τ 로 정의된다. 세 번째 섹션에서는 여러 센서의 판단을 결합하는 방법으로 ‘단순 게임(simple game)’을 도입한다. 연합 C⊂N 에 대해 특성 함수 φ(C)∈{0,1} 를 정의하고, 승리 연합 W={C:φ(C)=1} 를 지정한다. 각 센서는 0(침입자 없음) 또는 1(침입자 존재) 를 선언하고, 논리 함수 π(x_1,…,x_p)=∨_{C∈W}∧_{i∈C}x_i∧_{i∉C}(1−x_i) 로 최종 결정을 내린다. 이는 다수결, 단조 투표 등 기존 방식의 일반화이며, 연합 구조에 따라 탐지 민감도와 위양성률을 조절할 수 있다. 네 번째 섹션에서는 위의 집계 규칙을 비협력 정지 게임으로 형식화한다. 플레이어 i는 개별 정지 전략 σ_i^n∈{0,1} 를 선택하고, 전체 정지는 t(σ)=inf{n:π(σ_1^n,…,σ_p^n)=1} 로 정의된다. 각 플레이어의 보상은 f_i(X_{t(σ)}) 로 주어지며, 이는 정지 시점의 마코프 상태에 대한 실현값이다. 논문은 이 게임이 유한 지평선 N에 대해 역동적 프로그래밍 형태의 재귀식으로 균형값 v_{i,n}(x)와 최적 정지 집합 C_i^*를 도출한다. Lemma 1을 이용해 기대 보상이 최대가 되는 집합을 구하고, 이를 통해 균형 전략 σ^*를 구성한다. 구체적으로, v_{i,0}(x)=f_i(x) 로 시작해 v_{i,n}(x)=E_x

다변량 신속 탐지를 위한 비협력 정지 게임 모델

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기