술취한 도둑과 경찰의 추격

이 논문은 그래프 위에서 무작위 보행을 하는 ‘술취한’ 도둑을 쫓는 경찰(경찰팀)의 전략을 연구한다. 최적의 적대적 도둑과 비교해 기대 포획 시간의 비율을 “술취함 비용”이라 정의하고, 경로·사이클·그리드·완전 d-진 트리 등 여러 그래프에서 상·하한을 구한다. 또한 마코프 결정 과정(MDP)과의 연관성을 이용해 최적 경찰 전략을 계산하는 알고리즘을 제시하고, 보이지 않는 도둑 경우를 간략히 탐색한다.

저자: Athanasios Kehagias, Pawel Pralat

본 논문은 그래프 이론과 게임 이론의 교차점에 위치한 Cops‑and‑Robbers 게임을 확장하여, 도둑이 최적적인 전략이 아닌 무작위 보행(Random Walk)을 수행하는 경우를 연구한다. 전통적인 게임에서는 경찰(k명)과 도둑이 서로 최적의 전략을 구사하며, 최소한의 경찰 수 c(G) 를 ‘경찰 수’라 정의한다. 여기서 저자들은 도둑이 ‘술취한’ 상태, 즉 각 단계에서 인접 정점 중 하나를 균등 확률로 선택하는 무작위 보행을 한다고 가정한다. 경찰은 이러한 확률적 움직임을 사전에 알고 있으며, 기대 포획 시간( Expected Capture Time, dct )을 최소화하는 전략을 설계한다. 논문은 먼저 기본 정의와 기호를 정리한다. 그래프 G=(V,E)는 단순하고 연결된 무방향 그래프이며, X_i^t는 i번째 경찰의 t시점 위치, Y^t는 도둑의 t시점 위치를 나타낸다. 포획 시간 T는 최초로 어떤 경찰과 도둑이 같은 정점에 도달하는 시점이며, 적대적 상황에서는 ct(G) = min_x max_y T(x,y) 로 정의된다. 무작위 도둑 상황에서는 dct(G) = min_x E

술취한 도둑과 경찰의 추격

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기