다중모달 데이터의 사이클로스테이션리티 기반 이상 탐지 모델 및 알고리즘

본 논문은 CCTV 영상과 소셜미디어 게시물을 객체 검출기로 전처리한 후, 시간에 따라 주기적으로 변하는 카운트 시퀀스를 “독립적·주기적 동일분포(i.p.i.d.)” 과정으로 모델링한다. 제안된 순차적 변화점 탐지 알고리즘은 학습된 사이클로스테이션리티 행동에서의 편차를 실시간으로 감지하며, 거짓 경보 제약 하에 탐지 지연을 로그 차수로 최소화하는 ‘점근적 효율성’을 이론적으로 입증한다. 5K 마라톤 이벤트 데이터에 적용해 정상·비정상 패턴을 성…

저자: Taposh Banerjee, Gene Whipps, Prudhvi Gurram

다중모달 데이터의 사이클로스테이션리티 기반 이상 탐지 모델 및 알고리즘
본 연구는 실시간 감시·교통 모니터링 등에서 다중모달 데이터(영상, 소셜미디어 등)를 활용한 이상 탐지 문제를 다룬다. 기존 방법들은 정상·비정상 라벨이 명확히 정의된 학습 데이터를 필요로 하지만, 실제 현장에서는 비정상 사건이 드물고 사전 정의가 어려워 이러한 접근법이 제한적이다. 이를 해결하고자 저자들은 먼저 딥러닝 기반 객체 검출기(예: Faster‑RCNN, YOLO 등)를 이용해 CCTV 영상에서 사람·차량 수를 추출하고, 동일 시간 구간에 해당 지역의 트위터·인스타그램 게시물 수를 집계한다. 이렇게 얻어진 카운트 시퀀스는 시간에 따라 주기적 변동을 보이며, 이는 ‘사이클로스테이션리티’라는 통계적 특성으로 설명된다. 논문은 사이클로스테이션리티를 수학적으로 ‘독립적·주기적 동일분포(i.p.i.d.)’ 과정으로 정의한다. i.p.i.d. 과정은 전체 시계열을 T개의 배치(또는 에피소드)로 나누고, 각 배치는 동일한 파라미터 θ(e) 를 갖는 i.i.d. 서브시퀀스로 구성된다. 이렇게 하면 전체 파라미터 수는 T가 아니라 배치 수 E 로 크게 감소한다. 실제 데이터에서는 하루 혹은 일주일 단위의 주기가 관찰되며, 각 배치는 1시간 혹은 1분 구간과 같이 실질적인 의미를 가진다. 이후 논문은 두 가지 변화점 모델을 제시한다. 첫 번째 모델은 특정 배치 e에서만 파라미터가 변하는 경우이며, 두 번째 모델은 모든 배치에서 동시에 파라미터가 변하는 경우이다. 이러한 모델은 센서 네트워크에서 일부 센서가 고장 나는 상황과 유사하지만, 여기서는 배치가 시간 순서대로 관측되므로 순차적(online) 탐지가 필요하다. 변화점 탐지를 위한 알고리즘은 각 배치별 로그우도비 누적 통계량 Wₑⁿ을 정의한다. Wₑⁿ은 배치 e에 속하는 관측값만을 사용해 사전 파라미터 θ(e) 와 가능한 사후 파라미터 λ 사이의 로그우도비를 최대화한 값이다. 임계값 A 를 초과하면 해당 배치 탐지기가 경보를 발생하고, 전체 시스템은 가장 먼저 경보를 낸 탐지기의 정지시간 τ₀ = minₑ τₑ 로 결정을 내린다. 이 구조는 배치가 사전에 알려지지 않은 상황에서도 최적에 근접한 성능을 보장한다. 이론적 분석에서는 거짓 경보 평균 시간(E∞

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기