강인한 객체 검출을 위한 적대적 학습
본 논문은 객체 검출 모델이 분류와 위치 두 가지 과업을 동시에 수행한다는 점에 주목하여, 각 과업 손실이 서로 영향을 미치는 비대칭성을 분석한다. 이를 기반으로 분류 손실과 위치 손실을 별도로 활용한 두 종류의 적대적 예제를 생성하고, 두 손실 중 더 큰 전체 손실을 갖는 예제로 학습하는 다중 과업 적대적 훈련 방식을 제안한다. Pascal‑VOC와 MS‑COCO에서의 실험을 통해 제안 방법이 기존 검출기 대비 공격에 대한 강인성을 크게 향상…
저자: Haichao Zhang, Jianyu Wang
본 논문은 객체 검출 모델의 적대적 견고성을 향상시키기 위한 최초의 체계적인 시도를 제시한다. 서론에서는 객체 검출이 자율 주행, 감시 등 실시간 시스템에서 핵심 역할을 수행함에도 불구하고, 최근 연구들이 보여준 바와 같이 작은 픽셀 교란에도 쉽게 오작동한다는 문제점을 강조한다. 기존 연구들은 주로 공격 방법에 초점을 맞추었으며, 방어 메커니즘에 대한 탐구는 미비했다는 점을 지적한다.
관련 연구 파트에서는 이미지 분류 분야에서의 적대적 공격·방어(FGSM, PGD, Adversarial Training 등)와 객체 검출 분야에서 최근 제안된 다양한 공격(ShapeShifter, RAP, DPatch 등)을 정리한다. 특히, 검출 공격은 분류 손실, 위치 손실, 혹은 두 손실의 조합을 목표 함수로 삼는 공통된 구조를 가진다.
다음으로 3절에서는 객체 검출을 다중 과업 학습(MTL) 관점에서 재해석한다. 베이스넷 θ_b 가 공유된 특징을 추출하고, 분류 헤드 θ_c 와 위치 헤드 θ_l 이 각각 loss cls와 loss loc 를 담당한다. 전체 손실은 두 손실의 가중합이며, 이는 다중 과업 학습의 전형적인 형태이다. 이 구조를 바탕으로 기존 공격들을 표로 정리하고, 각 공격이 어떤 손실을 이용하는지, 목표가 타깃인지 비타깃인지 구분한다.
4.1절에서는 과업 손실이 견고성에 미치는 영향을 실험적으로 분석한다. 첫 번째 실험에서는 분류 손실 기반 공격이 검출 정확도와 평균 IoU 모두를 감소시키는 교차 효과를 보여준다. 두 번째 실험에서는 분류와 위치 손실의 그래디언트가 방향은 일부 일치하지만 크기와 각도에서 차이를 보이며, 이는 두 과업 간 그래디언트 충돌을 의미한다. t‑SNE 시각화로 두 과업이 차지하는 교란 공간이 부분적으로 겹치면서도 독립적인 영역을 가진다는 점을 확인한다.
이러한 관찰을 토대로 4.2절에서는 새로운 적대적 훈련 프레임워크를 제안한다. 목표는
\
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기