EEG 기반 BCI를 위협하는 보편적 적대적 교란 생성 방법
본 논문은 EEG 신호를 입력으로 하는 CNN 기반 뇌‑컴퓨터 인터페이스(BCI) 모델에 대해, 입력마다 별도로 교란을 만들 필요 없이 한 번만 생성하면 모든 시도에 적용 가능한 보편적 적대적 교란(UAP)을 제안한다. 총 손실 최소화(TLM) 방식을 도입해 기존 DeepFool 기반 방법보다 더 작은 크기로 높은 성공률을 달성했으며, 비목표 및 목표 공격 모두를 지원하고 모델 간 전이 가능성을 확인하였다.
저자: Zihan Liu, Lubin Meng, Xiao Zhang
본 논문은 EEG 기반 뇌‑컴퓨터 인터페이스(BCI)에서 널리 사용되는 Convolutional Neural Network(CNN) 분류기에 대한 보편적 적대적 교란(Universal Adversarial Perturbation, UAP) 연구를 최초로 수행한다. 서론에서는 EEG가 저비용·편리성으로 BCI의 주요 입력 신호가 되었으며, 최근 EEGNet, DeepCNN, ShallowCNN 등 다양한 CNN 모델이 높은 정확도를 보이고 있음을 소개한다. 그러나 딥러닝 모델은 이미지·음성 등에서 적대적 공격에 취약함이 알려졌고, Zhang·Wu(2022)는 EEG 기반 CNN에 대한 개별 교란 공격을 시연했지만, 교란을 각 트라이얼마다 실시간으로 생성해야 하는 비현실적인 제약이 있었다.
이를 해결하기 위해 저자들은 두 가지 UAP 생성 방법을 제안한다. 첫 번째는 Moosavi‑Dezfooli 등이 제시한 DeepFool 기반 알고리즘을 그대로 적용한 것으로, 각 샘플에 대해 최소 교란 △v_i 를 구하고 이를 누적·투사해 ℓ_p 볼 안에 유지한다. 이 과정은 알고리즘 2에 상세히 기술되어 있으며, 목표 성공률(ASR) δ와 교란 크기 제한 ξ를 만족할 때까지 전체 데이터셋을 순회한다.
두 번째이자 핵심 기여는 총 손실 최소화(Total Loss Minimization, TLM) 접근법이다. TLM은 전체 훈련 데이터 D에 대해 교란 v를 변수로 두고, 손실 함수 l(x+v, y)와 정규화 항 C(x, v)를 결합한 목적식
min_v E_{x∼D}
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기