스마트폰 기반 실시간 수면 단계 분류: 웨어러블 EEG와 딥러닝

본 논문은 단일 채널 EEG를 이용해 30초 단위 에포크를 실시간으로 분류하는 딥러닝 모델을 스마트폰에 탑재한 시스템을 제안한다. Time‑Distributed 1‑D CNN 구조와 Z‑score 기반 신호 보정으로 5가지 수면 단계(W, N1, N2, N3, REM)를 구분하며, Sleep‑EDF 데이터셋에 대해 20‑fold 교차 검증 시 평균 정확도 83.5%를 달성한다. 서버 없이 온‑디바이스 추론이 가능해 가정이나 연구 현장에서 손쉽게…

저자: Abhay Koushik, Judith Amores, Pattie Maes

스마트폰 기반 실시간 수면 단계 분류: 웨어러블 EEG와 딥러닝
본 논문은 웨어러블 EEG와 스마트폰을 결합해 실시간 수면 단계 자동 분류 시스템을 구현한 연구이다. 기존 PSG는 다채널(EEG, EOG, EMG 등)과 복잡한 장비·전문가가 필요해 일상 생활에서 적용이 어려웠다. 저자들은 Muse 헤드밴드의 단일 채널(주로 AF7)만을 사용해 30 초 길이의 에포크를 실시간으로 분석하고, 이를 스마트폰에서 바로 추론하도록 설계하였다. 데이터는 PhysioNet의 Sleep‑EDF 확장판을 활용했으며, Fpz‑Cz 전극을 100 Hz로 샘플링한 원시 EEG를 사용한다. 전체 20명의 피험자(33밤 훈련, 4밤 검증, 2밤 테스트) 데이터를 20‑fold 교차 검증 방식으로 나누어 모델을 평가하였다. 전처리 단계에서는 수면 전후의 비수면 구간을 제거하고, N4와 N3를 합쳐 AASM 기준 5단계(Wake, N1, N2, N3, REM)로 라벨링하였다. 모델은 Time‑Distributed 1‑D CNN 구조를 채택했다. 기본 CNN(Base‑CNN)은 3번 반복되는 두 개의 Conv1D‑MaxPool‑SpatialDropout 블록과, 이후 2개의 Conv1D‑GlobalMaxPool‑Dropout‑Dense 레이어로 구성된다. 각 30 초 에포크는 독립적으로 입력되어, 시퀀스 전체를 동시에 처리하는 RNN 기반 모델(DeepSleepNet, SeqSleepNet)과 달리 실시간 단일 에포크 추론이 가능하다. 활성화 함수는 ReLU, 최적화는 Adam(learning_rate = 1e‑3)이며, 검증 손실이 정체될 경우 학습률을 감소시키는 ReduceLROnPlateau 콜백을 사용한다. 실시간 적용을 위해서는 측정 장치 간 신호 스케일 차이를 보정해야 한다. 저자는 Wake 상태의 표준편차를 이용한 Z‑score 정규화를 선택했으며, 이는 통계적 특징 중 표준편차가 가장 높은 상관관계를 보인다는 Mutual Information 분석 결과에 기반한다. 이 보정은 기기·피험자 독립적인 신호 전처리를 가능하게 하여, 다른 웨어러블 EEG에도 적용 가능하도록 설계되었다. 성능 평가는 20‑fold 교차 검증에서 평균 정확도 83.5%를 기록했으며, 테스트 세트에서는 최저 72%까지 변동하였다. 클래스별 정밀도·재현율·F1‑score는 다음과 같다: Wake(0.83/0.96/0.89), N1(0.47/0.42/0.44), N2(0.87/0.83/0.85), N3(0.92/0.81/0.86), REM(0.71/0.83/0.77). 전반적으로 N1과 REM에서 오분류가 많았으며, 이는 전두 전극만으로는 안구 움직임(EOG)이나 후두 전극 정보가 부족하기 때문이다. 혼동 행렬과 하이프노그램 비교에서도 이러한 경향이 확인되었다. 시스템 구현은 TensorFlow Lite 기반 Android 애플리케이션으로, BLE를 통해 Muse 헤드밴드의 AF7 채널 데이터를 실시간 전송받는다. 매 30 초마다 신호를 다운샘플링·Z‑score 보정 후 모델에 입력하고, 추론 결과와 confidence를 UI에 시각화한다. UI는 원시 EEG 파형, 현재 수면 단계, 누적 정확도 통계 등을 제공해 사용자가 실시간으로 자신의 수면 상태를 확인할 수 있게 한다. 서버 없이 온‑디바이스 추론을 수행함으로써 개인정보 보호와 네트워크 의존성을 최소화하였다. 논문의 주요 기여는 (1) 단일 채널 웨어러블 EEG만으로 5단계 수면 분류를 실시간으로 구현, (2) Time‑Distributed 1‑D CNN을 이용해 에포크 단위 독립 추론을 가능하게 함, (3) Z‑score 기반 신호 보정으로 기기·피험자 간 일반화성을 확보, (4) TensorFlow Lite를 활용한 온‑디바이스 배포로 서버‑프리 솔루션을 제공한 점이다. 한계점으로는 데이터가 주로 건강한 청년에 국한돼 임상적 다양성 검증이 부족하고, 전두 전극만 사용해 N1·REM 구분이 약한 점, BLE 전송 지연 및 스마트폰 배터리 소모가 실시간 사용에 영향을 줄 수 있다는 점을 들 수 있다. 향후 연구에서는 다채널(예: TP9/TP10) 통합, 하드웨어 가속(NPU) 활용, 그리고 실시간 BCI 피드백(예: 냄새·음향 자극)과 연계한 인터벤션 연구가 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기