심장 박동별 RNN으로 부정맥 자동 분류

본 논문은 모바일 심장 이벤트 레코더를 통해 수집된 단일 리드 ECG 데이터를 자동으로 부정맥을 분류하는 시스템을 제안한다. 전체 12,186개의 라벨링된 ECG 레코드를 활용해 정상 리듬, 심방세동(AF), 기타 부정맥, 잡음 신호 네 클래스로 구분한다. 주요 아이디어는 ECG를 심장 박동 단위로 세분화하여 시퀀스 길이를 크게 축소하고, 각 박동에서 도출한 풍부한 특징을 RNN에 입력함으로써 시간적·형태학적 패턴을 효과적으로 학습하는 것이다. 1. **데이터 전처리 및 세그멘테이션** - ECG를 평균 0, 표준편차 1로 정규화하고, Pan‑Tompkins 기반 QRS 검출기로 R‑peak를 찾는다. - R‑peak를 중심으로 ±0.33 초(총 0.66 초) 윈도우를 잡아 각 박동을 추출한다. - 평균 9,000개의 원시 샘플이 33개의 박동 시퀀스로 압축된다. 2. **특징 추출** - 전통적인 도메인 특성: δRR, 5대역 상대·전체 웨이블릿 에너지(RWE, TWE), R‑peak 진폭, Q‑amplitude, QRS 지속시간, 웨이블릿 엔트로피(WE). - 두 개의 Stacked Denoising Autoencoder(SDAE)를 각각 원시 박동 파형과 웨이블릿 계수에 비지도 학습시켜 저차원 임베딩을 얻는다. - 모든 특성을 하나의 벡터로 결합해 박동당 입력으로 사용한다. 3. **Level 1 모델** - 15개의 RNN(1~5층 GRU 또는 양방향 LSTM, 각 80유닛)과 선택적 어텐션 레이어를 다양한 이진 분류 설정(정상 vs. 나머지, AF vs. 나머지 등)으로 학습한다. - 각 클래스별 64상태 Hidden Semi‑Markov Model(HSMM)을 비지도 방식으로 학습해 로그‑우도값을 산출한다. - RNN의 softmax 출력과 HSMM 로그우도를 연결해 19차원 예측 벡터를 만든다. 4. **Level 2 블렌더** - 다층 퍼셉트론(MLP)으로 Level 1 예측 벡터와 전체 ECG의 RWE, WE, 평균 절대 편차(AAD) 등 전역 특성을 결합한다. - 블렌더는 검증 세트에서 학습해 과적합을 방지한다. - 최종 출력은 소프트맥스 형태의 클래스 확률이다. 5. **어텐션 메커니즘 및 해석 가능성** - 각 박동의 은닉 상태 h_t에 대해 u_t = tanh(W_beath_t + b_beat)를 계산하고, 전역 컨텍스트 u_beat와의 내적을 softmax로 정규화해 가중치 a_t를 얻는다. - 컨텍스트 벡터 c = ∑a_t h_t는 분류에 사용되며, a_t 값을 시각화하면 모델이 어떤 박동에 주목했는지 확인 가능하다. - 정상 리듬 모델은 모든 박동에 고르게 가중치를 부여하고, ‘기타 부정맥’ 모델은 비정상적인 PR 연장 구간에 집중한다는 결과가 제시된다. 6. **실험 및 결과** - PhysioNet 2017 Challenge 데이터(비공개 테스트 3,658개)에서 평균 F1 = 0.79를 기록했다. 클래스별 F1은 정상 0.90, AF 0.79, 기타 0.68이다. - 클래스 불균형을 완화하기 위해 가중치 손실, 외부 데이터 보강, 샘플 가중치를 적용했다. - 파라미터 수가 적음에도 불구하고 Rajpurkar 등(34‑layer CNN)과 비슷하거나 우수한 성능을 보이며, 어텐션 기반 해석이 추가적인 임상적 가치를 제공한다. 7. **한계 및 향후 연구** - 현재는 ECG 신호와 박동 특성만 사용했으며, 환자 연령·성별·기저질환 등 메타데이터를 통합하면 성능 향상이 기대된다. - 실시간 모바일 디바이스에 경량 모델을 배포하고, 임상 현장에서 의사와 협업해 어텐션 결과를 진단 보조에 직접 활용하는 방안을 제시한다. 결론적으로, 이 연구는 심장 박동 단위의 시퀀스 모델링과 어텐션 기반 해석을 결합해 단일 리드 ECG에서 부정맥을 정확히 구분하고, 의료 현장에서 신뢰성 있는 AI 도구로 활용될 가능성을 보여준다.

심장 박동별 RNN으로 부정맥 자동 분류

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기