짧은 심음 구간 분류를 위한 딥 CNN 앙상블
본 논문은 단일 심장 박동 구간(짧은 세그먼트)만을 이용해 정상·비정상을 구분하는 자동 심음 분류 시스템을 제안한다. 1차원 원시 신호를 직접 학습하는 1D‑CNN과 멜 주파수 켑스트럼(MFCC) 기반 시간‑주파수 특성맵을 입력으로 하는 2D‑CNN을 설계하고, 두 모델의 소프트맥스 확률을 점수‑레벨에서 합산하는 TF‑ECNN 앙상블을 구축하였다. PhysioNet CinC 2016 대규모 데이터베이스에서 기존 SVM·HMM 기반 방법들을 크게…
저자: Fuad Noman, Chee-Ming Ting, Sh-Hussain Salleh
본 논문은 심음(PCG) 자동 분류에서 짧은 구간, 즉 단일 심장 박동만을 이용해 정상·비정상을 구분하는 새로운 딥러닝 기반 프레임워크를 제안한다. 연구 배경으로는 기존의 심음 분류 방법이 긴 기록에서 평균적인 특성을 추출하거나, 잡음에 민감한 전통적인 시간·주파수 도메인 특징에 의존해 왔으며, 이는 실시간 진단이나 모바일 환경에 적용하기 어려운 한계가 있었다는 점을 들었다.
데이터는 PhysioNet CinC 2016 챌린지에서 제공하는 3153개의 PCG 녹음 중 ‘unsure’ 라벨을 제외한 2872개를 사용했으며, 전체 81 503개의 심장 박동 세그먼트를 추출하였다. 전처리 단계에서는 1000 Hz로 다운샘플링하고 25–400 Hz 대역의 Butterworth 밴드패스 필터링을 적용했으며, 평균·표준편차 정규화를 수행했다. 세그먼트는 데이터베이스에 제공된 어노테이션을 이용해 심장 박동 단위로 나누었고, 길이가 1200 샘플을 초과하는 경우는 1.2 %만 제외하고 나머지는 제로패딩으로 1200 샘플(1.2 초)로 맞추었다.
분류 모델은 크게 세 가지로 구성된다. (1) 1D‑CNN은 원시 파형을 직접 입력으로 받아 3개의 Conv‑BN‑ReLU‑MaxPool 블록과 2개의 전결합 레이어로 구성했으며, 드롭아웃(0.4)과 배치 정규화를 적용해 과적합을 방지했다. (2) 2D‑CNN은 두 종류의 시간‑주파수 특성맵을 입력으로 사용한다. 첫 번째는 MFCC(12 차원)이며, 두 번째는 12차 TV‑AR(선형예측) 계수이다. 각각 4개의 Conv‑BN‑ReLU‑MaxPool 블록을 쌓아 깊은 특징을 추출하고, 256‑노드 전결합 레이어와 Softmax로 이진 분류한다. (3) TF‑ECNN은 앞의 1D‑CNN과 2D‑CNN을 점수‑레벨에서 합산하는 앙상블 모델이다. 두 네트워크는 독립적으로 베이지안 최적화를 통해 하이퍼파라미터를 튜닝했으며, 학습률은 각각 0.001031, 0.000496, 배치 크기 128, 옵티마이저는 Adam을 사용했다.
베이스라인으로는 (a) RBF‑SVM, (b) 결정트리 앙상블, (c) 연속형 HMM을 사용했으며, 각각 58개의 전통적인 시간·주파수 특징(시간 도메인 22개, 주파수 도메인 36개)을 추출하고, NCA를 통해 28개 특징을 선택했다. 하이퍼파라미터는 5‑fold 교차검증과 베이지안 최적화로 조정했으며, 클래스 불균형을 완화하기 위해 가중치를 적용했다.
실험 결과는 표 4에 요약된다. 1D‑CNN은 원시 신호만 사용했음에도 86‑87 % 수준의 정확도와 민감도를 보였으며, 2D‑CNN은 MFCC 입력 시 특이도 91.55 %와 수정 정확도(MAcc) 88.82 %를 기록해 가장 높은 성능을 달성했다. TF‑ECNN은 두 모델을 결합해 정확도 89.22 %와 민감도 89.94 %를 얻었으며, 이는 기존 SVM(84.87 %)·HMM(87.07 %)보다 현저히 우수했다. 특히, 1D‑CNN은 복잡한 전처리 없이도 원시 데이터를 효과적으로 학습할 수 있음을 보여주었고, 2D‑CNN은 MFCC가 TV‑AR보다 심음의 음향적 차이를 더 잘 포착한다는 점을 확인했다.
결론적으로, 짧은 심음 구간만을 이용한 자동 분류에서 1D‑CNN과 2D‑CNN을 결합한 TF‑ECNN이 높은 정확도와 민감도를 제공함을 입증했다. 이 접근법은 실시간 진단, 모바일 헬스케어, 임베디드 시스템 등에 적용 가능하며, 향후 잡음 강인성 강화, 모델 경량화, 다중 클래스(다양한 심장 질환) 확장 등의 연구가 필요하다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기