심장 MRI 분류를 위한 전역 및 지역 해석 가능성

본 논문은 심장 자기공명영상(CMR)에서 추출한 시계열 세그멘테이션 데이터를 이용해 관상동맥질환(CAD) 여부를 자동으로 판별하면서, 모델의 판단 근거를 임상적으로 해석 가능한 형태로 제공하는 새로운 프레임워크를 제안한다. 기존 딥러닝 기반 이미지 분류 모델은 높은 정확도를 보이지만, ‘왜 이런 결과가 나왔는가’에 대한 설명이 부족해 임상 현장에서의 신뢰와 적용에 제약이 있었다. 이를 해결하고자 저자들은 두 가지 핵심 기술을 결합하였다. 첫 번째는 변분 오토인코더(Variational AutoEncoder, VAE)로, 입력된 2D 세그멘테이션 시퀀스를 저차원 잠재공간으로 압축하고 다시 복원하도록 학습한다. VAE는 인코더가 각 프레임을 평균(µ)과 표준편차(σ) 형태의 128차원 벡터로 변환하고, 디코더가 이 벡터를 이용해 원본 세그멘테이션을 재구성한다. 재구성 손실과 KL 발산을 동시에 최소화함으로써 잠재공간이 실제 해부학적·생리학적 변화를 보존하도록 강제한다. 두 번째는 개념 활성화 벡터(Concept Activation Vector, CAV)이다. 임상에서 널리 사용되는 바이오마커(예: 좌심실 구혈분율(EF), 피크 배출률(PER), 피크 충전률(PFR), 심방 충전률(APFR), 좌심실 벽 두께 변이)를 ‘concept’로 정의하고, 해당 개념이 포함된 샘플과 포함되지 않은 샘플을 분류기의 중간 은닉층(64유닛)에서의 활성화와 연관시킨다. 두 집합을 선형 분류기로 구분했을 때 얻어지는 초평면의 법선벡터가 바로 CAV이며, 이는 해당 개념이 모델의 최종 로그잇에 미치는 영향을 정량화한다. 데이터는 영국 바이오뱅크(UK Biobank)에서 추출한 10,816명의 CMR 세그멘테이션이며, ICD‑10 코드에 따라 CAD 양성(778명)과 음성(10,038명)으로 라벨링하였다. 각 피험자는 3개의 단축축 슬라이스를 50프레임(전체 심장 주기) 동안 세그멘테이션했으며, 이를 80×80 픽셀 크기로 정규화하였다. 모델 학습은 두 단계로 진행되었다. 첫 단계에서는 VAE 손실만을 사용해 인코더‑디코더를 사전 학습하고, 두 번째 단계에서는 VAE와 이진 분류기를 동시에 학습시켜 전체 손실(L_recon + β·L_KL + γ·L_class)를 최소화하였다. β와 γ는 경험적으로 조정했으며, 최종 모델은 테스트 셋에서 AUC 0.78을 기록했다. 재구성 성능은 Dice 점수 0.93으로, VAE가 세그멘테이션을 거의 손실 없이 복원함을 보여준다. CAV 분석에서는 5가지 바이오마커를 개념으로 선정하였다. 각 개념에 대해 라벨이 높은 1,000명과 낮은 1,000명을 각각 ‘positive’와 ‘negative’ 샘플로 정의하고, 해당 샘플들의 중간층 활성화를 이용해 선형 분류기를 학습했다. 테스트 단계에서 각 샘플에 대해 ∇z ŷ·v_c 값을 계산했으며, 양의 비율이 높은 경우 해당 개념이 CAD 예측에 긍정적인 영향을 미친다. 결과적으로 EF, PER, PFR, APFR, LV 벽 두께 변이 모두 양의 기여를 보였으며, 특히 PFR(0.156)과 APFR(0.0048)에서 높은 평균 기여도가 관찰되었다. 이는 모델이 심장 수축·충전 속도와 같은 동적 기능을 주요 판별 근거로 활용한다는 임상적 해석과 일치한다. 지역적 해석은 VAE 디코더를 활용해 수행하였다. 잠재벡터 µ에 CAV v_c를 ±스케일로 더하거나 빼서 변형된 잠재벡터를 만든 뒤, 이를 디코더에 입력해 재구성된 세그멘테이션을 시각화한다. 예를 들어 ‘low peak ejection rate’ 개념을 적용하면 LV의 수축 정도가 얕아지고, ‘high LV wall variance’ 개념을 적용하면 특정 구역의 벽 두께가 비정상적으로 변하는 모습을 확인할 수 있다. 이러한 잠재공간 보간은 이미지 도메인에서 의미 있는 변화를 일으키므로, 모델이 학습한 특징이 실제 임상 지표와 일관됨을 증명한다. 논문의 주요 기여는 다음과 같다. (1) 시계열 전체를 활용해 동적 정보를 보존함으로써 단일 프레임 기반 모델보다 풍부한 특징을 학습한다. (2) VAE와 CAV를 결합해 전역(전체 데이터에 대한) 및 지역(개별 이미지에 대한) 해석을 동시에 제공한다. (3) 임상적으로 친숙한 바이오마커와 직접 연결된 잠재공간 벡터를 시각화함으로써 의료진의 신뢰성을 높인다. 한편, 제한점으로는 잠재공간 차원(128)의 선택이 경험적이며, CAV가 선형 가정에 의존해 복합적인 비선형 관계를 완전히 포착하지 못할 가능성이 있다. 또한, ICD‑10 기반 라벨링은 라벨 노이즈를 내포할 수 있다. 향후 연구에서는 잠재공간 차원 최적화, 비선형 개념 모델링, 다중 질환(예: 심부전, 고혈압) 다중 라벨 학습, 그리고 실제 임상 워크플로우에의 통합을 탐색할 예정이다.

심장 MRI 분류를 위한 전역 및 지역 해석 가능성

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기