MRI 기반 좌심방 자동 분할을 위한 nnU‑Net 적용 연구

본 논문은 Left Atrium Segmentation Challenge 2013(LASC’13) MRI 데이터셋에 nnU‑Net 프레임워크를 그대로 적용하여 좌심방을 자동으로 분할하였다. 30건의 MRI 중 20건을 학습, 10건을 테스트에 사용했으며, 전처리·패치 기반 학습·데이터 증강을 자동으로 최적화하였다. 결과는 평균 Dice 93.5 % ± 1.8, 95th percentile Hausdorff Distance 3.2 mm, 평균 S…

저자: Fatemeh Hosseinabadi, Seyedhassan Sharifi

MRI 기반 좌심방 자동 분할을 위한 nnU‑Net 적용 연구
본 연구는 좌심방(Left Atrium, LA) 구조를 정확히 파악하는 것이 심방세동(Atrial Fibrillation, AF) 치료와 개인 맞춤형 심장 모델링에 필수적이라는 배경에서 시작된다. 기존의 수동 분할은 시간 소모가 크고 관찰자 간 변동성이 높아 대규모 임상 적용에 한계가 있었다. 이러한 문제를 해결하고자 최근 의료 영상 분야에서 각광받고 있는 딥러닝 기반 분할 기법, 특히 U‑Net 계열 구조를 활용한 자동화 방법을 검토하였다. 그러나 전통적인 U‑Net 모델은 데이터 전처리, 네트워크 깊이, 패치 크기, 학습률 등 다수의 하이퍼파라미터를 연구자가 직접 설정해야 하며, 이는 재현성 저하와 비전문가의 접근 장벽을 만든다. 이에 저자들은 nnU‑Net(framework)을 선택하였다. nnU‑Net은 입력 데이터의 통계적 특성을 자동 분석해 최적의 전처리 파이프라인(리샘플링, 정규화, 크롭), 네트워크 아키텍처(채널 수, 레이어 깊이, residual block), 학습 파라미터(배치 크기, 패치 크기, 손실 함수 조합) 등을 자동으로 구성한다. 이러한 “self‑configuring” 특성은 데이터셋마다 별도의 튜닝 없이도 최고 수준의 성능을 보장한다는 장점이 있다. 데이터는 Left Atrium Segmentation Challenge 2013(LASC’13)에서 제공된 30건의 MRI 스캔과 대응하는 전문가 라벨을 사용하였다. 연구에서는 MRI 서브셋만을 대상으로 하여, 20건을 학습(train) 세트, 10건을 테스트(test) 세트로 할당하였다. 환자 수준으로 데이터를 분리해 데이터 누수를 방지했으며, 학습/검증 비율은 70 %/10 %/20 %(train/val/test)로 설정하였다. 전처리 단계에서는 nnU‑Net이 자동으로 isotropic voxel spacing(예: 1 mm³)으로 재샘플링하고, 평균 0·표준편차 4로 강도 정규화를 수행하였다. 또한, 심장 영역을 중심으로 3D 볼륨을 크롭해 배경을 최소화함으로써 메모리 사용량을 절감하고, 불필요한 잡음이 학습에 미치는 영향을 감소시켰다. 데이터 증강은 회전·좌우·상하 플립, 탄성 변형, 감마 보정·밝기 변동, 가우시안 노이즈 등을 on‑the‑fly로 적용해 다양한 형태와 대비 변화를 모델이 학습하도록 하였다. 네트워크는 3D full‑resolution nnU‑Net을 채택하였다. 기본 구조는 encoder‑decoder 형태에 skip connection을 두어 고해상도 정보를 보존하고, residual block에 instance normalization과 leaky ReLU를 적용해 안정적인 학습을 지원한다. 중간 디코더 레이어에서 보조 출력(auxiliary output)을 도입해 deep supervision을 구현, 손실 함수는 Dice loss와 cross‑entropy loss를 가중합한 형태로 설정하였다. 패치 크기와 배치 크기는 GPU 메모리(48 GB)와 입력 이미지 크기에 맞춰 자동 결정되었으며, 본 실험에서는 배치 2, 패치 크기 약 128³ voxels가 사용되었다. 학습은 PyTorch 기반 nnU‑Net v2.1 구현을 이용해 NVIDIA RTX A6000 GPU에서 진행했으며, 최적화 알고리즘은 momentum 0.99, weight decay 3e‑5를 갖는 SGD를 사용하였다. 초기 학습률은 1e‑2이며, 다항식 감소 스케줄러로 점진적으로 감소시켰다. 전체 1000 iteration(≈500 epoch) 동안 학습했으며, 총 학습 시간은 약 36시간이었다. 추론 단계에서는 슬라이딩 윈도우 방식을 적용해 전체 3D 볼륨을 한 번에 처리했으며, 평균 추론 시간은 10초 미만으로 임상 워크플로우에 충분히 적합했다. 성능 평가는 Dice similarity coefficient(DSC), 95th percentile Hausdorff Distance(HD95), Average Surface Distance(ASD) 세 가지 지표를 사용하였다. 테스트 셋에서 평균 DSC는 93.5 % ± 1.8, HD95는 3.2 mm ± 0.9, ASD는 1.1 mm ± 0.4를 기록했다. 최우수 케이스는 DSC 0.958, 최악 케이스는 0.90으로, 모든 케이스에서 DSC 0.90 이상을 유지하였다. 5‑fold 교차 검증에서도 DSC 92.8‑94.1 % 사이의 일관된 결과를 보였으며, Wilcoxon signed‑rank test 결과 자동 분할과 수동 라벨 간 차이는 통계적으로 유의미하지 않았다(p > 0.05). 비교 분석에서는 기존 LASC’13 참가자들이 보고한 전통적인 방법(Region Growing, Statistical Shape Models 등)의 Dice가 84‑90 % 수준에 머물렀던 반면, nnU‑Net은 평균 93.5 %로 약 9 %p의 향상을 달성했다. 특히 폐정맥(PV) 입구와 좌심방 부속(LAA) 같은 미세 구조까지 정확히 복원한 점이 임상적 가치를 높인다. 또한, 강한 모션 아티팩트나 부분적인 금속 임플란트가 포함된 경우에도 DSC 0.90 이상을 유지해 다양한 임상 상황에 대한 강인성을 입증했다. 임상적 함의는 두드러진다. 고정밀 3D LA 모델은 전기생리학 시뮬레이션에 직접 활용될 수 있어, 환자 맞춤형 절제 전략 수립에 기여한다. 자동화된 파이프라인은 수동 라벨링에 소요되는 수분~수시간을 10초 이하로 단축시켜, 대규모 코호트 연구와 실시간 이미지‑가이드드 절차에 적용 가능하게 만든다. 또한, nnU‑Net의 자동 구성 특성은 비전문가도 손쉽게 모델을 재현·배포할 수 있게 하여, 병원 간 표준화와 재현성을 크게 향상시킨다. 결론적으로, 본 연구는 nnU‑Net이 좌심방 MRI 분할에 있어 최고 수준의 정확도와 일반화 능력을 제공함을 실증하였다. 자동화된 전처리·학습·추론 파이프라인은 임상 현장에 바로 적용 가능하며, 향후 다기관 데이터셋이나 CT 기반 분할에도 확장될 여지가 있다. 이러한 접근은 AF 치료 계획, 개인 맞춤형 심장 모델링, 그리고 대규모 이미지 기반 연구에 새로운 가능성을 열어줄 것으로 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기