도메인 특화 전처리와 증강으로 CT 볼륨 분할 강인성 향상
본 논문은 CT 영상의 고유 특성을 고려한 전처리·증강 파이프라인을 제안하고, 이를 U‑Net 기반 nnU‑Net과 혼합‑스케일 Dense Net(MS‑D Net) 두 가지 아키텍처에 적용한다. 2D·3D 모델 각각을 독립적으로 학습한 뒤, 서로의 장점을 결합한 스택형 앙상블을 구축해 간결한 파라미터 조정만으로도 다양한 장기·신장 데이터셋에서 높은 Dice 점수와 낮은 변동성을 달성한다.
저자: Marie Kloenne, Sebastian Niehaus, Leonie Lampe
본 연구는 CT 영상 특유의 넓은 동적 범위와 슬라이스 수·두께의 변동성을 고려한 데이터 전처리·증강 파이프라인을 제안하고, 이를 최신 CNN 아키텍처에 적용해 강인한 장기·신장 분할 모델을 구축한다. 논문 서두에서는 기존 딥러닝 기반 의료 영상 분석이 데이터‑드리븐 특성으로 인해 다양한 모달리티에 대해 일관된 성능을 보장하지 못한다는 문제점을 제시한다. 특히 CT는 HU(Hounsfield Unit) 스케일을 사용해 조직별 방사선 밀도를 정량화하므로, 일반적인 0~255 정규화 방식으로는 중요한 조직 정보를 손실할 위험이 있다.
이를 해결하기 위해 저자들은 다음과 같은 전처리 과정을 설계했다. 첫째, 임상에서 흔히 사용하는 윈도우링 방식을 차용해 각 볼륨을 (0.6, 0.99) 퍼센타일 구간으로 클리핑한다. 이는 뼈, 장기, 폐 등 관심 조직에 맞는 강도 범위를 자동으로 선택하게 해준다. 둘째, 클리핑된 데이터를 무작위 샘플의 평균·표준편차를 이용해 z‑score 정규화한다. 전체 데이터셋 통계가 아닌 샘플 기반 통계 사용은 실제 임상 환경에서 사전 데이터가 부족한 상황을 모사한다.
다음으로 부피 차원의 불균형을 완화한다. CT 스캔은 ROI에 따라 슬라이스 수가 크게 달라지며, 기존 3D CNN은 일정한 깊이를 전제한다. 저자들은 모든 볼륨을 16개의 슬라이스로 강제 축소하고, 각 볼륨에서 무작위로 슬라이스를 선택한다. 이 과정은 데이터 증강 효과도 제공한다. 또한, 512×512 해상도를 128×128로 다운샘플링해 GPU 메모리 사용을 최소화했으며, 실험적으로 더 큰 해상도가 성능 향상에 기여하지 않음을 확인했다.
증강 단계에서는 가우시안 노이즈 추가, 슬라이스 스킵·보간, 강도 범위 이동, ±16도 회전 등을 적용해 환자 자세 변화·스캔 파라미터 변동을 모사한다. 특히 슬라이스 스킵·보간은 비등방성 데이터에서 3D 컨텍스트 손실을 보완하도록 설계되었다.
아키텍처 측면에서는 두 가지 상이한 모델을 선택했다. 첫 번째는 nnU‑Net(기존 U‑Net의 자동화 버전)으로, 다운‑업 스케일링 구조와 인스턴스 정규화, LeakyReLU를 사용한다. 두 번째는 Mixed‑Scale Dense Net(MS‑D Net)으로, dilated convolution을 활용해 병렬 다중 스케일 처리를 수행한다. 두 모델 모두 동일한 전처리·증강 파이프라인에 적용했으며, 손실 함수는 Tanimoto 손실과 categorical cross‑entropy를 0.6:0.4 비율로 가중합했다. 2D 모델은 배치 크기 28, 3D 모델은 메모리 제약으로 배치 1을 사용했으며, Adam 옵티마이저로 학습하였다.
가장 주목할 점은 스택형 앙상블 전략이다. 신장 종양 분할에서는 3D MS‑D Net이 신장과 배경을 이진 분할하고, 2D nnU‑Net이 건강 조직·종양·배경을 다중 클래스 분류한다. 두 결과를 voxel‑wise하게 결합해 최종 예측을 생성한다. 간단히 말해, 3D 모델이 제공하는 장기적 연속성과 2D 모델이 제공하는 세밀한 경계 정보를 동시에 활용한다. 간단한 스택 구조에도 불구하고, 앙상블은 개별 모델보다 Dice 점수와 표준편차 모두에서 우수한 성능을 보였다.
평가에는 KiTS 2019 신장 종양 챌린지 데이터와 CHAOS CT‑MR 복합 데이터셋을 사용했다. 교차 검증 시 슬라이스 수·두께에 따라 데이터를 고르게 분배해 “최악의 경우” 시나리오를 시뮬레이션했으며, 이는 실제 임상 현장에서 다양한 스캔 프로토콜에 대한 모델의 일반화 능력을 검증한다. 실험 결과, 제안된 프레임워크는 평균 Dice 점수에서 기존 최첨단 방법과 동등하거나 더 높았으며, 특히 표준편차가 현저히 낮아 예측의 일관성이 크게 향상되었다. 이는 자동·반자동 워크플로우에서 강력히 요구되는 “안정성”을 확보한 것으로 해석된다.
결론적으로, 본 논문은 CT 전용 전처리·증강이 모델 아키텍처와 무관하게 성능과 강인성을 동시에 끌어올릴 수 있음을 실증한다. 또한, 2D·3D 모델을 조합한 앙상블이 비등방성·볼륨 크기 변동 문제를 효과적으로 완화한다는 점에서, 향후 다양한 장기·질환에 대한 일반화 가능한 CT 분할 파이프라인 설계에 중요한 지침을 제공한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기