다중병원 CT 스캔을 위한 이질적 앙상블 모델로 본 COVID‑19 진단 고도화
본 논문은 서로 다른 스캐너와 프로토콜을 사용하는 4개 병원 데이터에 대해, Vision Transformer 기반 자체지도 학습 모델, RadImageNet 사전학습 DenseNet, 그리고 다양한 백본을 활용한 Gated Attention MIL 모델을 포함한 9개의 이질적 모델을 앙상블하여 COVID‑19 여부를 판별한다. 센터별 샘플링, Mixup 기반 임베딩 혼합, Focal Loss, 도메인 특화 증강 등으로 과적합을 억제하고, 각 …
저자: Aadit Nilay, Bhavesh Thapar, Anant Agrawal
본 논문은 COVID‑19 판별을 위한 CT 기반 자동화 시스템이 다중 병원 환경에서 직면하는 스캐너 하드웨어, 촬영 프로토콜, 환자 집단 차이로 인한 도메인 쉬프트 문제를 해결하고자 한다. 이를 위해 저자들은 4개 병원(소스 0~3)에서 수집된 1,222개의 학습 스캔과 308개의 검증 스캔을 활용했으며, 각 스캔은 50~700장의 JPEG 슬라이스로 구성된 3D 볼륨이다. 라벨은 스캔 수준(코로나 양성/음성)만 제공되므로, 슬라이스 수준 라벨이 없는 약한 감독 상황에 적합한 Multiple Instance Learning(MIL) 접근이 필요했다.
모델 구성은 크게 세 가지 파라다임으로 나뉜다. 첫 번째는 자체 지도 학습 기반 DINOv2 Vision Transformer(ViT‑B/14)를 사용해 슬라이스별 로짓을 출력하고, sigmoid 변환 후 평균을 취해 스캔 수준 확률을 산출한다. 두 번째는 방사선 이미지 전용 사전학습 데이터셋인 RadImageNet으로 초기화된 DenseNet‑121을 적용해 동일한 슬라이스 평균 방식을 사용한다. 두 모델 모두 초기에는 백본을 고정하고 헤드만 학습한 뒤, 단계적으로 백본 일부를 언프리즌하며 차등 학습률을 적용한다.
세 번째 파라다임은 Gated Attention MIL 구조를 채택한 7개의 모델이다. EfficientNet‑B3, ConvNeXt‑Tiny, EfficientNetV2‑S를 백본으로 사용하며, 각 백본에 대해 시드 변형과 Stochastic Weight Averaging을 적용해 모델 다양성을 확보한다. MIL 파이프라인은 먼저 슬라이스 수준에서 경량 분류기를 붙여 20 epoch 정도 사전학습을 수행한 뒤, 슬라이스 임베딩을 추출한다. 이후 가중치된 어텐션 메커니즘을 통해 슬라이스 임베딩을 스캔 수준 특징으로 집계하고, 최종 softmax 클래스를 예측한다.
학습 과정에서 과적합을 방지하기 위해 다중 정규화 전략을 도입했다. Focal Loss를 사용해 클래스 불균형을 보정하고, 임베딩 수준 Mixup을 적용해 데이터 다양성을 인위적으로 확대했다. 또한, 수평 뒤집기, ±15° 회전, 밝기·대비 변동, 가우시안 블러 등 방사선학적 구조를 보존하면서 스캐너·프로토콜 차이를 모방하는 도메인‑aware 증강 파이프라인을 구축했다. 배치 구성은 센터‑스트라티파이드 샘플러를 이용해 각 병원의 슬라이스를 균등하게 섞어 학습했으며, 특히 소스 2와 같이 데이터가 희소한 센터는 오버샘플링으로 균형을 맞췄다.
추론 단계에서는 각 모델에 대해 4‑view 테스트‑타임 어그멘테이션(TTA)을 적용하고, 모델별 확률을 가중 평균한다. 이후 병원별로 별도 임계값을 최적화해 최종 라벨을 결정함으로써, 전역 임계값을 사용할 때보다 macro F1이 0.14 상승하는 효과를 얻었다. 최종 앙상블은 전체 4개 센터 평균 macro F1 = 0.9280을 기록했으며, 가장 성능이 좋은 단일 모델(DINOv2)의 F1 = 0.8969 대비 +0.031 향상을 달성했다.
결론적으로, 서로 다른 아키텍처와 사전학습 전략을 결합한 이질적 앙상블은 다중센터 의료 영상 분류에서 도메인 차이를 효과적으로 완화하고, 모델 일반화 능력을 크게 향상시킨다. 또한, 센터별 임계값 보정이라는 후처리 기법이 실제 현장 적용 시 중요한 성능 향상 요인임을 실증하였다. 향후 연구에서는 더 많은 병원과 다양한 영상 모달리티를 포함한 확장성 검증과, 실시간 임상 워크플로우에의 통합을 위한 경량화 방안이 필요할 것으로 보인다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기