스케일 인식 적응형 반지도 네트워크로 제한된 의료 라벨 활용

본 논문은 제한된 라벨만을 이용하는 의료 영상 분할을 위해, 저·고수준 특징을 별도 디코더에 전달하고, 시간적 신뢰도 누적을 기반으로 픽셀별 가중치를 동적으로 조정하는 Scale‑aware Adaptive Reweight(SAR) 전략과 3D 푸리에 변환을 이용해 다양한 시점·스케일의 가상 라벨을 생성하는 View Variance Enhancement를 결합한 SASNet을 제안한다. LA, Pancreas‑CT, BraTS 데이터셋에서 기존 …

저자: Zihan Li, D, an Shan

스케일 인식 적응형 반지도 네트워크로 제한된 의료 라벨 활용
**1. 서론** 의료 영상 분할은 정확한 병변 식별과 치료 계획 수립에 필수적이지만, 고품질의 픽셀‑단위 라벨을 확보하는 비용이 매우 높다. 특히 라벨이 부족한 상황에서는 기존의 완전 지도 학습 모델이 크게 성능 저하를 겪으며, 작은 병변이나 복잡한 경계 영역에서 오류가 빈번히 발생한다. 이러한 문제를 해결하기 위해 반지도(semisupervised) 학습이 활발히 연구되고 있으나, 현재 대부분의 방법은 라벨이 전혀 없는 영역에 대해 단순히 pseudo‑label을 생성하거나, 데이터 증강을 통한 일관성 정규화에 의존한다. 이들은 멀티스케일 정보를 충분히 활용하지 못하고, 임상의가 서로 다른 시점·전문성에 따라 달라지는 주석 변동성을 모델이 학습하도록 설계되지 않았다. **2. 관련 연구** 반지도 학습은 크게 self‑training 기반과 consistency regularization 기반으로 나뉜다. Self‑training은 교사 모델이 높은 신뢰도의 pseudo‑label을 생성하고, 이를 학생 모델에 재학습시키는 방식이며, consistency regularization은 다양한 변형(augmentation) 하에서도 예측이 일관되도록 강제한다. 최근에는 불확실성 기반 가중치, 다중 스케일 일관성, 그리고 Transformer‑CNN 혼합 구조가 제안되었지만, 이들 모두는 스케일 간 가중치를 동적으로 조정하거나, 실제 주석 변동성을 시뮬레이션하는 메커니즘이 부족하다. **3. 방법론** SASNet은 크게 세 부분으로 구성된다. - **Dual‑branch Architecture**: 인코더는 동일하게 공유하지만, 저수준(Low‑level)와 고수준(High‑level) 특징을 각각 별도의 디코더에 전달한다. 저수준 디코더는 세밀한 공간 정보를, 고수준 디코더는 풍부한 의미 정보를 복원한다. 두 디코더의 출력은 동일 해상도로 업샘플링된 뒤, SAR 단계에서 결합된다. - **Scale‑aware Adaptive Reweight (SAR)**: 각 픽셀에 대해 이전 에포크들의 예측 신뢰도(softmax 확신)를 누적해 “신뢰도 매트릭스”를 만든다. 이 매트릭스는 현재 에포크에서 저·고수준 디코더의 출력에 픽셀‑별 가중치를 부여한다. 수식적으로는 \

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기