3D 의료 형태에서 노화와 질병 효과를 자동 분리하는 두 단계 프레임워크
본 논문은 진단 라벨이 부족한 상황에서도 3차원 의료 형태의 노화와 질병 변화를 구분하기 위해, 암시적 신경표현(INR) 기반의 형태 코드를 학습하고, 이를 클러스터링해 가짜 질병 라벨을 생성한다. 이후 가짜 라벨과 연령 라벨을 이용해 변분 오토인코더(VAE)에서 다중 목표 손실(공분산 억제, 감독 대비 손실, 감도 정규화 등)로 질병·노화 요인을 분리한다. ADNI 해마와 OAI 대퇴골 데이터에서 기존 무감독 방법보다 높은 질병‑연령 분리 성…
저자: Jakaria Rabbi, Nilanjan Ray, Dana Cobzas
본 논문은 의료 영상에서 형태 변이를 분석할 때, 노화와 질병이 동시에 작용해 형태를 복합적으로 변화시키는 문제를 다룬다. 기존 연구는 주로 충분한 진단 라벨이 있을 때만 질병 효과를 분리했으며, 라벨이 부족하거나 노이즈가 많은 경우에는 성능이 급격히 저하되었다. 이를 해결하기 위해 저자들은 두 단계로 구성된 새로운 프레임워크를 제안한다.
첫 번째 단계는 암시적 신경표현(Implicit Neural Representation, INR)을 이용해 각 3D 형태를 연속적인 Signed Distance Function(SDF)으로 변환한다. INR은 좌표 p와 형태 코드 zᵢ를 입력받아 거리값을 출력하는 신경망 G_θ이며, SDF 손실, Eikonal 손실, 그리고 두 개의 가우시안 혼합 모델(GMM) prior을 결합한 복합 손실 L_INR을 최소화한다. 이 과정에서 형태 코드는 d 차원의 고정된 벡터로 압축되고, GMM prior은 코드 공간을 두 개의 클러스터(건강·질병)로 강제한다. 학습이 끝난 후, GMM을 이용해 각 코드에 대해 가장 높은 사후 확률을 갖는 클러스터를 가짜 질병 라벨 ỹᵢ로 할당한다. 실험 결과, 이 클러스터링은 실제 AD·CN 라벨과 높은 순수도(>80 %)와 평균 부피 차이(≈1400 mm³)를 보이며, 라벨이 전혀 없는 상황에서도 의미 있는 질병 구분을 제공한다.
두 번째 단계에서는 앞서 얻은 형태 코드를 입력·출력으로 하는 변분 오토인코더(VAE)를 학습한다. 인코더 E_ϕ는 고차원 코드 zᵢ를 k 차원의 잠재 변수 zᵥᵢ로 압축하고, 디코더 D_ψ는 이를 다시 원래 코드 ẑᵢ로 복원한다. 복원된 코드는 고정된 INR G_θ에 전달돼 실제 3D 형태를 재생성한다. 이 단계의 핵심은 다중 목표 손실 L_disentangle이다.
1. **VAE 기본 손실**: 재구성 손실 L_code와 KL 발산 L_KL을 결합해 전체 형태 정보를 유지한다.
2. **감독 대비 손실(SNNL)**: 가짜 질병 라벨 ỹᵢ와 지정된 차원 c(예: 질병 차원 zᵥᵢ,0)를 이용해 같은 라벨을 가진 샘플 간 거리를 최소화하고, 다른 차원에서는 거리 차이를 억제한다. 이는 질병 차원을 명확히 구분하도록 유도한다.
3. **공분산 정규화(L_cov)**: 잠재 변수들의 공분산 행렬에서 비대각 성분을 최소화해 차원 간 독립성을 강화한다.
4. **감도 정규화(L_dis_sen)**: 지정된 차원의 작은 변동이 디코더 출력에 미치는 영향을 직접 측정해, 차원 비활성화와 분산 붕괴를 방지한다. 구체적으로, 차원 c의 표준편차와 평균 표준편차 차이, 그리고 유한 차분을 이용한 민감도 α_c를 정규화한다.
5. **INR 재사용 손실**: 복원된 코드 ẑᵢ에 대해 SDF 손실을 다시 적용해 형태 일관성을 유지한다.
학습은 ADNI 해마와 OAI 대퇴골 두 데이터셋에서 수행되었다. ADNI에서는 819개의 스캔(AD·CN)과 OAI에서는 191개의 스캔(건강·OA)을 사용해 80/10/10 비율로 훈련·검증·테스트를 나누었다. Stage‑1은 2000 epoch, Stage‑2도 2000 epoch 동안 학습했으며, 하이퍼파라미터는 Optuna를 통해 최적화하였다.
평가 지표는 질병‑연령 분리 정도를 나타내는 SAP, 잠재 차원과 연령·진단 간 피어슨 상관, 질병 차원의 분류 정확도, 연령 차원의 회귀 RMSE, 그리고 Chamfer Distance(CD) 기반 재구성 오류였다. 기존 무감독 방법(β‑VAE, β‑TCVAE, DIP‑VAE 등)과 비교했을 때, 제안 방법은 SAP을 0.38까지 끌어올리며(기존 최고 0.30), 질병 차원 상관과 정확도도 크게 향상시켰다. 재구성 오류는 약간 증가했지만, 이는 차원 독립성을 위한 제약 때문이며 전체적인 성능 트레이드오프는 만족스럽다.
또한, 잠재 공간을 따라 연령 차원 zᵥᵢ,1을 변조하고 질병 차원 zᵥᵢ,0을 최소·최대로 설정하면 동일 연령에서 AD·CN 형태 쌍을 생성할 수 있었다. 생성된 형태는 부피 감소(~30 %)와 알려진 해마 위축 패턴을 재현했으며, OAI에서는 연령에 따른 대퇴골 변형이 미미함을 확인했다.
라벨 비율 실험에서는 실제 진단 라벨이 전혀 없을 때도 가짜 라벨만으로 SAP가 0.29에 달했으며, 실제 라벨이 30 %까지 추가될 경우에도 가짜 라벨이 큰 이득을 제공한다는 점을 보여준다.
결론적으로, 이 논문은 (1) 고해상도 연속 형태 표현을 위한 INR, (2) 클러스터링 기반 가짜 라벨 생성, (3) 다중 목표 손실을 통한 명시적 요인 분리라는 세 축을 결합해, 라벨이 부족한 의료 형태 분석에 강력하고 해석 가능한 프레임워크를 제공한다. 향후 연구에서는 다중 장기·다중 모달 데이터에 확장하고, 임상 예후 예측에 직접 연결하는 방향을 제시한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기