다중 인접 뇌 MRI 슬라이스 재구성을 활용한 비지도 알츠하이머 진단

본 연구는 건강한 뇌 MRI 슬라이스 3장을 입력으로 받아 다음 3장을 생성하는 GAN 기반 모델을 학습하고, 재구성 손실(L2)을 이용해 비지도 방식으로 알츠하이머병(AD)과 그 단계(MCI, 경증·중증 치매)를 구분한다. Wasserstein GAN‑GP와 L1 손실을 결합한 재구성 네트워크는 정상 데이터에 대한 일반화가 뛰어나며, 손실값이 클수록 병변이 의심되는 이미지로 판정한다. 실험 결과, 초기 단계(MCI)에서는 AUC 0.78, 후…

저자: Changhee Han, Leonardo Rundo, Kohei Murao

다중 인접 뇌 MRI 슬라이스 재구성을 활용한 비지도 알츠하이머 진단
본 논문은 비지도 학습을 활용해 알츠하이머병(AD)과 그 진행 단계(경도 인지장애(MCI), 경증·중등도 치매)를 자동으로 진단하는 새로운 프레임워크를 제안한다. 기존의 비지도 이상 탐지 연구는 주로 단일 이미지 재구성에 초점을 맞추어, 연속적인 해부학적 변화를 포착하지 못한다는 한계가 있었다. 알츠하이머는 해마·편도체·뇌실 등 특정 부위의 점진적 위축이 특징이므로, 인접 슬라이스 간의 연속성을 고려한 재구성이 필수적이다. **1. 데이터와 전처리** - OASIS‑3 데이터셋에서 3T T1‑weighted axial MRI 슬라이스(176×256)를 사용하였다. 전체 256 슬라이스 중 해마·편도체·뇌실을 포함하는 영역만 선택해, 병변과 직접 연관된 부위에 집중하였다. - 라벨은 Clinical Dementia Rating(CDR) 기준으로 구분했으며, 훈련 단계에서는 CDR=0(건강)인 408명(1,133 스캔, 57,834 슬라이스)만 사용해 순수한 정상 데이터만으로 모델을 학습시켰다. 검증·테스트 단계에서는 CDR 0.5, 1, 2를 포함해 단계별 성능을 평가하였다. **2. 모델 설계** - **입력/출력 구조**: 연속된 3개의 슬라이스를 RGB와 유사하게 3채널 이미지로 결합하고, 이를 입력으로 다음 3개의 슬라이스를 예측한다. 이는 전체 스캔에 대해 35개의 (3→3) 매핑을 학습하게 만든다. - **생성기(Generator)**: U‑Net 기반으로, 4개의 인코더와 4개의 디코더 레이어, 스킵 연결을 사용해 저해상도 특징을 고해상도 복원에 전달한다. 배치 정규화와 LeakyReLU/ReLU 활성화 함수를 적용해 학습 안정성을 높였다. - **판별기(Discriminator)**: 3개의 디코더 레이어를 갖는 CNN으로, Wasserstein 거리와 Gradient Penalty(GP)를 적용해 모드 붕괴와 학습 발산을 방지한다. **3. 손실 함수와 학습** - **재구성 단계**: Wasserstein GAN‑GP 손실에 L1 손실(가중치 100)을 추가했다. L1 손실은 픽셀 수준에서 절대 차이를 최소화해 전반적인 밝기·구조를 보존하고, WGAN‑GP는 전체 이미지 분포를 맞추어 현실감 있는 결과를 만든다. - **학습 파라미터**: Adam 옵티마이저(learning rate 2e‑4)를 사용했으며, U‑Net은 600,000 스텝(배치 64), GAN은 각각 300,000 스텝(배치 32) 동안 학습했다. **4. 진단 단계** - 재구성된 슬라이스와 원본 슬라이스 간의 평균 L2(제곱 오차) 손실을 스캔 단위로 집계한다. L2 손실은 이상치에 민감해, 정상 데이터와 비교했을 때 병변이 있는 경우 손실이 크게 증가한다. 검증 단계에서 평균 L2 손실이 가장 높은 모델을 선택했으며, 이는 모든 비교 손실(L1, Dice, SSIM)보다 일관되게 높은 AUC를 보였다. **5. 실험 결과** - **재구성 품질**: WGAN‑GP+L1 모델이 U‑Net 및 WGAN‑GP(단독)보다 해부학적 세부 구조(특히 해마·편도체) 재현에 우수했다. 고위 CDR(1,2) 슬라이스에서는 위축 부위가 흐릿하게 재현돼 손실이 크게 증가한다는 점이 시각적으로 확인되었다. - **진단 성능**: 평균 L2 손실 기반 ROC 분석 결과, CDR 0 vs 0.5에서 AUC 0.78, CDR 0 vs 1에서 0.83, CDR 0 vs 2에서 0.92를 기록했다. 특히 초기 단계(MCI)에서도 0.78이라는 높은 AUC를 달성해, 기존 감독학습 기반 방법보다 경쟁력 있는 성능을 보였다. 손실 분포는 정상군과 병변군 사이에 명확한 경계가 형성돼, 단순 임계값 설정만으로도 실시간 이상 탐지가 가능함을 시사한다. - **추가 관찰**: WGAN‑GP(단독) 모델이 블러링이 심함에도 불구하고 U‑Net보다 진단 성능이 좋았으며, 이는 GAN 기반 재구성이 구조적 일관성을 유지하는 데 유리함을 보여준다. **6. 논문의 의의** - **비지도 접근**: 라벨링 비용이 전혀 들지 않으며, 새로운 혹은 희귀 질환에도 동일 파이프라인을 적용할 수 있다. - **연속성 활용**: 인접 슬라이스 간의 연속성을 학습함으로써, 미세한 해부학적 변화를 효과적으로 포착한다. 이는 알츠하이머와 같이 점진적 위축이 핵심인 질환에 특히 유용하다. - **단계별 진단**: CDR에 따라 성능이 점진적으로 향상되는 점은, 손실 기반 접근이 질환 진행 정도를 정량화할 수 있음을 보여준다. **7. 한계 및 향후 연구** - 현재는 해마·편도체·뇌실에 국한된 슬라이스만 사용했으므로, 전뇌 영역에 대한 일반화는 검증되지 않았다. - 입력·출력 슬라이스 수(현재 3)와 방향(앞쪽만) 등이 최적인지 여부는 추가 실험이 필요하다. - 향후 연구에서는 양방향(앞·뒤) 재구성, 슬라이스 수 변환, Attention‑GAN, Transformer 기반 모델 등을 도입해 재구성 품질을 높이고, 다중 모달(PET, fMRI) 데이터를 결합해 종합적인 바이오마커를 구축할 계획이다. 또한 손실 기반 이상 탐지와 동시에 병변 위치를 시각화하는 방법을 개발해 임상 적용성을 강화하고자 한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기