자동으로 전정신경초 종양을 T2 MRI에서 분할하는 2.5D 딥 어텐션과 하드니스 가중 손실

본 논문은 고해상도 T2‑weighted MRI에서 전정신경초(VS) 종양을 자동으로 분할하기 위해, 인‑플레인 해상도와 스루‑플레인 해상도의 차이를 활용한 2.5D U‑Net 구조와 다중 스케일 공간 어텐션 모듈, 그리고 어려운(voxel‑level) 픽셀에 가중치를 부여하는 하드니스‑Weighted Dice 손실을 제안한다. 실험 결과 2.5D 모델이 2D·3D 모델보다 정확도와 효율성에서 우수했으며, 감독된 어텐션과 하드니스 가중 손실이 …

저자: Guotai Wang, Jonathan Shapey, Wenqi Li

자동으로 전정신경초 종양을 T2 MRI에서 분할하는 2.5D 딥 어텐션과 하드니스 가중 손실
본 연구는 전정신경초(Vestibular Schwannoma, VS)라는 작은 양성 종양을 고해상도 T2‑weighted MRI에서 자동으로 분할하는 방법을 제안한다. VS는 저대조, 작은 부피, 그리고 스루‑플레인 방향의 낮은 해상도라는 세 가지 어려운 특성을 가지고 있어 기존의 2D 혹은 3D CNN 기반 분할 방법으로는 충분한 정확도와 효율성을 확보하기 어렵다. 이를 해결하기 위해 저자는 세 가지 핵심 기술을 개발하였다. 첫 번째는 “2.5D” 컨볼루션 신경망이다. 일반적인 2D CNN은 각 슬라이스를 독립적으로 처리해 인‑플레인 상의 연속성을 무시하고, 3D CNN은 등방성으로 재샘플링해야 물리적 수용 영역을 균일하게 만들 수 있지만 메모리와 연산량이 급증한다. 저자는 인‑플레인 해상도가 스루‑플레인보다 약 4배 높다는 점을 활용해, 초기 두 레벨(L1‑L2)에서는 2D 컨볼루션과 2D 풀링만을 적용해 인‑플레인 고해상도를 그대로 유지한다. 이후 레벨(L3‑L5)에서는 3D 컨볼루션과 3D 풀링을 도입해 스루‑플레인 방향의 연관성을 학습한다. 이렇게 하면 물리적 수용 영역이 거의 등방성이 되면서도 메모리 사용량을 크게 늘리지 않는다. 네트워크는 U‑Net 형태의 인코더‑디코더 구조를 따르며, 각 레벨마다 두 개의 컨볼루션‑BN‑pReLU 블록을 사용한다. 두 번째는 다중 스케일 공간 어텐션 모듈이다. 작은 병변에 집중하도록 설계된 이 모듈은 디코더 단계에서 인코더와 디코더 피처를 concatenate한 뒤, 1×1 컨볼루션으로 채널을 절반으로 축소하고 ReLU, 다시 1×1 컨볼루션과 sigmoid를 거쳐 0‑1 사이의 단일 채널 어텐션 맵 A_l을 만든다. 기존 연구에서 제안된 어텐션 게이트는 엔코더 피처에만 적용하고 별도 지도 없이 학습했지만, 본 논문은 어텐션 맵에 대해 전경 마스크 G_f와 평균‑풀링된 버전 G_f^l 사이의 L1 손실을 추가해 직접적인 감독을 제공한다. 이 손실은 다중 스케일(L=5)에서 동시에 적용되어, 각 해상도 단계에서 어텐션이 목표 영역을 정확히 강조하도록 유도한다. 세 번째는 voxel‑level Hardness‑Weighted Dice Loss(HDL)이다. 기존 Dice 손실은 모든 픽셀을 동일하게 취급해 작은 병변의 경계 학습이 약화되는 문제를 가지고 있다. 저자는 예측 확률 p_{ci}와 실제 라벨 g_{ci}의 차이를 절대값으로 취한 w_{ci}=λ·|p_{ci}-g_{ci}|+(1-λ) 로 정의한 가중치를 도입했다. λ는 0‑1 사이의 하이퍼파라미터로, λ가 클수록 오차가 큰 “어려운” 픽셀에 더 큰 가중치를 부여한다. 이 가중치를 기존 Dice 분자·분모에 곱해 HDL를 구성했으며, ε=10^{-5} 로 수치 안정성을 확보했다. 실험에서는 λ=0.4~0.6 구간이 가장 좋은 성능을 보였으며, λ가 0.6을 초과하면 과도한 강조로 일반화가 저하되는 현상이 관찰되었다. 데이터는 245명의 VS 환자 T2‑MRI(인‑플레인 0.4 mm, 스루‑플레인 1.5 mm)이며, 178/20/47 로 학습/검증/테스트로 분할하였다. 각 이미지에서 100 mm × 50 mm × 50 mm 크기의 ROI를 수동으로 지정하고, 평균·표준편차 정규화를 적용했다. 구현은 TensorFlow 기반 NiftyNet을 사용했으며, Adam optimizer(learning rate 1e‑4, weight decay 1e‑7)으로 학습했다. 배치 사이즈는 2, 10k 스텝마다 learning rate를 절반 감소시켰다. 성능 평가는 Dice, 평균 대칭 표면 거리(ASSD), 상대 부피 오차(RVE)로 수행했다. 2.5D U‑Net은 2D U‑Net(80.38 % Dice)과 3D U‑Net(83.61 % Dice)보다 각각 5.31·%p, 2.08·%p 높은 Dice를 기록했으며, 추론 시간도 2D 대비 약 0.1 s 단축되었다. 어텐션을 추가한 변형으로는 2.5D+AG(Attention Gate), 2.5D+PA(Proposed Attention), 2.5D+SpvPA(Supervised Proposed Attention) 순으로 성능이 상승했으며, 특히 감독된 어텐션(SpvPA)을 적용했을 때 Dice 86.71 %→87.27 % (HDL 적용)까지 향상되었다. HDL 적용 시 λ=0.6에서 2.5D U‑Net은 Dice 85.69 %→86.66 %(+1·%p), ASSD 0.67 mm→0.56 mm(‑0.11 mm)로 개선되었으며, 2.5D+SpvPA는 Dice 86.71 %→87.27 %(+0.56·%p), ASSD 0.53 mm→0.43 mm(‑0.10 mm)까지 개선되었다. RVE 역시 13.40 %→12.14 %로 감소했다. 결론적으로, 본 논문은 (1) 해상도 비대칭성을 고려한 2.5D 아키텍처, (2) 다중 스케일 및 지도된 공간 어텐션, (3) 어려운 픽셀에 가중치를 부여하는 손실 함수라는 세 가지 혁신을 결합해, 작은 병변을 포함한 저대조 MRI에서 높은 정확도와 효율성을 동시에 달성하였다. 제안된 방법은 전정신경초뿐 아니라 다른 저해상도·저대조 의료 영상에서도 적용 가능성이 높으며, λ 값에 따른 가중치 강도와 어텐션 지도 설계가 향후 연구의 중요한 방향이 될 것이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기