뇌종양 MRI 분류를 위한 최적 가중치 앙상블 학습 시스템

본 논문은 MRI 영상에서 뇌종양(교모세포종, 수막종, 뇌하수체 종양)을 3가지 클래스로 정확히 구분하기 위해, 다중 딥러닝·전통 머신러닝 모델을 결합한 가중치 투표 앙상블을 제안한다. 원본 영상, 대비 강화 영상, 엣지 영상, HOG 특징 등 다양한 입력 형태를 각각 전용 모델에 학습시킨 뒤, 개별 모델의 정확도에 비례하는 가중치를 부여해 최종 클래스를 결정한다. Figshare와 Kaggle 두 공개 데이터셋에서 99% 이상 정확도를 달성해…

저자: Ha Anh Vu

뇌종양 MRI 분류를 위한 최적 가중치 앙상블 학습 시스템
본 연구는 뇌종양 MRI 영상의 자동 분류 정확도를 극대화하기 위해, 다중 모델 앙상블과 가중치 투표 방식을 결합한 새로운 프레임워크를 제안한다. 먼저, 원본 512×512 그레이스케일 MRI에 BCET(균형 대비 강화)를 적용해 종양 영역의 시각적 구분을 명확히 하였다. 이어 K‑means 클러스터링을 통해 뇌 조직, 두개골, 종양을 구분하고, Canny 엣지 검출을 수행해 경계가 강조된 엣지 영상을 생성하였다. 동시에 HOG 특징을 추출해 전통 머신러닝 모델에 입력함으로써 전역적인 형태·텍스처 정보를 보존하였다. 모델 구성은 크게 두 부류로 나뉜다. 딥러닝 부문에서는 ResNet101, DenseNet121, Xception, ResNet50(엣지 영상 전용), 그리고 자체 설계 CNN‑MRI(3개의 Conv 레이어) 등 5개의 네트워크를 사용하였다. ResNet101은 101층의 깊이로 복잡한 텍스처와 의미적 패턴을 포착하고, DenseNet121은 밀집 연결을 통해 특징 재사용과 그래디언트 흐름을 개선한다. Xception은 depthwise separable convolution을 활용해 파라미터 효율성을 높였으며, ResNet50은 엣지 영상에 특화돼 경계 정보를 강조한다. CNN‑MRI는 경량 구조로 빠른 추론을 목표로 설계되었으며, 과적합 방지를 위해 dropout(0.5)과 Adam 옵티마이저를 적용하였다. 전통 머신러닝 부문에서는 SVM과 KNN을 HOG 특징에 학습시켰다. SVM은 Linear, RBF, Polynomial 등 7가지 커널을 실험했으며, 최종적으로 Linear 커널이 가장 높은 정확도를 보였다. KNN은 Euclidean, Manhattan, Minkowski, Chebyshev 거리 측정과 k=1~10 범위의 이웃 수를 탐색해, k=3, Euclidean 거리 조합이 최적임을 확인했다. 각 모델은 개별적으로 학습된 후, 가중치 투표 메커니즘을 통해 최종 예측을 만든다. 가중치는 검증 정확도에 비례하도록 설정했으며, 수식은 \(y_{final}= \arg\max_c \sum_{i=1}^{N} w_i \cdot p_{i,c}\) 로 정의된다. 실험에서는 세 가지 가중치 전략을 비교하였다. ① 동등 가중치(모든 모델 동일 기여) ② 증분 가중치(성능 순위에 따라 7→1 가중치 부여) ③ 최고 가중치(최우수 모델에 약간 높은 가중치 부여). 평가 데이터는 Kaggle(7,023장)와 Figshare(3,064장) 두 공개 MRI 데이터셋이다. Kaggle는 클래스가 균형 잡힌 반면 Figshare는 불균형을 보인다. 개별 모델 성능을 보면, ResNet101와 DenseNet121가 가장 높은 정확도(≈99.6% Kaggle, ≈99.1% Figshare)를 기록했으며, Xception도 99.46%/97.93% 수준으로 우수했다. 전통 모델인 SVM과 KNN도 각각 96% 수준의 정확도를 달성했지만, 딥러닝에 비해 약간 뒤처졌다. 앙상블 결과는 다음과 같다. 동등 가중치 시나리오에서 전체 정확도는 Figshare 99.13%, Kaggle 99.54% 로, 단일 모델보다 약간 향상되었다. 증분 가중치에서는 Figshare 정확도가 98.36% 로 소폭 감소했으며, 이는 불균형 데이터에서 가중치가 과도하게 특정 모델에 편중될 때 발생한다는 점을 보여준다. 최고 가중치 전략에서는 Figshare에서 98.9% 수준, Kaggle에서는 99.55% 수준을 유지했다. 모든 시나리오에서 정밀도·재현율·F1 점수는 0.94 이상이며, 특히 ‘No tumor’ 클래스는 100% 정확도를 기록했다. 핵심 인사이트는 다음과 같다. (1) 원본, 엣지, HOG 등 서로 다른 이미지 표현을 활용하면 각 모델이 서로 보완적인 특징을 학습할 수 있다. (2) 가중치 투표는 개별 모델 성능 차이를 반영해 전체 성능을 끌어올리지만, 데이터 양이 적고 불균형이 심한 경우에는 단순 다수결이 더 안정적일 수 있다. (3) 자동 하이퍼파라미터 탐색(AutoKeras, Optuna)과 정규화(L2, dropout) 적용이 과적합을 효과적으로 억제한다. (4) 엣지 강화 이미지에 특화된 ResNet50은 작은 종양이나 경계가 흐릿한 경우에 유리함을 확인했다. 결론적으로, 본 논문은 다양한 전처리와 모델을 결합한 가중치 앙상블이 뇌종양 MRI 분류에서 기존 단일 모델을 능가하는 성능을 보이며, 실제 임상 적용을 위한 신뢰성 높은 자동 진단 시스템 구축에 기여할 수 있음을 입증한다. 향후 연구에서는 더 많은 병변 종류와 다중 모달리티(예: T2, FLAIR) 데이터를 포함하고, 모델 해석성을 높이기 위한 시각화 기법을 도입해 임상의 신뢰를 더욱 강화할 계획이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기