딥러닝 기반 자동 종양 형태 분석으로 저등급 교모세포종 유전체 아형 예측
본 연구는 딥러닝 기반 U‑Net 모델을 이용해 저등급 교모세포종(LGG)의 MRI 영상을 자동으로 분할하고, 3가지 형태학적 지표(각도 표준편차, 경계 타원 부피비, 마진 변동)를 추출한다. 110명의 환자(5개 기관)에서 추출된 지표와 6가지 유전체 클러스터(IDH/1p19q, RNASeq, DNA 메틸화, 복제수, miRNA, 클러스터‑오브‑클러스터)를 Fisher 정확 검정으로 연관성을 탐색했으며, Bonferroni 보정 후 p<0.0…
저자: Mateusz Buda, Ashirbani Saha, Maciej A Mazurowski
본 논문은 저등급 교모세포종(LGG)의 방사선유전체학 연구에 딥러닝 기반 자동 종양 분할과 형태학적 특징 추출을 적용하여, 이들 특징이 기존에 정의된 유전체 아형과 통계적으로 연관되는지를 검증한다. 연구는 총 110명의 환자를 대상으로 진행되었으며, 이들은 TCGA와 TCIA에서 확보한 MRI(FLAIR 중심)와 6가지 유전체 클러스터(IDH/1p19q, RNASeq, DNA 메틸화, 복제수, miRNA, 클러스터‑오브‑클러스터) 데이터를 보유하고 있다. 환자들은 5개 기관에서 모집되었고, 데이터는 22개의 교차검증 폴드(각 5명)로 나누어 모델 학습·평가에 활용되었다.
**자동 분할 파이프라인**
전처리 단계에서는 이미지 스케일링, 스컬 스트리핑, 히스토그램 기반 윈도우 조정, Z‑score 정규화를 수행해 서로 다른 스캔 간 강도 차이를 최소화하였다. 분할 모델은 2D U‑Net 구조를 채택했으며, 입력 채널은 전·후 조영제와 FLAIR을 포함한 3채널 혹은 FLAIR만 사용할 경우 인접 슬라이스를 보조 채널로 사용했다. 종양이 차지하는 픽셀 비율이 매우 낮아 오버샘플링 전략을 적용했으며, 각 종양 슬라이스를 3번 복제하고 회전·스케일 변형을 가해 데이터 다양성을 확보했다. 학습 후에는 3D 연결성 분석을 통해 가장 큰 연결 컴포넌트만을 남겨 false positive를 제거하는 후처리를 수행했다. 교차검증 결과 평균 Dice 계수는 0.82(±0.04)로 인간 전문가 수준에 근접했다.
**형태학적 특징 정의**
분할된 종양에 대해 세 가지 2D·3D 형태학적 지표를 계산했다.
1. **각도 표준편차(ASD)**: 종양 중심에서 10개의 등각 구간으로 방사 거리를 측정하고, 각 구간의 표준편차를 평균한 값. 방사 거리들을 평균 1로 정규화해 크기 의존성을 배제한다.
2. **경계 타원 부피비(BEVR)**: 종양 부피와 최소 경계 타원의 부피 비율. 값이 클수록 종양이 구형에 가깝고, 작을수록 불규칙성을 나타낸다.
3. **마진 변동(MF)**: 종양 경계 거리 시계열에 10% 길이의 평균 필터를 적용한 전후 차이의 표준편차. 고주파 변동성을 반영해 경계의 거칠기를 정량화한다.
**통계 분석 및 주요 결과**
연구 가설은 자동 추출된 형태학적 특징이 유전체 아형을 예측할 수 있다는 것이었다. 이를 검증하기 위해 각 연속형 특징을 사분위수(1‑4)로 이산화하고, Fisher 정확 검정을 적용했다. 총 10개의 가설(ASD·BEVR·MF와 6가지 유전체 클러스터 중 사전 연구에서 의미가 있었던 조합) 에 대해 검정을 수행했으며, 다중 검정 보정을 위해 Bonferroni 방법을 적용, 유의 수준을 0.005(p=0.05/10)로 설정했다.
결과적으로 가장 강력한 연관은 **RNASeq 클러스터와 BEVR** 사이에서 나타났으며(p<0.0002), **RNASeq 클러스터와 MF** 사이에서도 유의미한 연관이 관찰되었다(p<0.005). 추가적으로 BEVR는 모든 유전체 서브타입과 p<0.02 수준의 연관을 보였고, ASD는 RNASeq 클러스터와 p<0.02 수준의 연관을 나타냈다. 이러한 결과는 자동화된 형태학적 지표가 특정 유전체 아형을 구별하는 데 실질적인 정보를 제공함을 시사한다.
**한계 및 향후 방향**
연구는 110명이라는 비교적 제한된 샘플 크기와 TCGA 데이터에 국한된 점이 주요 한계로 지적된다. 또한 2D U‑Net 기반 분할이 3D 연속성을 완전히 보존하지 못한다는 점에서 보다 정교한 3D 딥러닝 모델의 도입이 필요하다. 향후 연구에서는 다기관·다국가 데이터셋 확대, 다양한 MRI 모달리티(예: T1‑post, DWI)와의 융합, 그리고 더 많은 형태학적·텍스처적 특징을 포함한 멀티모달 모델을 개발해 예측 정확도를 향상시키고, 임상 현장에서 실시간으로 유전체 정보를 추정할 수 있는 시스템을 구축하는 것이 목표이다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기