다중모달 연결망 융합으로 자폐 스펙트럼 장애 자동 분류
본 연구는 기능적 rs‑fMRI와 구조적 sMRI, 그리고 연령·성별·촬영 사이트와 같은 비영상 표현을 결합한 인구 그래프를 구축하고, 비대칭 트랜스포머 기반 교차‑어텐션을 통해 기능적 연결망을 주도적으로 보강함으로써 ABIDE‑I 데이터셋에서 ASD와 정상 대조군을 높은 정확도로 구분한다. 10‑fold 교차검증에서 AUC 87.3%, 정확도 84.4%를 달성했으며, LOSO‑CV에서도 평균 82.0%의 정확도를 기록하였다.
저자: Ansar Rahman, Hassan Shojaee-Mend, Sepideh Hatamikia
본 논문은 자폐 스펙트럼 장애(ASD) 진단을 위한 새로운 다중모달 그래프 학습 프레임워크를 제안한다. 연구 배경으로는 ASD가 기능적 연결성의 이상과 구조적 변화를 동시에 보이며, 단일 모달리티만으로는 병리학적 특징을 충분히 포착하기 어렵다는 점을 들었다. 기존의 딥러닝 기반 ASD 분류 연구는 주로 rs‑fMRI 기반 기능적 연결성에 초점을 맞추었으며, 비영상 변수와 결합하는 경우에도 구조적 MRI(sMRI)를 충분히 활용하지 못했다. 또한, 기존 그래프 기반 접근법은 하나의 모달리티에만 초점을 맞추거나, 다중 모달리티를 단순히 concatenate하는 수준에 머물렀다.
제안된 방법은 세 가지 주요 구성 요소로 이루어진다. 첫째, **인구 그래프 구축** 단계에서 각 피험자를 노드로 하고, rs‑fMRI에서 추출한 기능적 연결 행렬과 sMRI에서 추출한 형태학적 연결 행렬을 각각 노드 특성으로 할당한다. 둘째, **페노타입 기반 엣지 가중치 학습**을 위해 Pairwise Association Encoder(PAE)를 사용한다. PAE는 연령, 성별, 촬영 사이트와 같은 비영상 변수들을 임베딩 공간에 매핑하고, 두 피험자 간의 코사인 유사도를 통해 학습 가능한 엣지 가중치를 생성한다. 이렇게 함으로써 다중 사이트 데이터의 이질성을 완화하고, 비영상 정보가 그래프 구조에 반영되도록 한다. 셋째, **모달리티 별 EV‑GCN**을 적용해 각각의 그래프에서 노드 임베딩을 학습한다. EV‑GCN은 변분적 방식으로 엣지 가중치를 동적으로 조정하며, 기능적·구조적 그래프 각각에 최적화된 표현을 얻는다.
이후 핵심 융합 단계인 **비대칭 트랜스포머 기반 교차‑어텐션**을 도입한다. 기능적 임베딩을 query, 구조적 임베딩을 key와 value로 사용함으로써, 기능적 정보가 주도적인 역할을 유지하면서도 구조적 정보를 상황에 맞게 선택적으로 보강한다. 비대칭 설계는 기능적 연결망이 ASD의 핵심 병리적 마커라는 가정에 기반한다. 융합된 임베딩은 최종적으로 다층 퍼셉트론(MLP) 분류기에 입력되어 ASD와 정상 대조군을 이진 분류한다.
실험은 ABIDE‑I 데이터셋(17개 사이트, 총 871명, ASD 468명, TD 403명)을 사용했으며, 데이터 전처리는 기존 ABIDE 전처리 파이프라인을 그대로 따랐다. rs‑fMRI는 Harvard‑Oxford 111 ROI 기반 Pearson 상관 행렬을, sMRI는 FreeSurfer 기반 AAL 116 ROI 형태학적 연결 행렬을 이용해 각각의 노드 특성을 구성했다. 모델 학습 및 평가에서는 층화된 10‑fold 교차검증과 LOSO‑CV(사이트 별 탈락 검증)를 모두 적용해 일반화 성능을 검증하였다.
성능 결과는 다음과 같다. 10‑fold 교차검증에서 AUC 87.3%, 정확도 84.4%를 달성했으며, 이는 기존 최첨단 그래프 기반 모델보다 약 3%p 향상된 수치이다. LOSO‑CV에서는 평균 정확도 82.0%를 기록했으며, 이는 기존 방법 대비 7%p 상승한 결과이다. 특히, 다중 사이트 간 변동성을 고려한 PAE 기반 엣지 학습과 비대칭 교차‑어텐션이 모델의 견고성을 크게 높인 것으로 분석된다.
논문의 주요 기여는 (1) 기능적·구조적 연결성을 각각 독립적인 인구 그래프로 모델링하고, 페노타입 정보를 통해 학습 가능한 엣지 가중치를 도입한 점, (2) 비대칭 트랜스포머 기반 교차‑어텐션을 통해 기능적 우위를 유지하면서 구조적 정보를 선택적으로 통합한 점, (3) 다중 사이트 ABIDE‑I 데이터에 대한 포괄적인 실험을 통해 기존 방법 대비 실질적인 성능 향상을 입증한 점이다.
한계점으로는 페노타입 변수에 사이트 정보가 포함돼 있어 완전한 사이트 독립성을 보장하기 어렵다는 점, 구조적 연결성을 AAL 기반 형태학적 상관 행렬로 단순화함으로써 미세 구조 정보를 충분히 반영하지 못할 가능성, 그리고 교차‑어텐션이 비대칭이므로 구조적 정보가 기능적 정보를 완전히 보완하지 못할 수 있다는 점을 들 수 있다. 향후 연구에서는 보다 정교한 구조적 특징(예: 확산 MRI 기반 텐서 연결성)과 추가 임상 변수(예: 행동 검사 점수)를 통합하고, 양방향 어텐션을 도입해 두 모달리티 간 상호 보완성을 강화하는 방향을 제시한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기