Riemannian 접공간 매핑과 탄성망 회귀를 이용한 비용 효율적 알츠하이머 뇌 위축 EEG 마커 개발
본 연구는 대규모 전향적 AD EEG 데이터셋을 활용해, 대칭 양정( SPD) 공분산 행렬을 리만 접공간에 매핑하고 탄성망(Elastic Net) 회귀로 뇌 위축(MRI 기반) 지표를 예측하는 새로운 프레임워크를 제시한다. 로그-유클리드와 리만 평균을 이용한 접공간 매핑이 전통적인 유클리드 접근보다 예측 정확도가 높으며, 특히 주파수‑공간 결합 특성을 반영한 스페이시오‑주파수 행렬이 최적 성능을 보였다.
저자: Wolfgang Fruehwirt, Matthias Gerstgrasser, Pengfei Zhang
알츠하이머병(AD)은 전 세계적으로 급증하고 있는 치매의 주요 원인으로, 조기 진단과 진행 모니터링이 임상적·사회적으로 매우 중요하다. 현재 임상에서는 주관적인 평가와 비용이 높은 MRI·PET이 주된 진단 도구이지만, 저비용·비침습적인 바이오마커의 필요성이 대두되고 있다. 정량적 EEG(QEEG)는 뇌 전기활동을 실시간으로 측정할 수 있어 이러한 요구에 부합하지만, 기존 연구는 표본수가 작고 인지검사 점수를 종속변수로 삼아 일반화 가능성이 제한적이었다.
본 논문은 이러한 한계를 극복하고자, 대규모 전향적 AD EEG 데이터셋(총 110명)을 활용해 새로운 분석 파이프라인을 제시한다. 환자들은 4개의 대학병원에서 모집되었으며, 각자 1.5 T 혹은 3 T MRI를 통해 전체 뇌용적(BrainVol)과 해마용적(HippVol)을 추출하였다. EEG는 10‑20 전극 배치로 19채널을 사용했으며, 눈을 감은 휴식 상태(180 s)와 단어쌍 기억 과제(140 s) 두 조건에서 기록되었다.
데이터 전처리 단계에서는 시계열의 정상성을 검증하기 위해 Dickey‑Fuller 검정을 적용하고, 4 s 길이의 세그먼트로 나누어 각 세그먼트를 n × t 행렬로 표현하였다. 두 종류의 의존성 측정법을 사용했는데, (1) 전통적인 표본공분산(SCM)과 (2) 비선형 상관관계인 Kendall rank correlation(KEN)이다. 또한, 주파수 밴드(δ, θ, α, β1)를 각각 필터링한 뒤 수직으로 결합해 4 n × t 형태의 스페이시오‑주파수 행렬을 구성함으로써, 공간적 정보와 주파수적 정보를 동시에 반영한 고차원 특성을 확보하였다.
SPD 행렬은 유클리드 공간에서 평균을 취하면 행렬식이 부풀어 오르는 ‘swelling’ 현상이 발생하므로, 로그‑유클리드 거리와 리만 거리(카르허 평균)를 각각 적용해 보다 자연스러운 평균을 구했다. 로그‑유클리드 평균(M_log)과 리만 평균(M_rie)을 기준점(M_G)으로 삼아, 각 환자별 평균 행렬을 M_G⁻¹⁄²·M·M_G⁻¹⁄² 형태로 정규화하고, 상삼각 부분을 벡터화해 접공간 특징벡터(F_z)를 얻었다. 이 과정은 SPD 행렬을 유클리드 공간으로 투사하면서도 원래의 기하학적 거리 관계를 보존한다.
특징벡터를 이용한 회귀 모델링에는 Elastic Net을 선택했다. Elastic Net은 L1(라소)와 L2(릿지) 페널티를 결합해 변수 선택과 그룹화 효과를 동시에 제공한다. 여기서는 α=0.5로 설정해 두 페널티를 동일하게 가중했고, λ는 10 × 10 이중 교차검증(내부 루프)에서 MSE가 최소가 되는 값을 선택하였다. 외부 루프에서는 동일한 λ를 사용해 최종 모델을 학습하고, 전체 과정을 100번 반복해 평균 성능과 변동 범위를 보고하였다. 연령·성별은 BrainVol 모델에, MRI 장비 자기장 강도는 HippVol 모델에 공변량으로 포함시켜 잠재적 혼란을 보정했다.
성능 평가는 RMSE(루트 평균 제곱 오차)와 통계적 유의성을 기준으로 했다. 결과는 표 1에 요약되어 있는데, 주요 발견은 다음과 같다. (1) 스페이시오‑주파수 행렬을 사용한 로그‑유클리드 접공간 모델(TAN_log SF)이 가장 낮은 RMSE를 기록했으며, 이는 동일 조건의 유클리드 모델보다 통계적으로 유의미하게 우수했다(p < 0.003). (2) Covariance 기반 모델은 정적 휴식 상태에서 전체 뇌용적을 예측할 때 유리했으며, 이는 대각 원소(전극별 전력) 정보가 중요한 역할을 함을 시사한다. (3) Kendall rank correlation 기반 모델은 기억 과제 중 해마 연관 네트워크를 포착해 해마 용적 예측에 더 좋은 성능을 보였다. 이는 비선형 상관관계가 비정상적인 EEG 분포를 더 잘 설명한다는 점과 일치한다. (4) 로그‑유클리드 평균이 리만 평균보다 계산 비용이 낮음에도 불구하고 성능이 더 좋았으며, 이는 실시간 혹은 대규모 스크리닝 환경에서 구현 가능성을 높인다.
논의에서는 첫째, 본 연구가 대규모 전향적 AD EEG 데이터와 MRI 바이오마커를 동시에 활용한 최초 사례임을 강조한다. 둘째, Riemannian 기하학을 이용해 SPD 행렬을 적절히 처리함으로써 기존 Euclidean 기반 방법보다 더 정확한 뇌 위축 추정이 가능함을 입증한다. 셋째, Elastic Net을 통한 변수 선택은 고차원 특성(수천 차원)에서도 과적합을 방지하고, 의미 있는 전극·주파수 조합을 도출한다는 장점이 있다. 마지막으로 제한점으로는 (a) 단일 코호트(오스트리아) 데이터에 국한돼 외부 일반화 검증이 필요하고, (b) EEG 신호의 잡음 및 전극 배치 변동성이 결과에 미치는 영향을 추가적으로 조사해야 하며, (c) 현재는 정량적 MRI 용적 비율만을 목표변수로 삼았으나, 임상적 인지 점수와의 연계 연구가 향후 필요하다고 제언한다.
결론적으로, Riemannian 접공간 매핑과 Elastic Net 회귀를 결합한 프레임워크는 저비용 EEG만으로도 MRI 수준의 뇌 위축 지표를 정밀하게 추정할 수 있음을 보여준다. 이는 대규모 스크리닝, 조기 진단, 그리고 치료 효과 모니터링에 있어 비용 효율적인 대안으로 활용될 가능성을 시사한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기