뇌전도 서술 혁신: NeuroNarrator로 EEG‑텍스트 변환의 새 지평

NeuroNarrator는 16개 데이터셋을 통합한 160 K EEG 세그먼트와 임상‑정밀 텍스트를 매핑한 NeuroCorpus‑160K를 기반으로, 스펙트로‑공간 대조 학습과 상태공간 기반 LLM 결합으로 짧은 EEG 구간을 임상의가 바로 활용할 수 있는 서술형 보고서로 자동 생성한다.

저자: Guoan Wang, Shihao Yang, Jun-en Ding

뇌전도 서술 혁신: NeuroNarrator로 EEG‑텍스트 변환의 새 지평
본 연구는 임상 현장에서 EEG 데이터를 해석하고 보고하는 과정이 고도의 전문지식과 시간 소모를 요구한다는 점에 착안하여, 전기뇌파(EEG) 구간을 자동으로 임상용 서술 텍스트로 변환하는 ‘NeuroNarrator’라는 일반화된 foundation model을 제안한다. 1) 데이터 구축 – NeuroCorpus‑160K 저자들은 16개의 공개 EEG 데이터셋을 통합해 총 483 시간, 160 249개의 10 초 세그먼트를 수집하였다. 각 세그먼트는 (i) 사건·임상 라벨, (ii) 주파수 영역 특징(파워 스펙트럼 밀도 기반 5대 밴드), (iii) 공간 에너지 분포(전극별 파워)라는 세 가지 정량적 템플릿을 자동 생성한 뒤, 대형 언어 모델을 활용해 인간 전문가 수준의 서술문으로 정제한다. 데이터는 피험자 단위로 학습/평가를 분리해 ‘subject‑disjoint’ 방식의 벤치마크를 제공한다. 2) 스펙트로‑공간 대조 정렬 EEG 파형은 시계열 인코더(Transformer 기반)로, 동일 구간의 스칼프 토포그래픽 맵은 비전 인코더(ViT)로 변환한다. 두 인코더의 출력은 각각 선형 투사 후 동일 차원의 잠재공간에 매핑되며, 대조 학습(InfoNCE)으로 같은 시간 구간의 파형·맵을 가깝게, 다른 구간을 멀게 배치한다. 이 과정은 스펙트럼 동역학과 공간 토포그래피 사이의 일대일 대응을 강제해, “alpha activity in posterior region”과 같은 임상 의미를 내재화한다. 3) 상태공간 기반 MLLM 설계 대형 언어 모델(Llama‑2 등)의 입력 프롬프트에 ‘소프트 프롬프트’ 토큰을 삽입한다. 토큰은 (a) 현재 세그먼트의 스펙트로‑공간 임베딩, (b) 직전 N개의 임베딩(시간적 히스토리)으로 구성되며, 이는 뇌 상태가 시간에 따라 어떻게 변하는지를 모델이 추론하도록 돕는다. LLM은 이러한 연속적 임베딩을 조건으로 받아, “10초 동안 오른쪽 전두측에서 급격히 증가한 뾰족 파형이 관찰되며, 이는 3 Hz 스파이크‑슬로우 웨이브 복합체와 일치한다”와 같은 상세하고 일관된 서술을 생성한다. 4) 실험 및 평가 다양한 다운스트림 과제(발작 검출, 수면 단계 구분, 운동 상상 분류 등)와 제로샷 전이 시나리오에서 모델을 평가하였다. 텍스트 품질 평가지표(BLEU, ROUGE)와 임상 전문가 평점(정확성, 가독성) 모두 기존 EEG‑CLIP, NeuroLex, NeuroLM 대비 유의미하게 향상되었다. 특히, 스펙트로‑공간 정합성(대조 정확도)과 시간 연속성(상태공간 일관성)에서 높은 점수를 받아, 모델이 전형적인 “전역적” 텍스트가 아니라, 전극·주파수·시간 정보를 모두 반영한 ‘임상 친화적’ 서술을 만든다는 것을 입증했다. 5) 의의 및 향후 과제 NeuroNarrator는 (1) 대규모 임상‑정밀 EEG‑텍스트 쌍 데이터셋 제공, (2) 스펙트로‑공간 대조 정렬을 통한 의미론적 grounding, (3) 상태공간 기반 LLM 조건화로 연속적 뇌 상태를 언어화하는 세 가지 혁신을 통해 EEG 기반 임상 보고 자동화의 새로운 패러다임을 제시한다. 향후 연구에서는 (a) 실시간 스트리밍 적용, (b) 다중 모달(영상·생리) 연계, (c) 다양한 언어·문화권에 대한 로컬라이제이션 등을 통해 실제 병원 워크플로에 통합하는 방안을 모색할 수 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기