다기관 연합학습을 활용한 주요 수술 후 합병증 예측 모델

본 연구는 플로리다주 OneFlorida 데이터 트러스트에 포함된 5개 의료기관의 35만 8천명 환자(49만 4천 건 수술) 데이터를 이용해 연합학습(Federated Learning) 모델을 개발·검증하였다. ICU 입원, 기계적 환기, 급성 신손상(AKI), 병원 내 사망이라는 네 가지 주요 수술 후 합병증을 예측했으며, 연합학습 모델은 로컬 모델 및 중앙집중식 모델에 비해 AUROC와 AUPRC 측면에서 동등하거나 우수한 성능을 보였다. …

저자: Yuanfang Ren, Varun Sai Vemuri, Zhenhong Hu

다기관 연합학습을 활용한 주요 수술 후 합병증 예측 모델
본 논문은 미국 플로리다주에 기반을 둔 OneFlorida 데이터 트러스트의 5개 의료기관에서 수집된 대규모 전자건강기록(EHR) 데이터를 활용해 연합학습(Federated Learning, FL) 기반 수술 후 합병증 예측 모델을 개발하고 검증한 연구이다. 연구 배경으로는 연간 4천만 건에 달하는 주요 수술이 시행되는 가운데, 수술 후 합병증 발생률이 20%에 이르고, 고위험 수술에서는 75%까지 상승한다는 점을 들었다. 이러한 위험을 사전에 정확히 예측하는 것이 환자 관리와 의료자원 배분에 핵심적이며, 기존 AI 모델은 단일 기관 데이터에 국한돼 일반화가 제한적이었다. 따라서 다기관 데이터를 활용하면서도 환자 프라이버시를 보호할 수 있는 연합학습의 필요성을 제시한다. 연구 대상은 2012년부터 2023년까지 5개 파트너 기관에 입원한 35만 8천명 성인 환자(총 49만 4천 건 수술)이며, 주요 수술은 CPT 코드와 RVU를 기준으로 정의하였다. 제외 기준은 외래 입원, 18세 미만, 주요 수술 미이행, 말기 신부전 환자 등이다. 각 환자에 대해 99개의 전처리된 전임상 변수(인구통계, 사회경제, 입원 경로, 수술 코드, 동반질환, 약물, 실험실 검사 등)를 수집하고, 이상치 제거·결측값 보완·정규화를 수행하였다. 예측 대상은 네 가지 주요 수술 후 합병증으로, (1) ICU 입원, (2) 기계적 환기(MV), (3) 급성 신손상(AKI), (4) 병원 내 사망이다. 이들 결과는 수술 시작 시점부터 퇴원 시점까지의 기간 동안 발생 여부를 코드 기반으로 추출하였다. 모델 개발은 세 가지 학습 패러다임으로 진행되었다. 첫째, 로컬 학습은 각 기관별로 독립적으로 모델을 학습해 일반화 한계가 존재한다. 둘째, 중앙집중식 학습은 모든 기관 데이터를 하나의 서버에 모아 학습하지만 개인정보 유출 위험이 있다. 셋째, 연합학습은 각 기관에서 로컬 모델을 학습하고, 모델 파라미터만을 중앙 서버에서 평균화·조정해 전체 모델을 업데이트한다. 연합학습에서는 FedAvg, FedProx, SCAFFOLD 세 가지 알고리즘을 적용했으며, 특히 SCAFFOLD는 비IID 데이터 환경에서의 수렴성을 개선한다. 또한, XGBoost 기반 연합학습(Federated XGBoost) 모델도 별도로 구축해 딥러닝 모델과 비교하였다. 모델 아키텍처는 연속·이진 변수에 대해 완전 연결층, 고차원 범주형 변수에 대해 임베딩 층을 사용한 다중 신경망 구조이며, 세 서브네트워크의 잠재 표현을 결합해 네 개의 출력 브랜치를 통해 각 결과를 동시에 예측한다. 학습 과정에서 파트너 3·4·6을 개발·내부 검증용으로, 파트너 1·2를 외부 검증용으로 할당하였다. 데이터는 시간 순서대로 60% 훈련, 10% 검증, 30% 테스트로 분할했으며, 동일 환자는 같은 코호트에만 포함되도록 하였다. 성능 평가는 주로 AUROC와 AUPRC를 사용했으며, 부트스트랩(1 000회)으로 95% 신뢰구간을 산출하였다. 결과적으로 연합학습 모델은 모든 네 가지 결과에 대해 AUROC 0.78~0.86, AUPRC 0.12~0.45를 기록했으며, 이는 로컬 모델보다 일관되게 우수하거나 동등한 수준이었다. 중앙집중식 모델과 비교했을 때도 차이가 미미했으며, 특히 외부 검증에서 각 기관별 최우수 로컬 모델 대비 AUROC 차이가 0.01~0.03에 불과해 일반화 능력이 뛰어남을 확인했다. 민감도 분석에서는 외과 의사 식별자를 개인화 피처로 추가해 파인튜닝한 하이브리드 모델을 실험했으며, 소폭의 성능 향상이 있었지만 개인정보 보호 측면에서 추가 검토가 필요함을 지적했다. 통계적으로 파트너 간 인구통계·결과 분포에 유의한 차이가 있었음에도 연합학습이 이러한 이질성을 효과적으로 보정한다는 점이 강조된다. 결론적으로, 본 연구는 대규모 다기관 EHR 데이터를 활용한 연합학습이 수술 후 합병증 예측에 있어 높은 정확도와 일반화 능력을 제공하면서도 환자 데이터의 프라이버시를 보호한다는 실증적 근거를 제시한다. 향후 임상 현장에 적용하기 위해서는 실시간 추론을 위한 인프라 구축, 모델 업데이트 주기 관리, 그리고 HIPAA 등 관련 법규에 부합하는 데이터 거버넌스 체계가 필요하다. 이러한 조건이 충족된다면 연합학습 기반 예측 모델은 수술 전 위험 평가와 맞춤형 치료 계획 수립에 중요한 의사결정 지원 도구로 활용될 수 있을 것이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기