생존 모델 해석을 위한 기능 분해와 샤플리 상호작용

본 논문은 생존 분석 모델의 비가법성 문제를 해결하기 위해 Survival Functional Decomposition(SurvFD)이라는 이론적 프레임워크를 제시하고, 이를 기반으로 시간‑인덱스된 샤플리 상호작용 지표인 SurvSHAP‑IQ를 개발한다. SurvFD는 위험·생존 함수의 예측을 시간‑의존적·시간‑비의존적 효과로 명확히 분리하고, SurvSHAP‑IQ는 이러한 효과를 실험적으로 추정·시각화한다. 시뮬레이션과 실제 암 데이터에 대한…

저자: Marvin N. Wright (Leibniz Institute for Prevention Research, Epidemiology – BIPS) 외 다수 공동 저자 (University of Bremen, University of Warsaw

생존 모델 해석을 위한 기능 분해와 샤플리 상호작용
본 연구는 생존 분석 모델에서 흔히 사용되는 위험 함수 h(t|x) 와 생존 함수 S(t|x) 가 비가법적 특성을 가지고 있어 기존의 가법적 설명 기법(예: SHAP, LIME)으로는 충분히 해석하기 어렵다는 문제점을 출발점으로 삼는다. 이를 해결하기 위해 두 가지 주요 기여를 제시한다. 첫 번째는 **Survival Functional Decomposition (SurvFD)** 라는 이론적 프레임워크이며, 두 번째는 **SurvSHAP‑IQ** 라는 실용적인 추정·시각화 도구이다. SurvFD는 함수 분해(FD)의 개념을 시간‑인덱스된 예측 함수 F(t|x) 에 적용한다. 일반적인 FD는 F(x)=f∅+∑_{M⊆P}f_M(x) 와 같이 순수 효과 f_M 를 정의하지만, SurvFD는 이를 F(t|x)=f∅(t)+∑_{M∈I⋆_d}f_M(t|x)+∑_{M∈I⋆_id}f_M(x) 로 확장한다. 여기서 I⋆_d 와 I⋆_id 는 각각 시간‑의존적·시간‑비의존적 효과를 포함하는 부분집합들의 집합이다. 논문은 먼저 독립적인 특성 가정 하에 로그‑위험 함수 log h(t|x) 에 대해 SurvFD가 실제 모델이 내포한 I_d 와 I_id 를 정확히 복원한다는 정리(Thm 3.2)를 증명한다. 그러나 일반적인 비선형 변환(예: exp 함수)을 적용하면 시간‑의존적 효과가 하위·상위 부분집합으로 전파되는 현상이 발생한다. 이는 ‘downward propagation’(시간‑의존적 효과가 하위 집합에 나타남)과 ‘upward propagation’(시간‑비의존적 효과가 상위 집합에 나타남)으로 구분되며, Thm 3.3와 Cor 3.4에서 구체적으로 기술된다. 특히 Cox 비례위험 모델조차도 위험·생존 함수로 변환될 경우 인위적인 2차 이상 상호작용이 생성된다는 Proposition 3.5를 통해, 위험·생존 함수 자체가 복합적인 상호작용을 내포하고 있음을 강조한다. 두 번째 기여인 SurvSHAP‑IQ는 샤플리 상호작용 값을 시간‑인덱스 함수 형태로 확장한다. 기존 SHAP는 ϕ_j(t) 와 같이 개별 특성 기여도만을 제공했지만, SurvSHAP‑IQ는 ϕ_{i,j}(t) 와 같은 2차, 혹은 고차 상호작용을 정의한다. 이를 위해 값 함수 v(t|M)=E

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기