생존 모델 해석을 위한 기능 분해와 샤플리 상호작용

본 연구는 생존 분석 모델에서 흔히 사용되는 위험 함수 h(t|x) 와 생존 함수 S(t|x) 가 비가법적 특성을 가지고 있어 기존의 가법적 설명 기법(예: SHAP, LIME)으로는 충분히 해석하기 어렵다는 문제점을 출발점으로 삼는다. 이를 해결하기 위해 두 가지 주요 기여를 제시한다. 첫 번째는 **Survival Functional Decomposition (SurvFD)** 라는 이론적 프레임워크이며, 두 번째는 **SurvSHAP‑IQ** 라는 실용적인 추정·시각화 도구이다. SurvFD는 함수 분해(FD)의 개념을 시간‑인덱스된 예측 함수 F(t|x) 에 적용한다. 일반적인 FD는 F(x)=f∅+∑_{M⊆P}f_M(x) 와 같이 순수 효과 f_M 를 정의하지만, SurvFD는 이를 F(t|x)=f∅(t)+∑_{M∈I⋆_d}f_M(t|x)+∑_{M∈I⋆_id}f_M(x) 로 확장한다. 여기서 I⋆_d 와 I⋆_id 는 각각 시간‑의존적·시간‑비의존적 효과를 포함하는 부분집합들의 집합이다. 논문은 먼저 독립적인 특성 가정 하에 로그‑위험 함수 log h(t|x) 에 대해 SurvFD가 실제 모델이 내포한 I_d 와 I_id 를 정확히 복원한다는 정리(Thm 3.2)를 증명한다. 그러나 일반적인 비선형 변환(예: exp 함수)을 적용하면 시간‑의존적 효과가 하위·상위 부분집합으로 전파되는 현상이 발생한다. 이는 ‘downward propagation’(시간‑의존적 효과가 하위 집합에 나타남)과 ‘upward propagation’(시간‑비의존적 효과가 상위 집합에 나타남)으로 구분되며, Thm 3.3와 Cor 3.4에서 구체적으로 기술된다. 특히 Cox 비례위험 모델조차도 위험·생존 함수로 변환될 경우 인위적인 2차 이상 상호작용이 생성된다는 Proposition 3.5를 통해, 위험·생존 함수 자체가 복합적인 상호작용을 내포하고 있음을 강조한다. 두 번째 기여인 SurvSHAP‑IQ는 샤플리 상호작용 값을 시간‑인덱스 함수 형태로 확장한다. 기존 SHAP는 ϕ_j(t) 와 같이 개별 특성 기여도만을 제공했지만, SurvSHAP‑IQ는 ϕ_{i,j}(t) 와 같은 2차, 혹은 고차 상호작용을 정의한다. 이를 위해 값 함수 v(t|M)=E

생존 모델 해석을 위한 기능 분해와 샤플리 상호작용

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기