비선형 가속생존시간 모델을 위한 구조적 비모수 프레임워크

본 논문은 전통적인 선형 가속생존시간(AFT) 모델의 한계를 극복하고자, 콜모고로프‑아놀드(Kolmogorov‑Arnold) 표현을 이용한 구조적 비모수 회귀 함수를 도입한다. 로그생존시간을 비선형 함수 η(z) 로 모델링하고, 다양한 검열 보정 손실(Buckley‑James, IPCW, 변환법)을 통합한 추정 프레임워크를 제시한다. 정규화와 가지치기를 통해 모델 복잡도를 제어하고, 학습된 일변량 함수를 기호적으로 근사함으로써 해석 가능성을 확…

저자: Mebin Jose, Jisha Francis, Sudheesh Kumar Kattumannil

비선형 가속생존시간 모델을 위한 구조적 비모수 프레임워크
본 논문은 가속생존시간(AFT) 모델의 선형 예측자 가정이 복잡한 임상 데이터에서 비현실적일 수 있다는 점을 출발점으로, 콜모고로프‑아놀드(Kolmogorov‑Arnold) 표현을 활용한 구조적 비모수 회귀 프레임워크를 제안한다. 기존 AFT 모델은 로그생존시간을 선형 결합 zᵀβ 와 오차 σϵ 로 표현했으며, 이는 공변량 효과를 단순히 시간 스케일링으로 해석하게 만들었다. 그러나 실제 의료·생물학적 현상에서는 비선형 효과와 변수 간 상호작용이 흔히 나타난다. 이를 해결하기 위해 저자들은 일반화된 AFT 식 log Tᵢ = η(zᵢ) + σϵᵢ 를 도입하고, η(·)를 구조적 비모수 함수 클래스로 제한한다. 구체적으로 η는 일변량 변환 함수들의 합과 합성으로 구성된 콜모고로프‑아놀드 표현을 따르며, 이는 η(z) = ∑ₖ ϕ₁,ₖ,₁(∑ⱼ ϕ₀,ⱼ,ₖ(zⱼ)) 형태로 구현된다. 모델 구현은 KAN(Kolmogorov‑Arnold Network)이라는 신경망 구조를 사용한다. KAN은 전통적인 다층 퍼셉트론(MLP)과 달리, 각 엣지에 배치된 일변량 함수 ϕ 가 B‑스플라인 기반으로 파라미터화된다. 즉, ϕ(x) = w_b b(x) + w_s G + ∑ₘ cₘ Bₘ,𝑑(x) 형태이며, 여기서 b(x) 는 고정 베이스 함수, G 는 그리드, Bₘ,𝑑 는 차수 d 의 스플라인이다. 이러한 설계는 각 공변량에 대한 비선형 변환을 독립적으로 학습하게 하여, 모델이 복잡한 비선형 관계를 포착하면서도 해석 가능한 형태로 결과를 제공한다. 검열된 생존 데이터에 대한 손실 함수는 여러 옵션을 제공한다. 기본적인 제곱오차 L_AFT = (1/n)∑(Yᵢ − KAN(zᵢ))² 는 검열이 없을 때 사용된다. 검열이 존재할 경우, 저자들은 Buckley‑James 대체, IPCW 가중치, 그리고 로그변환 기반 변환 방법을 포함한 검열 보정 손실 L_survival 을 정의한다. 전체 목표 함수는 L_total = L_survival + L_R 이며, L_R 은 구조적 정규화 항으로, L1 혹은 그룹 라소 형태를 취해 불필요한 일변량 변환을 자동으로 제거한다. 최적화는 자동 미분이 가능한 프레임워크에서 Adam 등 gradient‑based 방법으로 수행된다. 시뮬레이션 실험에서는 두 가지 시나리오를 검증한다. 첫 번째는 데이터 생성 과정이 선형 AFT를 따르는 경우로, KAN‑AFT는 정규화와 가지치기를 통해 비선형 변환을 거의 모두 제거하고, 기존 선형 AFT와 동일한 추정 정확도와 C‑index를 달성한다. 두 번째는 비선형 효과가 포함된 경우로, KAN‑AFT는 기존 선형 AFT와 비교해 평균 제곱오차가 크게 감소하고, C‑index가 0.02~0.05 정도 향상된다. 실제 임상 데이터 적용에서는 폐암, 유방암, 간질환, 심부전 네 가지 데이터셋을 사용하였다. 각 데이터셋은 검열 비율이 20%~60% 사이이며, 공변량 차원이 10~50 정도였다. KAN‑AFT는 CoxPH, 전통적 AFT, DeepSurv, DeepHit, DeepAFT와 비교했을 때, 대부분의 경우 예측 정확도(Concordance Index, Integrated Brier Score)에서 동등하거나 우수한 성능을 보였다. 특히, 비선형 관계가 뚜렷한 변수(예: 혈청 마커, 나이와 신장 기능의 상호작용)에서는 KAN‑AFT가 해당 변수들의 일변량 변환 함수를 명시적으로 학습하고, 이를 기호적 근사(예: 다항식, 로그함수)로 표현함으로써 임상의가 직접 해석할 수 있는 형태로 제공한다. 논문의 주요 기여는 다음과 같다. 첫째, AFT 모델에 구조적 비모수 함수를 도입해 선형성 제한을 완화하면서도 시간‑스케일링 해석을 유지한다. 둘째, 콜모고로프‑아놀드 정리를 실용적인 신경망(KAN)으로 구현함으로써 비선형 효과를 일변량 함수들의 합으로 명확히 분리한다. 셋째, 다양한 검열 보정 손실을 통합한 일관된 추정 프레임워크를 제공한다. 넷째, 정규화와 가지치기를 통해 모델 복잡도를 자동으로 조절하고, 학습된 함수들을 기호적으로 근사해 해석 가능성을 확보한다. 마지막으로, 시뮬레이션 및 실제 데이터에서 선형·비선형 양쪽 상황 모두에서 경쟁력 있는 예측 성능과 투명한 변수 효과 해석을 동시에 달성한다는 점에서, 생존 분석 분야의 실용적·이론적 발전에 크게 기여한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기