재발 이진 결과를 위한 잠재 모멘트 모델 베이지안·준분포 접근

본 논문은 반복 이진 결과(예: 병원 재입원, 치료 재발)를 분석하기 위해 기존 평균‑중심 접근법의 한계를 극복하고자, 잠재 위험을 연속적인 잠재 변수로 보고 그 변수의 네 가지 “잠재 모멘트”(위치 μ, 규모 σ, 왜도 ν, 첨도 τ)를 시간에 따라 동적으로 추정하는 두 가지 모델링 프레임워크를 제안한다. 첫 번째 모델인 BLaS‑Recurrent는 베이지안 접근법으로, sinh‑arcsinh(SAS) 분포를 잠재 변수의 분포로 채택한다. SAS는 네 파라미터가 각각 위치·스케일·비대칭·꼬리 두께를 직접 제어할 수 있는 4‑parameter 가족이며, ν=0, τ=0이면 정규분포로 회귀한다. 각 모멘트는 고유의 선형 예측식 η_m = X_mβ_m + b_{im} + a_{im,t} 로 표현되며, 스케일·첨도는 로그링크, 위치·왜도는 아이덴티티 링크를 사용한다. 주제별 랜덤 인터셉트와 AR(1) 자기상관을 포함해 시간‑변화 공변량을 반영한다. 베이지안 추정은 Stan의 Hamiltonian Monte Carlo을 이용해 전체 사후분포를 얻으며, 회귀계수에 정규 사전, 랜덤 효과 분산에 Half‑Cauchy 사전을 부여해 적절한 정규화와 수축을 제공한다. 모델 적합도는 사후예측 검증, QQ‑플롯, 그리고 SAS 기반 예측과 QuaD‑Recurrent 예측 간 비교를 통해 평가한다. 두 번째 모델인 QuaD‑Recurrent는 파라미터화된 잠재 분포를 가정하지 않는다. 대신 (μ,σ,ν,τ) 조합을 광범위하게 격자화하고, 각 조합에 대해 SAS 분포를 이용해 Z>0 확률을 시뮬레이션한다. 이렇게 얻은 확률값을 펜얼티드 스플라인이나 가우시안 프로세스로 부드럽게 보간해 연속적인 매핑 표면 f̂(μ,σ,ν,τ) 을 만든다. 이 표면을 의사‑우도에 삽입해 베이지안 샘플링을 수행함으로써, 잠재 분포 형태에 대한 강건성을 확보한다. 비록 정규화된 우도는 아니지만, 시뮬레이션 기반 매핑은 실제 데이터가 SAS와 다르게 분포하더라도 정확한 사건 확률을 제공한다는 장점이 있다. 두 모델 모두 다중소속(random‑membership) 효과를 포함한다. 환자가 여러 병동·의료기관에 동시에 노출될 경우, 각 소속에 대한 가중치 w_{ig} 를 이용해 랜덤 효과를 가중합함으로써 복합적인 위험 궤적을 모델링한다. 이는 의료 데이터에서 흔히 나타나는 교차‑클러스터링 구조를 자연스럽게 반영한다. 시뮬레이션에서는 시간에 따라 왜도와 첨도가 증가하는 시나리오와, 공변량에 따라 스케일이 변동하는 시나리오를 설정했다. 결과적으로 BLaS‑Recurrent와 QuaD‑Recurrent는 평균‑중심 GLMM·GEE에 비해 Brier 점수, 로그우도, 캘리브레이션 플롯에서 현저히 우수했으며, 특히 위험 분포가 비대칭·중심에서 벗어날 때 정확한 예측을 제공했다. 실제 데이터 적용에서는 MIMIC‑IV 데이터베이스의 ICU 재입원 사건을 분석했다. 시간에 따라 위험 분포가 오른쪽으로 치우치고 분산이 확대되는 패턴이 관찰되었으며, 이는 환자 상태 악화와 치료 효과 감소를 반영한다. 또한, 다중소속 효과 분석을 통해 특정 병동에 오래 머무를수록 위험 분포의 꼬리가 무거워지는 현상이 확인되었다. 이러한 결과는 기존 GLMM·GEE에서는 전혀 드러나지 않았으며, 임상 의사결정—예를 들어 고위험 환자 조기 식별 및 맞춤형 치료 계획 수립—에 직접적인 정보를 제공한다. 논문은 또한 “잠재 모멘트”를 통계적 파라미터와 동일시함으로써, 모멘트 자체가 분포를 완전히 규정하지 못한다는 수학적 사실을 인정하면서도 실용적인 모델링 프레임워크를 구축했다는 점에서 학술적 기여가 크다. 베이지안과 준분포 접근법을 병행함으로써 파라미터 지정 오류에 대한 로버스트성을 확보하고, 복잡한 데이터 구조(시간‑변화 공변량, 자기상관, 다중소속)를 포괄적으로 다룰 수 있다.

재발 이진 결과를 위한 잠재 모멘트 모델 베이지안·준분포 접근

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기