검열된 밀도와 위험률 추정을 위한 SiZer

** 본 논문은 비모수 위험률 및 검열된 밀도·위험률 추정에 SiZer(Scale‑Space Significance) 방법을 확장한다. 기존 SiZer는 커널 스무딩과 시각적 통계 추론을 결합해 곡선의 증가·감소 구간을 동시에 검정했지만, 검열 데이터에 그대로 적용하면 가중치가 반영되지 않아 잘못된 결론이 나온다. 저자들은 Kaplan‑Meier 가중치를 이용한 새로운 분산 추정식과 유효 표본 크기(Eff‑Sample‑Size) 정의를 도입…

저자: Jiancheng Jiang, J. S. Marron

검열된 밀도와 위험률 추정을 위한 SiZer
** 본 논문은 비모수적인 위험률 추정과 검열된 밀도·위험률 추정에 SiZer(Scale‑Space Significance) 방법을 확장함으로써, 데이터의 구조적 변화를 시각적으로 탐색하고 통계적 유의성을 동시에 판단할 수 있는 새로운 분석 도구를 제시한다. 1. **연구 배경 및 필요성** - 위험률(λ(x))은 생존 분석에서 사건 발생률을 나타내는 핵심 함수이며, 그 증가·감소 구간을 파악하는 것이 임상·공학 분야에서 중요한 과제이다. - 기존 비검열 커널 추정법은 대역폭 선택에 따라 결과가 크게 달라지며, 어느 구간이 실제로 유의한 변화를 보이는지 판단하기 어렵다. - SiZer는 여러 대역폭에서 커널 추정량의 1차 도함수(sign of slope)를 검정해 “동시 추론(simultaneous inference)”을 제공하지만, 검열 데이터에 그대로 적용하면 가중치가 반영되지 않아 잘못된 결론이 도출된다. 2. **SiZer의 기본 아이디어** - 커널 스무딩을 다양한 대역폭 h에 대해 수행하고, 각 x에서 추정된 도함수 b̂′_h(x)의 부호가 0인지 검정한다. - 검정 통계량은 (b̂′_h(x))/sd(b̂′_h(x)) 로 계산되며, 유의수준에 따라 빨강(유의한 감소), 파랑(유의한 증가), 회색(불확실)으로 색칠한다. - 다중 비교 문제는 “독립 블록 수” 즉, 커널이 포함하는 관측치 수를 기반으로 자유도를 조정함으로써 해결한다. 3. **검열 데이터에 대한 확장** - 검열 데이터는 (X_i, δ_i) 형태이며, X_i = min(T_i, C_i), δ_i = 1(T_i ≤ C_i) 로 정의된다. 여기서 T_i는 실제 사건 시간, C_i는 검열 시간이다. - Kaplan‑Meier 추정량 F_n(x)와 G_n(x) (검열 시간의 생존함수)를 이용해 가중치를 부여한다. - 밀도 추정식은 b̂_f,h(x) = (1/n) Σ δ_i K_h(x−X_i) / G_n(X_i) 로, 위험률 추정식은 b̂_λ,h(x) = (1/n) Σ δ_i K_h(x−X_i) /

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기