방문 및 관찰 과정의 정보성을 고려한 전자건강기록 장기 데이터 공동 모델링
본 논문은 전자건강기록(EHR)에서 관찰 시점과 바이오마커 측정이 환자 건강 상태에 의해 비정형적으로 발생하는 두 단계의 누락 메커니즘(Informative Presence, Informative Observation)을 동시에 고려한 반파라메트릭 공동 모델링 프레임워크인 GIVEHR을 제안한다. 공유된 가우시안 잠재변수를 통해 방문 강도, 관찰 여부, 그리고 장기 결과 사이의 상관관계를 포착하고, 3단계 추정 절차와 이론적 일관성·정규성을 입…
저자: Cheng-Han Yang, Xu Shi, Bhramar Mukherjee
본 논문은 전자건강기록(EHR) 데이터에서 장기적인 바이오마커 추적을 수행할 때 발생하는 두 단계의 누락 메커니즘, 즉 ‘Informative Presence(IP)’와 ‘Informative Observation(IO)’를 동시에 고려한 새로운 통계 모델링 프레임워크를 제시한다. IP는 환자의 건강 상태가 병원 방문 빈도에 직접적인 영향을 미쳐, 고위험군이 더 자주 방문하거나 반대로 저소득·저접근성 환자는 방문 기회를 놓치는 현상을 의미한다. IO는 실제 방문이 이루어졌더라도 특정 바이오마커가 측정되는 여부가 임상의 판단, 증상 강도, 이전 검사 결과 등 관측되지 않은 요인에 의해 결정되는 상황을 말한다. 두 메커니즘 모두 관측되지 않은 잠재 요인과 연관되어 있어, 기존 연구에서 흔히 가정하는 MAR(관측가능한 변수에 조건부로 무작위) 가정을 위배한다.
이를 해결하기 위해 저자들은 ‘GIVEHR(Gaussian Informative Visiting and observation processes in Electronic Health Records)’이라는 반파라메트릭 공동 모델을 개발하였다. 핵심 아이디어는 환자별 단일 가우시안 잠재변수 Uᵢ∼N(0,1)를 도입해 방문 강도, 관찰 여부, 그리고 장기 바이오마커 결과를 모두 연결하는 것이다.
1. **방문 프로세스**: 방문 카운팅 프로세스 Nᵢ(t) 를 강도 모델로 표현한다. 조건부 기대값은 E
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기