베이지안 성향점수 보강 잠재 요인 모델을 이용한 시계열 횡단면 데이터 인과추론

본 논문은 시계열 횡단면(패널) 데이터에서 인과 효과를 추정하기 위해, 치료 할당 메커니즘과 결과 모델을 동시에 베이지안 프레임워크 안에 통합한 새로운 방법론인 베이지안 성향점수 보강 잠재 요인 모델(PS‑LFM)을 제안한다. 기존의 패널 인과추론 방법은 주로 관측 가능한 사전 공변량 Z_i에만 의존해 조건부 무작위성(conditional ignorability)을 가정하거나, 두 단계 추정(예: DID + 회귀) 방식을 사용한다. 그러나 이러한 접근은 시간에 불변하는 잠재적 단위 효과(γ_i)와 같은 미관측 교란을 충분히 통제하지 못한다. 저자는 이러한 한계를 극복하기 위해 다음과 같은 구조를 설계한다. 1. **모델 설정** - **데이터 구조**: N개의 단위가 T시점에 걸쳐 관측되는 패널이며, 각 단위‑시점(i,t)에서 이진 치료 D_it와 연속형 결과 Y_it를 관측한다. 치료는 ‘staggered adoption’ 형태로, 각 단위는 한 번만 치료를 받으며, 채택 시점 A_i가 존재한다. - **잠재 무시 가능성 가정**: {Y_it(0),Y_it(1)} ⟂⟂ W_i | Z_i,γ_i 로 정의되며, 여기서 W_i는 치료 여부(채택 여부)이다. γ_i는 시간에 불변하는 잠재 요인으로, 치료 할당과 결과 모두에 영향을 미친다. - **치료 할당 모델**: Pr(W_i=1 | Z_i,γ_i) = ψ(α_0 + α_Z' Z_i + α_γ' γ_i) 형태의 로짓(또는 probit) 모델을 사용한다. 이는 전통적인 성향점수 정의와 동일하지만, γ_i를 포함함으로써 잠재 교란을 반영한다. - **결과 모델**: Y_it = δ_it D_it + Z_i' α_t + γ_i' f_t + ε_it 로, 여기서 f_t는 시간‑공통 요인, γ_i는 단위‑특정 로딩이다. δ_it는 이질적인 치료 효과이며, ε_it는 평균 0의 오차이다. 성향점수는 층화(stratification) 혹은 가중치 형태로 결과 모델에 삽입된다(예: 각 성향점수 구간별 별도 회귀). 2. **베이지안 추정 및 모델 피드백 문제** - 베이지안 프레임워크에서는 치료 할당 모델과 결과 모델을 동시에 추정하면, 결과 모델이 성향점수 추정에 역으로 영향을 미쳐 ‘모델 피드백’이 발생한다. 이는 추정 편향을 야기할 위험이 있다. - 이를 해결하기 위해 저자는 Zigler 등(2013, 2014)의 근사 베이지안 접근을 채택한다. 구체적으로, (i) 치료 할당 모델을 별도로 MCMC로 추정하고, (ii) 그 사후 평균을 고정한 뒤 결과 모델을 조건부로 추정한다. 이렇게 하면 두 단계 사이의 정보 흐름이 일방향으로 제한돼 피드백이 억제된다. - 잠재 요인 γ_i와 공통 요인 f_t는 베이지안 팩터 분석을 이용해 사후 분포를 얻으며, 사전은 일반적인 정규‑역와이시안 형태를 사용한다. 모델 차원 r(잠재 요인 수)은 사후 예측오차 혹은 정보 기준(예: WAIC)으로 선택한다. 3. **식별 및 추정량** - ATT와 동적 ATT_r(채택 후 r시점 효과)를 주요 추정량으로 정의한다. 식별은 (a) 잠재 무시 가능성, (b) 양측성(positivity) 0

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기