쌍 매칭의 필수적 역할에 대한 논평

Hill과 Scott은 Imai, King, Nall(IKN)이 발표한 “쌍 매칭이 가능한 경우 반드시 사용하라”는 주장에 대해 긍정적인 입장을 유지하면서도, 그들의 디자인 기반 추정법이 실제 데이터 분석에서 갖는 한계를 지적한다. IKN은 설계 단계에서 쌍 매칭을 강조하고, 간단한 차이‑평균 추정량과 상한 분산 추정량을 제시한다. 그러나 이러한 방법은 매칭이 완벽하지 않거나, 처리 효과가 군‑쌍별로 이질적일 때, 혹은 군 수준 공변량이나 결측치가 존재할 때 유연하게 대응하기 어렵다. 이에 저자들은 두 가지 기본 다층모형을 제시한다. 첫 번째 모델(식 1)은 고정된 처리 효과 τ와 군‑쌍별 절편 α_k를 포함한다. α_k는 정규분포 N(α_0,σ^2_α)를 따르며, 오차 ε_ijk는 N(0,σ^2_ε)이다. 두 번째 모델(식 2)은 τ_k를 군‑쌍별 랜덤 효과로 확장한다. τ_k∼N(τ_0,σ^2_τ)이며, α_k와 τ_k 사이에 공분산 σ_{ατ}를 허용한다. 이렇게 하면 쌍 간 처리 효과 이질성을 통계적으로 검정할 수 있다. 또한, 공변량 X_jk를 절편에 포함하는 식 3을 통해 사전 변수 조정이 가능하도록 설계하였다. 시뮬레이션은 30쌍, 평균 군 크기 50인 설정에서 (i) 군 크기 매칭 여부, (ii) 잠재적 평균 결과(SATE) 매칭 여부, (iii) 처리 효과 고정·변동 여부를 조합한 8가지 시나리오를 100번씩 반복한다. 매칭 품질을 나타내는 파라미터 π가 0이면 완벽한 매칭, π가 커질수록 매칭이 불완전해진다. 결과는 다음과 같다. 1. 처리 효과가 고정된 경우(π=0)에는 MLM1과 MLM2 모두 동일한 정밀도를 보였지만, π가 증가하면서 MLM1의 표준오차가 급격히 커졌다. 반면 MLM2는 변동 효과를 모델에 포함함으로써 보다 안정적인 추정치를 제공한다. 2. 처리 효과가 이질적인 경우(τ_k=30/Y·jk(0)와 같은 비선형 함수)에는 MLM1이 실제 변동을 무시하고 과소평가하는 반면, MLM2는 LR 검정으로 σ^2_τ>0을 검출하고, 이 경우 MLM2가 선호된다. 3. IKN의 상한 분산 추정량은 MLM2의 불확실성 추정치와 거의 일치했으며, 특히 군 크기가 동일할 때는 거의 동일한 정밀도를 보였다. 그러나 두 방법 모두 실제 처리 효과와 매칭 불균형을 구분하지 못한다는 공통된 한계가 있다. 공변량을 포함한 추가 실험에서는 X_jk=Y·jk(0)+ζ_j (ζ_j∼N(0,σ^2_ζ)) 형태로 설정하였다. σ^2_ζ를 작게 잡으면 군‑쌍 간 변동 σ^2_α가 크게 감소하고, 결과적으로 처리 효과 추정의 표준오차가 현저히 감소한다. 이는 공변량이 잠재적 결과와 높은 상관을 가질 때 특히 효과적이다. 전반적으로 저자들은 다층모형이 (1) 처리 효과 이질성 검정, (2) 공변량 조정, (3) 결측치 및 불완전 매칭 처리 등 다양한 현실적 문제에 대응할 수 있음을 강조한다. 현대 통계 소프트웨어(lme4, BUGS, JAGS 등)로 손쉽게 구현 가능하므로, 실무 연구자들이 접근하기에 충분히 실용적이다. IKN이 제시한 “가능하면 쌍 매칭을 해야 한다”는 원칙은 설계 단계에서 여전히 유효하지만, 분석 단계에서는 다층모형을 활용함으로써 보다 정교하고 신뢰성 있는 추정이 가능하다는 것이 논문의 핵심 결론이다.

쌍 매칭의 필수적 역할에 대한 논평

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기