다중 처리 실험에서 회귀 보정의 편향과 효율성 분석

본 논문은 무작위 배정 실험에서 여러 처리와 공변량을 포함한 회귀 보정이 가져오는 편향을 Neyman의 비모수 모델을 이용해 정량화하고, 편향이 사라지는 특수 조건과 조정이 분산을 감소시킬 수 있는지를 이론적으로 규명한다.

저자: David A. Freedman

이 논문은 무작위 배정 실험(Randomized Controlled Experiments, RCT)에서 흔히 사용되는 회귀 보정(regression adjustment)의 통계적 타당성을 Neyman의 비모수 모델을 기반으로 재검토한다. 전통적인 실무에서는 처리 효과를 추정하기 위해 Y를 처리 더미(U, V, W)와 공변량 z에 대한 선형 회귀식(4)로 모델링한다. 그러나 무작위 배정만으로는 회귀 모델이 요구하는 “선형성·동일계수” 가정을 정당화할 수 없으며, 이는 추정량에 편향을 초래한다는 점을 저자는 강조한다. 논문은 먼저 기본 설정을 명시한다. 전체 모집단은 n명의 피험자로 구성되고, 각 피험자는 잠재적 반응 a_i, b_i, c_i와 공변량 z_i를 가진다. 실제 관측되는 반응 Y_i는 할당된 처리에 따라 a_i, b_i, 혹은 c_i 중 하나가 된다(식 3). 처리 할당은 무작위이며, 각 처리군의 크기는 n_A, n_B, n_C이며 비율 p̃_A=n_A/n 등으로 표기한다. 다음으로, 무작위 할당에 대한 기본적인 확률적 성질을 정리한다. Proposition 1은 각 처리군 평균 x_A, y_A 등의 기대값, 분산, 공분산을 n에 대한 정확한 식으로 제시한다. 이는 이후 CLT와 회귀 추정량의 asymptotic 성질을 도출하는 데 핵심적인 역할을 한다. Theorem 1은 조건 #1–#4(4차 모멘트 유계, 1·2차 모멘트 수렴, 처리군 비율 양의 한계, 변수 평균 0)를 가정하고, 12차원 벡터 √n(a_A, a_B, a_C, b_A, …, z_C)의 결합분포가 다변량 정규임을 증명한다. 여기서 a_A 등은 각 처리군의 평균 잠재반응이며, 이 정규분포의 평균·공분산은 모집단 모멘트 h_a, h_ab 등으로 표현된다. 그 후, 다중 회귀 추정량 β̂_MR을 정의한다. 회귀식은 Y를 U, V, W, z에 회귀시켜 β̂_MR=(β̂_A, β̂_B, β̂_C)′를 얻는다. 공변량 z는 평균 0, 분산 1로 정규화한다(식 11). 핵심은 β̂_MR−β를 두 부분으로 분해하는 것이다. Theorem 2는 조건 #1–#3과 (11)을 가정하고, ζ_n=√n(a_A−Q̃z_A, b_B−Q̃z_B, c_C−Q̃z_C)′를 정의한다. 여기서 Q̃= p̃_A ãz + p̃_B b̃z + p̃_C c̃z이며, ãz 등은 모집단 평균이다. ζ_n은 평균 0, 공분산 Σ를 갖는 정규벡터이며, β̂_MR−β는 β̂_MR−β = ζ_n/√n − K/n + ρ_n 형태로 전개된다. K는 각 처리와 공변량의 공분산 조합(K_A, K_B, K_C)이며, ρ_n은 O_p(n^{-3/2})이다. 따라서 편향은 1/n 차수이며, K=0이면 편향은 더 작아진다. 편향이 사라지는 특수 상황은 두 가지로 제시된다. 첫째, 공변량 z와 모든 처리 효과(a, b, c) 사이의 공분산이 0이면 K=0이 된다. 둘째, Q=0(즉, 각 처리 효과와 z의 가중 평균이 0)인 경우에도 K가 소멸한다. 이러한 경우 회귀 보정은 무편향 추정량이 된다. 다음으로, 회귀 모델이 제공하는 “명목적인” 표준오차와 실제 asymptotic 분산을 비교한다. Theorem 3은 X′X/n → D, σ̂² → σ², 그리고 n·Σ_nom → σ² D^{-1}임을 보인다. 여기서 D는 처리군 비율과 공변량의 스케일을 포함한 블록 대각 행렬이다. 명목적인 분산 σ² D^{-1}의 상위 3×3 블록은 실제 Σ와 일반적으로 일치하지 않으며, 이는 회귀 모델이 가정하는 조건(선형성, 등분산성, 독립성)이 무작위 배정만으로는 충족되지 않기 때문이다. 분산 효율성 측면에서는 Theorem 4가 핵심이다. 관심 매개변수 Δ=c−a(처리 C와 A의 차이)를 추정할 때, ITT 추정량(Y_C−Y_A)와 회귀 추정량(β̂_C−β̂_A)의 asymptotic 분산 차이는 Γ/(n p_A p_C)로 표현된다. Γ=2Q(p_C h_az + p_A h_cz)−Q²(p_A+p_C)이며, Q가 0이면 Γ=0이므로 조정이 효율성을 바꾸지 않는다. Q>0이면 Γ>0가 될 가능성이 높아 조정이 분산을 감소시킨다. 반대로 Q<0이면 조정이 오히려 분산을 늘린다. 논문은 여러 예시를 통해 이론을 구체화한다. Example 1에서는 ITT와 회귀 추정량의 편향·분산을 직접 계산하고, Example 2에서는 Q=0인 경우 명목 분산이 실제보다 크게 혹은 작게 추정될 수 있음을 보여준다. Example 3·4는 실제 데이터 시뮬레이션을 통해 조정이 효율성을 향상시키는 경우와 그렇지 않은 경우를 비교한다. 마지막으로 Example 5는 편향 K≠0인 상황을 시연하며, 표본 크기가 커질수록 편향이 1/n 수준으로 감소하지만 완전히 사라지지는 않음을 강조한다. 결론적으로, 무작위 배정 실험에서 회귀 보정은 “자동으로” 효율성을 높이는 도구가 아니다. 편향이 존재함을 인식하고, 공변량과 처리 효과 사이의 공분산 구조를 검토해 K가 0에 가깝거나 Q가 0에 가까운 상황에서만 적용해야 한다. 또한, 표준 회귀 소프트웨어가 제공하는 표준오차는 실제보다 크게 혹은 작게 추정될 위험이 있으므로, 연구자는 이론적 보정(예: 편향 보정, 부트스트랩)이나 설계 단계에서 균형을 맞추는 방법을 병행해야 한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기