고차 자기상관 오류를 고려한 다집단 중단시계열 분석 NeweyWest와 PraisWinsten 비교

** 본 연구는 다집단 통제 중단시계열(MG‑ITSA) 모델에서 2차·3차 자기상관(AR2, AR3) 오류 구조가 존재할 때, Newey‑West 표준오차를 이용한 OLS와 Prais‑Winsten 변환을 적용한 FGLS 방법의 추정 정확도와 검정력을 비교한다. 시뮬레이션 결과, 두 방법 모두 편향이 거의 없으나 OLS‑NW는 높은 검정력 뒤에 과도한 제1종 오류와 신뢰구간 미포함률을 보이며, 특히 시계열 길이가 길고 자기상관이 강할수록 문…

저자: Ariel Linden

고차 자기상관 오류를 고려한 다집단 중단시계열 분석 NeweyWest와 PraisWinsten 비교
** 본 논문은 다집단 통제 중단시계열 분석(MG‑ITSA)이 보건의료 분야에서 널리 활용되는 배경에서 출발한다. 단일 집단 ITSA는 사전·사후 추세 변화를 통해 개입 효과를 추정하지만, 외부 요인이나 사전 추세 차이로 인한 혼란을 완전히 배제하기 어렵다. 이를 보완하기 위해 대조군을 포함한 MG‑ITSA가 도입되었으며, 실제 연구에서는 두 가지 통계적 접근법, 즉 OLS에 Newey‑West(HAC) 표준오차를 적용한 방법(OLS‑NW)과 Prais‑Winsten 변환을 이용한 일반화 최소제곱(FGLS) 방법(PW)이 가장 흔히 사용된다. 그러나 기존 비교 연구는 주로 1차 자기상관(AR1) 오류를 전제로 했으며, 보건의료 데이터에서는 종종 2차·3차 이상의 자기상관이 나타난다. 최근 Vougas가 제안한 고차 Prais‑Winsten 알고리즘은 AR(k) 오류를 직접 추정하고 변환할 수 있게 함으로써, 이러한 고차 자기상관 상황에서도 PW를 적용할 수 있는 기반을 마련했다. 본 연구는 이러한 최신 방법론을 활용해, AR2와 AR3 오류 구조 하에서 OLS‑NW와 PW의 성능을 체계적으로 비교한다. 시뮬레이션 설계는 다음과 같다. MG‑ITSA 모델은 4개의 대조군과 1개의 처리군을 포함하며, 시간 변수(T), 처리 더미(X), 군 더미(Z) 및 그 상호작용을 포함한다. 오류는 AR2와 AR3 프로세스로 생성되며, 각각 약한 양의 상관(ρ1≈0.3, ρ2≈0.1 등), 감쇠 진동형(ρ1≈0.5, ρ2≈‑0.4 등), 강한 지속 양의 상관(ρ1≈0.8, ρ2≈0.6 등)으로 설정한다. 시계열 길이는 10, 20, …, 100으로 변동시키고, 효과 크기는 수준 차이(β6)와 추세 차이(β7) 두 가지 형태로 각각 3단계(20 %~30 % 수준, 25 %~100 % 추세)로 지정한다. 각 조합마다 2,000개의 데이터셋을 생성해 OLS‑NW와 PW를 각각 적용하고, Wald 검정을 통해 β6=0, β7=0 가설을 검정한다. 평가 지표는 (1) 검정력(1‑β), (2) 95 % 신뢰구간 커버리지, (3) 제1종 오류율, (4) 백분율 편향, (5) 평균제곱근오차(RMSE), (6) 경험적 표준오차이다. 결과 요약은 다음과 같다. 1. **편향**: 두 방법 모두 평균 추정값이 실제값과 거의 일치해 편향이 미미했다. 2. **검정력**: OLS‑NW는 전반적으로 높은 검정력을 보였으나, 이는 실제 효과가 없을 때도 높은 유의확률을 초래하는 제1종 오류 증가와 연관된다. 특히 AR3 및 고강도 지속 양의 상관 상황에서 검정력은 80 % 이상이지만, 동시에 제1종 오류가 40 %~57 %에 달했다. PW는 검정력이 다소 낮았지만, 효과 크기가 중간 이상이거나 시계열이 50~100에 이를 때는 OLS‑NW와 비슷하거나 약간 앞섰다. 3. **신뢰구간 커버리지**: PW는 90 %~94 % 수준으로 안정적인 커버리지를 유지했으며, 시계열 길이가 늘어나도 크게 변하지 않았다. 반면 OLS‑NW는 75 % 수준에서 시작해 시계열이 길어질수록 45 %~50 %까지 급격히 감소했다. 이는 검정력 상승이 실제 효과가 없을 때도 과도하게 유의하게 만드는 원인이다. 4. **제1종 오류**: PW는 거의 5 % 수준을 유지했으며, AR2·AR3 모두에서 일관되었다. OLS‑NW는 약한 양의 상관에서는 25 %~30 % 수준, 강한 지속 양의 상관에서는 40 %~57 %까지 크게 부풀었다. 5. **RMSE와 표준오차**: 두 방법의 RMSE는 효과 크기와 시계열 길이에 따라 비슷한 수준을 보였으나, OLS‑NW는 표준오차가 과소추정되는 경향이 있어 신뢰구간이 좁아지는 원인이 되었다. 민감도 분석에서는 수준 변화와 추세 변화가 동시에 존재하는 복합 상황, 그리고 대조군 초기 수준을 다르게 설정하는 경우에도 위와 동일한 패턴이 재현되었다. 이는 결과가 특정 시뮬레이션 설정에 국한되지 않음을 의미한다. **연구 의의**: 고차 자기상관이 존재하는 실무 데이터에서 OLS‑NW는 겉보기에 높은 검정력을 제공하지만, 실제로는 허위 양성을 크게 증가시켜 신뢰할 수 없는 결론을 초래한다. 반면 Prais‑Winsten 변환을 이용한 FGLS는 제1종 오류와 신뢰구간 커버리지를 적절히 제어하면서도 충분한 검정력을 확보한다. 따라서 보건의료 정책·임상 개입 효과를 평가할 때는 고차 자기상관을 고려한 PW 접근법을 우선 선택하는 것이 통계적 타당성과 실무적 신뢰성을 동시에 만족시킨다. **

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기