두 히스토그램 일관성 검정

이 논문은 두 히스토그램이 동일한 확률분포에서 추출되었는지를 검정하기 위한 다양한 통계적 방법을 체계적으로 조사하고, 각각의 장단점을 실험적 예시와 시뮬레이션을 통해 평가한다. 1. **문제 정의와 모델링** - 두 히스토그램은 동일한 bin 구성을 갖는 다변량 포아송 과정으로 가정한다. 첫 번째 히스토그램의 bin 카운트를 U_i, 두 번째를 V_i라 두고, 각각의 평균을 μ_i와 ν_i라 정의한다. 전체 카운트는 N_u = ΣU_i, N_v = ΣV_i 로 표기한다. - 영가설은 두 가지 형태로 나뉜다. (H₀) bin‑by‑bin 평균이 동일한 경우와 (H′₀) 전체 형태(shape)만 동일하고 정규화는 다를 수 있는 경우이다. 2. **대규모 데이터에서의 정규근사와 χ² 검정** - 모든 bin에 충분한 카운트가 존재하면 각 bin을 정규분포로 근사한다. Δ_i = U_i – V_i, σ_i² ≈ U_i+V_i 로 두고, χ² 통계량 T = Σ(Δ_i)²/(U_i+V_i) 를 계산한다. - σ_i²를 관측값으로 대체함으로써 자유도 k(절대 비교) 혹은 k‑1(형태 비교)인 χ² 분포를 사용한다. 이때, bin이 모두 0이면 해당 항은 0으로 처리한다. - 형태 비교를 위해 두 히스토그램을 동일한 총 카운트 N = (N_u+N_v)/2 로 스케일링하고, 스케일된 값에 대해 동일한 χ² 통계량을 적용한다. 3. **예시와 실험 결과** - Fig.1의 두 히스토그램은 각각 492와 424의 총 카운트를 가지고, 평균값이 10% 차이 나도록 생성되었다. 표 I에 제시된 결과에 따르면, 절대 비교와 형태 비교 모두 χ² 기반 p‑값이 0.86~0.96 사이로 높은 일관성을 보였으며, “toy” Monte‑Carlo 시뮬레이션을 통해 얻은 경험적 p‑값도 거의 일치한다. - 그러나 영가설이 완전히 규정되지 않아 μ_i와 ν_i를 알 수 없으므로, 최대우도 추정값을 사용한다. 이는 작은 카운트 영역에서 보수적(conservative) 혹은 과민(anti‑conservative)하게 작동할 수 있다. 4. **χ² 근사의 보수성에 대한 정리** - 저자는 “큰 T 값에 대해 χ² 분포가 실제 분포보다 더 큰 꼬리를 가진다”는 정리를 제시한다. 한 bin을 예로 들면, T ≈ U (U가 큰 경우)이며, 포아송 분포와 χ² 분포의 비율을 비교하면 큰 T에서 비율이 0에 수렴한다. 따라서 χ² 기반 p‑값은 실제보다 보수적일 가능성이 높다. 5. **다양한 비모수 검정법 비교** - Kolmogorov‑Smirnov, Cramér‑von‑Mises, Anderson‑Darling 등 연속형 데이터에 적합한 검정법을 히스토그램에 적용했지만, 자유도와 이산성 때문에 정확한 p‑값을 얻기 어렵다. - Bhattacharyya 거리(BDM)는 두 히스토그램을 정규화된 벡터로 보고 내적을 이용해 형태 유사성을 측정한다. 표 I에서 BDM은 0.986, p‑값은 0.97로 매우 높은 유사성을 나타냈다. 6. **bin 결합 전략** - 작은 카운트가 존재할 경우, 인접 bin을 결합해 최소 카운트(minBin)를 확보한다. 이 방법은 정규근사의 정확성을 높이지만, 통계적 파워를 감소시킬 위험이 있다. Fig.3은 minBin을 변화시켰을 때 T와 p‑값이 어떻게 변하는지를 보여준다. 7. **전체 정규화(총 카운트) 검정** - 두 히스토그램의 총 카운트를 이항분포로 모델링하고, μ_T = ν_T 를 검정하는 uniformly most powerful test를 적용한다. 예시에서는 N=916, N_v=424 로 두었을 때 양측 검정 p‑값이 0.027이며, 이는 앞서 형태 검정에서 얻은 0.025와 일치한다. 8. **결론 및 실무적 권고** - 영가설이 완전히 명시되지 않은 상황에서는 χ² 근사가 보수적으로 작동할 수 있음을 인식하고, 필요시 Monte‑Carlo 시뮬레이션을 통해 경험적 p‑값을 보정해야 한다. - 데이터의 특성(총 카운트 규모, bin 수, 각 bin의 평균값)과 검정 목적(절대 일치 vs 형태 일치)에 따라 적절한 검정법을 선택해야 한다. - 하나의 검정이 모든 상황을 지배하지 않으며, 여러 검정을 병행하고 결과를 종합적으로 해석하는 것이 바람직하다.

두 히스토그램 일관성 검정

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기