가중 히스토그램을 위한 카이제곱 적합도 검정 개선

본 논문은 가중 히스토그램에 적용되는 카이제곱 적합도 검정의 기존 이론을 정리하고, 기대치와 분산을 정확히 반영하도록 수정한 새로운 검정 통계량을 제안한다. 제안된 방법은 명목 유의 수준에 더 가깝게 크기를 유지하며, 정규화 상수가 알려지지 않은 경우와 같은 실용적인 상황에도 적용 가능하도록 확장한다. 수치 실험을 통해 기존 검정보다 크기와 검정력에서 우수함을 확인한다.

저자: Nikolai Gagunashvili

본 논문은 가중 히스토그램을 이용한 확률밀도함수(PDF) 추정과 그에 대한 적합도 검정 문제를 체계적으로 다룬다. 서론에서는 히스토그램이 m개의 빈으로 구분되고, 각 빈에 대한 확률 p_i = ∫_{S_i} p(x)dx 를 추정하는 기본 개념을 소개한다. 전통적인 히스토그램에서는 사건 수 n_i 를 사용해 ˆp_i = n_i/n 으로 추정하고, n_i 는 다항분포를 따른다. 가중 히스토그램은 각 사건에 가중치 w_i(k)를 부여해 빈 i의 총 가중치 W_i = Σ_{k=1}^{n_i} w_i(k) 로 정의한다. 가중치 함수 w(x) = p(x)/g(x) 로 설정하면, g(x) 로부터 샘플링한 뒤 가중치를 적용해 p(x) 를 추정할 수 있다. 두 번째 예시에서는 검출 효율 A(x′)와 해상도 R(x|x′) 를 포함한 재구성 PDF p_rec(x) 를 가중 히스토그램으로 얻는 절차를 설명한다. 2절에서는 적합도 검정의 기본 가설 H₀: p_i = p_i⁰ (i=1,…,m) 와 대립 가설을 설정하고, Pearson의 χ² 통계량 X² = Σ_i (n_i – n p_i⁰)²/(n p_i⁰) 를 도출한다. 공분산 행렬 Γ 를 이용한 다변량 형태 (n – n p⁰)ᵀ Γ_k⁻¹ (n – n p⁰) 를 전개해도 동일한 X² 가 얻어짐을 증명한다. 가중 히스토그램에 대한 일반화에서는 W_i 를 무작위 가중치의 합으로 모델링하고, 가중치의 1차·2차 모멘트 μ_i, α_i² 를 도입한다. 기대값 E

가중 히스토그램을 위한 카이제곱 적합도 검정 개선

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기