ABC 모델 선택의 근본적 한계: 베이지안 증거 추정의 불가능성
본 논문은 근사 베이지안 계산(ABC)이 모델 선택에 적용될 때, 요약통계만을 이용하는 한계 때문에 진정한 베이지안 사후확률을 근사할 수 없음을 이론적으로 증명한다. 특히 충분통계라도 모델 간 비교에는 충분하지 않으며, ABC가 수렴하더라도 얻어지는 베이지안 팩터는 실제 팩터와 차이가 크게 난다. 따라서 일반적인 ABC‑MC 방법은 모델 선택에 신뢰할 수 없는 결과를 제공한다.
저자: Christian Robert (Universite Paris Dauphine), Jean-Michel Marin (Universite de Montpellier 2), Natesh S. Pillai (Harvard University)
이 논문은 근사 베이지안 계산(Approximate Bayesian Computation, ABC)이 복잡한 확률 모델의 사후 추정에는 유용하지만, 모델 선택(model choice)에는 근본적인 한계가 있음을 이론적으로 입증한다. 먼저 ABC의 기본 원리를 설명한다. 데이터 y와 파라미터 θ에 대해 사전 π(θ)와 시뮬레이션 가능한 모델 f(z|θ)가 주어지면, 요약통계 η와 거리 함수 ρ, 허용오차 ε를 정의해 ρ{η(z),η(y)}≤ε인 시뮬레이션을 받아들여 θ를 추출한다. η가 충분통계이면 ε→0일 때 얻어지는 근사 사후분포 π_ε(θ|y)는 진정한 사후분포 π(θ|y)에 수렴한다.
그러나 모델 선택에서는 모델 인덱스 M을 추가 파라미터로 두고, 각 모델 m마다 고유 파라미터 θ_m과 사전 π_m(θ_m)를 갖는다. ABC‑MC(ABC Model Choice) 알고리즘은 모든 모델에 대해 동일한 요약통계 집합 η(z)=(η_1(z),…,η_M(z))를 사용하고, ε 이하의 거리 조건을 만족하는 시뮬레이션을 받아들여 모델별 수용 횟수를 기록한다. 모델 m의 사후확률은 수용 횟수 비율으로 추정된다.
논문은 이 절차가 실제 베이지안 팩터와 어떻게 다른지를 수학적으로 전개한다. ε와 시뮬레이션 수 T를 무한히 크게 하면, ABC‑MC가 산출하는 베이지안 팩터 B̂_12(y)는
\
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기