사례 삭제 중요도 샘플링 추정량: 중심극한정리 및 관련 결과

** 본 논문은 복잡한 베이지안 모델에서 관측치 집합을 삭제(case‑deletion)했을 때 얻어지는 사후분포와 전체 데이터 사후분포 사이의 차이를 중요도 샘플링을 통해 추정하는 방법의 신뢰성을 이론적으로 분석한다. 저자들은 사례 삭제 가중치 함수 \(w_{\mathcal I}(s)=q_{\mathcal I}(s)/q(s)\) 의 r‑차 모멘트 존재 여부가 추정량의 중심극한정리(CLT) 적용 가능성을 결정한다는 점에 주목한다. **1. 기본 설정 및 정의** - 베이지안 모델은 파라미터 \(\mathbf s\in\mathbb R^k\) 와 데이터 \(\mathbf y=(y_1,\dots,y_n)\) 로 정의된다. - 전체 사후밀도 \(p(\mathbf s\mid\mathbf y)\) 와 사례 삭제 사후밀도 \(p_{\mathcal I}(\mathbf s\mid\mathbf y_{\setminus\mathcal I})\) 를 각각 \(q(\mathbf s,\mathbf y)\) 와 \(q_{\mathcal I}(\mathbf s,\mathbf y_{\setminus\mathcal I})\) 로 표현한다(정규화 상수는 알 수 없음). - 중요도 샘플링 추정량은 (2.1)식과 같이 가중치 \(w_{\mathcal I}(\mathbf s)=q_{\mathcal I}(\mathbf s)/q(\mathbf s)\) 를 이용해 계산한다. **2. 꼬리 두께와 모멘트 존재성** - 사전분포의 꼬리 두께를 ‘thick’ 혹은 ‘thin’으로 정의하고, Lemma 2.1을 통해 두 사전분포 사이의 비율이 유계이면 적분 발산·수렴 특성이 동일함을 증명한다. - 이를 이용해 conjugate prior와 비‑conjugate prior 모두에 대해 동일한 판정 기준을 적용한다. **3. 베이지안 선형 회귀 모델** - 모델: \( \mathbf Y\mid\boldsymbol\theta,\sigma^2\sim N(\mathbf X\boldsymbol\theta,\sigma^2\mathbf I)\) , 사전: \(\boldsymbol\theta\sim\pi_1\), \(\sigma^2\sim IG(\alpha,\beta)\). - 레버리지 행렬 \(H=\mathbf X(\mathbf X^\top\mathbf X)^{-1}\mathbf X^\top\), RSS, 레버리지 고유값 \(\lambda_i\) 등을 정의한다. - Theorem 3.1에 따라, 가중치 함수의 r‑차 모멘트가 유한하려면 (a) \(\lambda_{\max}<1/r\), (b) \(n/2+\alpha>rI/2\), (c) 조정된 RSS\(^*_{\mathcal I}(r)>-2/\beta\) 를 만족해야 한다. 반대 조건이면 모멘트가 무한하고 CLT가 성립하지 않는다. - 비정보적 사전 \(\pi(\boldsymbol\theta,\sigma^2)\propto 1/\sigma^2\) 에 대해서는 (b)와 (c)가 각각 \(n>rI+k\) 와 \(RSS^*_{\mathcal I}(r)>0\) 로 단순화된다. **4. Michaelis–Menten (MM) 모델** - MM 모델은 \(\mu_i = \frac{\theta_1 x_i}{\theta_2 + x_i}\) 형태의 비선형 회귀이며, \(\theta_2\) 를 고정하면 \(\mu_i\) 가 \(\theta_1\) 에 대해 선형이 된다. - 조건부 선형성을 이용해 선형 모델에서 도출한 레버리지·잔차 조건을 그대로 적용한다. 따라서 동일한 r‑차 모멘트 존재 조건이 MM 모델에도 적용 가능함을 보인다. **5. 로지스틱 회귀 모델** - 로지스틱 회귀는 이항 데이터에 대한 베이지안 모델이며, 사후분포는 일반적으로 비정규이다. - 저자들은 로그우도와 사전의 꼬리 두께를 고려해, 선형 모델과 유사한 형태의 조건(레버리지·잔차·샘플 크기)을 제시한다. 특히, 사전이 충분히 ‘thin’ 하면 모멘트가 유한하고, ‘thick’ 하면 무한해진다. **6. 중심극한정리와 모멘트 인덱스** - 가중치 함수의 r‑차 모멘트가 유한하면, 중요도 샘플링 추정량 \(\hat E_{p_{\mathcal I}}

사례 삭제 중요도 샘플링 추정량: 중심극한정리 및 관련 결과

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기