대리 로그가능도와 이질분산을 이용한 비선형 역문제에서의 사후 수축

본 논문은 비선형 역문제에서 정확한 로그가능도를 사용할 수 없을 때, 근사 전방 연산자와 대리 잡음 분산을 이용한 대리 로그가능도를 구성하고, 가우시안 프로세스 사전분포와 결합한 사후분포가 진정 파라미터를 기존 수축 속도와 동등한 속도로 추정함을 증명한다. 이론적 결과는 반정규화 최대우도(MLE)의 강건성을 활용하여 이질분산 및 근사오차를 제어하고, 반응‑확산 방정식과 2차원 Navier‑Stokes 방정식에 대한 구체적 예시를 제공한다.

저자: Fanny Seizilles, Maximilian Siebel

본 논문은 비선형 역문제에서 정확한 로그가능도 ℓ_N(θ)를 직접 계산하기 어려운 현실적인 상황을 다루며, 대리(log‑likelihood) 접근법의 통계적 타당성을 이론적으로 검증한다. 먼저 저자들은 일반적인 비선형 역문제 모델을 설정한다. 파라미터 θ는 무한 차원 함수공간 Θ에 존재하고, 관측값 Y_i는 전방 연산자 G(θ)와 독립적인 가우시안 잡음 ε_i(σ_i^2) 의 합으로 표현된다. 실제 문제에서는 전방 연산자 G와 잡음 분산 σ_i^2 를 정확히 알기 어려워, 근사 전방 연산자 \tilde G와 대리 잡음 분산 s_i^2 를 사용해 대리 로그가능도 \tilde ℓ_N(θ) 를 정의한다. 이때 사전분포 Π는 가우시안 프로세스(예: Matérn 커널)로 선택되며, 이는 무한 차원 베이지안 추정에 널리 쓰이는 형태이다. 핵심 이론적 결과는 “대리 사후분포는 실제 파라미터 θ_0 주위에 기존 비선형 역문제에서 알려진 비모수 수축 속도와 동일하게 수축한다”는 정리이다. 이를 위해 저자들은 다음과 같은 일련의 분석을 전개한다. 1. **근사 오차 조건**: 전방 연산자와 잡음 분산의 근사 오차가 N에 대해 충분히 빠르게 감소한다는 가정을 두었다. 구체적으로, ‖G(θ)-\tilde G(θ)‖_Y ≤ C N^{-α}·‖θ-θ_0‖_Θ 와 |σ_i^2 - s_i^2| ≤ C N^{-β} 와 같은 형태이며, α,β>0 를 만족한다. 2. **반정규화 MLE의 강건성**: 기존 연구(Kleijn & van der Vaart, White 등)에서 제시된 반정규화 최대우도(penalised MLE)의 일관성과 강건성을 활용한다. 이 추정량은 모델 오차와 잡음 오차가 존재해도 pseudo‑true 파라미터 θ* (KL 최소화 파라미터) 로 수렴한다. 논문은 θ* = θ_0 라는 추가 가정을 통해, MLE가 실제 파라미터에 대한 좋은 초기값을 제공함을 보인다. 3. **테스트 함수와 오류 제어**: Ψ_N(D_N) 라는 테스트 함수를 구성해 1종 오류 P_{θ_0}(Ψ_N=1) ≤ e^{-cNε_N^2} 와 2종 오류 sup_{θ∈Θ:‖θ-θ_0‖>Mε_N} P_θ(Ψ_N=0) ≤ e^{-cNε_N^2} 를 만족하도록 한다. 여기서 ε_N 은 목표 수축률이며, M 은 충분히 큰 상수이다. 4. **변경 측정(change of measure) 기법**: 대리 로그가능도와 실제 로그가능도 사이의 Radon‑Nikodym 미분을 분석해, 사전의 작은 구 확률과 결합해 likelihood ratio 가 충분히 억제됨을 보인다. 특히, 전방 연산자가 전역적으로 유계가 아니더라도, 파라미터 공간을 구간(slicing)으로 나누어 각 구간에서 사전 질량이 충분히 크고, 오차가 제어된다는 점을 이용한다. 5. **수축 정리**: 위의 결과들을 종합해, 사후분포 Π(·|D_N) 가 Π(θ:‖θ-θ_0‖_Θ > Mε_N | D_N) → 0 (P_{θ_0}‑a.s.) 를 만족함을 증명한다. 여기서 ε_N 은 일반적인 비모수 회귀에서 얻어지는 최소화된 수축률 (예: N^{-s/(2s+ d)} 형태) 이다. 또한, 사후 평균 E_Π

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기