확장된 확산 샘플링으로 희귀 이벤트와 자유 에너지 정확히 계산

본 논문은 분자 동역학(MD) 시뮬레이션에서 오래된 두 가지 샘플링 문제—느린 혼합(slow mixing)과 희귀 상태(rare state) 문제—를 동시에 해결하기 위한 새로운 프레임워크, “Enhanced Diffusion Sampling”(EDS)를 제시한다. 기존 MD는 시간 상관된 궤적을 생성하기 때문에 장시간에 걸친 전이 현상을 포착하기 어렵고, 특히 평형 분포에서 확률이 매우 낮은 상태(예: 단백질의 비접힌 상태)를 충분히 샘플링하려면 천문학적인 시뮬레이션 시간이 필요하다. 최근 BioEmu와 같은 확산 기반 Boltzmann 생성기가 독립적인 평형 샘플을 빠르게 제공함으로써 느린 혼합 문제를 크게 완화했지만, 여전히 희귀 상태를 충분히 관찰하기엔 샘플 수가 부족한 한계가 남는다. EDS는 사전 학습된 확산 모델을 “스티어링”함으로써 이 한계를 극복한다. 구체적으로, 확산 모델이 역시간 SDE dx_t = g_t(x_t)dt + σ̃_t dW_t 로 샘플을 생성하는데, 여기서 g_t(x)는 원래 스코어(∇log p_t)와 드리프트 f_t를 결합한 형태이다. 저자들은 이 역 SDE에 추가적인 편향 포텐셜 b_t(x) 를 삽입하고, 동시에 Feynman‑Kac 교정(FKC)과 Sequential Monte Carlo(SMC) 기법을 이용해 각 타임스텝에서 중요도 가중치 w_t를 계산한다. 편향 포텐셜은 시간에 따라 점진적으로 적용되며, b_0(x) 는 상수, b_1(x)=b(x) 는 최종 목표 편향이다. 이렇게 하면 원래의 평형 분포 p(x) 에 대해 q(x)∝p(x)·e^{-b(x)} 라는 목표 분포를 정확히 샘플링할 수 있다. 샘플 효율성을 높이기 위해 ESS(Effective Sample Size)를 모니터링하고, ESS가 사전에 정의된 임계값 이하로 떨어지면 stratified resampling을 수행한다. 이는 가중치가 한 샘플에 집중되는 현상을 방지하고, 전체 배치의 가중치를 균등하게 유지한다. 최종적으로 각 편향된 샘플에 대해 w_k,i·exp(b_k(x_k,i)) 로 재가중하고, 다중 편향( K>1 )이 존재할 경우 MBAR(Multistate Bennett Acceptance Ratio)으로 최적 가중치를 추정한다. 이렇게 하면 무편향 평형 기대값 E_p

확장된 확산 샘플링으로 희귀 이벤트와 자유 에너지 정확히 계산

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기