위험중립 확산 모델을 활용한 파생상품 가격 평가
본 논문은 물리적 측정(P)에서 학습된 DDPM의 점수 함수를 위험중립 측정(Q)으로 변환하는 폐쇄형 ε‑시프트를 제안한다. 이 변환은 역확산 동역학에 위험중립 드리프트를 삽입하면서 학습된 변동성 구조를 보존하고, 할인된 가격 경로가 마팅게일 조건을 만족함을 증명한다. GBM 기반 실험에서 유럽 옵션 및 아시안 옵션 가격을 정확히 재현한다.
저자: Nilay Tiwari
본 연구는 딥러닝 기반 확산 생성 모델인 DDPM을 금융 분야, 특히 위험중립 측정 하에서의 파생상품 가격 평가에 적용하기 위한 이론적·실험적 프레임워크를 제시한다. 먼저, 물리적 측정 P 하에서 자산 가격 S_t 는 로그수익 Y =log S_{t+Δt}−log S_t 가 평균 m_P = (μ−½σ²)Δt 와 분산 v₀ =σ²Δt 을 갖는 정규분포임을 확인한다. 위험중립 측정 Q 에서는 드리프트만 μ→r 로 바뀌어 평균이 m_Q = (r−½σ²)Δt 가 된다. 이 차이는 평균만 변화하고 분산은 동일하다는 점에서, 확산 모델의 핵심인 점수 s_t(y)=∇_y log p_t(y) 에 간단한 상수 보정만 필요함을 암시한다.
DDPM의 전방 노이징 과정은 Y_t=√ᾱ_t Y₀+√(1−ᾱ_t) ε_t 로 정의되며, 여기서 Y₀ 은 P 혹은 Q 하의 초기 로그수익이다. 논문은 Lemma 1을 통해 전방 마진이 각각 Y_t^P∼N(μ_P_t,σ²_t) 와 Y_t^Q∼N(μ_Q_t,σ²_t) 이며, 평균 차이는 μ_Q_t−μ_P_t=√ᾱ_t(m_Q−m_P) , 분산 σ²_t=ᾱ_t v₀+(1−ᾱ_t) 임을 증명한다.
다음으로 Proposition 1에서 Gaussian 점수의 변화를 분석한다. 점수는 s_t(y)=−y/σ²_t+μ_t/σ²_t 이므로, Q 하의 점수는 P 하의 점수에 상수 η_t=√ᾱ_t σ²_t (m_Q−m_P) 을 더한 형태가 된다. 이는 위험중립 변환이 점수에 단순히 상수 오프셋을 추가함을 의미한다.
Fisher 식 ∇_y log p_t(y)=−(1/√(1−ᾱ_t)) E
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기