확률 컴퓨터로 구현하는 구조화된 확산 모델: 상관 노이즈와 효율적 샘플링

본 논문은 기존 독립적인 노이즈 주입 방식을 넘어, 이징 상호작용을 이용한 마코프 체인 몬테카를로(MCMC) 동역학을 확산 모델의 노이즈 커널에 통합한다. 이를 확률 비트(p‑bit) 기반의 확률 컴퓨터(p‑computer) 위에 구현함으로써 샘플링 속도와 에너지 효율을 GPU 대비 10²~10⁴ 배 향상시킨다. 2차원 페로마그네틱 이징 모델과 3차원 에드워즈‑앤더슨 스핀 글래스에 대한 실험에서, 상관 확산이 독립 확산보다 실제 MCMC 기준 …

저자: Nihal Sanjay Singh, Mazdak Mohseni-Rajaee, Shaila Niazi

확률 컴퓨터로 구현하는 구조화된 확산 모델: 상관 노이즈와 효율적 샘플링
본 논문은 확산 모델의 두 핵심 구성 요소인 결정론적 신경망 평가와 확률적 샘플링을 재구성함으로써, 기존 GPU 중심 설계의 한계를 극복하고 새로운 하드웨어 패러다임인 확률 컴퓨터(p‑computer)를 활용하는 방안을 제시한다. 1. **배경 및 동기** 확산 모델은 데이터에 점진적으로 노이즈를 주입하고, 학습된 신경망이 이를 역전파하여 새로운 샘플을 생성한다. 현재 대부분의 연산은 GPU에 최적화된 신경망에 집중돼 있으며, 샘플링 단계는 독립적인 가우시안·베르누이 노이즈를 삽입하는 단순 전이 커널에 머물러 있다. 이는 하드웨어 가용성에 의한 설계 선택일 뿐, 확산 프레임워크 자체가 요구하는 제약은 아니다. 2. **확률 컴퓨터와 p‑bit/g‑bit** p‑bit은 이진 확률 유닛으로, 로컬 필드 I_i와 역온도 β에 따라 tanh와 균등 잡음의 조합으로 s_i를 샘플링한다. 이는 이징 모델의 Gibbs 샘플링과 동일한 확률 분포를 만든다. g‑bit은 다중 상태(가우시안) 변수를 구현하기 위해 여러 p‑bit을 결합하거나 자체적인 연속형 확률 유닛을 사용한다. 이러한 하드웨어는 FPGA, sMTJ 등 다양한 물리적 구현이 가능하며, 32비트 난수 생성에서 GPU 대비 10²~10⁴배의 효율성을 보인다. 3. **확산을 p‑bit 동역학으로 해석** 독립 확산은 J_{ij}=0인 경우로, 각 p‑bit이 시간에 따라 변하는 로컬 바이어스 h_i(t)=s_{t-1,i}와 역온도 β_t에 의해 독립적으로 업데이트된다. 이때 전이 행렬은 2×2 스칼라 커널의 텐서곱으로 표현돼 λ_t라는 누적 스칼라 파라미터만 필요하다. 반면, 물리적 시스템에서 알려진 상호작용 J_{ij}를 그대로 적용하면, 전이 행렬은 전체 2^N×2^N 차원을 갖는 상관된 Gibbs 샘플링이 된다. 이를 ‘상관 확산(correlated diffusion)’이라 명명한다. 4. **하이브리드 아키텍처** Fig.1에 제시된 구조는 p‑computer가 샘플링을 담당하고, GPU가 신경망 기반의 조건부 확률 p(s₀|s_t)를 계산한다. 역전파 단계에서 신경망이 제시한 ‘깨끗한’ 상태 ˆs₀를 p‑computer에 전달하면, 여러 개의 Gibbs 체인이 병렬로 실행돼 후보 s_{t-1}을 생성한다. 이 후보들은 실제 전이 확률 P(s_t|s_{t-1})에 따라 가중치가 부여되고, 최종적으로 하나가 선택되어 역방향 확산이 진행된다. 5. **실험 설정 및 결과** - **2D 페로마그네틱 이징 모델**: 온도 스케줄을 동일하게 적용한 독립 확산과 상관 확산을 비교. 상관 확산은 자기화와 에너지 분포에서 MCMC 기준과의 KL 발산이 약 30% 감소하였다. - **3D 에드워즈‑앤더슨 스핀 글래스**: 복잡한 에너지 지형으로 인해 독립 확산은 높은 샘플링 편향을 보였으나, 상관 확산은 Gibbs 체인의 짧은 길이만으로도 충분히 낮은 편향을 달성하였다. - **하드웨어 효율성**: FPGA 기반 p‑bit 구현은 15,000 Gsamples/s, 전력 25 W로 GPU(1,000 Gsamples/s, 280 W) 대비 600 Gsamples/J 효율을 보였으며, sMTJ 기반 예상치는 15,625 Gsamples/J에 달한다. 6. **의의 및 향후 연구** - **구조 인식**: 물리적 상호작용을 직접 전이 커널에 반영함으로써, 데이터 자체에 내재된 상관 구조를 보존하고 샘플 품질을 향상시킨다. - **에너지 효율**: 확산 모델의 샘플링 비용을 하드웨어 수준에서 크게 절감함으로써, 대규모 생성 모델의 운영 비용을 낮출 수 있다. - **확장 가능성**: 현재는 이진 이징 모델에 초점을 맞췄지만, g‑bit을 이용한 연속형 변수, 다중 모드 분포, 그리고 비이징형 그래프 구조에도 적용 가능하다. 또한, 실시간 이미지·음성 생성, 물리 시뮬레이션, 최적화 문제 등 다양한 도메인에 통합될 전망이다. 결론적으로, 이 논문은 확산 모델의 샘플링 단계에 구조화된 MCMC를 도입하고, 이를 p‑bit 기반 확률 컴퓨터에 구현함으로써, 기존 GPU 기반 구현 대비 샘플링 속도와 에너지 효율에서 획기적인 개선을 달성하였다. 이는 생성 모델 연구에 새로운 하드웨어-알고리즘 공동 설계 패러다임을 제시하며, 물리 기반 데이터와 복잡한 상관 구조를 가진 문제에 특히 유리한 접근법으로 평가된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기