모멘텀 넷: 역문제 해결을 위한 빠르고 수렴 가능한 반복 신경망

본 논문은 이미지 복원·재구성 등 다양한 역문제에 적용 가능한 새로운 반복 신경망 구조인 Momentum‑Net을 제안한다. 기존의 INN은 회귀형 신경망(정제기)과 모델 기반 이미지 재구성(MBIR) 알고리즘을 결합했지만, 수렴성 보장과 연산 가속 측면에서 한계가 있었다. 이를 극복하기 위해 저자들은 블록‑프로시멀 외삽 그라디언트와 메이저라이저(M‑Lipschitz)를 활용하는 BPEG‑M(Block Proximal Extrapolated Gradient with Majorizer) 최적화 프레임워크를 차용하였다. Momentum‑Net의 각 반복은 세 개의 핵심 모듈로 구성된다. 첫 번째는 이미지 정제 모듈로, 학습된 컨볼루션 오토인코더(얕은 sCNN 또는 깊은 dCNN)를 사용해 현재 추정 이미지에 대한 사전 정보를 제공한다. 두 번째는 외삽 모듈로, 이전 두 반복의 차에 모멘텀 행렬 E 을 곱해 가속화 효과를 만든다. 세 번째는 MBIR 모듈로, 메이저라이저 행렬 M 을 이용해 비반복형 근사 해를 계산한다. 이 구조는 기존 ADMM‑기반 INN이 필요로 하던 내부 반복을 없애고, 한 번의 외삽·정제·MBIR 순환만으로 충분히 업데이트를 수행한다. 수렴 이론은 두 가지 비대칭 조건을 전제로 한다. 첫 번째는 정제 네트워크가 반복이 진행될수록 비팽창성(즉, Lipschitz 상수 L → 1)을 만족한다는 가정이다. 두 번째는 블록‑좌표 최소화가 점차 정확해져 최종 단계에서 실제 최소화와 동일한 효과를 낸다는 가정이다. 이 두 조건 하에 저자들은 Momentum‑Net이 일반적인 (비)볼록 데이터 적합 함수 f(x; y)와 볼록 제약 집합 X 에 대해 고정점 수렴을 보장하고, 그 고정점이 원 문제의 임계점임을 증명한다. 또한 데이터 적합 파라미터 γ 의 선택을 위해 메이저라이저 행렬들의 고유값 스펙트럼 스프레드를 이용한 자동 스케일링 방식을 제안한다. 이는 학습 데이터와 테스트 데이터 사이의 노이즈·시스템 차이를 보정해, 동일한 정제 NN 구조를 유지하면서도 최적의 정규화 강도를 자동으로 결정한다. 실험은 두 가지 극단적인 영상 응용 분야에서 수행되었다. 첫 번째는 라이트필드(LF) 촬영에서 다중 초점 스택을 이용한 4D 복원이며, 두 번째는 희소 뷰 CT에서 30° 이하의 투시각만을 사용한 3D 재구성이다. 동일한 정제 NN 아키텍처를 사용했음에도 Momentum‑Net은 기존 BCD‑Net, ADMM‑Net, PnP‑PDS 등과 비교해 평균 PSNR을 1.5~2.3 dB 향상시키고, 수렴 속도는 2배 이상 빨라졌다. 특히 비볼록 포아송 노이즈 모델에서도 안정적인 수렴을 보였으며, 정규화 파라미터 자동 선택이 없을 경우 대비 재구성 품질이 평균 0.8 dB 개선되었다. 결론적으로, 본 연구는 메이저라이저 기반 가속과 모멘텀 외삽을 딥러닝 정제와 결합함으로써, 이론적 수렴 보장과 실용적 연산 효율을 동시에 만족하는 최초의 INN 아키텍처를 제시한다. 이는 고해상도·고속 영상 복원, 저선량·희소 뷰 CT, 라이트필드 촬영 등 다양한 역문제에 적용 가능하며, 향후 더 복잡한 비선형·비볼록 모델에도 확장될 여지를 제공한다.

모멘텀 넷: 역문제 해결을 위한 빠르고 수렴 가능한 반복 신경망

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기