다중산란 매체 이미지 복원을 위한 엔드투엔드 변환 합성곱 신경망

다중 산란 매체를 통과한 빛은 복잡한 다중 반사와 회절을 겪으며 위상 정보를 크게 손실시킨다. CCD나 CMOS와 같은 일반적인 이미지 센서는 이러한 스펙클 패턴의 강도만을 기록하므로, 원본 물체를 복원하기 위해서는 위상 복원(phase retrieval)이라는 본질적으로 비선형이고 불안정한 역문제를 해결해야 한다. 기존 연구에서는 전송 행렬 A를 먼저 추정한 뒤, 알려진 A를 이용해 위상 복원을 수행하는 이중 위상 복원(double phase retrieval) 방법이 제안되었다. 이 방법은 전송 행렬을 추정하기 위해 다수의 알려진 물체와 대응하는 스펙클 데이터를 필요로 하며, 전송 행렬이 정확히 추정된 이후에도 Wirtinger Flow, Gerchberg‑Saxton, PhaseLift 등 복잡한 최적화 알고리즘을 반복 실행해야 하므로 계산 비용이 매우 크다. 본 논문은 이러한 두 단계 과정을 하나의 엔드투엔드 신경망인 TCNN(Transforming Convolutional Neural Network)으로 통합한다. 핵심 아이디어는 스펙클 강도 b와 물체 이미지 x 사이에 존재하는 비선형 매핑 g를 직접 학습하는 것이다. 이 매핑은 이론적으로는 충분히 복잡한 신경망 구조와 충분한 학습 데이터가 주어지면 보편 근사 정리(Universal Approximation Theorem)에 의해 임의의 정확도로 근사 가능함을 증명한다. TCNN은 크게 두 부분으로 구성된다. 첫 번째 부분(gΘ₁)은 입력 스펙클 패턴의 다중 스케일 특징을 추출한다. 입력은 2×, 4×, 8× 다운샘플링 블록을 거쳐 각각의 해상도로 축소되며, 이후 5개의 Residual 블록(각 블록은 두 개의 컨볼루션‑배치정규화‑ReLU 레이어와 스킵 연결)으로 고차원 특징을 학습한다. 이렇게 얻어진 특징 맵은 3, 2, 1배 업샘플링 블록을 통해 원래 해상도로 복원된다. 업샘플링 과정에서는 디컨볼루션 대신

다중산란 매체 이미지 복원을 위한 엔드투엔드 변환 합성곱 신경망

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기