다중산란 매체 이미지 복원을 위한 엔드투엔드 변환 합성곱 신경망

본 논문은 위상 정보를 잃은 스펙클 패턴으로부터 물체 영상을 복원하는 문제를 다룬다. 기존의 이중 위상 복원(double phase retrieval) 방식은 전송 행렬을 추정한 뒤 다시 위상 복원을 수행해 계산량이 크다. 저자들은 두 과정을 하나의 엔드투엔드 신경망(TCNN)으로 통합하고, 변환 레이어를 도입해 스펙클 도메인과 이미지 도메인 사이의 변환을 학습한다. 실험 결과 TCNN은 기존 최첨단 방법과 동등한 복원 품질을 보이며, 특히 추…

저자: Ziyang Yuan, Hongxia Wang

다중산란 매체 이미지 복원을 위한 엔드투엔드 변환 합성곱 신경망
다중 산란 매체를 통과한 빛은 복잡한 다중 반사와 회절을 겪으며 위상 정보를 크게 손실시킨다. CCD나 CMOS와 같은 일반적인 이미지 센서는 이러한 스펙클 패턴의 강도만을 기록하므로, 원본 물체를 복원하기 위해서는 위상 복원(phase retrieval)이라는 본질적으로 비선형이고 불안정한 역문제를 해결해야 한다. 기존 연구에서는 전송 행렬 A를 먼저 추정한 뒤, 알려진 A를 이용해 위상 복원을 수행하는 이중 위상 복원(double phase retrieval) 방법이 제안되었다. 이 방법은 전송 행렬을 추정하기 위해 다수의 알려진 물체와 대응하는 스펙클 데이터를 필요로 하며, 전송 행렬이 정확히 추정된 이후에도 Wirtinger Flow, Gerchberg‑Saxton, PhaseLift 등 복잡한 최적화 알고리즘을 반복 실행해야 하므로 계산 비용이 매우 크다. 본 논문은 이러한 두 단계 과정을 하나의 엔드투엔드 신경망인 TCNN(Transforming Convolutional Neural Network)으로 통합한다. 핵심 아이디어는 스펙클 강도 b와 물체 이미지 x 사이에 존재하는 비선형 매핑 g를 직접 학습하는 것이다. 이 매핑은 이론적으로는 충분히 복잡한 신경망 구조와 충분한 학습 데이터가 주어지면 보편 근사 정리(Universal Approximation Theorem)에 의해 임의의 정확도로 근사 가능함을 증명한다. TCNN은 크게 두 부분으로 구성된다. 첫 번째 부분(gΘ₁)은 입력 스펙클 패턴의 다중 스케일 특징을 추출한다. 입력은 2×, 4×, 8× 다운샘플링 블록을 거쳐 각각의 해상도로 축소되며, 이후 5개의 Residual 블록(각 블록은 두 개의 컨볼루션‑배치정규화‑ReLU 레이어와 스킵 연결)으로 고차원 특징을 학습한다. 이렇게 얻어진 특징 맵은 3, 2, 1배 업샘플링 블록을 통해 원래 해상도로 복원된다. 업샘플링 과정에서는 디컨볼루션 대신

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기