시야를 넘어서는 파노라마 영역 적응 분할

본 논문은 기존 핀홀 카메라로 학습된 모델을 360° 파노라마 이미지에 적용하면서, 시야각(FoV) 변형과 미지 클래스(오픈셋) 문제를 동시에 해결하는 새로운 프레임워크 EDA‑PSeg을 제안한다. 핵심 모듈인 Euler‑Margin Attention(EMA)은 각도 마진을 도입해 시점 불변성을 강화하고, 진폭·위상 조절을 통해 미지 클래스 구분 능력을 향상한다. Graph Matching Adapter(GMA)는 고차원 그래프 관계를 구축해…

저자: Yuanfan Zheng, Kunyu Peng, Xu Zheng

본 논문은 “Seeing Beyond: Extrapolative Domain Adaptive Panoramic Segmentation”이라는 제목 아래, 핀홀 카메라(일반적인 시야)에서 학습된 모델을 360° 파노라마 이미지에 적용하면서 두 가지 핵심 문제—시야각(FoV) 변형과 오픈셋(미지 클래스) 문제—를 동시에 해결하는 새로운 프레임워크 EDA‑PSeg을 제안한다. 1. **문제 정의 및 동기** - 기존 Cross‑Domain Panoramic Segmentation(CPS) 연구는 주로 닫힌 클래스 집합을 전제로 하며, 핀홀 이미지와 파노라마 이미지 사이의 기하학적 왜곡을 보정하거나 패치‑단위 어텐션을 적용해 시야 차이를 완화한다. 그러나 실제 자율주행·로봇 환경에서는 카메라 시야 밖에 존재하는 물체나 새로운 도로 표지판 등 미지 클래스가 빈번히 등장한다. 따라서 “오픈셋 도메인 적응”과 “시야 변형”을 동시에 고려한 접근이 필요하다. 2. **프레임워크 개요** - **입력/출력**: 소스 도메인 D_s 은 라벨이 있는 핀홀 이미지, 타깃 도메인 D_t 은 라벨이 없는 파노라마 이미지. 소스 라벨 집합 Y_s 에 미지 클래스 Y_u 를 추가해 Y_t = Y_s ∪ Y_u 로 정의한다. - **전체 파이프라인**: 이미지 → 백본 인코더‑디코더 → Euler‑Margin Attention(EMA) → Graph Matching Adapter(GMA) → 최종 세그멘테이션. 3. **Euler‑Margin Attention (EMA)** - **복소수 임베딩**: 피처 V∈ℝ^{B×N×d} 를 실수 r와 허수 s로 분리하고, V = r + i·s 로 복소수 형태로 변환한다. - **각도 마진**: 각도 θ 에 학습 가능한 마진 m을 도입해 θ∈

시야를 넘어서는 파노라마 영역 적응 분할

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기