GeoHCC: 기하학 기반 계층형 컨텍스트 압축으로 3D 가우시안 스플래팅 효율 극대화
** GeoHCC는 3D Gaussian Splatting(3DGS)에서 발생하는 거대한 저장 비용을 줄이기 위해, 앵커 간의 기하학적 상관관계를 활용한 두 단계 압축 방식을 제안한다. 첫 단계인 Neighborhood‑Aware Anchor Pruning(NAAP)은 인접 앵커들의 위치·불투명도 정보를 그래프 형태로 결합해 중요도를 평가하고, 중복된 앵커를 인접한 중요한 앵커와 병합한다. 두 번째 단계는 Geometry‑Guided Con…
저자: Xuan Deng, Xi, ong Meng
**
본 논문은 3D Gaussian Splatting(3DGS)이 제공하는 고품질 실시간 렌더링 능력에도 불구하고, 수백만 개에 달하는 가우시안 프리미티브가 차지하는 저장 용량이 실용적 적용을 가로막는 문제를 해결하고자 한다. 기존 연구들은 주로 프리미티브 자체를 삭제하거나 속성을 양자화하는 방식으로 압축을 시도했으며, 최근에는 앵커 기반 구조를 도입해 프리미티브를 계층적으로 클러스터링함으로써 저장 효율을 높였다. 그러나 이러한 앵커 기반 방법들은 앵커 간의 기하학적 연관성을 충분히 활용하지 못해, 프루닝 과정에서 중요한 구조적 정보를 손실하거나, 엔트로피 코딩 단계에서 부정확한 컨텍스트 모델링으로 인해 비트레이트 대비 재구성 품질이 떨어지는 한계를 보였다.
이에 저자들은 “GeoHCC”(Geometry‑aware Hierarchical Context Compression)라는 새로운 프레임워크를 제안한다. GeoHCC는 두 개의 핵심 모듈로 구성된다. 첫 번째는 **Neighborhood‑Aware Anchor Pruning (NAAP)**이며, 두 번째는 **Geometry‑Guided Convolution (GG‑Conv) 기반 계층형 엔트로피 코딩**이다.
**1) Neighborhood‑Aware Anchor Pruning (NAAP)**
NAAP는 기존의 불투명도 임계값 기반 프루닝을 대체한다. 먼저, 각 앵커를 정점으로 하고 K‑nearest 이웃(반경 r)과의 연결을 엣지로 하는 로컬 그래프 G = (A, E)를 구축한다. 여기서 각 정점은 위치 p와 평균 불투명도 ¯α(훈련 과정에서 누적된 불투명도 평균)라는 두 가지 특성을 가진다. 그래프 상에서 거리 기반 가중치 wᵢⱼ = (‖pᵢ−pⱼ‖²+ε)⁻¹ 를 계산해 인접 노드의 영향을 정량화하고, 이를 이용해 이웃 기반 불투명도 평균 Φᵢ = (¯αᵢ + Σ wᵢⱼ¯αⱼ) / (1+Σ wᵢⱼ) 를 구한다. 최종 중요도 점수 ξᵢ는 ξᵢ = (1−λ)¯αᵢ + λΦᵢ 로 정의되며, λ는 로컬·글로벌 중요도 비중을 조절한다. 점수가 낮은 앵커는 가장 높은 ξ를 가진 이웃에 속성을 병합하고 삭제한다. 병합 시 위치, 스케일, 오프셋 등 모든 속성이 전달되므로, 구조적 연속성을 유지하면서도 중복을 크게 줄일 수 있다.
**2) Geometry‑Guided Convolution (GG‑Conv) 기반 계층형 엔트로피 코딩**
프루닝 후 남은 앵커는 다중 레벨 계층 구조로 조직된다. 각 레벨은 이전 레벨에서 예측된 속성 및 현재 레벨의 로컬 그래프 정보를 입력받는다. 여기서 핵심은 GG‑Conv이다. 전통적인 3D 컨볼루션은 규칙적인 격자 형태에 최적화돼 있지만, 앵커 클라우드는 불규칙하고 밀도가 가변적이다. GG‑Conv는 그래프 신경망(GNN) 아이디어를 차용해, 각 정점의 피처 f와 위치 p를 결합한 임베딩을 만든 뒤, 인접 노드들의 가중합(거리 가중치와 평균 불투명도 기반)으로 컨텍스트 벡터를 생성한다. 이 컨텍스트는 MLP에 전달돼 각 속성(색상, 불투명도, 스케일, 회전 등)의 조건부 평균 μ와 표준편차 σ를 예측한다. 이렇게 얻은 확률 분포를 바탕으로 arithmetic coding을 수행해 비트스트림을 생성한다.
엔트로피 모델은 손실 함수 L = λ_R·R + λ_D·D 로 최적화된다. 여기서 R은 실제 비트레이트, D는 재구성 손실(PSNR 기반)이며, λ_R·λ_D는 RD 트레이드오프를 조절한다. 실험에서는 λ_R=0.01, λ_D=1.0 정도가 최적으로 발견되었다.
**실험 및 결과**
저자들은 대표적인 복합 장면 데이터셋인 BungeeNeRF를 포함해 여러 실험을 수행했다. 주요 비교 대상은 Scaled‑GS, HAC, HAC++, Context‑GS, CAT‑3DGS 등 기존 앵커 기반 압축 기법이다. 평가 지표는 저장 용량(MB), PSNR(dB), 그리고 실시간 렌더링을 위한 FPS이다. GeoHCC는 동일한 PSNR(≈30 dB)에서 저장 용량을 20 ~ 30 % 감소시켰으며, FPS는 기존 방법과 거의 동일하거나 약간 향상되었다. 특히 저밀도 영역에서 NAAP가 구조적 연속성을 유지함으로써, 기존 방법이 발생시키는 경계 왜곡을 크게 감소시켰다.
**기여 요약**
- **기하학적 그래프 기반 프루닝**: 로컬 기하학 정보를 활용해 구조 손실 없이 중복 앵커를 효율적으로 제거.
- **경량 GG‑Conv 설계**: 불규칙한 앵커 클라우드에 적합한 그래프 컨볼루션으로, 엔트로피 모델의 컨텍스트 예측 정확도 향상.
- **RD 최적화 프레임워크**: 비트레이트와 재구성 품질을 동시에 고려한 손실 함수 설계 및 실험적 검증.
**한계와 향후 연구**
- K‑nearest와 반경 r 파라미터가 장면마다 최적값이 다르므로, 자동 파라미터 튜닝 메커니즘이 필요하다.
- 대규모 장면에서 GG‑Conv의 메모리 사용량이 증가할 수 있어, 메모리 효율적인 샘플링 및 배치 처리 기법이 요구된다.
- 현재는 불투명도와 위치 중심의 중요도만 사용했지만, 색상·시점·구면조화 등 다중 속성 간 상관관계를 통합하면 압축 효율이 더욱 개선될 가능성이 있다.
종합적으로, GeoHCC는 3DGS 압축 분야에서 기하학적 정보를 적극 활용함으로써, 저장 효율과 렌더링 품질 사이의 균형을 크게 개선한 혁신적인 접근법이라 할 수 있다.
**
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기