PVM 기반 Radiance 병렬 구현과 초고속 이미지 분할

본 논문은 Parallel Virtual Machine(PVM)을 이용해 Greg Ward의 Radiance 렌더링 코드를 분산 구현한다. 주요 가속 기법인 quincunx 샘플링을 그대로 유지하면서, 장면의 octree와 로컬 앰비언트 값을 모든 워크스테이션에 복제·공유한다. 정적·동적 이미지 파티셔닝 기법을 설계해 스캔바와 윈도우 단위로 작업을 나누고, 서버‑클라이언트 구조에서 자동 부하 균형을 적용한다. 8대 워크스테이션 네트워크에서 7.…

저자: Francisco R. Villatoro, Antonio J. Nebro, Jose E. Fern

본 논문은 전통적인 전역 조명 렌더링 패키지인 Radiance를 병렬화하기 위해 Parallel Virtual Machine(PVM) 툴을 활용한 분산 구현 방식을 제안한다. Radiance는 광선 추적, 경로 추적, 몬테카를로 적분을 혼합한 하이브리드 렌더러로, 대규모 건축 시각화에 널리 사용되지만 계산 비용이 매우 높아 병렬 처리가 필수적이다. 기존 Radiance는 메모리 공유 방식(rpiec)이나 프레임 단위 분산 실행만을 제공했으며, 이는 메모리 제약과 부하 불균형 문제를 안고 있었다. 논문은 Radiance의 세 가지 핵심 가속 기법—octree 기반 객체 계층화, 로컬 앰비언트 값 저장, 그리고 quincunx 샘플링—을 그대로 유지하면서 병렬화를 설계한다. 첫 번째 단계로, 서버 프로세스가 장면 octree를 생성하고 이를 모든 클라이언트에 복제한다. 두 번째로, 각 클라이언트는 로컬 앰비언트 값을 계산하면서 즉시 브로드캐스트하여 전역 일관성을 확보한다. 이는 순차 실행보다 빠른 수렴을 가능하게 하며, 간접 조명 계산에 필요한 레이 수를 감소시킨다. 이미지 파티셔닝은 정적과 동적 두 가지 접근법으로 나뉜다. 정적 파티셔닝에서는 이미지 전체를 스캔바(연속 스캔라인 집합) 단위로 나누고, 각 스캔바의 계산 비용을 사전 레이 샘플링(무작위 기본 레이 트레이싱)으로 추정한다. 추정된 비용을 기반으로 비용이 균등하도록 스캔바를 그룹화하고, 각 그룹을 프로세서에 할당한다. 작업이 끝난 프로세서는 서버에 요청을 보내며, 서버는 남은 작업량이 큰 프로세서에서 작업을 절반씩 나눠 아이들 프로세스에 재분배한다. 이때 스캔바 간 공유 스캔라인을 정확히 전달해 quincunx 샘플링의 중복 계산을 방지한다. 동적 파티셔닝은 작업 풀(pool)에서 스캔바 혹은 고정 크기 윈도우(이미지 블록)를 꺼내어 처리한다. 클라이언트가 작업을 마치면 즉시 새로운 블록을 요청하고, 서버는 부하 상황에 따라 블록 크기를 조정한다. 윈도우 기반 방식은 특히 복잡한 장면에서 부하 변동이 심할 때 유리하며, 전체 프로세스가 항상 작업을 수행하도록 보장한다. 또한, 애니메이션 시퀀스 렌더링을 위해 프레임 간 로컬 앰비언트 값을 재사용하고, 프레임 종료 시 최신 값을 브로드캐스트함으로써 초선형 속도 향상을 달성하였다. 실험은 8대의 이기종 UNIX 워크스테이션(네트워크 대역폭 제한)에서 수행되었다. 정적 파티셔닝은 평균 7.5배, 동적 파티셔닝은 8배에 가까운 속도 향상을 보였으며, 특히 복잡도가 높은 장면에서는 동적 파티셔닝이 정적보다 일관된 부하 분산을 제공해 전체 실행 시간을 크게 단축하였다. 그러나 모든 프로세스가 동일한 octree와 로컬 앰비언트 octree를 메모리에 보관해야 하므로, 메모리 용량이 제한적인 경우 처리 가능한 장면 규모에 제약이 있다. 또한, 로컬 앰비언트 값의 빈번한 브로드캐스트는 네트워크 트래픽을 증가시켜, 대규모 클러스터에서는 통신 오버헤드가 성능에 영향을 미칠 수 있다. 결론적으로, 본 연구는 Radiance의 핵심 가속 구조를 손상시키지 않으면서 PVM 기반 메시지 전달 모델을 이용해 효율적인 이미지 파티셔닝과 부하 균형을 구현한 점이 가장 큰 공헌이다. 정적·동적 파티셔닝을 비교·조합함으로써 다양한 하드웨어 환경에 적용 가능한 유연한 병렬 프레임워크를 제공하고, quincunx 샘플링을 그대로 유지함으로써 결과 이미지의 재현성을 보장한다. 향후 연구에서는 메모리 사용량을 최소화하는 octree 압축 기법과 통신 오버헤드를 줄이는 비동기 브로드캐스트 전략을 탐색함으로써 더욱 큰 클러스터에서도 확장성을 확보할 수 있을 것으로 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기