SRP PHAT 오픈소스 구현 평가와 LOCATA 챌린지 적용

본 논문은 SRP‑PHAT 기반 다채널 음원 위치 추정 알고리즘의 효율적이고 유연한 오픈소스 구현을 제시한다. 구현된 MATLAB 툴박스를 LOCATA 2018 챌린지의 단일 음원 과제(정적·동적 배열)에서 평가했으며, 기존 MUSIC 기반 베이스라인 대비 평균 방위 오차가 2~6배 감소하고 20° 이하 오차 성공률이 92% 이상에 달한다는 결과를 보고한다.

저자: Romain Lebarbenchon, Ewen Camberlein, Diego di Carlo

본 논문은 다채널 음원 위치 추정을 위한 SRP‑PHAT 알고리즘의 오픈소스 구현과 이를 LOCATA 2018 챌린지 데이터셋에 적용한 평가 결과를 상세히 기술한다. 서론에서는 기존 TDOA 기반 방법들, 특히 GCC‑PHAT이 단일 마이크 쌍에서 좋은 성능을 보였음에도 불구하고 다채널 확장 구현이 부족했음을 지적한다. 이를 보완하기 위해 SRP‑PHAT의 원리를 재정리하고, 구현 시 고려해야 할 파라미터(시간·주파수 풀링, 탐색 그리드 해상도, 마이크 쌍 좌표 변환)와 구현상의 선택지를 체계적으로 문서화한다. 알고리즘 설명에서는 (1) 로컬 각도 스펙트럼 φ(t,f,θ,φ)의 정의와 GCC‑PHAT 가중치의 수식적 전개, (2) 다채널 확장을 위한 마이크 쌍별 스펙트럼 계산, (3) 전역 좌표계로의 매핑 및 풀링 절차를 4단계로 구분한다. 특히 마이크 쌍마다 AOAs를 5° 해상도로 재샘플링하고, 선형 보간을 통해 원래 그리드에 복원함으로써 연산량을 크게 줄이는 전략을 강조한다. 풀링은 마이크 쌍·주파수 차원에서 합산 후 시간 차원에서 최대값을 취해 전역 스펙트럼 Φ(θ,φ)를 만든다. 최종적으로 단일 피크를 찾아 방위와 고도를 추정한다. 실험에서는 두 종류의 배열, 12채널 로봇 헤드와 32채널 Eigenmike를 사용한다. 로봇 헤드에서는 모든 66개의 마이크 쌍을 활용하고, Eigenmike에서는 90° 이하 거리 차이를 가진 240개의 쌍만 선택해 복잡도를 제어한다. 분석 파라미터는 16 kHz 샘플링, 64 ms STFT 프레임(1024 샘플), 50 % 오버랩, 사인 윈도우, 256–512 ms 슬라이딩 윈도우(256 ms 간격)이며, 각 윈도우마다 15개의 푸리에 프레임을 얻는다. 탐색 공간은 1° 해상도의 구면 격자(azimuth, elevation)이며, 마이크 쌍별 AOAs는 5° 해상도로 계산한다. 평가 결과는 표 1에 정리되어 있다. 로봇 헤드 배열은 정적 상황(task 1)에서 평균 방위 오차 1.51°, 고도 오차 1.71°를 기록했으며, 성공률(오차 < 20°)이 99.9%에 달한다. 동적 상황(task 3, 5)에서도 평균 방위 오차가 4–8°, 고도 오차가 2–4° 수준으로 높은 정확도를 유지한다. Eigenmike는 정적 상황에서 평균 방위 오차 2.48°, 고도 오차 1.75°, 성공률 95.8%를 보였으며, 동적 상황에서도 평균 방위·고도 오차가 각각 5.84°·2.94° 이하, 성공률 94.8%를 기록한다. 이러한 성능은 동일 데이터셋에 대한 MUSIC 기반 베이스라인 대비 방위 오차가 2~6배 감소하고, 성공률이 현저히 높다는 점에서 SRP‑PHAT 구현의 우수성을 입증한다. 결론에서는 구현된 MATLAB 툴박스(Multichannel BSS Locate)의 유연성을 강조한다. 배열 기하학, 신호 특성, 환경 조건에 따라 파라미터를 손쉽게 조정할 수 있으며, 두 채널 방법을 다채널로 일반화하는 프레임워크를 제공한다. 현재는 단일 음원 추정에 초점을 맞추었으며, 다중 음원 카운팅·트래킹 기능은 향후 업데이트 계획에 포함된다. 또한 실시간 처리와 GPU 가속, 자동 파라미터 튜닝 등을 통해 실용성을 높일 방안을 제시한다. 전반적으로 이 연구는 SRP‑PHAT 알고리즘을 실제 복잡한 실내 환경에 적용할 수 있는 실용적인 도구와 성능 검증을 제공함으로써, 음향 신호 처리 및 로봇 청각 분야 연구자들에게 중요한 참고 자료가 될 것이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기