스쿼시 선수 성능 평가를 위한 오디오 기반 분석 프레임워크
본 논문은 스쿼시 경기 중 발생하는 충돌음의 특성을 이용해 샷 종류를 분류하고, 충돌 위치를 고정밀로 추정하는 시스템을 제안한다. 6개의 마이크(바닥 3개, 천장 3개)를 96 kHz로 동시에 녹음하고, 통계적 검출·다중 센서 시간차 기반 위치추정·신경망 분류 모델을 결합한다. 실험 결과, 위치 오차는 약 10 cm 수준이며, 샷 종류 구분 정확도도 충분히 높아 코치와 선수에게 객관적인 퍼포먼스 피드백을 제공한다.
저자: Katalin Hajdu-Szucs, Nora Fenyvesi, Jozsef Steger
본 논문은 스쿼시 경기에서 발생하는 다양한 충돌음(공이 라켓·벽·바닥·유리 등에 맞는 소리)을 활용해 선수의 샷 종류와 정확도를 객관적으로 평가하는 시스템을 설계·구현·검증한다. 서론에서는 기존 비디오 기반 추적이 시야 제한·고가의 카메라 필요성 등으로 인해 실시간 피드백 제공에 한계가 있음을 지적하고, 저비용·고속 음향 센서를 이용한 접근법을 제안한다.
2절에서는 하드웨어 구성을 상세히 설명한다. 총 6개의 마이크가 사용되는데, 바닥에 3개의 전방향 마이크와 천장에 3개의 심장형 마이크를 배치해 3차원 음원 포착을 가능하게 한다. 모든 마이크는 Presonus AudioBox 1818VSL 사운드 카드에 연결돼 96 kHz, 24‑bit 동시 샘플링을 수행한다. 이는 1 샘플당 약 6 mm의 전파 거리 차이를 제공해, 밀리초 이하의 시간 정밀도를 확보한다. 하드웨어와 소프트웨어는 API 기반으로 제어·재구성 가능하도록 설계돼, 필요에 따라 마이크 수·위치를 조정할 수 있다.
3절에서는 충돌 이벤트 검출 알고리즘을 제시한다. 두 가지 방법을 비교한다. 첫 번째는 배경 잡음이 정규분포를 따른다는 가정 하에, 새로운 샘플이 평균·분산을 벗어나면 이벤트로 판단한다. 평균·분산은 Welford 알고리즘을 이용해 실시간으로 업데이트한다. 두 번째는 Schauerte와 Stiefelhagen이 제안한 윈도우 기반 Gaussian surprise 검출을 확장한 방법이다. 여기서는 먼저 주파수 영역에서 w‑size 윈도우의 파워 스펙트럼을 계산하고, 기존 윈도우들의 다변량 가우시안 모델과 KL divergence를 비교한다. KL divergence가 사전 정의된 임계값을 초과하면 이벤트가 발생한 것으로 판단한다. 이 방법은 잡음에 강인하며, 검출 후 시간 영역에서 미세 탐색을 수행해 정확도를 높인다.
4절은 다중 마이크를 이용한 음원 위치 추정 모델을 제시한다. 각 마이크 i에 대해 도착 시간 t_i와 거리 r_i=||r−r_i^mic|| 사이의 관계 p(t_i,r_i)= (1/√(2π)σ_i)·exp
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기