쿼터니온 CNN으로 3D 사운드 이벤트 탐지·위치 추정
본 논문은 1차 오더 앰비소닉 마이크로폰으로 얻은 구면조화 성분을 하나의 사원수(쿼터니온) 신호로 결합하고, 이를 전용 쿼터니온 합성곱 신경망(QCNN)으로 처리하여 3차원 사운드 이벤트 탐지(SED)와 방향 추정(DOA)을 공동 학습한다. 실험 결과, 기존 실수값 CNN 기반 SELDnet 대비 SED와 DOA 모두에서 향상된 정확도를 보이며, 특히 상관관계가 높은 앰비소닉 채널을 하나의 다차원 엔티티로 다루는 것이 성능 개선에 크게 기여함을…
저자: Danilo Comminiello, Marco Lella, Simone Scardapane
본 논문은 3차원 사운드 이벤트 탐지와 위치 추정을 동시에 수행하는 SELD(Sound Event Detection and Localization) 문제에 대해, 사원수(쿼터니온) 기반 합성곱 신경망(QCNN)을 제안한다. 연구 배경으로는 1차 오더 앰비소닉 마이크로폰이 제공하는 네 개의 채널(W, X, Y, Z)이 물리적으로 강하게 상관관계를 가지며, 이를 실수값으로 각각 처리하면 채널 간 연관성을 충분히 활용하지 못한다는 점을 들었다. 따라서 네 채널을 하나의 사원수 신호 \(x
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기