해석 가능한 SincNet 기반 컨볼루션 필터
SincNet은 첫 번째 컨볼루션 층을 파라미터화된 sinc 함수로 제한해 저·고 차단 주파수만 학습함으로써 필터 수를 크게 줄이고, 학습 속도와 성능을 향상시키며, 주파수 해석이 가능한 필터 뱅크를 제공한다. 스피커 식별과 음성 인식 실험에서 기존 CNN보다 빠르게 수렴하고 더 낮은 오류율을 기록한다.
저자: Mirco Ravanelli, Yoshua Bengio
본 논문은 음성 신호를 직접 raw waveform 형태로 입력받아 처리하는 컨볼루션 신경망(CNN)에서, 첫 번째 층의 필터가 인간이 직관적으로 이해하기 어려운 형태로 학습되는 문제점을 지적한다. 이를 해결하기 위해 저자들은 SincNet이라는 새로운 아키텍처를 제안한다. SincNet은 첫 번째 컨볼루션 층을 파라미터화된 sinc 함수 집합으로 구성하고, 각 필터를 직사각형 밴드패스 형태로 제한한다. 구체적으로, 필터의 시간 영역 임펄스 응답 g
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기