음악 장르 분류를 위한 딥러닝·전통 머신러닝 비교 연구
본 논문은 Audio Set 데이터셋의 7개 장르를 대상으로, MEL 스펙트로그램만을 입력으로 하는 VGG‑16 기반 CNN과, 시간·주파수 영역에서 추출한 27개의 손수 만든 특징을 활용한 전통 머신러닝(로지스틱 회귀, 랜덤 포레스트, 그래디언트 부스팅, SVM) 모델을 비교한다. 전처리, 모델 설계, 정규화·드롭아웃 등 구현 세부사항을 제시하고, 특징 중요도 분석을 수행한다. 최종적으로 두 접근법을 앙상블한 모델이 AUC 0.894를 달성하…
저자: Hareesh Bahuleyan
본 논문은 음악 장르 자동 분류를 목표로, 최신 딥러닝 기법과 전통적인 머신러닝 기법을 동일 데이터셋에서 직접 비교한다. 데이터는 Google이 제공하는 Audio Set에서 음악 카테고리만 추출했으며, 7개의 장르(팝, 록, 힙합, 테크노, 리듬 블루스, 보컬, 레게)로 구성된 총 40,540개의 10초 클립을 사용한다. 원본 YouTube 비디오를 youtube‑dl로 다운로드하고, ffmpeg를 통해 22.05 kHz, 16‑bit WAV 파일로 변환한 뒤, 각 클립에 대해 프리‑엠퍼시스 필터(y
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기