적대적 페어 언믹스‑앤‑리믹스를 이용한 무감독 단일채널 블라인드 소스 분리

본 논문은 깨끗한 소스 데이터 없이도 단일채널 혼합 신호를 분리할 수 있는 새로운 무감독 방법을 제안한다. 두 혼합 신호를 마스크 기반으로 임시 분리한 뒤, 서로의 소스를 교환해 새로운 혼합 신호를 만든다. 원본과 재구성된 혼합 신호의 분포가 동일하도록 GAN 기반 판별자를 학습하고, 에너지 균형 및 사이클 복원 손실을 추가해 트리비얼 해를 방지한다. 이미지 데이터(MNIST, Shoes/Bags) 실험에서 기존 무감독 기법(RPCA, GLO)…

저자: Yedid Hoshen

적대적 페어 언믹스‑앤‑리믹스를 이용한 무감독 단일채널 블라인드 소스 분리
본 논문은 단일채널 블라인드 소스 분리(BSS) 문제를 무감독 방식으로 해결하기 위해 “Adversarial Pair Unmix‑and‑Remix”(APUR)라는 새로운 프레임워크를 제안한다. 기존 BSS 방법들은 저‑랭크, 스파시티, 시간 연속성 등 강력한 선험적 프라이어를 필요로 했으며, 최근에는 깨끗한 소스 데이터를 이용한 지도 학습 기반 딥러닝이 성능을 크게 끌어올렸다. 그러나 완전 무감독 상황, 즉 어떤 소스의 클린 샘플도 없는 경우에는 여전히 성능이 제한적이었다. APUR은 두 개의 혼합 신호 y₁, y₂를 임의로 선택하고, 동일한 마스크 함수 M(y) (신경망으로 파라미터화)를 통해 각각 추정 소스 fₓ₁ = y₁·M(y₁), b₁ = y₁·(1‑M(y₁))와 fₓ₂, b₂를 만든다. 여기서 마스크는 곱셈 형태이므로 원본 신호와 같은 차원에서 직접 작동한다. 이후 두 신호의 소스를 교차 결합해 새로운 혼합 신호 z₁ = fₓ₁ + b₂, z₂ = fₓ₂ + b₁을 만든다. 이때 원본 혼합 신호와 새로운 혼합 신호는 동일한 확률 분포를 가져야 한다는 가정을 두고, LS‑GAN 기반 판별자 D를 도입해 두 분포를 매칭한다. 판별자 D는 실제 혼합 신호 y와 합성 혼합 신호 z를 구분하도록 학습되며, 마스크 M은 D를 속여 z가 y와 구분되지 않도록 역전파한다. 이 과정만으로는 “전체를 그대로 복원하고 한 소스를 0으로 만드는” 트리비얼 해가 존재한다. 이를 방지하기 위해 에너지 균형 손실 L_E = Σ_y

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기