복합 환경에서 최적의 양쪽 귀 BLCMV 빔포밍 설계와 실험 검증

본 논문은 헤드마운트 보조청취장치용 양쪽 귀 최소분산전력(BLCMV) 빔포머의 간섭 스케일링 파라미터를 이론적으로 최적화하고, 카페테리아에서 측정한 임펄스 응답을 이용해 짧은 관측 구간에서도 안정적인 잡음 감소와 양쪽 귀 단서 보존이 가능함을 실험적으로 입증한다. 또한, 추정 오류에 강인하도록 파라미터에 상한·하한 임계값을 적용하는 방법을 제안한다.

저자: N. G"o{ss}ling, D. Marquardt, I. Merks

복합 환경에서 최적의 양쪽 귀 BLCMV 빔포밍 설계와 실험 검증
본 논문은 헤드마운트 보조청취장치(HA)에서 사용되는 양쪽 귀 최소분산전력(BLCMV) 빔포머의 설계와 실험적 검증을 다룬다. 서론에서는 청취 보조기기의 핵심 목표가 음성 명료도와 청취 인텔리전스를 향상시키는 동시에 청취자가 주변 음향 장면을 공간적으로 인식할 수 있도록 양쪽 귀 단서(ITD, ILD)를 보존하는 것임을 강조한다. 기존의 BMVDR은 목표 음원의 단서만 보존하고 방해원의 단서는 왜곡시키는 한계가 있으며, BLCMV는 추가적인 간섭 스케일링 제약을 도입해 방해원까지 단서를 유지하도록 설계되었다. 이론적 배경에서는 마이크 어레이 모델을 2M 차원(좌·우 각각 M개의 마이크)으로 정의하고, 신호 모델을 원하는 음성 x, 방해원 uₚ, 백그라운드 잡음 n으로 분리한다. 각 성분의 상관 행렬 Rₓ, Rᵤ, Rₙ을 정의하고, 전체 상관 행렬 R = Rₓ + Rᵤ + Rₙ을 도출한다. BMVDR‑RTF 빔포머는 목표 음원의 RTF a_L, a_R를 보존하면서 출력 전력을 최소화하는 제약 최적화 문제로, 해는 w_MVDR = R⁻¹ a / (aᴴ R⁻¹ a) 형태이다. BLCMV는 여기서 방해원 p에 대한 스케일링 파라미터 δ_{L,p}, δ_{R,p}을 추가한다. 제약식은 wᴴ b_{L,p} = δ_{L,p}·a_Lᴴ b_{L,p}, wᴴ b_{R,p} = δ_{R,p}·a_Rᴴ b_{R,p} 로 표현되며, b_{L,p}, b_{R,p}는 방해원의 RTF이다. 라그랑주 승수를 이용해 최적화하면, δ 파라미터가 목표 음원과 방해원의 전력 비율, 그리고 추정된 상관 행렬의 정확도에 따라 결정되는 폐쇄형 해가 얻어진다. 수식 (21)‑(25)에서 최적 δ는 w_RTF⁻¹·C·Cᴴ·w_RTF 형태로 나타나며, 여기서 C는 제약 행렬이다. 실제 시스템에서는 상관 행렬과 RTF를 제한된 시간 구간에서 추정해야 한다. 짧은 구간일수록 표본 수가 적어 추정 편차가 커지고, 이는 δ 값이 0 ~ 1 범위를 벗어나게 만든다. 이를 방지하기 위해 논문은 δ_thr = min(max(δ, δ_min), δ_max) 형태의 상한·하한 클리핑을 제안한다. δ_min과 δ_max는 관측 길이와 방해원 SNR에 기반한 경험적 함수이며, 실험을 통해 δ_max ≈ 0.8, δ_min ≈ 0.2가 적절함을 확인했다. 실험 설정은 다음과 같다. 2 × 6 마이크 어레이(좌·우 각각 6개)를 사용하고, 실제 청각 보조기기의 임펄스 응답을 카페테리아(테이블, 의자, 사람들의 움직임)에서 측정하였다. 목표 음원은 앞쪽 0°에 위치한 스피커, 방해원은 좌·우 ±30°, ±60°에 배치된 3개의 스피커, 그리고 배경 잡음은 실내 환경 잡음으로 구성하였다. 관측 구간은 100 ms, 250 ms, 500 ms, 1 s 네 가지로 설정하고, 각 구간마다 500번의 무작위 시뮬레이션을 수행했다. 성능 평가는 (1) SNR 향상, (2) SINR 향상, (3) 방해원 ITD/ILD 오류, (4) 전체 단서 오류(SINR + ITD/ILD)로 측정하였다. 결과는 크게 두 가지로 요약된다. 첫째, BLCMV는 BMVDR 대비 평균 5‑7 dB의 추가적인 잡음 감소를 제공하면서, 방해원 ITD/ILD 오류를 30 % 이상 감소시켰다. 특히 250 ms 구간에서는 SNR 향상이 6.2 dB, 방해원 단서 오류가 0.12 ms(ITD)와 1.5 dB(ILD) 수준으로 크게 개선되었다. 둘째, δ_thr를 적용한 경우, 특히 100 ms와 250 ms 구간에서 단서 오류가 추가로 15 %‑40 % 감소했으며, SNR 손실은 거의 없었다. 이는 추정 오류가 큰 상황에서도 파라미터 클리핑이 빔포머의 안정성을 보장한다는 것을 의미한다. 관측 구간이 1 s 이상으로 늘어나면 성능이 약간 개선되지만, 실시간 청취 보조기기의 지연 제한을 고려하면 250 ms~500 ms가 실용적인 최적 구간임을 확인했다. 마지막으로 논문은 실시간 구현을 위한 계산 복잡도 분석을 제공한다. BLCMV의 핵심 연산은 상관 행렬 역행렬과 δ 파라미터 계산이며, 이들은 FFT 기반의 빠른 업데이트와 정규화된 샘플 평균을 이용해 2 ms 이내에 처리 가능함을 시뮬레이션으로 입증했다. 따라서 제안된 최적 δ 파라미터와 임계값 클리핑 전략은 현재 상용 HA에 바로 적용할 수 있는 실용적인 설계 가이드라인을 제공한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기