소수인자 알고리즘 기반 무곱셈 DFT 근사 설계

본 논문은 소수인자 알고리즘(PFA)을 활용해 3·11·31 크기의 소규모 DFT 근사를 결합, 1023점 DFT를 완전 무곱셈(덧셈·시프트만) 형태로 구현한다. 기존 Cooley‑Tukey 기반 근사와 비교해 연산량과 근사 오차 모두에서 우수함을 입증한다.

저자: L. Portella, F. M. Bayer, R. J. Cintra

본 논문은 디지털 신호 처리에서 핵심적인 변환인 DFT(Discrete Fourier Transform)의 연산 복잡도를 크게 낮추는 새로운 무곱셈 근사 방법을 제시한다. 기존의 DFT 근사 연구는 주로 2의 거듭제곱 길이(8, 16, 32 등)에 초점을 맞추었으며, Cooley‑Tukey FFT 기반으로 작은 블록 근사를 재조합하는 방식이 일반적이었다. 그러나 Cooley‑Tukey 알고리즘은 단계마다 트윌드 팩터 ωⁿ을 곱해야 하므로, 근사 블록을 무곱셈 형태로 설계하더라도 전체 변환에서는 여전히 곱셈이 남는다. 이 문제를 해결하고자 저자들은 Prime Factor Algorithm(PFA, Good‑Thomas 알고리즘)을 기반으로 설계 전략을 전환한다. PFA는 N = N₁·N₂·…·N_k 로 서로소인 인수들로 분해된 경우, 입력 신호를 2‑차원 배열로 재배열하고 각 차원에 대해 독립적인 작은 DFT를 수행한 뒤 다시 1‑차원으로 복원한다. 이 과정에서 트윌드 팩터가 전혀 등장하지 않으며, 인수별 DFT만 수행하면 된다. 따라서 저자는 N = 1023 = 3·11·31 라는 비2ⁿ 길이를 선택하고, 각각 3‑point, 11‑point, 31‑point DFT에 대해 완전 무곱셈 근사를 설계한다. 무곱셈 근사의 핵심은 행렬 원소를 제한된 집합 P = {0, ±1, ±½} 로 제한하고, 전체 변환을 스케일링 인자 α와 정수화 함수 g(·)를 이용해 근사한다. 구체적으로 정확한 DFT 행렬 F_N에 α를 곱한 뒤, g(·) (예: 반올림)으로 정수화해 저복잡도 행렬 T_N을 만든다. 이후 T_N 의 정규화 행렬 Ŝ_N = diag((T_N·T_Nᴴ)⁻¹)¹ᐟ² 를 곱해 최종 근사 행렬 ŴF_N = Ŝ_N·T_N 을 얻는다. 최적 α* 는 총 오차 에너지(ℰ), 평균 절대 백분율 오차(MAPE), 직교성 편차(φ) 세 가지 지표를 동시에 최소화하는 다목적 최적화 문제로 정의된다. 이때 α는 행렬 원소가 P 를 초과하지 않도록 제한된 구간 D 내에서 탐색한다. 각 소규모 DFT(3, 11, 31) 에 대해 위 절차를 적용하면, 3‑point DFT는 4개의 덧셈, 11‑point DFT는 54개의 덧셈, 31‑point DFT는 144개의 덧셈만 필요함을 확인한다(구체적인 연산 수는 논문 표에 제시). 이러한 무곱셈 블록을 PFA 구조에 삽입하면 전체 1023‑point DFT는 다음과 같은 연산 흐름을 가진다: (1) 입력을 3×341 배열로 매핑, (2) 각 열에 11‑point 무곱셈 DFT 적용, (3) 각 행에 31‑point 무곱셈 DFT 적용, (4) 최종 행/열 재배열을 통해 출력 획득. 전체 연산에서 실수 곱셈은 전혀 없으며, 덧셈은 약 2 200회, 비트 시프트는 약 1 100회 정도로 추정된다. 이는 기존 Cooley‑Tukey 기반 1024‑point 근사(실제 곱셈 2 883개, 덧셈 25 155개)와 비교해 100배 이상 연산량이 감소한 것이다. 오차 측면에서도 논문은 세 가지 지표 모두에서 기존 방법보다 우수함을 보인다. 총 오차 에너지는 약 0.018 (기존 0.045), MAPE는 0.42 % (기존 1.2 %), 직교성 편차는 0.001 (기존 0.008) 수준으로, 근사 변환이 원본 DFT와 거의 동일한 스펙트럼 특성을 유지함을 확인한다. 특히 직교성 편차가 거의 0에 가까워 수치적 안정성이 확보되며, 이는 실제 시스템에서 누적 오차가 최소화된다는 의미이다. 논문은 또한 설계 범위와 확장성을 논의한다. PFA는 서로소인 인수 분해가 가능한 모든 N에 적용 가능하므로, 2·3·5·7·11·13 등 다양한 비2ⁿ 길이에 대해 동일한 설계 흐름을 적용할 수 있다. 또한 하이브리드 방식으로, 2의 거듭제곱 인수는 기존 radix‑2 FFT로 처리하고, 나머지 인수는 무곱셈 PFA 방식으로 처리하는 혼합 전략도 제시한다. 이는 실제 하드웨어 설계 시 자원 배분을 최적화하는 데 유용하다. 마지막으로, 저자들은 무곱셈 근사가 저전력·저면적 임베디드 시스템, IoT 디바이스, 5G/6G 빔포밍, 디지털 라디오 등 다양한 응용 분야에서 큰 장점을 제공한다고 주장한다. 특히 변환 길이가 고정되지 않고 유동적인 상황(예: 적응형 OFDM, 동적 채널 등)에서도 PFA 기반 설계는 유연성을 제공한다. 향후 연구 과제로는 더 큰 소인수 조합에 대한 자동 최적화 도구 개발, 하드웨어 구현 시 실제 전력·면적 측정, 그리고 실시간 시스템에 적용한 성능 평가가 제시된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기