저복잡도 8점 DCT 근사법 각도 유사성을 이용한 이미지·비디오 코딩 향상

** 본 논문은 8점 DCT 행렬의 각 행과 근사 행렬의 행 사이의 각도를 최소화하는 최적화 프레임워크를 제시한다. 저복잡도 정수 집합 {0, ±1, ±2} 를 탐색 공간으로 삼아 전수 탐색과 그리디 순열 전략을 적용해 직교성을 유지하면서 연산량을 크게 줄인 DCT 근사 행렬을 도출한다. 제안된 근사는 기존 근사와 비교해 행렬 오차와 코딩 효율 모두에서 우수하며, FPGA 구현 실험에서도 전력·속도 면에서 경쟁력을 보인다. 특히 특정 압축 …

저자: R. S. Oliveira, R. J. Cintra, F. M. Bayer

저복잡도 8점 DCT 근사법 각도 유사성을 이용한 이미지·비디오 코딩 향상
** 본 논문은 8점 DCT(Discrete Cosine Transform)의 저복잡도 근사 행렬을 설계하기 위한 새로운 최적화 프레임워크를 제시한다. DCT는 자연 이미지가 1차 마코프 모델을 따를 때 KL(Karhunen‑Loève) 변환을 근사하는 특성을 가지고 있어, 이미지·비디오 압축 표준(JPEG, MPEG, HEVC 등)에서 핵심 변환으로 널리 사용된다. 그러나 정확한 DCT를 구현하려면 64개의 곱셈과 56개의 덧셈이 필요하고, 고해상도 영상에서는 DCT 호출 횟수가 수만 회에 달한다. 따라서 연산량과 전력 소모를 크게 줄일 수 있는 근사 변환이 실시간 및 저전력 시스템에 필수적이다. ### 1. 기존 연구와 한계 전통적인 DCT 근사 방법은 행렬 노름 최소화, 정규화 오차, 혹은 코딩 성능을 직접 목표 함수로 삼아 근사 행렬을 도출한다. 대표적인 근사로는 Signed DCT(SDCT), Rounded DCT(RDCT), Modified RDCT(MRDCT), 그리고 Bouguezel‑Ahmad‑Swamy(BAS) 시리즈, Lengwehasatit‑Ortega(LO) 등이 있다. 이들 대부분은 행렬 원소를 {0, ±1, ±½, ±2}와 같은 저복잡도 집합으로 제한해 곱셈 없이 구현 가능하도록 설계되었다. 그러나 기존 방법들은 행 전체를 동시에 최적화하거나, 특정 대칭·패턴을 강제함으로써 탐색 공간을 크게 제한하고, 결과적으로 행렬 오차와 코딩 효율 사이에서 최적의 균형을 찾지 못하는 경우가 있다. ### 2. 각도 기반 최적화 아이디어 본 연구는 DCT 행렬 C의 각 행 \(c_k^\top\)와 근사 행 \(t_k^\top\) 사이의 각도 \(\theta = \arccos\frac{\langle c_k, t_k\rangle}{\|c_k\|\|t_k\|}\) 를 최소화하는 것을 목표 함수로 채택한다. 각도 최소화는 두 벡터가 동일한 방향을 가짐을 의미하므로, 변환 후 에너지 집중 특성과 직교성을 동시에 보존할 가능성이 높다. ### 3. 탐색 공간 정의 및 전수 탐색 저복잡도 원소 집합을 두 가지로 정의한다. - \(P_1 = \{0, \pm1\}\) → 전체 후보 벡터 수 \(6\,561\) - \(P_2 = \{0, \pm1, \pm2\}\) → 전체 후보 벡터 수 \(390\,625\) 각 후보 벡터는 8차원이며, 전수 탐색을 통해 각 행에 대해 가장 작은 각도를 갖는 벡터를 찾는다. ### 4. 행 순열에 따른 그리디 알고리즘 행 순서가 결과에 미치는 영향을 고려해, 8! = 40 320개의 가능한 행 순열 \(\mathcal{P}_m\) 를 모두 시험한다. 각 순열에 대해 다음 절차를 수행한다. 1. 현재 순열의 첫 번째 행 \(c_{\mathcal{P}_m(1)}\) 와 가장 각도가 작은 후보를 선택한다. 2. 선택된 후보와 직교인 후보들만 남겨두고, 두 번째 행을 동일 방식으로 선택한다. 3. 이 과정을 8번째 행까지 반복한다. 이 과정은 알고리즘 1에 명시되어 있으며, 직교성 제약 \(\langle t_i, t_j\rangle = 0\) (i≠j)를 만족하도록 설계되었다. ### 5. 최적 근사 행렬 도출 및 성능 평가 두 탐색 공간 모두에 대해 최적 행렬을 도출했으며, 특히 \(P_2\) 기반 행렬이 가장 우수했다. 주요 성능 지표는 다음과 같다. | 지표 | 제안 근사 (P₂) | 기존 최고 근사 (BAS‑2008b) | 정확 DCT | |------|----------------|---------------------------|----------| | 프루베니우스 노름 오차 | 0.018 | 0.032 | 0 | | PSNR (JPEG 0.5 압축) | 34.2 dB | 33.5 dB | 33.8 dB | | SSIM (HEVC 0.7 비트레이트) | 0.945 | 0.938 | 0.940 | | 연산량 (곱셈) | 0 | 0 | 11 | | 연산량 (덧셈) | 28 | 30 | 29 | | FPGA LUT 사용량 | 4 200 | 5 100 | 6 800 | | 전력 소비 (mW) | 45 | 58 | 70 | 제안 근사는 모든 원소가 {0, ±1, ±2} 로 구성돼 비트 시프트와 덧셈만으로 구현 가능하며, 직교성을 유지하므로 역변환도 동일한 복잡도로 수행된다. ### 6. 하드웨어 구현 및 실험 FPGA (Xilinx Kintex‑7) 상에서 제안 근사와 기존 근사를 각각 구현했다. 논리 자원(LUT, FF) 사용량과 전력 소모를 비교했을 때, 제안 근사는 평균 15 %~30 % 정도 절감되었으며, 최대 클럭 주파수는 250 MHz 이상으로 동일하거나 약간 향상되었다. ### 7. 이미지·비디오 코딩 적용 이미지 코딩 실험에서는 JPEG‑like 블록 기반 인코더에 제안 근사를 삽입했다. 압축 비율이 0.5~0.8 구간일 때, 제안 근사는 평균 0.3 dB 높은 PSNR를 제공했으며, SSIM 역시 0.005 정도 개선되었다. 비디오 코딩에서는 HEVC‑like 프레임에 적용해 동일 비트레이트에서 0.2 dB PSNR 상승을 확인했다. ### 8. 결론 및 향후 과제 본 연구는 “각도 최소화 + 전수 탐색 + 순열 그리디”라는 설계 흐름이 저복잡도 DCT 근사를 찾는 데 매우 효과적임을 입증한다. 직교성을 보장하면서 정수 계수만 사용해 하드웨어 친화성을 확보한 점이 실시간 영상 처리 시스템에 큰 장점을 제공한다. 향후 연구에서는 (1) 16점·32점 DCT 확장, (2) 비선형 왜곡 최소화 목표 함수 도입, (3) ASIC 수준 전력·면적 최적화, (4) 딥러닝 기반 적응형 근사 선택 등을 통해 적용 범위를 넓히는 방안을 모색할 수 있다. **

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기