Winograd 최소 필터링 기반 CNN 가속 모듈의 하드웨어 효율적 설계

본 논문은 3‑tap FIR 필터를 이용한 2차원 컨볼루션의 기본 연산을 가속화하기 위해 Winograd 최소 필터링 알고리즘을 변형하고, 연산 벡터화를 적용한 하드웨어 모듈 구조를 제안한다. 기존의 전통적 병렬 구현이 필요로 하는 6개의 이진 곱셈기와 4개의 이진 가산기에 비해, 제안된 구조는 곱셈기를 4개, 가산기를 8개만 사용한다. ASIC과 FPGA(특히 Altera Stratix II) 구현 관점에서 모듈 설계와 자원 매핑 방식을 상세…

저자: Aleks, r Cariow, Galina Cariowa

Winograd 최소 필터링 기반 CNN 가속 모듈의 하드웨어 효율적 설계
본 논문은 컨볼루션 신경망(CNN)의 기본 연산인 2‑차원 컨볼루션 중, 특히 3‑tap FIR 필터를 이용한 1‑차원 슬라이딩 내적을 하드웨어적으로 효율화하는 방법을 제시한다. 서론에서는 CNN이 다양한 과학·산업 분야에서 폭넓게 활용되고 있으며, 컨볼루션 연산이 전체 연산량의 대부분을 차지한다는 점을 강조한다. 기존 가속 방법으로는 FFT 기반 대규모 필터 가속, GPU·ASIC·FPGA 기반 전용 가속기가 소개되지만, 현대 CNN은 작은 3×3 필터를 주로 사용하므로 FFT보다 Winograd 최소 필터링이 더 적합하다고 설명한다. 2절에서는 기본적인 3‑tap FIR 연산을 수식으로 정리한다. 직접 계산 시 두 연속된 내적을 위해 6개의 곱셈과 6개의 덧셈이 필요함을 보이며, Winograd 알고리즘을 적용하면 사전 계산 가능한 상수 조합을 이용해 곱셈을 4개, 덧셈을 8개로 줄일 수 있음을 제시한다. 여기서 중요한 점은 곱셈이 가산보다 면적·전력 소모가 크다는 전제 하에, 곱셈기 수를 최소화하는 것이 설계 목표라는 것이다. 3절에서는 Winograd 최소 필터링 모듈의 구조적 합성을 상세히 다룬다. 입력 타일 X(4×1), 필터 계수 H(3×1), 출력 Y(2×1)로 정의하고, 행렬‑벡터 연산 Y = A·S·Aᵀ·X 형태로 변환한다. 여기서 A는 고정된 4×4 변환 행렬, S는 대각 행렬이며, S의 대각 원소는 h₀±h₁, h₁±h₂ 등 사전 계산 가능한 값이다. 논문은 이를 기반으로 데이터 흐름 다이어그램을 제시하고, 곱셈기 4개와 가산기 8개로 구성된 완전 병렬 구조를 설계한다. ASIC 관점에서는 트랜지스터 수와 전력 소비를 최소화하기 위해 곱셈기와 가산기를 각각 4·8개로 배치하고, 필요 시 모듈을 직렬·병렬로 연결해 클러스터를 형성한다는 설계 방안을 제시한다. FPGA 관점에서는 Altera Stratix II DSP 블록을 활용한다. 각 DSP 블록이 4개의 곱셈기와 3개의 입력·출력 가산기를 포함하므로, 제안된 모듈을 하나의 DSP 블록 내부에 구현하고, 남은 가산 연산은 외부 로직(LUT)으로 처리한다. 이때 일부 DSP 출력이 사용되지 않음에도 불구하고 전체 연산을 한 블록에 통합함으로써 자원 활용 효율을 높인다. 4절에서는 설계의 장점과 한계를 논의한다. 곱셈기 수를 4개로 감소시킴으로써 ASIC 및 FPGA에서 면적·전력 절감 효과가 기대되지만, 가산기 수가 늘어나면서 레이턴시와 배선 복잡도가 증가할 수 있다. 또한 현재 설계는 3‑tap FIR에 국한되어 있어, 실제 CNN에서 흔히 사용되는 3×3, 5×5와 같은 2‑차원 필터에 적용하려면 2‑D Winograd 변형(예: F(2×2,3×3))을 추가적으로 설계해야 한다. 논문은 구현 결과에 대한 정량적 데이터(예: LUT 사용량, DSP 사용량, 최대 클럭 주파수, 전력 소비)를 제공하지 않아, 제안된 구조가 기존 최적화 기법 대비 실제 이점을 입증하기에는 부족함을 인정한다. 결론에서는 Winograd 최소 필터링을 활용한 하드웨어 모듈이 곱셈기 절감이라는 명확한 목표를 달성했으며, ASIC·FPGA 양쪽에서 적용 가능함을 강조한다. 향후 연구에서는 다중 모듈 클러스터링에 따른 스케일링 효과, 2‑D 필터 확장, 그리고 실제 CNN 벤치마크(예: VGG, ResNet)에서의 성능·전력 비교가 필요하다고 제언한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기