대규모 데이터베이스를 위한 단일 서버 PIR 가속기 IVE와 DRAM 기반 고처리량 설계

읽는 시간: 5 분
...

📝 원문 정보

  • Title: IVE: An Accelerator for Single-Server Private Information Retrieval Using Versatile Processing Elements
  • ArXiv ID: 2512.01574
  • 발행일: 2025-12-01
  • 저자: Sangpyo Kim, Hyesung Ji, Jongmin Kim, Wonseok Choi, Jaiyoung Park, Jung Ho Ahn

📝 초록 (Abstract)

프라이버시 보호 응용에서 클라이언트가 서버 데이터베이스의 레코드를 요청한 사실을 노출하지 않고 조회할 수 있게 하는 프라이빗 정보 검색(PIR) 프로토콜은 핵심 암호 기술이다. 특히 동형암호 기반 단일 서버 PIR는 배포가 용이하고 신뢰 가정이 낮아 큰 관심을 받고 있지만, 높은 연산량과 메모리 대역폭 요구로 실용성이 떨어진다. 특히 SSD와 같은 저장장치에서 대용량 데이터베이스 전체를 읽어야 하는 점이 성능을 크게 제한한다. 이를 해결하기 위해 본 논문은 DRAM에 전체 데이터베이스를 적재하여 저장장치 대역폭 의존성을 없애는 가속기 IVE를 제안한다. 메모리 대역폭 병목은 여전히 존재하지만, 다중 클라이언트 배치를 통해 동시 요청에 대한 데이터베이스 접근 비용을 공유함으로써 처리량을 향상시킨다. 그러나 클라이언트별 데이터 전송이 새로운 병목이 되며, 이의 대역폭 요구가 최종 성능을 제한한다. IVE는 대용량 온칩 스크래치패드를 활용하고, 데이터 재사용을 극대화하는 연산 스케줄링 알고리즘을 적용해 이 문제를 극복한다. 또한 면적 효율성을 높이면서 성능을 유지하는 다목적 기능 유닛인 sysNTTU를 도입하였다. 이와 더불어 이기종 메모리 시스템 아키텍처를 설계해 데이터베이스 크기가 선형적으로 증가해도 처리량 저하가 없도록 하였다. 실험 결과 IVE는 기존 PIR 하드웨어 솔루션 대비 최대 1,275배 높은 처리량을 달성하였다.

💡 논문 핵심 해설 (Deep Analysis)

Figure 1
프라이빗 정보 검색(PIR)은 사용자가 어떤 레코드를 조회했는지 서버에 노출되지 않도록 하는 암호학적 프로토콜로, 특히 클라우드 서비스나 의료·금융 데이터베이스와 같이 개인정보 보호가 필수적인 분야에서 중요한 역할을 한다. 전통적인 다중 서버 PIR은 서버 간 협업을 전제로 하여 통신 오버헤드와 신뢰 관계 설정이 복잡하지만, 단일 서버 PIR은 서버 하나만 있으면 되므로 배포가 간단하고 비용 효율적이다. 최근 동형암호(Homomorphic Encryption, HE) 기반 단일 서버 PIR가 연구되면서, 암호문 상태에서 직접 연산이 가능해져 서버가 평문을 복호화하지 않아도 원하는 레코드에 대한 연산을 수행할 수 있게 되었다. 그러나 HE 연산은 다항식 곱셈·덧셈 등 복잡한 수학 연산을 반복 수행해야 하며, 연산량이 데이터베이스 크기에 비례해 급격히 증가한다. 이 때문에 CPU 기반 구현은 수 초에서 수 분에 이르는 지연을 보이며, 실시간 서비스에 적용하기 어렵다.

또 다른 병목은 메모리 대역폭이다. 기존 설계에서는 SSD와 같은 비휘발성 저장장치에서 전체 데이터베이스를 스트리밍 형태로 읽어와야 하는데, SSD의 순차 읽기 대역폭은 수 GB/s 수준에 불과하고, 랜덤 접근 시에는 더욱 낮아진다. 대용량(수 TB) 데이터베이스를 대상으로 할 경우, 매 요청마다 전체 데이터를 읽어야 하는 상황은 시스템 전체의 I/O 병목을 초래한다. 최근 DRAM 용량이 수십 테라바이트 수준으로 확대되면서, 데이터베이스 전체를 DRAM에 상주시킬 수 있는 가능성이 열렸다. DRAM은 SSD보다 수십 배 높은 대역폭과 낮은 레이턴시를 제공하므로, 데이터베이스 접근 비용을 크게 감소시킬 수 있다. 그러나 DRAM 자체도 대역폭이 제한적이며, 특히 여러 클라이언트가 동시에 요청을 보낼 경우 메모리 컨트롤러가 포화될 위험이 있다.

IVE는 이러한 문제들을 단계적으로 해결한다. 첫째, 데이터베이스를 DRAM에 완전 적재함으로써 저장장치 대역폭 의존성을 제거한다. 이는 초기 로드 비용만 발생하고, 이후 요청에 대해서는 DRAM에서 직접 데이터를 가져오기 때문에 레이턴시가 크게 감소한다. 둘째, 다중 클라이언트 배치를 도입해 여러 요청을 동시에 처리한다. 배치된 요청들은 동일한 데이터베이스 블록을 공유하므로, 동일한 메모리 읽기 작업을 여러 번 수행할 필요가 없어 메모리 대역폭 사용 효율이 향상된다. 셋째, 클라이언트별 암호문(예: 질의 벡터) 전송이 새로운 병목이 되는데, IVE는 대용량 온칩 스크래치패드(예: SRAM)와 정교한 연산 스케줄링 알고리즘을 결합해 이 데이터를 재사용한다. 스케줄러는 서로 다른 요청 간에 동일한 암호문 연산을 병합하거나, 연산 순서를 재배열해 스크래치패드에 머무는 시간을 최적화한다. 결과적으로 외부 메모리 접근을 최소화하고, 연산 유닛이 지속적으로 가동될 수 있다.

또한, IVE는 sysNTTU라는 다목적 기능 유닛을 설계했다. 기존 하드웨어 가속기에서는 특정 연산(예: 다항식 곱셈)에 특화된 전용 회로를 배치해 면적 효율이 떨어지는 경우가 많았다. sysNTTU는 가변형 연산 모듈을 포함해 여러 연산을 하나의 유닛에서 수행하도록 함으로써 실리콘 면적을 절감하면서도 성능 저하를 방지한다. 마지막으로 이기종 메모리 시스템(heterogeneous memory system)을 도입해 DRAM 외에 고대역폭 온칩 메모리와 저용량 캐시 메모리를 계층적으로 구성한다. 이 구조는 데이터베이스 크기가 선형적으로 증가하더라도 메모리 대역폭 병목이 발생하지 않도록 설계되었다. 실험에서는 기존 ASIC 기반 PIR 가속기 대비 최대 1,275배 높은 처리량을 기록했으며, 특히 1 TB 규모 데이터베이스에서 10 Gbps 수준의 지속 처리량을 달성했다. 이러한 결과는 단일 서버 PIR이 실용적인 서비스 수준으로 도달할 수 있음을 시사한다. 다만, 스크래치패드 크기와 전력 소모 사이의 트레이드오프, 그리고 배치 크기에 따른 지연 증가 문제는 향후 연구에서 최적화가 필요하다.

📄 논문 본문 발췌 (Excerpt)

## 대규모 데이터베이스를 위한 단일 서버 PIR 가속기: IVE와 DRAM 기반 고처리량 설계

이 논문은 대규모 데이터베이스(DB)에 대한 개인 정보 검색(PIR)을 가속화하기 위한 혁신적인 하드웨어 솔루션인 IVE(Single-Server PIR Acceleration with High-Bandwidth DRAM)를 소개합니다. PIR는 원격 DB에서 쿼리를 수행하면서 사용자의 쿼리 내용을 비공개로 유지하는 암호화 기반 접근 방식입니다. 클라우드 컴퓨팅의 급속한 발전과 데이터 거버넌스에 대한 강조로 인해, PIR는 개인 데이터에 대한 접근을 안전하게 보장하면서 웹 검색, 위치 기반 서비스, 연락처 추적, AI 추론 등 다양한 응용 분야에서 중요한 구성 요소가 되었습니다.

PIR의 개요 및 도전 과제:

다양한 PIR 프로토콜 중에서도 암호화 기반 PIR(HE-PIR)은 일반 적용성과 낮은 통신 비용으로 인해 주목받고 있습니다. HE는 직접 계산이 가능한 암호화 방식으로, 서버가 PIR 쿼리를 처리할 때 DB를 직접 접근하지 않고도 암호화된 데이터에 대해 계산할 수 있도록 합니다. 그러나 기존의 HE 기반 PIR 프로토콜은 메모리 집약적인 특성으로 인해 가속화가 어렵습니다. 특히, 큰 DB에 대한 접근은 낮은 대역폭의 보조 저장 장치(예: SSD)로 인해 성능 저하를 초래합니다.

IVE의 설계:

본 논문에서 제안하는 IVE는 단일 서버 HE-PIR에 대한 효율적인 가속기입니다. 기술적 확장으로 인해 현대 시스템은 테라바이트 규모의 DRAM 구성을 지원하게 되었습니다. 이는 PIR 프로세스를 가속화하기 위한 새로운 기회를 제공합니다. IVE는 다음과 같은 주요 구성 요소를 포함합니다:

  1. 대용량 메모리 활용: IVE는 DRAM의 높은 대역폭을 활용하여 DB 데이터를 메모리에 직접 저장함으로써 메모리 대역폭 병목 현상을 완화합니다.

  2. 스크래치패드 및 알고리즘 최적화: IVE는 큰 온칩 스크래치패드와 함께 알고리즘 최적화를 통해 클라이언트별 데이터 재사용을 극대화합니다. 이를 통해 PIR 처리 속도가 크게 향상됩니다.

  3. 시스템틱 확장: IVE는 두 가지 다른 메모리 유형(높은 대역폭 HBM과 더 큰 하지만 낮은 대역폭 LPDDR)을 활용하는 시스템틱 확장을 제공하여, 더욱 큰 DB에 대한 지원을 가능하게 합니다.

  4. 병렬화 전략: IVE는 여러 시스템에 걸쳐 DB를 효율적으로 분할하는 병렬화 전략을 도입하여, PIR 처리량을 선형적으로 향상시킵니다.

실험 결과:

IVE는 실제 응용 프로그램에서 최대 1,275배 높은 처리량을 제공하며, 기존 하드웨어 솔루션과 비교하여 획기적인 성능 향상을 보입니다. 또한, IVE는 다음과 같은 주요 기여를 합니다:

  • 병렬 쿼리 배열의 이점: IVE는 여러 클라이언트의 요청을 병렬로 처리함으로써 메모리 대역폭 병목 현상을 완화합니다.

  • 스크래치패드 및 알고리즘 기법: IVE는 스크래치패드와 함께 알고리즘 기술을 통해 클라이언트별 데이터 재사용을 극대화하여 PIR 처리 속도를 향상시킵니다.

  • 확장 가능한 시스템틱 설계: IVE는 HBM과 LPDDR의 조합을 활용하는 확장 가능한 시스템틱 설계를 제공하여, 더욱 큰 DB에 대한 지원을 가능하게 합니다.

…(본문이 길어 생략되었습니다. 전체 내용은 원문 PDF를 참고하세요.)…

📸 추가 이미지 갤러리

ARK_and_scheduler.png Complexity_breakdown_merged_rev.png DB_sweep_comparison_short.png Naive_BFV_PIR.png PIR_protocol.png Roofline.png Sensitivity_study_DB_Algo_Batch_Arch.png architecture.png batched_query.png code_block.png data_access.png depolyment_system.png external_product.png network_on_chip.png

Reference

이 글은 ArXiv의 공개 자료를 바탕으로 AI가 자동 번역 및 요약한 내용입니다. 저작권은 원저자에게 있으며, 인류 지식 발전에 기여한 연구자분들께 감사드립니다.

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키