연합 학습 평균 집계에 대한 임계 동형암호의 실용적 검토

본 논문은 연합 학습(Federated Learning)에서 평균 집계 연산을 안전하게 수행하기 위해 임계 동형암호(Threshold HE)를 적용하고, BFV와 CKKS 두 스킴의 성능·보안 특성을 비교한다. 제한된 복호화 오라클 공격에 대응하기 위해 큰 분산을 갖는 스머징 노이즈를 도입하고, 그 영향과 최적 파라미터 영역을 정량적으로 분석한다. 결과적으로 CKKS가 BFV와 비슷한 암호문 팽창률을 보이며, 근사 연산 특성이 추가적인 프라이버…

저자: Miguel Morona-Mínguez, Alberto Pedrouzo-Ulloa, Fern

연합 학습 평균 집계에 대한 임계 동형암호의 실용적 검토
연합 학습(Federated Learning, FL)은 중앙 서버가 여러 클라이언트의 로컬 데이터를 직접 수집하지 않고, 각 클라이언트가 로컬 모델 업데이트를 수행한 뒤 이를 서버에 전송해 전역 모델을 업데이트하는 분산 학습 패러다임이다. 그러나 로컬 업데이트 자체가 원본 데이터에 대한 민감한 정보를 포함할 수 있어, 평균 집계와 같은 핵심 연산에서도 프라이버시 침해 위험이 존재한다. 이를 해결하기 위해 동형암호(Homomorphic Encryption, HE)가 제안되었으며, 특히 다중키를 지원하는 임계 동형암호(Threshold HE, MHE)는 비밀키를 여러 파티가 공유하지 않고도 공동 복호화를 가능하게 해, 클라이언트와 서버 간의 신뢰 관계를 완화한다. 본 논문은 이러한 임계 HE를 연합 학습 평균 집계에 적용하는 구체적인 프로토콜을 설계하고, 두 대표적인 RLWE 기반 스킴인 BFV와 CKKS를 임계 형태로 구현해 비교 분석한다. 주요 기여는 다음과 같다. 1. **보안 모델 재조명**: 기존 연구는 IND‑CPA(Chosen‑Plaintext Attack) 모델만을 고려했지만, 실제 FL 환경에서는 클라이언트가 공동 복호화 과정을 수행하므로 제한된 복호화 오라클이 존재한다. 논문은 이를 반영한 IND‑CPAD(Chosen‑Plaintext Attack with Decryption oracle) 모델을 도입하고, 해당 모델 하에서 발생할 수 있는 키 복구 공격을 설명한다. 2. **스머징 노이즈 도입**: 복호화 오라클 공격을 방어하기 위해 복호화 결과에 인위적인 잡음(스머징 노이즈)을 추가한다. 이 노이즈는 큰 분산을 갖도록 설계되어, 공격자가 복호화 오류를 이용해 비밀키 조각을 추출하는 것을 어렵게 만든다. 논문은 스머징 노이즈가 암호문 크기와 연산 비용에 미치는 영향을 정량화하고, 보안 수준(복호화 오류 확률)과 성능 사이의 트레이드오프를 제시한다. 3. **BFV vs CKKS 성능 비교**: BFV는 정밀 정수 연산을 제공하지만, 정확한 복호화를 위해 높은 모듈러스와 작은 오류 한계가 필요해 암호문 팽창이 크게 나타난다. 반면 CKKS는 근사 실수 연산을 지원하며, 내부 스케일링 오차가 존재하므로 스머징 노이즈가 상대적으로 덜 영향을 미친다. 실험에서는 동일한 파라미터(다항식 차수 n, 모듈러스 q, 스케일 Δ 등) 하에 CKKS가 BFV와 비슷하거나 약간 더 작은 암호문 크기와 실행 시간을 보였으며, 특히 클라이언트 수가 많고 모델 차원이 클 때 그 차이가 두드러졌다. 4. **프라이버시 강화 효과**: CKKS의 근사 특성은 결과에 자연스럽게 작은 잡음을 포함한다. 이는 차분 프라이버시(Differential Privacy)와 결합했을 때 추가적인 보호 효과를 제공한다는 점을 논문은 강조한다. 즉, CKKS 기반 평균 집계는 암호학적 보안뿐 아니라 통계적 프라이버시 측면에서도 장점을 가질 수 있다. 5. **프로토콜 흐름**: 논문은 전체 FL 프로토콜을 5단계(Setup, Local Training, Input, Evaluation, Output)로 정리한다. Setup 단계에서 각 클라이언트는 비밀키 공유를 위한 비밀키 조각을 생성하고, 공통 공개키를 합성한다. 이후 로컬 모델 업데이트를 암호화해 서버에 전송하고, 서버는 동형덧셈만을 사용해 평균을 계산한다. 최종적으로 모든 클라이언트가 자신의 비밀키 조각을 이용해 공동 복호화를 수행한다. 이 과정에서 스머징 노이즈는 암호화 단계와 복호화 단계 모두에 삽입된다. 6. **실험 및 파라미터 선택**: 논문은 다양한 파라미터 설정(예: n=2¹⁴, q≈2⁶⁴, σ=3.2 등) 하에서 스머징 노이즈 분산을 2⁻³⁰부터 2⁻¹⁰까지 변화시켜 보안·성능 곡선을 그렸다. 결과는 노이즈 분산이 2⁻²⁰ 이상이면 복호화 오류 확률이 2⁻⁶⁰ 이하로 감소하면서도 암호문 크기 증가율은 10% 미만에 머물렀다. 7. **미래 연구 방향**: 현재 연구는 평균 집계에 국한되었으며, 다중 연산(예: 중앙값, 절대편차 등)이나 비동기식 클라이언트 환경(크로스‑디바이스)으로 확장하는 것이 과제로 남는다. 또한 스머징 노이즈와 차분 프라이버시를 통합한 하이브리드 프레임워크 개발이 제안된다. 종합적으로, 본 논문은 임계 동형암호를 연합 학습에 적용할 때 발생할 수 있는 보안 취약점을 정확히 진단하고, 스머징 노이즈라는 실용적인 방어 메커니즘을 제시한다. BFV와 CKKS 두 스킴을 정량적으로 비교함으로써, 근사 연산을 지원하는 CKKS가 암호문 팽창과 연산 비용 면에서 경쟁력을 갖추고, 추가적인 프라이버시 이점을 제공한다는 중요한 인사이트를 제공한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기