적응형 MC‑드롭아웃·컨포멀 예측 융합, MC‑CP로 안전한 딥러닝 불확실성 정량화
** 본 논문은 기존 MC‑드롭아웃의 연산량을 감소시키는 적응형 드롭아웃 기법과, 분포 가정이 없는 커버리지 보장을 제공하는 컨포멀 예측을 결합한 하이브리드 UQ 방법인 MC‑CP를 제안한다. 변동성 수렴을 기준으로 전방 패스 수를 조절해 메모리·시간을 절감하면서, 캘리브레이션 단계에서 얻은 임계값을 이용해 예측 집합·구간을 생성한다. CIFAR‑10/100, MNIST, Fashion‑MNIST, Tiny‑ImageNet 등에서 MC‑Dr…
저자: Daniel Bethell, Simos Gerasimou, Radu Calinescu
**
본 논문은 안전‑critical 분야에서 딥러닝 모델의 신뢰성을 확보하기 위한 불확실성 정량화(Uncertainty Quantification, UQ) 방법으로, 기존의 MC‑Dropout과 컨포멀 예측(Conformal Prediction, CP)의 장점을 결합한 새로운 하이브리드 기법 **MC‑CP**를 제안한다. 기존 MC‑Dropout은 여러 번의 전방 패스를 통해 모델 파라미터의 랜덤 마스크를 적용, 예측 분포의 평균과 분산을 추정함으로써 에피스틱(epistemic) 불확실성을 측정한다. 그러나 K번의 전방 패스를 고정적으로 수행하면 연산 비용이 크게 증가한다. 반면, CP는 모델의 점예측을 확률적 집합·구간으로 변환해, 사전 정의된 커버리지 \((1-\alpha)\)를 보장한다. 하지만 CP는 보통 과보수적인 집합 크기를 생성해 효율성이 떨어진다.
**1. 적응형 MC‑Dropout**
논문은 MC‑Dropout의 전방 패스 수를 동적으로 조절하는 알고리즘을 설계한다. 핵심 아이디어는 **분산 수렴**을 감시하는 것이다. 입력 \(x\)에 대해 현재까지 수집된 예측값들의 분산 \(\sigma\)를 계산하고, 직전 단계의 분산 \(\sigma_{i-1}\)와의 차이 \(|\sigma - \sigma_{i-1}|\)가 사전 정의된 임계값 \(\delta\) 이하이면 ‘수렴’으로 판단한다. 이러한 판단이 연속적으로 \(P\)번 지속되면, 남은 전방 패스는 수행하지 않고 조기 종료한다. 알고리즘은 최대 전방 패스 수 \(K\)와 \(\delta, P\)를 하이퍼파라미터로 받아, 실제 실행 시에는 \(K\)보다 적은 횟수만 수행한다. 이 과정은 드롭아웃이 독립적인 베르누이 샘플링을 수행한다는 가정 하에, 대수법칙에 의해 샘플 평균·분산이 점차 안정화된다는 통계적 근거를 가진다. 실험에서는 \(\delta=0.01, P=3\)을 기본값으로 사용했으며, CIFAR‑10/100, MNIST 등에서 평균 40 %~60 %의 전방 패스가 절감되었다.
**2. 컨포멀 예측과의 결합**
적응형 MC‑Dropout이 제공하는 평균 소프트맥스 \(\hat{\pi}(i)(x)\)와 분산 \(\sigma\)를 바탕으로, 논문은 두 단계의 CP 프로세스를 수행한다.
- **캘리브레이션 단계**: 테스트 데이터를 캘리브레이션 셋 \(c\)와 검증 셋 \(v\)로 분할한다. 캘리브레이션 셋에 대해 Platt scaling을 적용해 소프트맥스 점수를 보정하고, 각 샘플에 대해 컨포멀 스코어 \(E_j = \sum_{i=1}^{k'} \hat{\pi}(i)(x_j) + \lambda \mathbf{1}
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기