분포형 반사실 설명을 위한 모델 무관 솔버 DISCOVER
DISCOVER는 기존 DCE가 요구하던 미분 가능성을 없애고, 최적 수송 기반의 샘플별 영향 점수를 활용해 상위 k개의 핵심 샘플만 편집하는 희소 제안‑선택(search‑and‑select) 방식을 도입한다. 입력 측 전송 기하를 이용한 원뿔 샘플링 프리미티브로 후보 분포를 생성하고, 인증된 DCE 목표 함수를 그대로 사용해 검증한다. 이를 통해 비선형·혼합형 특성을 가진 탭형 블랙박스 파이프라인에서도 분포 수준의 반사실 설명을 효율적으로 제…
저자: Yikai Gu, Lele Cao, Bo Zhao
본 논문은 모델‑예측기의 미분 가능성에 의존하는 기존 Distributional Counterfactual Explanations(DCE) 방법의 한계를 극복하고, 비미분 가능·혼합형 탭형 파이프라인에서도 사용할 수 있는 모델‑무관 솔버 DISCOVER를 제안한다.
1. **배경 및 문제 정의**
- 전통적인 반사실 설명(CE)은 개별 샘플에 대한 최소 수정으로 목표 예측을 달성하도록 설계되었으며, 주로 개별 재구성에 초점을 맞춘다. 그러나 정책·금융 등 실제 응용에서는 전체 인구 혹은 특정 하위 집단의 출력 분포 자체를 조정하고자 하는 요구가 있다. 이를 위해 DCE는 입력 측 sliced Wasserstein 거리와 출력 측 Wasserstein 거리를 결합한 최적 수송 기반 목표 함수를 정의하고, 확률적 제약을 통해 목표 달성 확률을 보장한다.
- DCE는 gradient‑based 최적화를 사용하지만, 탭형 데이터에 널리 쓰이는 트리 기반 앙상블, 규칙 기반 전처리, 범주형·연속형 혼합 특성 등은 미분이 불가능하거나 그래디언트가 불안정해 기존 방법을 적용하기 어렵다.
2. **핵심 아이디어**
- OT 기반 목표는 샘플 수준에서 분해될 수 있다. 입력 측 전송 플랜 µ와 출력 측 전송 플랜 ν를 고정하면, 전체 목표 Q는 각 샘플 i의 기여도 qᵢ의 합으로 표현된다.
- qᵢ를 이용해 상위 k개의 샘플만을 편집 대상으로 선정하는 “top‑k 인터벤션 예산”을 도입함으로써, 전체 인구를 균등하게 변형시키는 비효율성을 제거하고, 편집 결과를 해석하기 쉽게 만든다.
3. **알고리즘 구조**
- **반복 구조**: 현재 분포 X를 평가하고, sliced Wasserstein와 Wasserstein을 이용해 Q와 η를 업데이트한다.
- **샘플 영향 점수 계산**: 식 (6)·(7)에서 정의된 q⁽ˣ⁾ᵢ, q⁽ʸ⁾ᵢ를 계산하고, 가중합 qᵢ를 구한다.
- **편집 대상 선정**: qᵢ가 큰 상위 k개의 인덱스를 I에 저장한다.
- **후보 생성**: 공유된 “OT‑guided cone sampling” 프리미티브를 사용해 I에 포함된 샘플만을 수정한다. 이 프리미티브는 입력 측 전송 플랜에서 추출한 방향 g(=∇SW₂)와 반대 방향으로 원뿔 형태의 후보 영역을 정의해, 높은 plausibility를 가진 후보를 효율적으로 탐색한다.
- **제안‑선택 단계**: M개의 후보 X^(m)와 no‑op 후보 X^(0)를 모두 평가하고, 인증된 목표 Q가 최소인 후보를 선택한다. 선택 과정은 Q가 감소하지 않음을 보장한다(정리 3.2).
- **종료 조건**: 정해진 반복 횟수 T가 끝나거나, 최종 후보가 DCE 인증 기준을 만족하면 반환한다.
4. **이론적 보장**
- 목표 Q와 인증 절차는 원본 DCE와 동일하게 유지되므로, 확률적 제약(α)으로 보장된 입력·출력 거리 상한을 그대로 제공한다.
- 정리 3.1은 고정된 전송 플랜 하에서 Q가 정확히 샘플별 기여도의 합으로 분해된다는 것을 증명한다. 정리 3.2는 제안‑선택 단계가 목표 함수를 비감소(오히려 감소)하게 만든다는 단조성(monotonicity)을 보장한다.
5. **실험 및 결과**
- **데이터 및 모델**: Adult, COMPAS, Credit 등 다중 탭형 데이터와 Gradient Boosting Trees, Random Forest, XGBoost, 규칙 기반 모델을 포함한 6가지 블랙박스 예측기를 사용하였다.
- **비교 대상**: 원본 gradient‑based DCE, 무작위 샘플링 기반 무구조 탐색, 그리고 DISCOVER.
- **평가지표**: 입력 측 sliced Wasserstein 거리, 출력 측 Wasserstein 거리, 목표 달성 확률(α‑level), 편집된 샘플 비율, 연산 시간.
- **주요 발견**: DISCOVER는 입력·출력 거리 모두에서 기존 DCE와 동등하거나 더 낮은 값을 기록했으며, 특히 범주형 비연속 특성이 많은 데이터셋에서 gradient‑based 방법이 수렴 실패하거나 과도한 연산 시간을 보인 반면, DISCOVER는 제안‑선택 구조와 원뿔 샘플링 덕분에 3~5배 빠른 수렴을 달성했다. 또한, top‑k 편집으로 전체 샘플 중 평균 7% 이하만을 수정했음에도 목표 출력 분포 이동을 성공시켰다.
6. **의의 및 한계**
- DISCOVER는 DCE의 이론적 프레임워크를 그대로 유지하면서, 실제 산업 현장에서 흔히 쓰이는 비미분 가능 모델에 적용 가능하도록 만든 최초의 모델‑무관 솔버이다.
- 현재는 입력 측 OT 기하를 이용한 원뿔 샘플링에 초점을 맞추었으며, 출력 측에 대한 직접적인 기하적 가이드는 미구현 상태이다. 향후 연구에서는 출력 측 OT를 활용한 후보 생성, 다중 목표(예: 비용·공정성) 통합, 연속적인 top‑k 예산 조정 등을 탐색할 수 있다.
**결론**
DISCOVER는 샘플‑레벨 OT 분해와 top‑k 인터벤션, OT‑guided cone sampling이라는 세 가지 핵심 메커니즘을 결합해, 비미분 가능·혼합형 탭형 파이프라인에서도 확률적 인증을 갖는 분포 수준 반사실 설명을 효율적으로 제공한다. 이는 정책·금융·헬스케어 등에서 인구 전체 혹은 특정 그룹의 위험·수익 분포를 조정하고자 하는 실무적 요구를 충족시키는 중요한 진전이다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기