퍼포먼스 예측의 안정성: 반복 재학습과 전략적 분류의 새로운 통합 프레임워크

예측이 의사결정에 직접 영향을 미치는 상황을 “퍼포먼스 예측”이라 정의하고, 모델 파라미터가 유도하는 데이터 분포 D(θ)를 고려한 위험 최소화 문제를 제시한다. 모델을 반복 재학습(RRM)하거나 반복 경사 하강(RGD)하면, 손실이 부드럽고 강하게 볼록하며 D(θ)가 충분히 Lipschitz일 때 수행가능한 고정점인 “퍼포먼스 안정성”에 선형 수렴한다. 이 안정점은 퍼포먼스 위험을 거의 최소화하며, 전략적 분류 문제에도 적용 가능함을 보인다.

저자: Juan C. Perdomo, Tijana Zrnic, Celestine Mendler-D"unner

본 논문은 예측 모델이 실제 의사결정에 사용될 때, 그 예측 자체가 목표 변수의 분포를 바꾸는 현상을 “퍼포먼스 예측(performative prediction)”이라 명명하고, 이를 정량화하기 위한 새로운 위험 최소화 프레임워크를 제시한다. 전통적인 통계 학습에서는 고정된 데이터 분포 D 위에서 손실 ℓ(Z;θ)의 기대값을 최소화하는 파라미터 θ_SL을 찾는다. 그러나 퍼포먼스 상황에서는 모델 파라미터 θ가 배포될 때마다 데이터 생성 과정이 달라지므로, 각 θ에 대응하는 분포 D(θ)를 정의한다. 이 매핑 D(·)는 모델이 만든 정책·결정이 실제 세계에 미치는 영향을 포괄적으로 표현한다. 새롭게 정의된 퍼포먼스 위험 PR(θ)=E_{Z∼D(θ)}

퍼포먼스 예측의 안정성: 반복 재학습과 전략적 분류의 새로운 통합 프레임워크

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기