판별 모델 강건성 정량화: 새로운 강건성 지표와 동적 분류기 선택 적용
본 논문은 확률적 판별 분류기에 적용 가능한 새로운 강건성 지표 r₍COR₎ 를 제안한다. 기존의 ε‑오염 방식은 이산형 특성에만 의미가 있었으나, 제안된 지표는 연속·혼합형 특성에서도 유효하며, 첫 번째와 두 번째로 높은 사후 확률만으로 폐쇄형 식을 제공한다. 실험에서는 정확도‑거부 곡선(ARC)을 통해 r₍COR₎가 예측 정확도와 높은 상관관계를 보임을 확인하고, 이를 기반으로 동적 분류기 선택 전략을 설계하였다.
저자: Rodrigo F. L. Lassance, Jasper De Bock
본 논문은 판별 모델의 개별 예측에 대한 신뢰성을 평가하기 위한 ‘강건성 정량화’라는 접근법을 재조명하고, 기존 방법이 갖는 제약을 극복한 새로운 강건성 지표 r₍COR₎ 를 제안한다. 기존 연구는 주로 ε‑오염 방식을 사용했으며, 이는 모델 전체 혹은 파라미터 수준에서 작은 혼합 비율 ε 을 도입해 예측이 변하지 않는 최대 ε 값을 측정한다. 그러나 이 방식은 이산형 특성에만 의미가 있고, 연속형 혹은 혼합형 특성을 포함하는 데이터에서는 대부분 0값을 반환한다는 심각한 한계가 있었다.
저자들은 이러한 문제를 해결하기 위해 확률 측도 사이의 거리 함수 d₍COR₎ 를 도입한다. d₍COR₎ 는 모든 사건 A, B 에 대해 P(A)·Q(B) / Q(A)·P(B) 의 비율이 일정하게 유지되는 ‘상수 오즈 비율(Constant Odds Ratio, COR)’ 모델을 정의한다. 이 거리의 변형 d*₍COR₎ 는 실제로 likelihood ratio L = q/p 의 상한·하한을 이용해 ess sup L · ess inf L 로 표현된다. 두 거리 함수는 단순히 역수 관계에 있으므로, 하나를 이용해 얻은 강건성 지표는 다른 하나에서도 동일하게 변환된다.
핵심 정리(Theorem 1)는 r₍COR₎ 와 r*₍COR₎ 에 대한 폐쇄형 식을 제공한다. 주어진 입력 x 에 대해 가장 높은 사후 확률을 갖는 클래스 ŷ₁ 와 두 번째로 높은 클래스 ŷ₂ 를 찾으면,
r*₍COR₎(x) = p(ŷ₁, x)·p(ŷ₂, x)
r₍COR₎(x) =
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기