블라인드 다중클래스 앙상블 분류: 텐서 기반 순간 매칭 기법
본 논문은 라벨이 없는 상황에서 다수의 분류기(또는 군중)의 출력을 결합해 정확한 라벨을 추정하는 블라인드 앙상블 학습 방법을 제안한다. 각 분류기의 혼동 행렬을 1차·2차·3차 순간(평균, 공분산, 3차 텐서)으로부터 추정하고, 이를 CPD/PARAFAC 텐서 분해와 결합해 클래스 사전확률과 함께 MAP 판별기를 구성한다. 합성·실데이터 실험을 통해 기존 이진·다중클래스 블라인드 방법보다 우수함을 입증한다.
저자: Panagiotis A. Traganitis, Alba Pag`es-Zamora, Georgios B. Giannakis
본 논문은 라벨이 없는 상태에서 다수의 분류기(또는 군중)의 예측을 결합해 정확한 라벨을 복원하는 블라인드(unsupervised) 앙상블 학습 방법을 제안한다. 연구 배경으로는 개별 머신러닝 알고리즘이 데이터 특성에 따라 성능이 크게 달라 “최적” 알고리즘을 찾기 어려운 점을 들며, 이를 보완하기 위해 여러 알고리즘을 결합하는 앙상블 학습의 필요성을 강조한다. 특히, 크라우드소싱이나 분산 센서 네트워크와 같이 각 분류기의 학습 라벨에 접근할 수 없거나 재학습이 불가능한 경우에 블라인드 앙상블이 필수적이다.
문제 정의에서는 N개의 데이터 {xₙ}와 K개의 클래스, M개의 annotator(분류기)를 가정한다. 각 annotator m는 혼동 행렬 Γᵐ∈ℝ^{K×K} 로 모델링되며, Γᵐ_{k',k}=Pr(fᵐ(X)=k'|Y=k) 로 정의된다. 주요 가정은 (As1) 조건부 독립성, 즉 같은 데이터에 대해 서로 다른 annotator들의 응답이 실제 라벨 Y를 기준으로 독립이며, (As2) 대부분의 annotator가 무작위보다 나은 성능을 가진다(대각 원소가 각 열에서 최대)이다.
이론적 기여는 순간 매칭을 통한 파라미터 추정이다. 1차 순간(평균)에서는 E
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기