저렴하고 뛰어난 군중 작업자 선택 전략

본 논문은 제한된 예산 하에서 작업자 풀 중 최적의 소수 작업자를 선택해 라벨 집계 정확도를 극대화하는 방법을 제시한다. 선형 가중 다수결 기반 오류 상한을 이용해 작업자 집합의 점수를 정의하고, 이를 최대화하는 조합 최적화를 O(M log M) 시간에 해결하는 알고리즘을 제안한다. 실험 결과, 제안 알고리즘은 적은 수의 고품질 작업자만으로도 전체 작업자를 모두 사용할 때와 동등하거나 더 높은 정확도를 달성함을 보여준다.

저자: Hongwei Li, Qiang Liu

본 논문은 군중소싱 작업에서 예산 제한 하에 어떤 작업자들을 선택해야 라벨 집계 정확도를 최대로 할 수 있는지를 탐구한다. 기존에는 예산이 허용하는 만큼 많은 작업자를 고용해 다수결이나 EM 같은 집계 기법을 적용하는 것이 일반적이었다. 그러나 작업자들의 신뢰도가 크게 다르고, 스팸러와 같은 무작위 응답자를 포함하면 오히려 정확도가 떨어질 수 있다는 점을 지적한다. 문제 정의는 다음과 같다. M명의 작업자 풀 Ω와 N개의 라벨링 대상이 존재하고, 각 작업자 i는 정확도 w_i 로 라벨을 제공한다. 금지문제(정답이 알려진 소수의 질문)를 통해 각 작업자의 신뢰도 추정값 \hat w_i 와 그 분산 \hat var(\hat w_i) 를 얻는다. 라벨 집계는 선형 가중 다수결(Weighted Majority Voting, WMV‑linear) 방식을 사용한다. 여기서 각 작업자의 가중치는 f_linear(\hat w_i)=L\hat w_i−1 로 정의된다. 이때, WMV‑linear의 오류율에 대한 상한을 정리 1을 통해 도출한다. 상한은 exp(−2F(S)^2 /

저렴하고 뛰어난 군중 작업자 선택 전략

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기