딥 뉴럴 네트워크 기반 선택 제거 모델

본 논문은 순차적 선택 과정을 “최악의 아이템을 먼저 제거”하는 선택‑제거(Choice by Elimination) 프레임워크를 제안하고, 이를 깊은 신경망인 Highway Network와 결합해 대규모 학습‑순위(L2R) 문제에 적용한다. 선택‑제거 모델은 Gompertz 분포를 따르는 잠재 효용을 적분함으로써 확률적 해석을 제공하며, 기존 Plackett‑Luce 모델의 한계를 보완한다. Yahoo! L2R 챌린지 데이터(425K 문서)에서…

저자: Truyen Tran, Dinh Phung, Svetha Venkatesh

본 논문은 “Neural Choice by Elimination”(NCE)이라는 새로운 학습‑순위 프레임워크를 제시한다. 기존 학습‑순위(L2R) 연구는 주로 리스트와이즈 손실을 설계하는 데 집중했으며, 선택 모델 자체에 대한 탐구는 상대적으로 적었다. 대표적인 선택 모델인 Plackett‑Luce는 아이템을 가장 높은 가치부터 순차적으로 선택하는 전방 선택 방식을 사용한다. 그러나 실제 많은 상황에서는 가장 낮은 가치의 아이템을 먼저 배제하는 역방향 과정이 더 자연스럽다. 예를 들어 스포츠 토너먼트나 구매 결정에서는 ‘가장 약한’ 후보가 먼저 탈락한다. 이러한 한계를 극복하고자 저자는 “선택‑제거” 모델을 도입한다. 수학적으로, 전체 순열 π에 대한 확률은 P(π)=∏_{i=1}^{N}Q(π_i|π_{i+1:N}) 로 표현된다. 여기서 Q(π_i|π_{i+1:N})는 현재 남아 있는 아이템 집합에서 가장 낮은 가치를 가진 아이템이 제거될 확률을 의미한다. 저자는 이 확률을 exp(−f(x_i))/∑_j exp(−f(x_j)) 로 정의한다. f(x)는 쿼리‑아이템 특성 x에 대한 순위 점수 함수이며, 이 함수는 이후에 신경망으로 근사한다. 이 정의에 따라 로그 손실 ℓ₂는 ℓ₂(π)=∑_{i=1}^{N}

딥 뉴럴 네트워크 기반 선택 제거 모델

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기