학습된 순위에서 소비자 선호 추정

1. 서론 본 논문은 디지털 마켓플레이스와 설문 조사 등에서 얻어지는 부분 순위 데이터를 활용해 개인별 소비자 선호를 정량화하고, 이를 기반으로 추천 시스템을 개선하고자 한다. 기존 연구는 완전 순위 혹은 단일 선택 로그를 전제로 했지만, 실제 데이터는 아이템 수가 방대하고 사용자마다 관측 가능한 아이템이 제한적이기 때문에 불완전한 순위가 일반적이다. 저자들은 이러한 불완전성을 “관측된 순위는 쌍별 비교의 집합”이라고 해석하고, 랜덤 유틸리티 모델에 기반한 로지스틱 선택 확률을 이용해 효용을 모델링한다. 2. 관련 문헌 검토 순위 데이터에 대한 전통적 접근은 exploded logit(다중 로짓) 모델이며, 혼합 효과, 라티스 클래스, 반파라메트릭 방법 등이 있다. 최근에는 협업 필터링에서 사용되는 저차원 임베딩과 쌍별 순위 손실을 결합한 방법이 주목받고 있다. 또한, 노출 편향을 보정하기 위한 역확률 가중(IPW) 기법이 추천 시스템 분야에서 활용되고 있다. 본 연구는 이들 흐름을 통합해, 경제학적 랜덤 유틸리티 프레임워크와 머신러닝식 저차원 잠재 요인을 결합하고, 노출 편향을 IPW로 교정한다. 3. 모델 설계 3.1 관측 순위 정의 각 사용자 i에 대해 관측된 쌍 (j, j′)의 집합 D_i 를 정의하고, 전체 데이터 D = ∪_i D_i 로 구성한다. 순위는 불완전하며, 관측되지 않은 쌍은 모델이 추론해야 할 대상이다. 3.2 효용 함수 u_ij = x_jᵀ β_i + α_j + λ_iᵀ f_j + ε_ij - x_j : 관측 가능한 제품 속성 (예: 브랜드, 원산지, 가격) - β_i : 사용자별 속성 가중치 (해석 가능) - α_j : 아이템 고정 효과 (전반적 인기) - f_j ∈ ℝ^r : 아이템 잠재 요인 (저차원) - λ_i : 사용자별 잠재 요인 로드ings - ε_ij : Type‑I extreme value 오류 → 로지스틱 선택 확률 3.3 쌍별 로지스틱 확률 P(i, j ≻ j′) = σ(u_ij − u_ij′) = 1/(1+exp

학습된 순위에서 소비자 선호 추정

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기