학습된 순위에서 소비자 선호 추정

본 논문은 부분 순위 데이터를 쌍별 비교 형태로 해석하고, 로지스틱 선택 확률을 이용해 개인별 선호를 추정한다. 관측된 비교는 아이템의 노출 여부에 따라 선택 편향이 존재하므로, 아이템별 노출 성향을 로지스틱 모델로 추정하고 역확률 가중(IPW)과 릿지 정규화를 결합한 로그우도 최적화로 보정한다. 대규모 데이터에 대해서는 가중치를 반영한 샘플링 기반 확률적 경사 하강법(SGD)을 제안하고, 온라인 와인 판매 데이터에 적용해 인기 기반 베이스라인…

저자: Yu-Chang Chen, Chen Chian Fuh, Shang En Tsai

학습된 순위에서 소비자 선호 추정
1. 서론 본 논문은 디지털 마켓플레이스와 설문 조사 등에서 얻어지는 부분 순위 데이터를 활용해 개인별 소비자 선호를 정량화하고, 이를 기반으로 추천 시스템을 개선하고자 한다. 기존 연구는 완전 순위 혹은 단일 선택 로그를 전제로 했지만, 실제 데이터는 아이템 수가 방대하고 사용자마다 관측 가능한 아이템이 제한적이기 때문에 불완전한 순위가 일반적이다. 저자들은 이러한 불완전성을 “관측된 순위는 쌍별 비교의 집합”이라고 해석하고, 랜덤 유틸리티 모델에 기반한 로지스틱 선택 확률을 이용해 효용을 모델링한다. 2. 관련 문헌 검토 순위 데이터에 대한 전통적 접근은 exploded logit(다중 로짓) 모델이며, 혼합 효과, 라티스 클래스, 반파라메트릭 방법 등이 있다. 최근에는 협업 필터링에서 사용되는 저차원 임베딩과 쌍별 순위 손실을 결합한 방법이 주목받고 있다. 또한, 노출 편향을 보정하기 위한 역확률 가중(IPW) 기법이 추천 시스템 분야에서 활용되고 있다. 본 연구는 이들 흐름을 통합해, 경제학적 랜덤 유틸리티 프레임워크와 머신러닝식 저차원 잠재 요인을 결합하고, 노출 편향을 IPW로 교정한다. 3. 모델 설계 3.1 관측 순위 정의 각 사용자 i에 대해 관측된 쌍 (j, j′)의 집합 D_i 를 정의하고, 전체 데이터 D = ∪_i D_i 로 구성한다. 순위는 불완전하며, 관측되지 않은 쌍은 모델이 추론해야 할 대상이다. 3.2 효용 함수 u_ij = x_jᵀ β_i + α_j + λ_iᵀ f_j + ε_ij - x_j : 관측 가능한 제품 속성 (예: 브랜드, 원산지, 가격) - β_i : 사용자별 속성 가중치 (해석 가능) - α_j : 아이템 고정 효과 (전반적 인기) - f_j ∈ ℝ^r : 아이템 잠재 요인 (저차원) - λ_i : 사용자별 잠재 요인 로드ings - ε_ij : Type‑I extreme value 오류 → 로지스틱 선택 확률 3.3 쌍별 로지스틱 확률 P(i, j ≻ j′) = σ(u_ij − u_ij′) = 1/(1+exp

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기