리포름: 리뷰 기반 LLM 프로파일링과 다중요인 어텐션을 활용한 레스토랑 추천
본 논문은 사용자와 아이템의 리뷰를 대규모 언어 모델(LLM)로 요약해 요인별 프로파일을 생성하고, 다중요인 어텐션(MFA)으로 각 사용자의 의사결정에 가장 영향을 미치는 요인을 동적으로 강조한다. 생성된 프로파일은 LightGCN 기반 그래프 임베딩과 결합되어 레스토랑 추천 정확도를 크게 향상시킨다. 두 개의 레스토랑 데이터셋 실험에서 기존 최첨단 모델들을 능가했으며, 요인별 소거 실험과 리뷰 노이즈 주입 실험을 통해 제안 방법의 효과와 견고…
저자: Moonsoo Park, Seulbeen Je, Donghyeon Park
**1. 서론**
레스토랑 추천은 사용자의 미묘한 취향(예: 분위기, 동행자, 대기 시간 등)을 반영해야 하지만, 기존 협업 필터링(CF) 기반 그래프 모델은 사용자‑아이템 상호작용만을 이용해 이러한 세부 정보를 놓친다. 최근 LLM을 활용한 텍스트 요약·생성 연구가 등장했지만, 대부분 아이템 타이틀이나 메타데이터 수준에 머물러 리뷰에 담긴 다차원 의사결정 요인을 충분히 활용하지 못한다. 이를 보완하고자 저자는 ‘리뷰‑집계 프로파일 생성(RPG)’과 ‘다중요인 어텐션(MFA)’을 결합한 ReFORM 프레임워크를 제안한다.
**2. 관련 연구**
그래프 기반 CF(NGCF, LightGCN 등)는 고차원 협업 신호를 효과적으로 전파하지만 텍스트 정보를 직접 다루지는 않는다. 반면, LLM 기반 추천(KAR, RLMRec 등)은 외부 지식이나 메타데이터를 보강하지만, 리뷰에 내재된 구체적 요인을 균등하게 처리해 노이즈를 유발한다. ReFORM은 두 접근의 장점을 융합한다.
**3. 방법론**
- **3.1 그래프 표현 학습**: LightGCN의 단순한 이웃 평균 전파 방식을 그대로 사용해 사용자·아이템 기본 임베딩을 얻는다.
- **3.2 리뷰‑집계 프로파일 생성(RPG)**: 레스토랑 도메인에 적합한 7가지 요인(음식 종류, 풍미, 분위기, 가격, 방문 시간, 대기 시간, 동행자)을 정의하고, 각 요인에 대한 설명을 포함한 프롬프트를 설계한다. GPT‑4o mini에 사용자·아이템별로 100개의 리뷰를 입력해 요인별 텍스트 요약을 생성한다. 사용자 프로파일은 무작위 샘플링, 아이템 프로파일은 길이가 긴 리뷰를 우선 선택해 LLM이 풍부한 정보를 포착하도록 한다.
- **3.3 프로파일 인코딩**: BERT를 사용해 요인별 텍스트를 d‑차원 임베딩으로 변환하고, M × d 행렬 X_Pu(사용자)와 Y_Pi(아이템)를 만든다.
- **3.4 다중요인 어텐션(MFA)**: 사용자 프로파일을 쿼리(Q)와 값(V)로, 아이템 프로파일을 키(K)로 변환한다. 스케일드 닷‑프로덕트 어텐션을 적용해 각 요인의 가중치를 학습한다. 어텐션 결과는 사용자·아이템 그래프 임베딩과 결합돼 최종 예측에 사용된다.
- **3.5 손실 함수**: 기본 BPR 손실에 더해, 프로파일과 그래프 임베딩 사이의 일관성을 강화하는 대조학습(contrastive) 및 정규화 항을 포함한다.
**4. 실험**
두 개의 레스토랑 데이터셋(Yelp 기반, 규모 차이)에서 HR@10, NDCG@10, MAP 등 5가지 지표를 측정했다. 베이스라인으로 LightGCN, NGCF, PinSage, GRCN, 그리고 LLM 기반 KAR, RLMRec을 사용했다. ReFORM은 모든 베이스라인 대비 평균 5~12%p 향상을 보였으며, 특히 MFA를 제거한 변형은 성능이 3~7%p 급감했다. 요인별 소거 실험에서는 ‘분위기’와 ‘동행자’ 요인이 가장 큰 기여를 했으며, 리뷰 노이즈 주입 실험에서는 30% 노이즈까지 성능 저하가 미미해 LLM 기반 프로파일링의 견고함을 확인했다.
**5. 분석 및 토론**
- **프로파일 품질**: LLM이 생성한 요인 텍스트는 인간 전문가가 직접 라벨링한 결과와 높은 코사인 유사도를 보였다.
- **어텐션 가중치 해석**: 특정 사용자는 ‘가격’ 요인에 높은 가중치를, 다른 사용자는 ‘분위기’에 높은 가중치를 부여받아, 개인화가 명확히 드러났다.
- **계산 비용**: LLM 호출은 오프라인 배치 단계에서만 수행되며, 실시간 추론 시에는 사전 저장된 프로파일 임베딩만 사용해 지연을 최소화한다.
**6. 결론 및 향후 연구**
ReFORM은 리뷰 텍스트를 LLM으로 요인별 프로파일링하고, 다중요인 어텐션으로 사용자마다 다른 의사결정 요인을 동적으로 강조함으로써 레스토랑 추천 성능을 크게 끌어올렸다. 향후 연구에서는 요인 자동 탐색, 멀티도메인 확장, 그리고 LLM 경량화 모델을 통한 실시간 서비스 적용을 목표로 할 수 있다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기