다양성 인식 프롬프트 라우팅을 위한 DAK‑UCB

본 논문은 텍스트‑투‑이미지 및 대형 언어 모델 등 생성형 AI에서 사용자 프롬프트에 따라 최적의 모델을 선택하는 온라인 컨텍스트 밴딧 문제에 다양성을 고려한 새로운 알고리즘 DAK‑UCB를 제안한다. 기존의 신뢰도(클립‑스코어) 중심 선택 방식과 달리, 프롬프트‑조건부 커널 거리와 커널 엔트로피를 이용해 다양성 점수를 정의하고 이를 상한 신뢰구간(Upper Confidence Bound)에 통합한다. 실험 결과, DAK‑UCB는 다양성을 크게…

저자: Donya Jafari, Farzan Farnia

본 논문은 생성형 AI 서비스가 급증함에 따라, 사용자 프롬프트에 가장 적합한 모델을 실시간으로 선택하는 문제를 다룬다. 기존 연구는 주로 프롬프트‑조건부 모델 선택을 위해 오프라인 학습 기반 선택기나 PA‑K‑UCB와 같은 온라인 컨텍스트 밴딧을 제안했으며, 이들은 모두 생성물의 신뢰도(예: CLIP‑Score)만을 보상으로 사용했다. 그러나 신뢰도는 개별 샘플의 품질을 측정하지만, 다수의 샘플이 모여 이루는 집합 수준의 다양성은 반영하지 못한다. 다양성 부족은 특히 민감한 속성(성별, 인종) 표현에서 편향을 심화시키고, 사용자 경험을 저해한다. 이에 저자들은 ‘Diversity‑Aware Kernelized Upper Confidence Bound(DAK‑UCB)’라는 새로운 컨텍스트 밴딧 알고리즘을 제안한다. 핵심 아이디어는 두 샘플 기반 기대값으로 정의되는 다양성 점수를 기존의 신뢰도 보상에 결합하고, 이를 UCB 상한에 포함시켜 탐색‑활용 균형을 조정하는 것이다. 구체적으로, (1) **Joint Kernel Distance(JKD)**와 (2) **Joint Rényi Kernel Entropy(JRKE)**라는 두 가지 프롬프트‑조건부 다양성 스코어를 정의한다. 두 스코어 모두 프롬프트와 출력의 결합 공간에 대한 곱 커널 k_joint(

다양성 인식 프롬프트 라우팅을 위한 DAK‑UCB

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기