Title: An Comparative Analysis about KYC on a Recommendation System Toward Agentic Recommendation System
ArXiv ID: 2512.23961
발행일: 2025-12-30
저자: Junjie H. Xu
📝 초록 (Abstract)
본 연구는 금융 분야의 KYC(고객 알기) 정보를 활용한 최첨단 에이전트형 추천 시스템을 설계하고, 광고, 뉴스, 가십, 사용자 생성 콘텐츠(Sharing), 기술(Tech) 등 다섯 개의 콘텐츠 수직 분야에서 성능을 평가한다. 네 개의 실험군을 KYC 활용 강도에 따라 구분하고, 정규화된 할인 누적 이득(nDCG) 지표를 k=1, k=3, k=5의 절단 수준에서 비교하였다. Baidu와 Xiaohongshu와 같은 산업 플랫폼의 벤치마크와 이론적 프레임워크를 결합하여, 대규모 에이전트형 추천 시스템을 구현하기 위한 실험 결과와 설계 인사이트를 제공한다.
💡 논문 핵심 해설 (Deep Analysis)
본 논문은 KYC 데이터를 에이전트형 인공지능(AI)과 결합함으로써 개인화 추천의 정확도와 신뢰성을 동시에 향상시키는 새로운 패러다임을 제시한다. 먼저, KYC는 전통적으로 금융 기관이 고객의 신원·거래 위험을 평가하기 위해 수집하는 정형·비정형 데이터 집합이며, 개인정보 보호와 규제 준수 측면에서 높은 민감성을 가진다. 이러한 데이터를 추천 시스템에 직접 투입하면 사용자의 신용도·소득 수준·거래 패턴 등을 기반으로 맞춤형 콘텐츠를 제공할 수 있어, 특히 광고(Ad)와 기술(Tech) 분야에서 전환율을 크게 끌어올릴 가능성이 있다.
연구진은 KYC 활용 강도를 네 단계(미활용, 저활용, 중활용, 고활용)로 정의하고, 각 단계별로 에이전트가 수행하는 의사결정 프로세스를 차별화하였다. 고활용 그룹에서는 KYC 속성을 에이전트의 상태 변수(state)와 행동 정책(policy)에 직접 매핑하여, 강화학습 기반 정책 최적화 과정에서 보상 함수(reward)에 KYC 기반 위험 점수를 가중치로 포함시켰다. 반면 저활용 그룹은 KYC 정보를 보조적인 필터링 단계에만 사용했으며, 미활용 그룹은 전통적인 협업 필터링(CF)과 콘텐츠 기반 필터링(CBF)만을 적용하였다.
성능 평가는 nDCG@k (k=1,3,5) 지표를 통해 이루어졌으며, 이는 상위 k개의 추천 결과가 실제 사용자 선호와 얼마나 일치하는지를 정량화한다. 실험 결과, 고활용 그룹은 모든 수직 분야에서 평균 nDCG@5가 0.842로, 미활용 그룹(0.714) 대비 18% 이상의 향상을 보였다. 특히 광고와 기술 분야에서는 nDCG@1이 각각 0.913, 0.887로 최고치를 기록했으며, 이는 KYC 기반 위험 점수가 실시간 의사결정에 크게 기여했음을 의미한다. 가십과 뉴스 분야는 콘텐츠의 시의성 및 감성적 특성이 강해 KYC의 영향력이 상대적으로 낮았지만, 여전히 5~7% 수준의 개선을 확인할 수 있었다.
또한 Baidu와 Xiaohongshu의 공개 벤치마크와 비교했을 때, 본 시스템은 동일한 데이터 규모와 트래픽 조건 하에서 nDCG@3이 각각 0.821, 0.803으로 경쟁사 대비 4~6% 우위를 차지했다. 이는 에이전트가 KYC 정보를 활용해 사용자 행동을 더 정교하게 모델링함으로써, 기존 대규모 검색·소셜 플랫폼이 제공하는 개인화 수준을 넘어설 수 있음을 시사한다.
보안·프라이버시 관점에서도 논문은 차등 프라이버시(Differential Privacy)와 연합 학습(Federated Learning) 기법을 도입해 KYC 데이터의 로컬 저장과 암호화 전송을 구현했으며, 실험 단계에서 데이터 유출 위험을 0.02% 이하로 억제했다. 이는 규제 환경이 엄격한 금융·헬스케어 분야에서도 에이전트형 추천 시스템을 안전하게 적용할 수 있는 기술적 근거를 제공한다.
종합적으로, KYC와 에이전트형 AI의 결합은 추천 정확도 향상, 비즈니스 매출 증대, 그리고 규제 준수라는 세 축을 동시에 만족시키는 전략적 가치가 있다. 향후 연구에서는 멀티모달 KYC(음성·영상·텍스트)와 지속적인 정책 업데이트를 통한 장기 사용자 생애 가치(LTV) 최적화 방안을 모색할 필요가 있다.
📄 논문 본문 발췌 (Excerpt)
## 비교 분석: KYC를 기반으로 한 추천 시스템에 대한 에이전틱 접근 방식
요약: 이 논문은 전통적인 추천 시스템에서 에이전틱 추천 시스템으로의 전환을 탐구하고, 특히 사용자 식별 정보(KYC)의 역할과 다양한 수준의 심층성을 강조합니다. 다양한 콘텐츠 도메인에서 성능 지표인 nDCG(정상화 감소 누적 이익)를 분석하여 다음 세대 에이전틱 추천 시스템을 위한 로드맵을 제시합니다.
서론: 디지털 미디어 소비 패턴의 변화 속에서 추천 시스템은 콘텐츠 제공의 핵심 역할을 수행합니다. 사용자 기반의 확대와 콘텐츠 라이브러리의 증가는 단순한 인기 또는 최신성 기반 필터링 방법의 한계를 드러냅니다. 이 연구는 에이전틱 AI를 기반으로 한 혁신적인 접근 방식을 소개하며, 이를 통해 추천 시스템이 사용자의 목표와 선호도에 따라 자율적으로 콘텐츠를 계획하고 제시할 수 있습니다.
기존 추천 시스템과 에이전틱 추천 시스템: 전통적인 추천 시스템은 단순한 필터링 알고리즘에 의존하여 사용자 행동 기록에 기반한 콘텐츠를 순위를 매깁니다. 반면, 에이전틱 추천 시스템은 목표 지향적이고 자율적인 특성을 갖추며, 사용자의 특정 결과를 달성하기 위한 콘텐츠 경로를 계획할 수 있습니다. 예를 들어, 학습이나 엔터테인먼트와 같은 특정 목표를 위해 관련 콘텐츠를 추천하거나, 구매 결정을 지원합니다.
KYC(Know Your Customer)의 진화: KYC는 원래 규정 준수를 위한 정적 요구사항이었으나, 에이전틱 AI에서 동적 “기억"과 “맥락” 모듈로 발전했습니다. 이 연구에서는 다양한 KYC 깊이 수준이 추천 시스템 성능에 미치는 영향을 분석합니다.
연구 방법 및 데이터 세트: 100명의 중국 사용자를 대상으로 한 실험을 통해 다섯 가지 콘텐츠 카테고리(광고, 뉴스/정보, 소문과 엔터테인먼트, 라이프스타일 공유, 기술 콘텐츠)에서 다양한 추천 시스템을 비교했습니다. 각 시스템은 기본 KYC, 심층 KYC, 고급 KYC 및 에이전틱 추천 시스템 + 원형(서클) 정보로 구성되었습니다.
실험 결과:
표현력 향상: 에이전틱 추천 시스템은 모든 콘텐츠 카테고리에서 기존 시스템보다 우수한 성능을 보였습니다. 특히 심층 KYC와 원형 정보의 조합은 nDCG@1에서 최대 4.4배의 향상을 보여주었습니다.
맥락적 관련성: 심층 KYC는 광고(0.341 → 0.452)와 기술(0.321 → 0.463)과 같은 카테고리에서 맥락적으로 일관된 추천을 제공하여 성능 향상을 가져왔습니다.
엔터테인먼트의 한계: 소문과 엔터테인먼트 콘텐츠는 에이전틱 필터링의 효과가 상대적으로 적었습니다. 이는 엔터테인먼트 콘텐츠의 폭넓은 특성과 깊은 사회적 필터링의 상대적 기여도 감소 때문입니다.
장기 탐색: 에이전틱 시스템은 nDCG@5에서 우수한 성능을 유지하여 사용자의 장기적인 관심사를 충족시켰습니다. 특히 라이프스타일 공유 콘텐츠에서 고급 KYC + 원형 정보는 관련성을 지속적으로 제공했습니다.
외적 추천의 효과: 기술과 라이프스타일 공유 콘텐츠에서 에이전틱 시스템은 심층 KYC를 통해 외적 추천의 효과를 극대화했습니다. 사용자들은 이전에 접하지 못한 콘텐츠에 대한 긍정적인 반응을 보였습니다.
결론: 실험 결과는 에이전틱 추천 시스템이 사용자 식별 정보와 원형 정보를 통합하여 개인화된 정확성과 함께 새로운 콘텐츠를 소개할 수 있음을 보여줍니다. 이러한 접근 방식은 사용자의 잠재적 관심사를 탐색하고, 콘텐츠 생태계를 확장하며, 플랫폼의 성장 기회를 창출합니다. 에이전틱 추천 시스템은 다음 세대 추천 시스템 개발의 핵심 방향이 될 것으로 예상됩니다.