저비용 검증 언제 믿을까: 약한 검증과 강한 검증의 균형

LLM 추론 과정에서 빠르고 저렴한 약한 검증과 비용이 많이 드는 강한 검증을 언제 활용할지 결정하는 정책을 이론화하고, 두 임계값 기반 최적 구조를 제시한다. 또한, 온라인 알고리즘 SSV를 통해 타입‑I·II 오류를 사전 설정한 수준으로 제어하면서 강한 검증 호출을 최소화한다. 실험은 수학적 추론과 순차 퍼즐에서 기존 강한 검증 수준의 정확도를 유지하면서 검증 비용을 크게 절감함을 보여준다.

저자: Shayan Kiyani, Sima Noorani, George Pappas

저비용 검증 언제 믿을까: 약한 검증과 강한 검증의 균형
본 연구는 대형 언어 모델(LLM)의 추론 과정에서 발생하는 두 종류의 검증, 즉 내부에서 빠르게 수행되는 약한 검증(weak verification)과 외부에서 비용이 많이 드는 강한 검증(strong verification) 사이의 상충 관계를 체계적으로 분석한다. 약한 검증은 self‑consistency, 프록시 보상, 도메인‑특화 툴 등으로 구현되며, 저비용·고속이 장점이지만 노이즈가 섞여 있어 신뢰성이 낮다. 반면 강한 검증은 인간 전문가의 검토나 실제 코드 실행 등으로, 높은 신뢰성을 제공하지만 비용·시간이 크게 소요된다. 이러한 차이를 고려해 저자는 “약‑강 검증 정책”(weak–strong verification policy)이라는 프레임워크를 제안한다. 정책은 매 순간 모델이 생성한 응답에 대해 약한 검증 점수 w∈

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기