LLM 에이전트 출력 실시간 제어 ATLAS RTC
ATLAS‑RTC는 자동회귀 언어 모델의 토큰별 로그잇을 실시간으로 감시·조정하여 JSON·툴 호출 등 구조화된 출력이 계약(컨트랙트)을 위반하지 않도록 하는 런타임 제어 시스템이다. 드리프트 점수를 기반으로 로그잇 바이어싱, 온도 조절, 토큰 마스킹, 중간 단계 롤백 등 6단계의 점진적 개입을 적용한다. 구조화된 생성과 툴 호출 벤치마크에서 최초 시도 성공률을 20~38%p 끌어올리고, 실패가 지배적인 상황에서는 지연을 최대 88% 감소시켰다…
저자: Christopher Cruz
본 논문은 LLM 기반 에이전트가 구조화된 출력을 생성할 때 발생하는 “출력 경계” 문제를 해결하기 위해, 토큰 수준에서 로그잇을 실시간으로 감시·조정하는 시스템 ATLAS‑RTC를 제안한다. 기존 접근법은 프롬프트 엔지니어링(입력 단계), 사후 검증(출력 단계), 정적 문법 기반 제약(디코딩 단계) 등으로 나뉘지만, 모두 모델이 이미 잘못된 토큰을 선택한 뒤에 개입하거나, 모델의 자유도를 과도하게 제한한다는 공통된 한계를 가진다.
ATLAS‑RTC는 이러한 한계를 극복하기 위해 다음과 같은 핵심 설계를 도입한다.
1. **런타임 상태 유지**: 매 타임스텝마다 현재 시퀀스, 로그잇, 상위‑k 분포, 엔트로피, 계약 진행 상황 등을 포함한 복합 상태 sₜ를 유지한다. 이를 통해 구조적 진행도와 불확실성을 동시에 파악한다.
2. **계약 기반 스테이지 어웨어 제어**: 출력 계약 C = (S,T,O,π,Φ)를 정의하고, 단계(cₜ)에 따라 허용 토큰 집합 T를 동적으로 변환한다. 구조적 결정 포인트(키, 값, 구분자 등)에서는 엄격히 마스킹하고, 값 생성 단계에서는 제한을 완화해 모델의 창의성을 보존한다.
3. **위험 점수와 점진적 개입**: 휴리스틱 드리프트 Dₜ와 학습된 실패 확률 Fₜ를 결합해 위험 점수 ρₜ를 산출하고, 이를 사전에 정의된 위험 구간에 매핑해 6단계(무작위, 로그잇 바이어스, 온도 감소, 토큰 마스킹, 중간 롤백·재스티어링, 강제 종료) 중 하나를 선택한다. 이 “라더 정책”은 최소한의 개입으로 오류를 방지하고, 필요 시 강력한 교정을 수행한다.
4. **중간 단계 롤백**: 위험이 임계값을 초과하면 KV‑Cache를 트렁케이션해 최근 n 토큰을 되돌리고, 수정된 로그잇을 재주입한다. 롤백은 평균 0.8회, 최대 깊이 3 토큰으로 제한돼 오버헤드가 거의 없다.
실험은 두 가지 주요 시나리오에서 수행되었다. 첫 번째는 애매한 프롬프트 하에서 다양한 JSON 스키마를 만족시키는 능력이다. 기본 모델은 56.7%의 성공률을 보였으나, ATLAS‑RTC 적용 시 76.7%(+20 pp)로 상승했으며, 가장 어려운 스키마에서는 40 pp까지 개선했다. 두 번째는 툴 호출 벤치마크로, 최초 시도 성공률이 28.3%에서 58.3%(+30 pp)로 크게 향상되었고, 특히 0%였던 특정 툴 호출이 90%까지 복구되었다.
하지만 한계도 명확히 제시된다. 다중 라인 문자열을 포함한 스키마에서는 마스킹과 온도 조절이 오히려 성능을 저하시켰으며, 이미 높은 성공률을 보이는 베이스라인에서는 추가 제어가 지연을 증가시켰다. 또한 계약 정의가 복잡하고, 위험 점수 임계값을 데이터셋별로 튜닝해야 하는 비용이 존재한다.
결론적으로 ATLAS‑RTC는 “디코딩 단계에서 실시간 위험 감지·점진적 교정”이라는 새로운 레이어를 도입함으로써, LLM 에이전트 파이프라인에서 구조화된 출력의 신뢰성을 크게 향상시키고 재시도 비용을 절감한다. 향후 연구는 다중 라인/복합 타입 지원 확대, 자동 계약 생성, 그리고 위험 점수 학습을 위한 대규모 메타데이터 구축 등을 목표로 할 수 있다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기