인터넷 측정을 위한 에이전트 기반 자동 워크플로우 생성 프레임워크 Airavat

Airavat는 대규모 언어 모델(LLM) 기반 에이전트를 활용해 자연어 질의에서 신뢰성 있는 인터넷 측정 워크플로우를 자동으로 생성하고, 50년간 축적된 측정 연구를 구조화한 지식 그래프와 검증·검증 엔진을 통해 방법론적 오류를 사전에 탐지·수정한다.

저자: Alagappan Ramanathan, Eunju Kang, Dongsu Han

인터넷 측정을 위한 에이전트 기반 자동 워크플로우 생성 프레임워크 Airavat
인터넷 측정은 네트워크 구조·동작을 이해하기 위해 BGP 분석, 트레이서트 처리, 토폴로지 매핑, 성능 모니터링 등 다양한 전문 도구를 조합해야 하는 복합 작업이다. 기존 연구에서는 이러한 도구들을 개별적으로 제공하거나 제한된 파이프라인만 지원했으며, 실제 현장에서 새로운 문제에 직면했을 때 전문가가 직접 스크립트를 작성하고 통합하는 데 많은 시간과 전문 지식이 요구된다. 또한, 측정 결과의 신뢰성은 단순히 코드가 정상 실행되는지 여부가 아니라, 데이터 전처리·필터링·통계적 검증 등 수십 년간 축적된 방법론적 규칙을 얼마나 충실히 따랐는가에 달려 있다. 이러한 배경에서 저자들은 두 가지 핵심 과제를 제시한다. 첫째, 복잡한 측정 워크플로우를 자동으로 설계·구현하는 메커니즘이 필요하다. 둘째, 자동 생성된 워크플로우가 기존 학술적 표준에 부합하는지 검증·검증하는 체계가 요구된다. Airavat는 이러한 요구를 충족시키기 위해 에이전트 기반 아키텍처를 설계한다. 전체 파이프라인은 크게 네 부분으로 나뉜다. (1) **멀티 에이전트 워크플로우 생성**: QueryMind, WorkflowScout, SolutionWeaver 세 에이전트가 순차적으로 문제를 분해하고 설계안을 도출한 뒤 구현 코드를 생성한다. 각 에이전트는 레지스트리(도구 카탈로그)와 상호작용해 도구 선택·파라미터 설정을 수행한다. (2) **레지스트리**: 도구의 기능·입출력 스키마만을 기술한 메타데이터 집합으로, 코드베이스 전체를 노출하지 않아 LLM이 불필요한 정보를 탐색하는 것을 방지한다. (3) **지식 그래프**: 지난 50년간 SIGCOMM, IMC 등 주요 학술대회·저널에 발표된 측정 논문을 자동 수집·분류해 구축한다. 논문은 문제 정의, 접근법, 파이프라인 단계, 사용 데이터, 검증 방법 등 다섯 카테고리로 구조화되고, Neo4j 기반 그래프로 저장돼 의미 검색·다중 홉 탐색이 가능하다. (4) **검증·검증 엔진**: 생성된 워크플로우를 지식 그래프와 매칭해 방법론적 일관성을 평가하고, 누락된 전처리·필터링·통계 검증 등을 자동으로 식별한다. 검증 엔진이 제시한 수정 사항은 워크플로우 설계 단계로 되돌아가 반영된다. 검증 엔진이 찾은 결함에 대해, 검증 엔진은 선행 연구에서 사용된 대체 검증 코드를 자동 생성해 사용자가 선택·실행할 수 있게 한다. 논문은 네 가지 실제 사례를 통해 Airavat의 성능을 검증한다. 첫 번째 사례는 AAE‑1 케이블 차단 사건으로, 케이블 매핑·BGP 변화·트레이서트 데이터를 통합해 장애 원인을 파악해야 했다. Airavat는 복합 파이프라인을 5분 내에 설계·코드화했으며, 전문가가 만든 파이프라인과 거의 동일한 결과를 도출했다. 두 번째 사례는 CDN 성능 저하 분석으로, 지역별 지연·캐시 히트율·트래픽 변동을 동시에 측정해야 했다. 여기서 Airavat는 다중 대안을 제시하고, 각 대안에 대한 백업 플랜까지 자동 생성했다. 세 번째 사례는 IP 할당 정책 조사로, 기존 데이터베이스와 최신 라우팅 정보를 결합해 정책 변화를 추적했다. Airavat는 레지스트리에서 적절한 파싱·정규화 도구를 찾아 자동으로 파이프라인을 구성했으며, 검증 엔진이 발견한 미세한 필터링 오류를 사전에 교정했다. 네 번째 사례는 전 세계 인프라 복원력 평가로, 복수의 측정 도구와 대규모 데이터셋을 조합해야 하는 고난이도 작업이었다. Airavat는 복잡도 점수 5에 해당하는 문제를 인식하고, 세 가지 이상의 독립적 분석 경로를 설계해 결과의 신뢰성을 높였다. 특히, 검증 엔진이 포착한 오류는 기존 실행 기반 테스트로는 드러나지 않는 미묘한 전처리 실수(예: 라우팅 테이블의 비활성 경로 필터링 누락)였으며, 이러한 오류를 자동 수정함으로써 결과 왜곡을 방지했다. 검증 엔진이 제시한 대체 검증 코드는 선행 논문에서 사용된 통계적 부트스트랩·교차 검증·시뮬레이션 기법을 자동으로 적용해, 사용자가 별도 검증 절차를 설계할 필요 없이 바로 실행할 수 있게 했다. 전체적으로 Airavat는 (i) 자연어 질의에서 전문가 수준의 측정 워크플로우를 자동 생성하고, (ii) 복잡한 다중 도구 통합을 체계적으로 설계·구현하며, (iii) 방법론적 결함을 사전에 탐지·수정하고, (iv) 선행 연구 기반의 검증 절차를 자동 제공함으로써 인터넷 측정 연구의 접근성을 크게 향상시킨다. 또한 레지스트리와 지식 그래프는 지속적인 업데이트가 가능해 최신 연구 동향을 빠르게 반영할 수 있다. 저자들은 향후 레지스트리 자동 확장·지식 그래프 실시간 업데이트·에이전트의 자기 개선 메커니즘을 통해 Airavat를 더욱 확장 가능한 플랫폼으로 발전시킬 계획이라고 밝힌다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기