EffiSkill 에이전트 스킬 기반 자동 코드 효율 최적화
본 논문은 대규모 느린‑빠른 코드 쌍으로부터 재사용 가능한 최적화 메커니즘을 추출하고, 이를 “Operator Skill”와 “Meta Skill” 형태의 스킬 카드로 정리한 뒤, 실행 없이 새로운 프로그램을 진단·검색·계획·생성하는 두 단계 파이프라인을 제안한다. 실험 결과, 경쟁 프로그래밍 벤치마크인 EffiBench‑X에서 기존 프롬프트·검색 기반 방법들을 3.69~12.52%p 상회하는 성공률을 기록한다.
저자: Zimu Wang, Yuling Shi, Mengfan Li
본 논문은 대규모 느린‑빠른 코드 쌍을 활용해 재사용 가능한 최적화 지식을 추출하고, 이를 LLM 기반 에이전트가 실행‑프리 환경에서도 활용할 수 있는 프레임워크 **EffiSkill**을 제안한다. 연구 배경으로는 코드 효율성이 소프트웨어 품질의 핵심 요소이며, 기존 자동 최적화 방법은 수동 규칙 기반이나 LLM 기반의 일회성 재작성, 검색·프롬프트 기반 접근에 머물러 있어, 최적화 메커니즘을 명시적으로 저장·재사용하지 못한다는 점을 지적한다.
EffiSkill은 두 단계로 구성된다. **Stage I – Skill Mining**에서는 (1) 느린‑빠른 솔루션 쌍으로부터 GPT‑5.1을 이용해 구조화된 최적화 트레이스를 생성한다. 트레이스는 문제 요약, 느린 코드 병목 진단, 빠른 코드 핵심 아이디어, 두 코드 사이 변환 요약 네 부분으로 이루어진다. (2) 각 트레이스를 “Signature”라는 압축 표현으로 변환한다. Signature는 최적화 유형(예: DP 상태 압축, 알고리즘 교체), 복잡도 변화, 트리거 조건, 문제 특성 등을 포함한다. (3) 유사 Signature들을 클러스터링해 **Operator Skill**을 도출한다. Operator Skill은 적용 조건, 변환 절차, 기대 복잡도 감소, 흔히 발생하는 함정, 최소 예시 등을 포함한 스킬 카드 형태로 정리된다. (4) Operator Skill 집합을 기반으로 **Meta Skill**을 만든다. Meta Skill은 최적화 플래닝, 스킬 선택·조합 로직, 예산·제어 전략 등을 정의한다.
**Stage II – Skill‑Guided Optimization**에서는 새로운 프로그램을 입력받아 (1) 정적 분석과 LLM 추론을 결합해 병목을 진단하고, (2) 진단 결과와 문제 특성에 맞는 Operator Skill을 검색한다. (3) Meta Skill에 정의된 플래닝 규칙에 따라 여러 스킬을 순차·병렬로 조합해 최적화 계획을 만든다. (4) 각 계획에 따라 코드를 변환하고, 정적 검증을 통해 문법·타입 오류를 최소화한다. 후보 코드는 실행 없이 생성되며, 필요 시 외부 평가 단계에서 실제 실행을 통해 최종 선택한다.
실험은 경쟁 프로그래밍 최적화 벤치마크 **EffiBench‑X**를 사용했다. 두 모델(GPT‑5‑mini, Qwen‑3‑Coder‑30B‑A3B‑Instruct)과 C++, Python 두 언어에 대해, 기존 최고 성능을 보인 SBLLM 등 5개 베이스라인과 비교했다. 결과는 C++에서 12.03%p, Python에서 4.98%p(또는 Qwen 모델에서는 각각 12.36%p, 8.67%p) 향상된 최적화 성공률을 기록했다. 특히 다단계 변환이 필요한 DP 상태 압축, 알고리즘 교체, 상수 팩터 감소와 같은 복잡한 사례에서 큰 이점을 보였다.
또한, 스킬 라이브러리는 인간이 직접 검토 가능한 형태로 제공돼, 최적화 과정의 투명성을 어느 정도 확보한다. 완전한 해석 가능성은 아니지만, “스킬 카드”라는 중간 추상화 덕분에 어떤 변환이 왜 선택됐는지 추적이 가능하다. 이는 코드 리뷰 보조, 레포지토리 규모 최적화, 혹은 다른 소프트웨어 엔지니어링 도구와의 연동에 활용될 수 있다.
결론적으로, EffiSkill은 (1) **메커니즘 수준의 재사용 가능한 최적화 지식**을 자동으로 추출·정리하고, (2) **실행‑프리 인퍼런스** 환경에서도 구조화된 플래닝과 변환을 수행함으로써 기존 LLM 기반 코드 최적화의 일반화·효율성 한계를 크게 완화한다는 점에서 학술적·실용적 의의가 크다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기