에지 스트림 서비스 자동 스케일링을 위한 에이전트 기반 최적화

본 논문은 엣지 디바이스에서 동시 실행되는 다중 스트림 처리 서비스를 대상으로, 서비스별 파라미터와 자원 할당을 정밀하게 조정할 수 있는 다차원 자동 스케일링 플랫폼(MUD‑AP)과, 실시간 회귀 분석을 통해 환경 모델을 구축하고 최적 정책을 도출하는 스케일링 에이전트(RASK)를 제안한다. 데모에서는 QR 코드 인식, YOLOv8 기반 컴퓨터 비전, 포인트 클라우드 매핑 세 서비스를 8코어 제한 하에 30번의 탐색만으로 SLO 달성률을 56 …

저자: Boris Sedlak, Víctor Casamayor Pujol, Schahram Dustdar

에지 스트림 서비스 자동 스케일링을 위한 에이전트 기반 최적화
본 논문은 스마트 시티와 같은 퍼베이시브 애플리케이션에서 센서 데이터의 저지연 처리를 위해 엣지 디바이스에 다중 스트림 처리 서비스를 배치하는 상황을 다룬다. 이러한 환경은 (1) 애플리케이션 요구와 자원 가용성이 시시각각 변동하여 동적 스케일링이 필요하고, (2) 각 서비스가 제공하는 조정 가능한 파라미터가 서로 다르기 때문에 서비스별 맞춤형 스케일링 정책이 요구되며, (3) 동일 디바이스에 여러 서비스가 공동 배치될 경우 자원 경쟁으로 서비스 간 “식인” 현상이 발생한다는 세 가지 문제점을 안고 있다. 이를 해결하기 위해 저자들은 두 가지 핵심 구성요소를 제안한다. 첫 번째는 MUD‑AP(Multi‑Dimensional Autoscaling Platform)이다. MUD‑AP은 엣지 디바이스에서 센서 데이터를 스트리밍·버퍼링하고, 컨테이너화된 서비스들을 실행한다. 각 서비스는 자체 REST 엔드포인트를 통해 파라미터(예: 이미지 해상도, 모델 크기, 라이다 범위 등)를 외부에서 읽고 수정할 수 있다. 서비스 실행 중 발생하는 레이턴시, CPU 사용량, 데이터 품질 등 다양한 메트릭은 시계열 데이터베이스에 지속적으로 기록된다. 이러한 메트릭은 서비스 상태 공간을 정의하고, 파라미터와 자원 할당을 정밀하게 조정할 수 있는 기반을 제공한다. 두 번째 구성요소는 RASK(Regression Analysis of Structural Knowledge) 스케일링 에이전트이다. RASK는 MUD‑AP이 제공하는 시계열 메트릭을 테이블 형태로 정리한 뒤, 회귀 분석을 통해 파라미터와 SLO(서비스 레벨 목표) 간의 함수 관계를 학습한다. 학습된 회귀식은 “파라미터 → 레이턴시·완료율·스루풋”과 같은 구조적 지식을 수치화한다. 이후, 모든 서비스에 대한 회귀 모델, 각 서비스의 SLO 목표값 및 가중치, 파라미터 경계 조건을 하나의 전역 최적화 문제로 결합한다. 수치 해석 솔버를 이용해 전역 최적 파라미터 할당을 도출하고, 이를 MUD‑AP의 REST API를 통해 실시간으로 적용한다. 데모에서는 세 가지 대표 서비스(QR 코드 리더, YOLOv8 기반 컴퓨터 비전, 포인트 클라우드 매퍼)를 동일 엣지 디바이스에 배치하고, 전체 CPU 코어를 8코어로 제한한다. 각 서비스는 데이터 품질, CPU 할당량, 그리고 CV 서비스의 경우 YOLOv8 모델 크기와 같은 조정 가능한 파라미터를 갖는다. 서비스별 SLO는 레이턴시와 완료율에 대한 목표값 및 가중치로 정의된다. 실험은 600초 동안 진행되며, 처음 300초는 무작위 탐색을 통해 환경을 학습하고, 이후 300초는 학습된 모델을 기반으로 최적 파라미터를 적용한다. 실험 결과, RASK는 30번의 파라미터 조정(≈300초)만으로도 전역 SLO 달성률을 56 %에서 98 %로 크게 향상시켰다. 이는 전통적인 강화학습(Q‑learning 등) 대비 샘플 효율성이 월등히 높다는 것을 보여준다. 또한, 에이전트가 학습한 회귀 모델은 시각화 인터페이스를 통해 실시간으로 확인 가능하며, 서비스별 파라미터와 SLO 달성 상황을 한눈에 파악할 수 있다. 논문은 또한 다음과 같은 확장 가능성을 제시한다. (1) 구조적 지식(변수 관계)은 전문가 지식으로 제공될 수도 있고, 자동 구조 학습을 통해 추출될 수도 있다. (2) MUD‑AP의 REST 기반 설계는 다양한 자동 스케일링 로직(예: 정책 기반, 머신러닝 기반)과 쉽게 연동될 수 있다. (3) 에이전트가 엣지 디바이스 자체에서 실행되므로 중앙 집중식 관리자가 없어도 시스템 전체의 자율성과 복원력을 확보한다. 결론적으로, 본 연구는 엣지 환경에서 다중 서비스가 제한된 자원을 공유하면서도 개별 파라미터를 정밀하게 조정할 수 있는 다차원 자동 스케일링 프레임워크와, 회귀 기반 구조적 학습을 통해 빠르게 최적 정책을 도출하는 스케일링 에이전트를 제시한다. 이를 통해 퍼베이시브 스트림 처리 서비스가 높은 QoS를 유지하면서도 자원 효율성을 극대화할 수 있음을 실증적으로 보여준다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기