에지에서 신뢰 기반 생성형 AI 라우팅 프레임워크 G‑TRAC
본 논문은 분산된 에지 디바이스에서 생성형 AI 추론을 수행할 때, 노드의 신뢰도와 지연을 동시에 고려한 라우팅 기법을 제안한다. 위험 제한 최단 경로(Risk‑Bounded Shortest Path) 문제를 다항식 시간 알고리즘으로 해결하고, 전역 신뢰 원장을 안정적인 앵커에 유지하면서 경량 업데이트를 에지 피어에 전파하는 하이브리드 신뢰 구조를 설계한다. 실험 결과, 라우팅 지연이 10 ms 이하로 유지되며, 실패·분할 상황에서도 추론 완료…
저자: Chanh Nguyen, Erik Elmroth
본 논문은 에지 디바이스가 분산된 형태로 생성형 AI(GenAI) 추론을 수행할 때 발생하는 신뢰·성능 불확실성을 해결하기 위해 G‑TRAC이라는 프레임워크를 제안한다. 기존의 P2P 기반 추론 시스템은 지연 최소화에만 초점을 맞추고, 노드의 실패나 악의적 행위를 고려하지 않아 인터랙티브 서비스에 치명적인 영향을 미칠 수 있다. G‑TRAC은 이러한 문제를 ‘라우팅을 제어 문제로 전환’하고, 위험 제한(Risk‑Bounded) 최단 경로 모델을 기반으로 신뢰와 지연을 동시에 최적화한다.
1. **시스템 모델**
- **엔티티**: 앵커(A) – 전역 신뢰 원장을 보관하는 고가용성 노드; 피어(P) – 실제 연산을 수행하는 이종 에지 디바이스; 서비스 시커(S) – 추론 요청을 시작하는 리소스 제한 디바이스.
- **그래프**: G = (V,E)에서 V는 A∪P∪S, E는 연속 레이어 혹은 파이프라인 단계 간 논리적 전송 가능성을 나타낸다.
- **워크로드**: 추론 요청을 K 단계의 서비스 체인 T = ⟨τ₁,…,τ_K⟩ 로 모델링하고, 각 단계는 피어 p(k)∈P에 매핑된다.
2. **신뢰·위험 모델**
- 각 피어 p는 시간 t에 신뢰 점수 r_p(t)∈
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기