비대칭 멀티프로세서에서 의존성 작업의 에너지·시간 효율적 스케줄링
본 논문은 서로 다른 속도를 가진 프로세서들로 구성된 비대칭 멀티코어 시스템에서, 선행 관계가 있는 작업들을 효율적으로 배치하는 두 가지 알고리즘을 제안한다. 첫 번째는 기존 스케줄을 사후 처리해 에너지 소비를 최소화하면서 makespan을 유지하는 선점형 “Save‑Energy” 알고리즘이며, 두 번째는 두 종류의 속도만을 갖는 제한된 비대칭 환경에서 거의 최적에 가까운 makespan을 보장하는 비선점형 “Remnants” 알고리즘이다. 또…
저자: Ioannis Chatzigiannakis, Georgios Giannoulis, Paul G. Spirakis
본 연구는 서로 다른 처리 속도를 가진 프로세서들로 구성된 비대칭 멀티코어 시스템에서, 선행 관계가 있는 작업들을 효율적으로 스케줄링하는 문제를 다룬다. 작업은 단위 실행 시간(1)으로 가정하고, 의존 관계는 DAG(Directed Acyclic Graph) 형태로 표현한다. 시스템은 m 개의 프로세서로 이루어지며, 그 중 m_s 개는 속도 s (>1)를, 나머지는 속도 1을 가진다. 전력 소비는 c(k)^α·t (α>1) 로 정의된 볼록 함수이며, 속도가 높을수록 에너지 소모가 급격히 증가한다는 가정 하에 에너지 효율성을 최적화한다.
첫 번째 절에서는 에너지 절감을 위한 선점형 알고리즘 “Save‑Energy”를 제시한다. 입력으로 기존 스케줄(작업‑프로세서 매핑)을 받아, 시간 구간 t₁,…,t_τ₀ 으로 분할한다. 각 구간에서 고속 코어에 할당된 작업을 가능한 한 저속 코어에 재배치하는데, 재배치 시 작업이 완전히 들어맞는 경우와 부분적으로 들어맞는 경우를 모두 고려한다. 핵심 정리(조건 of optimality)는 어떤 구간에서도 고속 코어 작업을 저속 코어로 옮겨 에너지를 감소시킬 수 없을 때 스케줄이 에너지 최적임을 보인다. 또한, 작업을 재배치할 최적 속도는 c(v)=α^{‑1}·c(u) 에 가장 가까운 속도이며, α=2일 경우 c(v)=c(u)/2 가 된다. 알고리즘은 작업을 가능한 가장 낮은 속도에 배치함으로써 전체 에너지 소비를 최소화하면서 makespan은 전혀 증가시키지 않는다. 복잡도는 O(m²·τ₀²) 이며, 실제 DAG에서는 선점 구간이 제한적이므로 실용적인 실행 시간이 기대된다.
두 번째 절에서는 비대칭 시스템이 동일 평균 속도와 프로세서 수를 가진 대칭 시스템보다 언제든지 같은 혹은 더 짧은 최적 makespan을 달성한다는 이론적 근거를 제시한다. 대칭 시스템의 최적 스케줄 OPT_σ 을 시간 구간별로 분할하고, 각 구간의 작업을 비대칭 프로세서에 순차적으로 할당한다. 이때 각 작업은 1/m 시간 동안 평균 속도 (∑c(i))/m 으로 처리되므로, 대칭 시스템과 동일한 처리량을 보장한다. 만약 대칭 스케줄에서 어떤 구간에 프로세서가 유휴 상태라면, 비대칭 시스템은 빠른 프로세서만을 활용해 더 높은 총 처리 능력을 발휘하므로 makespan이 실제로 감소한다. 이 정리는 모든 DAG와 선점형 모델에 적용 가능하며, 비대칭 시스템이 시간 효율성 측면에서도 우수함을 증명한다.
세 번째 절에서는 두 종류 속도만을 갖는 제한된 비대칭 환경에 초점을 맞춘 비선점형 알고리즘 “Remnants”를 설계한다. 작업 집합을 체인(Chain) 형태로 분해하고, 각 체인의 길이를 l₁≥l₂≥…≥l_r 로 정렬한다. 빠른 프로세서에 가능한 많은 체인을 할당한 뒤, 남은 작업을 느린 프로세서에 배분한다. 이때 남은 작업을 “잔여(Remnant)”라 부르고, 이를 효율적으로 배치하기 위해 확률적 선택과 균형 잡힌 부하 분산을 적용한다. 정밀 분석을 통해 기대값 기준 (3+o(1)) 의 근사 비율을 달성함을 보였으며, 이는 기존 6‑approximation (두 속도 경우)보다 크게 개선된 결과이다. 또한, 최근 연구에서 제시된 K 개의 속도에 대한 일반적 근사 알고리즘을 두 속도에 특화시켜 O(K) ≈ 6 에서 3 으로 비율을 절반 수준으로 낮춘다.
논문은 또한 에너지와 시간 효율성 사이의 트레이드오프를 논의한다. 선점형 “Save‑Energy”는 에너지 절감에 초점을 맞추며, makespan을 유지하거나 약간 감소시킬 수 있다. 반면, 비선점형 “Remnants”는 makespan을 최소화하는 데 중점을 두고, 에너지 소비는 기본 전력 모델에 따라 자연스럽게 감소한다. 두 알고리즘 모두 프로세서 재할당 오버헤드가 무시된다는 가정 하에 설계되었으며, 실제 시스템에서는 컨텍스트 스위치 비용이나 캐시 온도 효과 등을 고려해야 할 필요가 있다.
마지막으로, 연구의 한계와 향후 과제를 제시한다. 현재 모델은 작업이 모두 단위 시간이며, 전력 소비가 속도에 대한 단순 볼록 함수라는 가정을 사용한다. 실제 환경에서는 작업 크기가 다양하고, 전력 모델이 비선형적이며, 통신 지연이나 메모리 대역폭 제한이 존재한다. 또한, 선점이 가능한 경우에도 실제 운영체제 수준에서의 스케줄링 오버헤드가 무시할 수 없을 정도로 커질 수 있다. 향후 연구에서는 이러한 현실적인 제약을 포함한 확장 모델, 다중 작업 유형, 그리고 하드웨어 수준의 전력 관리 기법과의 통합을 탐구할 필요가 있다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기