NK 지형에서 추정분포 알고리즘과 유전 알고리즘 성능 비교

본 논문은 NK 피트니스 랜드스케이프라는 조정 가능한 이진 최적화 모델을 이용해 여러 진화적 알고리즘의 성능을 정량적으로 비교한다. NK 모델은 n개의 비트와 각 비트마다 k개의 이웃을 갖는 구조로 정의되며, 각 비트와 이웃 조합에 대한 서브함수 값은 무작위 룩업 테이블로 생성된다. k가 0이면 단순한 OneMax와 유사하지만, k>1이면 변수 간 복잡한 상호작용이 발생해 NP‑complete 문제로 전환된다. 연구자는 n과 k의 다양한 조합에 대해 10,000개의 무작위 인스턴스를 생성하고, 각 인스턴스의 전역 최적해를 브랜치‑앤‑바운드(BA‑B) 알고리즘으로 사전 검증한다. BA‑B는 재귀적 탐색 트리에서 현재까지 발견된 최적값보다 상한이 낮은 서브트리를 가지치기함으로써 탐색 공간을 크게 축소한다. 초기 상한을 높이기 위해 3‑비트 플립 힐클라이머를 여러 번 재시작하며 적용한다. 실험 가능한 최대 n은 k에 따라 제한되었으며, k=2일 때 n≤52, k=6일 때 n≤32까지 전역 최적을 보장했다. 비교 대상 알고리즘은 다음과 같다. (1) Hierarchical Bayesian Optimization Algorithm (hBOA) – 베이지안 네트워크와 결정 트리를 이용해 변수 간 의존성을 학습하고 샘플링한다. (2) Univariate Marginal Distribution Algorithm (UMDA) – 각 위치의 1 비율만을 모델링하는 단순 마진 모델을 사용한다. (3) Genetic Algorithm (GA) – 두 종류의 교차(균일, 두점)와 비트 플립 변이를 조합한다. (4) GA without crossover – 변이만 적용한다. 모든 알고리즘은 동일한 인구 크기와 제한 토너먼트 교체(RTR) 방식을 사용하며, 변이율 pₘ=1/n으로 설정한다. 또한, 각 알고리즘에 Deterministic Hill Climber(DHC)를 사전 적용해 모든 후보를 지역 최적으로 끌어올렸다. 실험 설정은 n=20~52(단계 2)와 k=2~6(단계 1) 범위에서 진행되었으며, 총 600,000개의 인스턴스에 대해 각 알고리즘을 실행했다. 성능 평가는 성공률(전역 최적 도달 비율), 평균 함수 평가 횟수, 평균 실행 시간으로 측정했다. 결과 분석은 다음과 같다. k가 작을수록(특히 k=2) 모든 알고리즘이 높은 성공률을 보였으며, 평가 횟수와 시간도 비교적 낮았다. 그러나 k가 4 이상으로 증가하면 문제 난이도가 급격히 상승한다. 이때 GA‑Uniform과 GA‑Two‑Point은 교차 연산이 변수 간 상관성을 파괴해 탐색 효율이 크게 떨어지며, 성공률이 30% 이하로 급감한다. 교차가 전혀 없는 GA‑Mutation‑Only는 가장 낮은 성능을 보이며, k≥4에서는 거의 수렴하지 못한다. 반면, hBOA는 베이지안 네트워크를 통해 변수 간 복잡한 의존 구조를 학습하고, 이를 기반으로 새로운 개체를 샘플링함으로써 높은 탐색 효율을 유지한다. k=5,6에서도 70% 이상 성공률을 기록했으며, 평균 평가 횟수와 실행 시간에서도 UMDA와 GA보다 우수했다. UMDA는 독립 마진만을 모델링하므로 변수 간 상호작용이 강한 경우 성능이 제한적이었다. DHC를 사전 적용한 결과는 모든 알고리즘에서 성공률을 약 5~10% 정도 향상시켰으며, 특히 hBOA와 UMDA에서 지역 최적에 빠지는 현상을 감소시켰다. 논문은 또한 브랜치‑앤‑바운드의 한계(지수적 시간 복잡도)와 실험 가능한 n의 상한을 논의하고, 향후 연구 방향으로 더 큰 NK 인스턴스를 다루기 위한 병렬 BA‑B, 샘플링 기반 근사 최적화, 그리고 hBOA의 구조 학습 비용을 줄이는 방법 등을 제시한다. 전반적으로, 변수 의존성을 모델링하는 확률적 모델 기반 알고리즘(hBOA)이 고차원 상호작용 문제에서 가장 강력한 성능을 보이며, 전통적인 교차 기반 GA는 복잡한 NK 랜드스케이프에서는 한계가 있음을 확인한다.

NK 지형에서 추정분포 알고리즘과 유전 알고리즘 성능 비교

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기