간접 유전 알고리즘을 활용한 집합 커버링 최적화

본 논문은 집합 커버링(Set Covering) 문제를 해결하기 위한 새로운 진화적 접근법을 제시한다. 집합 커버링은 m개의 행과 n개의 열로 구성된 0‑1 행렬에서 최소 비용으로 모든 행을 적어도 하나의 열로 커버하는 문제이며, NP‑complete 특성을 가진다. 전통적인 유전 알고리즘은 염색체가 직접 해를 나타내어 제약 위반과 에피스타시스 문제에 직면한다. 이를 극복하고자 저자는 **간접 유전 알고리즘(Indirect Genetic Algorithm, IGA)**을 설계하였다. IGA는 세 단계로 구성된다. 첫 번째 단계는 **유전 알고리즘** 자체이며, 여기서는 해 대신 **행 순서(permutation of rows)**를 탐색한다. 염색체는 1부터 m까지의 정수를 무작위 순서로 배열한 퍼뮤테이션이며, 인구 규모는 보통 200, 세대 수는 500 정도로 설정한다. 선택은 랭크 기반 룰렛 방식을 사용해 피트니스(비용) 순으로 랭크를 매긴 뒤, 높은 랭크에 비례해 선택 확률을 부여한다. 교배 연산은 **Permutation Uniform‑like Crossover (PUX)**를 적용한다. PUX는 두 부모의 순서를 균등하게 섞어 새로운 퍼뮤테이션을 생성하되, 행이 중복되거나 누락되지 않도록 보장한다. 돌연변이는 두 위치를 교환하는 **스와프(swap)** 연산으로 구현한다. 두 번째 단계는 **디코더(Decoder)**이다. 디코더는 GA가 제공한 행 순서를 입력받아 실제 열 선택을 수행한다. 디코더는 각 행을 차례대로 처리하면서 해당 행을 커버할 후보 열들을 조사한다. 후보 열에 대해 세 가지 평가 기준을 정의한다. (1) 열 비용 C₁, (2) 현재 아직 커버되지 않은 행 수 C₂, (3) 해당 열이 커버할 수 있는 전체 행 수 C₃. 각 기준에 가중치 w₁, w₂, w₃를 부여해 점수 S = w₂·C₂ + w₃·C₃ – w₁·C₁을 계산하고, 가장 높은 점수를 가진 열을 선택한다. 이 과정은 **결정적(deterministic)**이며, 동일한 행 순서에 대해 항상 동일한 열 집합을 반환한다. 결정성은 GA가 동일 염색체에 대해 일관된 피트니스를 얻도록 하여 선택 압력의 왜곡을 방지한다. 또한 디코더는 **계산량이 매우 적다**; 한 해당 한 번만 실행되며, 전체 GA 실행에서도 약 10⁵번 정도 호출에 그친다. 디코더 설계 시 저자는 **검색 공간 축소**를 의도한다. 모든 가능한 열 조합을 탐색하기보다는 가중치와 점수 체계에 의해 비용이 높거나 비실현 가능성이 큰 후보를 자연스럽게 배제한다. 이는 디코더가 **탐색 가능한 지역(local basin)**을 제공하고, 그 지역 안에서 최적화를 진행하도록 만든다. 다만, 가중치 설정이 부적절하면 최적 해 자체가 배제될 위험이 있으므로, 실험에서는 여러 가중치 조합을 시험해 최적의 성능을 찾았다. 세 번째 단계는 **힐클라이밍(Hill‑Climbing) 포스트‑옵티마이저**이다. 디코더가 만든 해는 아직 완전 최적이 아니다. 예를 들어, 동일한 행을 커버하는 여러 열이 중복 선택되었거나, 비용 대비 커버 효율이 낮은 열이 포함될 수 있다. 힐클라이머는 간단한 **교환·삽입·제거** 연산을 통해 비용을 감소시킨다. 구체적으로는 현재 선택된 열 집합에서 하나의 열을 제거하고, 그 대신 비용이 낮고 커버 효율이 높은 다른 열을 추가하는 시도를 반복한다. 이 과정은 디코더가 만든 **탐색 가능한 지역** 안에서만 수행되므로, 전역 탐색에 비해 연산량이 적고 수렴 속도가 빠르다. 제약 처리 측면에서 이 접근법은 **제약을 디코더에 완전히 위임**한다. GA는 제약에 무감각하게 탐색할 수 있으며, 디코더가 항상 모든 행을 최소 한 번씩 커버하도록 설계되었기 때문에 제약 위반이 발생하지 않는다. 기존의 페널티 함수나 리페어 메커니즘을 별도로 설계할 필요가 없으며, 이는 알고리즘을 다른 제약 최적화 문제(예: 집합 분할, 스케줄링)에도 쉽게 적용할 수 있게 만든다. 실험에서는 표준 집합 커버링 벤치마크 데이터(예: OR‑LIB)에 대해 최신 직접형 GA, Lagrangian 휴리스틱, 그리고 다른 메타휴리스틱과 비교하였다. 결과는 다음과 같다. (1) **품질** – 제시된 IGA는 평균 비용이 기존 방법보다 2~5% 낮았다. (2) **속도** – 디코더가 경량이므로 전체 실행 시간이 직접형 GA 대비 30~40% 단축되었다. (3) **확장성** – 행·열 수가 5000 이상으로 증가해도 메모리 사용량이 크게 늘어나지 않아 대규모 인스턴스에 적용 가능했다. 또한, 동일 모듈 구조를 유지하면서 집합 분할 문제에 적용했을 때도 비슷한 성능 향상을 확인하였다. 논문의 주요 기여는 다음과 같다. 첫째, **검색 공간과 해 공간을 분리**함으로써 제약 처리와 에피스타시스 문제를 근본적으로 해결했다. 둘째, **모듈러 설계**(GA‑퍼뮤테이션, 디코더, 힐클라이머)로 다양한 문제에 재사용 가능하도록 했다. 셋째, **간단하면서도 효율적인 디코더**를 제시해 GA의 피트니스 평가 비용을 크게 낮췄다. 넷째, **두 단계의 간접 최적화**(디코더 + 힐클라이머) 조합이 단일 단계보다 일관되게 우수한 결과를 만든다는 실증적 증거를 제공했다. 향후 연구 방향으로는 (1) 디코더 가중치 자동 튜닝을 위한 메타‑학습, (2) 힐클라이머를 다중 시작(local search) 방식으로 확장하여 전역 탐색 능력 강화, (3) 다른 메타휴리스틱(예: 파티클 스웜, 안테나 최적화)과의 하이브리드, (4) 실시간 스케줄링 등 동적 환경에 대한 적용 가능성 검증이 제시된다. 결론적으로, 이 논문은 집합 커버링과 같은 제약 최적화 문제에 대해 **간접 유전 알고리즘**이라는 새로운 패러다임을 제시하고, 실험을 통해 기존 방법 대비 품질·속도·확장성에서 현저한 이점을 입증함으로써 진화적 컴퓨팅 분야에 중요한 기여를 한다.

간접 유전 알고리즘을 활용한 집합 커버링 최적화

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기