시간 시계열 분류를 위한 WhatIf 설명 반사실 생성 기법 총정리
본 논문은 시계열 분류 모델에 대한 반사실(counterfactual) 설명 기법들을 체계적으로 조사한다. 인스턴스 기반, 패턴 기반, 최적화 기반, 진화 기반, 잠재공간 기반, 하이브리드 등 여섯 가지 범주로 정리하고, 각 방법의 핵심 아이디어, 적용 가능한 모델·데이터 유형, 사용된 벤치마크와 평가 지표를 비교한다. 또한 시간적 일관성, 현실성, 행동 가능성 등 시계열 특유의 제약을 강조하고, 이를 지원하는 오픈소스 라이브러리 CFTS를 소…
저자: Udo Schlegel, Thomas Seidl
본 논문은 시계열 분류 모델에 대한 반사실(counterfactual) 설명 기법을 종합적으로 조사하고, 이를 체계적으로 정리한 서베이 논문이다. 서론에서는 의료, 금융, 산업 등 핵심 도메인에서 시계열 분류 모델이 차지하는 역할과, 모델의 예측을 신뢰하기 위해서는 ‘왜’라는 질문에 대한 답이 필요함을 강조한다. 특히 반사실 설명은 “어떤 최소한의 변화가 일어나면 다른 결과가 나오는가”라는 what‑if 시나리오를 제공함으로써, 사용자가 직접 행동을 교정하거나 모델이 학습한 패턴을 이해하는 데 큰 도움이 된다. 그러나 시계열 데이터는 시간적 순서와 채널 간 상관관계가 강해 단순히 개별 시점의 값을 바꾸는 것만으로는 현실적인 설명을 만들기 어렵다. 따라서 시간적 일관성, 플라우시빌리티(현실성), 행동 가능성 등 특수한 제약을 만족해야 한다는 점을 강조한다.
관련 연구 파트에서는 기존 반사실 설명에 대한 일반적인 설문조사와, 시계열에 특화된 최근 연구들을 구분한다. 특히 Chukwu 등(2022)의 인간‑중심 설계 요구와, 기존 방법들이 시간적 일관성을 충분히 고려하지 못한다는 비판을 인용한다.
본 논문의 핵심은 시계열 반사실 생성 방법을 **여섯 가지** 범주로 분류하고, 각 범주에 속하는 대표 논문들을 표 1에 정리한 것이다.
1. **최적화 기반(Optimization‑Based)** – 워처(Wachter)의 원래 손실 함수를 시계열에 맞게 변형한다. CoMTE(2021)는 다변량 시계열에 대해 채널별 최적화를 수행해 어느 센서가 중요한지 직관적으로 드러낸다. TS‑Tweaking(2020)은 shaplet‑aligned 세그먼트를 그리디하게 수정해 모델을 뒤집는다. TSCF(2024)는 사용자 정의 제약(예: 부드러움, 물리적 제한)을 포함해 시간적 일관성을 강화한다. 이들 방법은 계산 효율성이 높고, 거리 기반 근접성을 최소화하는 데 강점이 있다. 그러나 변형이 시계열 전반에 퍼지는 경향이 있어 해석이 어려울 수 있다.
2. **진화 기반(Evolutionary)** – 다목적 최적화 프레임워크를 사용해 유효성, 근접성, 희소성, 시간적 압축성 등을 동시에 만족하는 파레토 최적 해를 탐색한다. MOC(2020)는 다목적 진화 알고리즘을 도입했으며, TSEvo(2022)는 시계열에 특화된 변이·교차 연산을 설계한다. Sub‑Space(2023)와 Multi‑Space(2024)는 연속 구간 편집을 제한해 지역적 변화를 강조한다. 진화 기반은 다양한 대안을 제공하고 모델에 대한 접근성을 유지하지만, 수천 번의 모델 호출이 필요해 실시간 적용이 어렵다.
3. **인스턴스 기반(Instance‑Based)** – 최근 사례를 찾아 유사한 클래스의 서브시퀀스를 교체한다. Native Guide(2021)는 가장 가까운 이웃의 중요한 구간을 차용하고, CELS(2023)와 M‑CELS(2024)는 saliency 맵을 이용해 최소한의 포인트만 수정한다. AB‑CF(2023)는 attention 메커니즘을 활용해 중요한 영역을 강조한다. 이러한 방법은 직관적인 사례 기반 설명을 제공하고, 변형이 자연스러워 플라우시빌리티가 높다. 그러나 모델 내부 구조를 활용하지 못해 복잡한 비선형 패턴을 반영하기 어렵다.
4. **잠재공간 기반(Latent‑Space)** – 오토인코더, GAN, 조건부 생성 모델 등을 통해 시계열을 저차원 잠재 표현으로 압축하고, 그 공간에서 목표 클래스로 이동하는 벡터를 탐색한다. CGM(2021)은 조건부 생성 모델을, LASTS(2020)는 라벨‑조건부 VAE를, GLACIER(2024)는 지역 제약을 추가한 잠재공간 탐색을 제안한다. CounTS(2023)와 SG‑CF(2022)는 구조화된 잠재 변수를 사용해 해석 가능성을 높인다. 잠재공간 기반은 데이터 분포와 일치하는 현실적인 반사실을 생성하지만, 잠재공간 자체가 불투명하고, 생성 모델이 편향될 경우 비현실적인 결과가 나올 위험이 있다.
5. **세그먼트 기반(Segment‑Based)** – shapelet, motif, discord 등 의미 있는 서브시퀀스를 식별하고 이를 교체하거나 변형한다. SETS(2022)는 효율적인 shapelet 탐색을, DisCOX(2024)는 discord 교체를, CFWot(2024)는 훈련 데이터 없이도 서브시퀀스 교체를 수행한다. TS‑CEM(2020)은 CEM을 시계열에 맞게 변형해 대비되는 세그먼트를 활용한다. 이 접근은 시간적 연속성을 자연스럽게 보존하고, 변형이 희소해 해석이 용이하지만, 사전 패턴 탐색 비용이 크고, 패턴이 없는 데이터에서는 적용이 제한된다.
6. **하이브리드(Hybrid)** – 위 방법들을 결합해 장점을 살린다. MG‑CF(2022)는 motif‑guided와 인스턴스 교체를 결합하고, SPARCE(2022)는 구조적 희소성을 강조한다. T eR CE(2022)는 심볼릭 규칙 기반 설명을, Time‑CF(2024)는 GAN‑기반 생성에 shapelet 가이드를 결합한다. 하이브리드 방식은 다양한 제약을 동시에 만족할 수 있지만 구현 복잡도가 급격히 상승하고, 파라미터 튜닝이 어려워 재현성이 낮아지는 단점이 있다.
논문은 이러한 방법들을 **CFTS**(Counterfactual Explanations for Time Series) 라는 오픈소스 라이브러리로 구현하였다. CFTS는 동일한 API와 평가 파이프라인을 제공해, 12개의 공개 시계열 데이터셋(ECG5000, FordA, Epilepsy, ArabicDigits 등)에서 각 알고리즘을 **유효성, 근접성, 희소성, 플라우시빌리티** 네 가지 지표로 정량화한다. 실험 결과는 다음과 같다. 최적화 기반은 거리 기반 근접성에서 가장 낮은 값을 기록했으나, 시간적 희소성 점수는 진화 기반에 비해 낮았다. 진화 기반은 희소하고 지역화된 변화를 제공해 사용자에게 다양한 선택지를 제공한다. 잠재공간 기반은 플라우시빌리티와 현실성 점수에서 최고였으며, 특히 GLACIER와 CounTS는 생성된 시계열이 원본 데이터 분포와 거의 일치함을 보였다. 인스턴스 기반은 가장 높은 플라우시빌리티를 보였지만, 유효성 확보에 있어 다른 방법에 비해 약간 뒤처졌다.
마지막으로 저자들은 현재 연구의 한계와 향후 과제를 제시한다. 첫째, **사용자 중심 인터페이스**가 부족해 실제 도메인 전문가가 쉽게 활용하기 어렵다. 둘째, **도메인 지식 통합**이 미비해 의료·금융 등 분야에서 요구되는 물리적·생리학적 제약을 반영하지 못한다. 셋째, 대부분의 연구가 **시계열 분류**에 국한되어 있어 **시계열 예측**(forecasting)이나 **멀티스텝 시계열**에 대한 반사실 생성이 아직 초기 단계이다. 향후 연구는 인과관계 모델을 도입해 ‘왜’와 ‘어떻게’를 동시에 설명하고, 실시간 인터랙티브 도구를 개발해 사용자가 직접 변형을 탐색하도록 지원하는 방향으로 나아가야 한다.
전반적으로 이 논문은 시계열 반사실 설명 연구의 현황을 포괄적으로 정리하고, 표준화된 라이브러리와 평가 프레임워크를 제공함으로써, 학계·산업 모두에서 실용적인 XAI 도구로 활용될 기반을 마련했다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기