케모컬 평형 예측을 위한 콜모고로프‑아놀드 서러게이트 모델
본 연구는 고전적인 다층 퍼셉트론(MLP)보다 적은 파라미터로 높은 정확도를 보이는 콜모고로프‑아놀드 네트워크(KAN)를 지오케미컬 평형 계산의 서러게이트 모델로 적용한다. 시멘트 수화 벤치마크와 방사성 폐기물 저장을 위한 Ba‑Ra‑Sr 황산염 고체 용액 시스템을 대상으로 학습·검증했으며, 절대·상대 오차를 각각 62 %·59 % 감소시켰고, 이진·삼진 고체 용액 모델에서 중위수 오류가 1 × 10⁻³ 수준에 머물렀다. KAN은 기존 화학 솔…
저자: Leonardo Boledi, Dirk Bosbach, Jenna Poonoosamy
본 논문은 지오케미컬 시뮬레이션에서 화학 평형 계산이 전체 연산 비용의 대부분을 차지한다는 문제 의식에서 출발한다. 특히, 반응 전달 모델(RTM)은 수백만에서 수십억 번에 달하는 화학 평형 해석을 요구하므로, 기존 솔버(GEM‑Selektor, Reaktoro 등)의 계산 속도는 시뮬레이션 전체를 병목 현상으로 만든다. 이러한 배경에서 데이터‑드리븐 서러게이트 모델이 대안으로 제시되었으며, 기존 연구에서는 Gaussian Process, Polynomial Chaos, 전통적인 다층 퍼셉트론(MLP) 등이 사용되었다.
최근 2024년에 제안된 콜모고로프‑아놀드 네트워크(KAN)는 Kolmogorov‑Arnold 정리를 기반으로, 각 연결(edge)에 학습 가능한 1차원 스플라인 활성화 함수를 두어 복잡한 비선형 함수를 효율적으로 근사한다. KAN은 고정된 활성화 함수 대신 가변적인 스플라인을 사용함으로써, 파라미터 수를 크게 줄이면서도 높은 예측 정확도를 달성한다는 보고가 있다. 본 연구는 이러한 KAN을 화학 평형 서러게이트에 적용해, 기존 MLP와의 성능을 정량적으로 비교한다.
연구 방법은 크게 두 부분으로 구성된다. 첫 번째는 시멘트 수화 시스템(CaO‑SiO₂‑H₂O) 벤치마크이다. 공개된 5만 개 샘플 데이터(입력 3차원, 출력 18차원)를 사용해, Bayesian 최적화(Optuna)로 하이퍼파라미터를 탐색하고, PyTorch Lightning 기반으로 MLP와 KAN을 각각 학습시켰다. 평가 지표는 절대 오차와 상대 오차이며, KAN은 MLP 대비 각각 62 %와 59 % 낮은 오류를 기록했다. 이는 동일한 학습 비용에도 불구하고 KAN이 더 효율적인 함수 근사를 수행함을 의미한다.
두 번째는 방사성 폐기물 저장에 핵심적인 라듐(Ra) 함유 황산염 고체 용액 시스템이다. 여기서는 세 단계의 모델 복잡성을 도입한다. (i) 기계적 혼합 모델은 라듐과 바륨(Ba) 황산염을 비상호작용 혼합물로 가정해 자유 에너지를 몰분율 가중 평균으로 계산한다. (ii) 비이상 이진 고체 용액 모델은 Margules 파라미터(w_RaBa = 2470 J mol⁻¹)를 사용해 정규 용액 모델을 적용, 이상 혼합 에너지와 과잉 에너지를 더한다. (iii) 삼진 고체 용액 모델은 Sr‑Ba, Sr‑Ra, Ba‑Ra 상호작용 파라미터를 포함해 3성분 정규 용액을 구현한다. 각 경우에 대해 GEM‑Selektor와 TSolMod 라이브러리를 이용해 정확한 평형 데이터를 생성하고, Sobol 샘플링으로 훈련·검증 데이터를 구축하였다.
KAN은 이 복잡한 비선형 시스템에서도 중위수 예측 오차가 약 1 × 10⁻³ 수준을 유지했으며, 특히 파라미터 수가 제한된 상황에서도 MLP 대비 동일하거나 더 낮은 오류를 기록한다. 또한, KAN 기반 서러게이트는 GEM‑Selektor 대비 수십 배에서 수백 배의 연산 속도 향상을 기대할 수 있다(논문에 구체적 속도비는 제시되지 않았지만, 기존 연구와 비교해 추정).
논문은 KAN이 화학 평형 서러게이트에 적합한 이유를 다음과 같이 정리한다. 첫째, 스플라인 기반 활성화 함수가 물리적 비선형성을 효과적으로 근사한다. 둘째, 파라미터 효율성이 높아 적은 학습 데이터로도 높은 정확도를 달성한다. 셋째, 구조 자체가 해석 가능성을 제공한다(각 스플라인이 입력 변수와 출력 사이의 함수 형태를 시각화 가능).
향후 연구 방향으로는 (1) 물리‑인포메드 학습(PINN)과 결합해 물리적 제약을 직접 삽입, (2) 다중 스케일 전이 학습을 통해 다양한 지오케미컬 시스템에 대한 범용 서러게이트 구축, (3) 훈련 불안정성 완화를 위한 정규화 및 스플라인 차수 최적화, (4) 실제 RTM 워크플로우에 KAN 서러게이트를 통합해 전체 시뮬레이션 속도와 정확도 향상을 실증하는 것이 제시된다.
결론적으로, 본 연구는 KAN이 기존 MLP 기반 서러게이트보다 더 높은 정확도와 효율성을 제공함을 실증하고, 방사성 폐기물 저장과 같은 안전성 평가에 필수적인 대규모 반응 전달 시뮬레이션을 실시간에 가깝게 수행할 수 있는 기반을 마련한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기