데이터 기반 스위칭 선형 시스템 차원 추정 및 저차원 근사
본 논문은 평균제곱 안정성을 갖는 스위칭 선형 시스템(SLS)의 차원(잠재 상태 차원)이 알려지지 않은 상황에서, 잡음이 섞인 입력‑출력 데이터를 이용해 시스템 파라미터와 저차원 근사 모델을 비공식적인 비선형 최적화 없이 추정하는 방법을 제시한다. 핵심은 OLS 기반으로 구성한 Hankel‑유사 행렬을 데이터 의존적인 차원 선택 규칙과 SVD를 통해 균형 절단(balanced truncation) 형태의 저차원 모델을 얻는 것이다.
저자: Tuhin Sarkar, Alex, er Rakhlin
본 논문은 평균제곱 안정성을 갖는 스위칭 선형 시스템(SLS)의 차원(잠재 상태 차원)과 파라미터를, 스위치 시퀀스가 외생적이고 관측 가능한 상황에서, 잡음이 섞인 입출력 데이터를 이용해 추정하는 새로운 프레임워크를 제시한다. 기존 연구는 주로 SLS의 존재성, 최소 차원(실현 가능성) 및 모델 축소(balanced truncation) 이론에 집중했으며, 차원 미지인 상황에서의 데이터 기반 식별은 거의 다루지 않았다. 저자는 이러한 공백을 메우기 위해 다음과 같은 일련의 기법을 개발한다.
1. **문제 설정 및 가정**
- 시스템은 \(x_{k+1}=A_{\theta_k}x_k+Bu_k+\eta_{k+1},\; y_k=Cx_k+w_k\) 형태이며, \(\theta_k\in\{1,\dots,s\}\)는 i.i.d. 스위치 변수이며 확률 \(p_i\)를 가진다.
- 잡음 \(\eta_k,w_k\)는 서브가우시안(i.i.d.)이며, 입력 \(u_k\sim\mathcal N(0,I)\)이다.
- 평균제곱 안정성 조건 \(\rho(\sum_{i=1}^s p_i A_i\otimes A_i)<1\)을 만족한다.
- 스위치 수 \(s\)는 알려져 있으나, 상태 차원 \(n\)은 전혀 알 수 없으며, 상한도 주어지지 않는다.
2. **데이터 수집 및 롤아웃 설계**
- 전체 샘플 수를 \(N_S\)라 하고, 각 샘플(시스템 인스턴스)은 길이 \(N\)의 롤아웃을 수행한다.
- 각 롤아웃에서 관측된 스위치 시퀀스 \(\theta^{(t)}_{1:N}\)와 입출력 \((u^{(t)}_{k},y^{(t)}_{k})\)를 기록한다.
- 스위치 시퀀스 길이 \(N\)에 따라 가능한 스위치 조합은 \(s^N\)개가 되며, 이는 SLS용 Hankel 행렬 차원이 급격히 증가함을 의미한다.
3. **Hankel‑like 행렬의 추정**
- 각 스위치 조합 \(\ell\)에 대해, OLS를 이용해 \(\hat{C}A_{\ell}B\)와 \(\hat{C}A_{\ell}\)를 추정한다.
- 이렇게 얻은 블록들을 적절히 배열해 \(\hat H(bN)\)라는 유한 시간 추정 행렬을 만든다. 여기서 \(b\)는 차원 선택 단계에서 결정되는 정수이며, 실제 차원 \(n\)보다 작을 수 있다.
- OLS는 비선형 최적화가 필요 없으며, 잡음이 서브가우시안이라는 가정 하에 고확률 경계가 적용된다.
4. **데이터 의존적 차원 선택**
- \(\|H(\infty)-\hat H(bN)\|_F\)를 두 부분으로 나눈다: (i) 추정 오차(샘플 수에 의존)와 (ii) 차원 절단 오차(선택된 \(b\)에 의존).
- 두 오차를 각각 \(\tilde O(N^{-\Delta_s/2})\)와 \(\sigma_{b+1}\) (다음 특이값) 형태로 상한을 잡는다.
- 최적의 \(b\)는 \(\sigma_{b+1}\)와 샘플 수에 기반한 추정 오차가 균형을 이루는 지점으로 정의한다. 이 규칙은 전적으로 데이터에만 의존한다.
5. **균형 절단을 통한 저차원 파라미터 복원**
- 선택된 \(\hat H(bN)\)에 SVD를 수행하고, 가장 큰 \(r\)개의 특이값(보통 \(r\le b\))에 대응하는 좌·우 특이벡터를 이용해 \((\hat C(r),\hat A_i(r),\hat B(r))\)를 정의한다.
- Weiden 정리의 변형을 사용해, 이 추정된 파라미터와 실제 시스템의 \(r\)-차원 균형 절단 모델 \((C(r),A_i(r),B(r))\) 사이의 거리 \(\|\cdot\|\)를 \(\tilde O(\sqrt{\sigma_r}\,N^{-\Delta_s/2})\)로 제한한다. 여기서 \(\sigma_r\)는 원래 무한 Hankel 행렬의 r번째 특이값이다.
6. **이론적 결과 요약**
- **샘플 복잡도**: \(N_S\)와 \(N\)이 충분히 크면, 차원 선택 규칙에 의해 선택된 \(b\)와 \(r\)에 대해 고확률로 \(\|H(\infty)-\hat H(bN)\|_F\)가 0에 수렴한다.
- **모델 정확도**: 추정된 저차원 모델은 실제 시스템의 균형 절단 근사와 \(\tilde O(\sqrt{\sigma_r}\,N^{-\Delta_s/2})\) 수준으로 가깝다.
- **계산 복잡도**: OLS와 SVD만 사용하므로, 비선형 최적화에 비해 구현이 간단하고, 대규모 데이터에서도 효율적으로 동작한다.
7. **관련 연구와 차별점**
- 기존 SLS 실현성·모델 축소 연구는 주로 알제브라적 조건이나 사전 차원 상한을 필요로 했다.
- 데이터 기반 LTI 식별에서 차원 미지인 경우를 다룬 최근 연구(
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기