스케일러블 데이터 기반 쿠프만 도달 가능성 분석 및 제어와 정규 커버리지 보장
본 논문은 신경망 기반 리프팅 함수를 이용해 비선형 로봇 시스템을 선형 쿠프만 형태로 근사하고, 해당 선형 모델에 LQR 추적 제어기를 설계한다. 선형 도달 가능성 분석을 통해 닫힌 루프 도달 집합을 효율적으로 계산한 뒤, 정규 예측(conformal prediction) 기법으로 모델 오차를 통계적으로 보정한다. 이렇게 확장된 도달 집합은 지정된 신뢰 수준(예: 97.5%)에서 실제 시스템 궤적을 포함함을 보장한다. 제안 방법은 고차원 MuJ…
저자: Devesh Nath, Haoran Yin, Glen Chou
본 논문은 “Scalable Data‑Driven Reachability Analysis and Control via Koopman Operators with Conformal Coverage Guarantees”(ScaRe‑Kro)라는 프레임워크를 제안한다. 목표는 분석 모델이 전혀 없는 고차원 비선형 로봇 시스템에 대해, 데이터만으로 안전 검증을 수행하면서도 확률적 보장을 제공하는 것이다. 이를 위해 저자들은 다음과 같은 순차적 절차를 설계한다.
1. **데이터 수집 및 Koopman 모델 학습**
- 블랙박스 시뮬레이터(또는 실제 로봇)로부터 N개의 길이 T+1 인 오픈‑루프 궤적 (x^{(i)}_{0:T}, u^{(i)}_{0:T‑1}) 을 수집한다.
- 자동인코더 구조를 사용해 인코더 ϕ: X→Z와 디코더 ψ: Z→X를 정의하고, 선형 전이 행렬 K_A, K_B를 동시에 학습한다.
- 손실 함수는 (i) 재구성 오차 ‖x−ψ(ϕ(x))‖₂, (ii) 잠재 일관성 ‖ϕ(x)−ϕ(ψ(ϕ(x)))‖₂, (iii) 다단계 예측 오차 ‖x_{t+H}−ψ(ẑ_{t+H})‖₂ 을 가중합한 형태이며, K_A는 초기에 항등행렬, K_B는 Xavier 초기화로 시작한다.
2. **잠재공간에서의 추적 제어 설계**
- 플래너 P가 생성한 목표 궤적 x_ref 을 ϕ를 통해 z_ref 으로 변환한다.
- 선형 전이식 z_{t+1}=K_A z_t+K_B u_t 에 대해 피드포워드 입력 u_ref_t 을 계산하고, 오차 상태 δz_t 와 오차 입력 δu_t 에 대한 LQR 문제를 정의한다.
- 비용 행렬 Q,R 과 최종 비용 Q_T 을 지정하고, Riccati 역방향 재귀를 통해 시간‑가변 피드백 이득 G_t 을 얻는다.
- 최종 제어법칙 u_t = u_ref_t − G_t (ϕ(x_t) − z_ref_t) 는 비선형 시스템에 직접 적용 가능하며, 초기 상태 교란 ε 와 모델 오차에 대해 강인성을 제공한다.
3. **선형 도달 가능성 분석**
- 위에서 얻은 선형 오류 동역학 δz_{t+1}= (K_A−K_B G_t) δz_t 에 대해, 초기 오차 집합 ΔZ_0 (예: B_ε(0))을 정의한다.
- 선형 시스템에 대한 전통적인 폴리토프/타원체 확장 기법을 사용해 ΔZ_{0:T} 을 빠르게 계산한다.
- 계산된 잠재공간 도달 집합 Z_t 을 디코더 ψ에 입력해 원래 상태공간 X_t 을 얻는다. 이때 NNV(Neural Network Verification) 도구인 auto‑LiRPA를 이용해 ψ 의 비선형 변환에 대한 보수적인 상한·하한을 구한다.
4. **정규 예측을 통한 확률적 보정**
- 학습 데이터에서 잔차 r_i = ‖x_{t+1} − \hat f(x_t,u_t)‖₂ 을 계산하고, 이를 캘리브레이션 세트와 테스트 세트로 분리한다.
- 지정된 오차 허용 수준 δ (예: 0.025) 에 대해 (1−δ) 분위수 C 를 구한다.
- 각 시간 단계에 대해 X_t^{inflated}=X_t ⊕ B_C(0) 와 같이 도달 집합을 팽창시킨다. 이렇게 하면 새로운 초기조건과 새로운 참조 궤적에 대해서도 P(∀t, x_t∈X_t^{inflated})≥1−δ 가 성립한다.
- 중요한 점은 이 정규 경계가 궤적 분포 전체에 대해 캘리브레이션되므로, 동일한 경계를 여러 컨트롤러·참조에 재사용할 수 있다는 점이다.
5. **실험 및 결과**
- 28‑D Swimmer, 11‑D Hopper, 12‑D Quadrotor에 대해 200 step 이상 장기 시뮬레이션을 수행했다.
- 비교 대상은 (a) 기존 쿠프만 기반 도달 가능성(오차 보정 없이), (b) 비선형 Hamilton‑Jacobi, (c) 샘플링 기반 시나리오 최적화이다.
- ScaRe‑Kro는 평균 계산 시간 ≈ 0.8 s (대조군 ≈ 4 s) 로 5배 이상 빠르며, 도달 집합 부피는 대조군 대비 30 % 이하로 작아 보수성이 크게 감소했다.
- 정규 예측을 적용한 경우 실제 궤적 포함률은 95 % 이상(δ=0.025) 이었으며, 정규 예측 없이 단순 쿠프만 방법은 70 % 수준에 머물렀다.
- 또한, 동일한 정규 경계가 서로 다른 목표 궤적(예: 다양한 보행 속도, 회전 각도)에도 재사용 가능함을 보였다.
**기여 요약**
1. NN 기반 리프팅과 NNV를 결합한 고차원 비선형 시스템에 대한 스케일러블 도달 가능성 프레임워크.
2. 정규 예측을 이용해 모델 오차를 통계적으로 보정하고, 지정된 신뢰 수준에서 실제 궤적 포함을 보장.
3. 선형화된 잠재공간에서 LQR 추적 제어를 설계해 다중 목표·다중 컨트롤러 상황에서도 재사용 가능한 보정 경계를 제공.
4. 28‑D 이상 고차원 로봇에 대한 실험을 통해 기존 방법 대비 계산 효율성, 보수성, 커버리지 모두에서 우수함을 입증.
이 논문은 데이터‑기반 로봇 안전 검증에 있어 “선형화 + 정규 예측”이라는 새로운 조합을 제시함으로써, 고차원·장기·다중‑목표 로봇 시스템에서도 실시간 수준의 안전 보장을 가능하게 만든다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기