모델 예측 경로 적분 제어의 사전조건화된 경사 하강법 해석
본 논문은 MPPI(모델 예측 경로 적분) 제어를 확률분포 위의 KL‑정규화 문제로 재구성하고, 이를 음의 로그분할함수(Free‑Energy) 최소화로 전환한다. 일반 파라메트릭 샘플링 가족에 대해 사전조건화된 경사 하강법 형태의 업데이트를 도출하고, 고정 공분산 가우시안 경우에는 기존 MPPI가 단위 스텝 크기의 사전조건화된 경사 하강법임을 보인다. 또한, 유계 feasible set 하에서 스무스니스 상수를 명시적으로 구하고, 정확한 MPP…
저자: Mahyar Fazlyab, Sina Sharifi, Jiarui Wang
본 논문은 모델 예측 경로 적분(MPPI) 제어의 내부 최적화 구조를 명확히 밝히기 위해, 제약 최적화 문제를 확률분포 위의 KL‑정규화 문제로 승격하고, 이를 음의 로그분할함수(Free‑Energy) 최소화 문제로 변환한다. 구체적으로, 초기 상태 \(x_0\) 와 시스템 동역학 \(x_{t+1}=F(x_t,u_t)\) 하에서 정의되는 비용 \(f_0(u)\)와 제약 \(C\) 에 대해 \(\min_{u\in C} f_0(u)\) 를 풀고자 한다. 이를 \(\rho\) 라는 제어 시퀀스 분포와 베이스 분포 \(\pi\) 를 도입해 \(\min_{\rho} \mathbb{E}_\rho
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기