네트워크 제어 시스템의 최적 스위칭: 유한 지평선에서의 대칭 임계값 정책

본 논문은 i.i.d. 영점 평균·대칭 분포 잡음이 존재하는 스위칭 LQR 문제에서, 스위칭 정책이 ‘대칭 정책’일 경우 분리 원리가 성립함을 증명하고, 동적 계획법을 통해 최적 스위칭은 누적 잡음에 대한 대칭 임계값 규칙, 최적 제어는 스위칭과 무관한 할인형 선형 피드백임을 제시한다.

저자: Abdullah Y. Etcibasi, C. Emre Koksal, Eylem Ekici

네트워크 제어 시스템의 최적 스위칭: 유한 지평선에서의 대칭 임계값 정책
본 논문은 무선 네트워크를 통해 제어 루프가 연결된 시스템(NCS)에서, 스위칭(통신)과 제어를 동시에 최적화하는 문제를 다룬다. 서론에서는 4G·5G·6G 시대에 자율 로봇, 드론, 자율주행차 등 네트워크 기반 제어 장치가 급증하고 있음을 언급하며, 기존 연구가 통신과 제어를 별도 설계하거나, 잡음이 영점 평균·대칭이라는 가정 하에 제한된 정책 집합(예: 대칭 정책)만을 고려해 왔음을 지적한다. 이러한 접근은 실제 최적성을 보장하지 못한다는 점을 강조하고, 본 연구의 목표는 ‘스위칭 비율 제약이 있는 유한 지평선 LQR 문제’에서 최적 스위칭과 제어 정책을 정확히 규명하는 것이라고 명시한다. 시스템 모델은 1차 스칼라 LTI 시스템 Xₖ₊₁ = aXₖ + bUₖ + Wₖ 로 정의하고, Wₖ는 i.i.d. 영점 평균·대칭 분포를 가진 잡음이다. 스위칭 결정 Dₖ∈{0,1}은 τ≥1 단계 지연을 두고 컨트롤러에 Yₖ = Dₖ₋τ Xₖ₋τ 로 전달된다. 여기서 τ≥1이 필요한 이유는 스위칭이 미래에 대한 정보를 포함하고 있기 때문에, 스위칭 결정이 바로 컨트롤러에 반영되면 인과성이 깨진다(비인과적 설계). 따라서 최소 1단계 지연을 도입해 인과성을 보장한다. 목표 함수는 유한 지평선 N에 대한 LQR 비용 J = ∑_{k=0}^{N-1}(qXₖ² + rUₖ²) + X_N²이며, 평균 스위칭 비율 Dₖ≤r_s 로 제한한다. 제어와 스위칭을 동시에 설계해야 하므로, 일반적인 분리 원리(separation principle)가 깨질 가능성이 있다. 정리 1에서는 최적 제어 입력이 상태 추정값 ĤXₖ에 대한 선형 피드백 Uₖ = −L ĤXₖ 형태임을 증명한다. 여기서 L은 리카티 방정식의 정상 상태 해 P와 시스템 파라미터 a, b, r을 이용해 L = abP/(r+b²P) 로 정의된다. 이때 추정값 ĤXₖ는 현재 정보 I_Cₖ에 대한 조건부 평균이다. 추정 오차 Eₖ = Xₖ−ĤXₖ 를 도입하면, 원래 비용은 오직 Eₖ² 의 합으로 변환된다(정리 2). 따라서 스위칭 정책이 추정 오차 동역학에만 영향을 주면 제어와 스위칭이 분리될 수 있다. 그러나 일반적인 스위칭 정책에서는 Dₖ₊₁₋τ가 미래 스위칭 결정에 포함되므로, E

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기