사회 인지형 자율 휠체어 내비게이션 SAATT Nav

SAATT Nav는 대형 언어 모델(LLM)을 활용해 보행자 의도를 추론하고, 텍스트로 이유를 설명함으로써 휠체어의 사회적 인식과 투명성을 동시에 제공한다. LLM이 생성한 의도 가설을 롤아웃 시뮬레이션으로 평가하고, 가장 안전·진보적인 가설을 규칙 기반 로컬 플래너에 전달한다. 시뮬레이션 실험에서 기존 A* 전역 플래너, 사회력 모델(SFM) 기반 플래너, LLM 비활성화 버전과 비교했을 때 충돌 회피와 사회적 규칙 준수에서 우수한 성능을 보…

저자: Yutong Zhang, Shaiv Y. Mehra, Bradley S. Duerstock

사회 인지형 자율 휠체어 내비게이션 SAATT Nav
본 연구는 이동 보조 기기로서 전동 휠체어가 직면하고 있는 인지 부하와 사회적 상호작용 문제를 해결하고자 ‘사회 인지형 자율 투명 내비게이션(SAATT Nav)’ 프레임워크를 설계·구현하였다. 기존 자율 휠체어 시스템은 주로 장애물 회피와 최단 경로 탐색에 초점을 맞추었으며, 보행자와의 사회적 거리 유지나 대화 공간 인식 같은 인간 사회 규칙을 충분히 고려하지 못했다. 또한, 시스템이 내린 결정에 대한 설명이 부족해 사용자는 왜 특정 경로를 선택했는지 이해하기 어려워 신뢰도가 낮았다. 이러한 한계를 극복하기 위해 저자들은 세 가지 핵심 구성 요소를 도입하였다. 1. **LLM 기반 의도 가설 생성기** - 주기적(trigger period)과 위험 기반(trigger risk) 두 스케줄링 정책에 따라 LLM을 호출한다. - 프롬프트에는 휠체어와 보행자의 현재 위치·속도·목표가 포함되며, LLM은 각 보행자에게 ‘yield(양보)’, ‘rush(돌진)’, ‘constant velocity(일정 속도)’ 중 하나의 행동 라벨을 부여하고, 그 이유를 자연어 문장으로 출력한다. - 온도 τ=0.7, 가설 수 k=8, 최소 호출 간격 Δt_min=15 스텝 등 파라미터가 설정되어 실시간 적용 가능성을 확보한다. 2. **롤아웃 기반 가설 점수화** - 각 가설은 고정된 horizon h=30 스텝 동안 시뮬레이션된다. 휠체어는 순수 추적(pure pursuit) 컨트롤러로 목표를 향해 이동하고, 보행자는 라벨에 따라 속도가 αyield=0.2·v_i, αrush=1.5·v_i, 또는 v_i 로 변한다. - 안전 점수는 충돌 횟수와 최소 거리(d_safe=2 m)를 기반으로, 진행 점수는 시작·종료 거리 차이 비율로 계산한다. 두 점수는 w_s=20, w_p=10의 가중치로 결합하고, 충돌·사회적 버블 침해에 대한 패널티 λ_c, λ_b를 적용한다. - 가장 높은 총점 S_total을 얻은 가설이 선택된다. 3. **규칙 기반 로컬 플래너** - 선택된 가설의 보행자 의도에 따라 속도 제한(v_ref)과 회피 전략을 적용한다. ‘yield’ 상황에서는 보행자와의 거리가 멀어질수록 일찍 감속하고, ‘rush’ 상황에서는 보행자와의 거리가 가까워질수록 감속하면서 lateral 회피를 수행한다. - 두 보행자가 대면해 대화 중인 경우(LFM이 사회적 버블을 인식) 버블 중심을 우회하는 디투어 웨이포인트를 생성한다. 버블 반경은 보행자 간 거리와 개인·그룹 공간 마진을 합산해 정의한다. - 최종적으로 순수 추적 컨트롤러가 각 웨이포인트를 목표로 선형·각속도 명령을 생성한다. **비교 실험 및 결과** - **시뮬레이션 환경**: 10 m×10 m 2D 공간, 휠체어 반경 0.4 m, 최대 속도 1.5 m/s, 보행자 반경 0.3 m. - **시나리오**: (A) 보행자 없는 직선 복도, (B) 대면 페어(F-formation) 버블, (C) 횡단 보행자. 각 시나리오당 30개의 무작위 레이아웃을 생성해 총 360번 실험. - **비교 대상**: (i) A* 전역 플래너(기본 장애물 회피), (ii) 사회력 모델(SFM) 기반 플래너, (iii) Ablation(LLM 비활성화 버전), (iv) 제안된 SAATT Nav. - **평가지표**: 충돌 횟수, 최소 보행자 거리, 버블 침해 횟수, 경로 길이·시간, 사용자 편안함(속도 변동성) 등 8가지. 실험 결과는 다음과 같다. SAATT Nav는 모든 시나리오에서 충돌 횟수를 현저히 감소시켰으며, 특히 시나리오 B에서 버블 침해를 0%로 유지했다. 사회력 모델은 충돌 회피는 가능했지만 버블을 무시해 침해가 발생했으며, A*는 전혀 사회적 규칙을 고려하지 못했다. 효율성 측면에서는 SAATT Nav가 약간 더 긴 경로·시간을 보였지만, 차이는 5% 이내에 머물렀다. Ablation과 비교했을 때, LLM이 제공하는 의도 추론과 버블 인식이 성능 향상의 핵심 요인임을 확인했다. 또한, LLM이 각 웨이포인트마다 텍스트 형태의 이유를 출력함으로써 사용자는 시스템이 왜 특정 행동을 선택했는지 실시간으로 이해할 수 있었으며, 이는 사용자 신뢰도와 인지 부하 감소에 긍정적인 영향을 미칠 것으로 기대된다. **의의 및 향후 과제** 본 논문은 LLM을 로봇 의사결정 모듈에 직접 연결함으로써 ‘사회 인지’와 ‘투명성’이라는 두 가지 요구를 동시에 만족시킨 최초 사례 중 하나이다. 보행자 의도 예측을 고차원 언어 모델에 위임함으로써 대규모 데이터 수집 없이도 일반화된 사회적 행동 모델을 구현했으며, 롤아웃 기반 점수화는 실시간 안전성을 보장한다. 향후 연구에서는 실제 물리 로봇 및 실환경 테스트, LLM의 추론 지연 최소화, 사용자 맞춤형 의도 라벨 확장, 그리고 다중 로봇·보행자 복합 상황에서의 확장성을 검증할 필요가 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기