CRASH: 자율주행 차량 사고 원인 자동 분석 에이전트

본 논문은 NHTSA 데이터베이스에 보고된 2021‑2025년 사이의 2,168건의 자율주행 차량(AV) 사고를 대상으로, 대규모 언어 모델(LLM) 기반 에이전트 CRASH를 설계·평가한다. CRASH는 구조화된 메타데이터와 자유 서술형 사고 보고서를 통합해 사고 요약, 주요 원인 귀속, AV 기여 여부를 자동으로 판단한다. 실험 결과, 사고의 64%가 인식·계획 오류에 기인하고, 전체 사고의 절반이 후방 충돌이라는 사실을 밝혀냈으며, 5명의…

저자: Erick Silva, Rehana Yasmin, Ali Shoker

CRASH: 자율주행 차량 사고 원인 자동 분석 에이전트
본 논문은 자율주행 차량(AV) 사고 원인 분석의 확장성을 확보하기 위해, 대규모 언어 모델(LLM) 기반 에이전트 CRASH를 설계하고 실제 NHTSA 사고 데이터에 적용한 전 과정을 상세히 기술한다. 연구 배경으로는 기존 AV 사고 분석이 통계적 요약이나 소수 사례에 대한 정성적 검토에 머물러, 시스템 수준의 인과 관계를 포괄적으로 파악하기 어렵다는 점을 제시한다. 이를 해결하고자 저자들은 2021‑2025년 사이에 보고된 2,168건의 사고 데이터를 수집·전처리하고, 구조화된 메타데이터와 자유 서술형 텍스트를 하나의 “Full Text” 열로 통합하였다. 전처리 단계에서 결측·비공개 서술을 가진 레코드를 제거해 데이터 품질을 확보했으며, 제조사별 사고 비중을 분석해 Cruise(35%), Jaguar I‑Pace(47%) 등 주요 업체의 비중을 확인한다. CRASH의 핵심 아키텍처는 세 개의 모듈로 구성된다. ① Preprocessing: 데이터 정제·통합, 열 재구성, 필터링을 수행한다. ② Processing: DeepSeek‑R1(32 B) 모델을 로컬 Ollama 환경에서 호출하고, 시스템 프롬프트와 한‑샷 예시를 포함한 맞춤형 프롬프트를 통해 각 사고에 대해 “AV가 기여했는가”, “주요 원인”, “고장 난 서브시스템”, “AI 반응 지연 여부”, “보조 원인”을 JSON 형태로 출력한다. 프롬프트는 도메인 규칙(예: 정지 상태 후방 충돌 → AV 비기여)과 코드(PE, PL, CO 등)로 구성돼 모델이 자유 텍스트를 구조화된 라벨로 변환하도록 유도한다. ③ Postprocessing: JSON 결과를 집계·분석하고, 원인별·시스템별 분포를 시각화한다. 또한, 인간‑인‑루프(HITL) 검증을 위해 5명의 AV 안전 전문가에게 무작위 샘플 200건을 제시해 정확도·명확도·인과 일관성을 평가받았다. 전문가 평가는 86% 일치율을 보였으며, 주요 오차는 서술이 모호하거나 복합 요인이 포함된 경우에 집중되었다. 평가 결과는 두 가지 주요 통계적 인사이트를 제공한다. 첫째, 전체 사고 중 64%가 인식(Perception) 또는 계획(Planning) 단계의 오류에 기인한다는 점이다. 이는 현재 AV 연구가 센서 데이터 처리·예측 모델의 신뢰성 향상에 더욱 집중해야 함을 의미한다. 둘째, 전체 사고의 약 50%가 후방 충돌이며, 특히 정지·감속 상황에서 발생하는 경우가 많아 거리 유지·감속 정책의 개선이 필요함을 시사한다. 또한, 시스템 고장 유형별로는 인식(PE) 38%, 계획(PL) 26%, 제어(CO) 12%가 가장 빈번했으며, 하드웨어·통신 오류는 5% 이하에 그쳤다. 기술적 논의에서는 LLM 선택과 프롬프트 설계가 결과 품질에 미치는 영향을 상세히 분석한다. 파라미터 수가 14 B 이하인 모델은 JSON 스키마 위반이 빈번해 실용성이 떨어졌으며, 32 B 모델을 사용해 온‑프롬프트와 한‑샷 예시를 결합한 방식이 토큰 효율성과 정확도 모두에서 최적임을 확인했다. 또한, 체인‑오브‑생각(CoT) 방식은 토큰 사용량이 크게 늘어나고 형식 일관성이 저하돼, 규칙 기반의 제한적 클래시피케이션이 더 적합함을 실험적으로 입증했다. 결론적으로, CRASH는 대규모 사고 데이터베이스에 대한 자동화된 인과 분석 파이프라인을 제공함으로써, 인간 전문가의 비용을 크게 절감하면서도 86% 수준의 정확도를 유지한다. 이는 실시간 사고 모니터링, 정책 입안, 제조사별 설계 개선 등에 활용될 수 있는 실용적인 도구로 평가된다. 향후 연구에서는 멀티모달 센서 데이터와 연계한 원인 추론, 지속적인 모델 업데이트를 위한 피드백 루프 구축, 그리고 국제 표준화된 사고 원인 taxonomy와의 연계 등을 제안한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기