변분 LSTM 기반 단기 교통 흐름 예측 모델

본 논문은 도시 교통 관리와 정책 수립에 핵심적인 역할을 하는 단기 교통 흐름 예측 문제를 다루며, 기존의 통계적·전통적 머신러닝 기법이 갖는 한계를 극복하기 위해 변분 오토인코더와 장기‑단기 메모리(LSTM) 네트워크를 결합한 새로운 모델인 VLSTM‑E(Variational LSTM Encoder)를 제안한다. 연구 배경으로는 교통량 데이터가 센서 고장, 비정상적인 샘플링 간격 등으로 인해 결측값이 빈번히 발생하고, 이러한 결측값을 적절히 처리하지 못하면 예측 정확도가 크게 저하된다는 점을 들었다. 따라서 데이터 전처리 단계에서 스플라인 보간과 15분 평균을 적용해 결측값을 보완하고, 이후 Min‑Max 스케일링을 통해 정규화하였다. 모델 설계는 크게 세 부분으로 이루어진다. 첫 번째는 LSTM 기반 인코더로, 과거 12개의 5분 간격 교통량 데이터를 입력받아 잠재 변수 z의 평균 μ와 표준편차 σ를 추정한다. 여기서 변분 오토인코더의 핵심인 KL‑다이버전스 최소화를 통해 잠재 공간이 가우시안 분포에 가깝도록 정규화한다. 두 번째는 재파라미터화 트릭을 이용해 z를 샘플링하고, LSTM 디코더가 이를 복원함으로써 시계열의 시간적 의존성을 유지한다. 세 번째는 복원된 시퀀스를 다층 퍼셉트론(MLP)으로 전달해 최종 교통량을 회귀한다. 손실 함수는 재구성 오차(주로 MSE)와 KL‑다이버전스의 가중합으로 구성되어, 데이터 분포 학습과 예측 정확도를 동시에 최적화한다. 실험은 캘리포니아 교통청의 Performance Measurement System(PeMS)에서 2019년 1월부터 5월까지 수집된 데이터를 사용하였다. 두 개의 관측소(716076, 717060)를 대상으로 1월~3월 데이터를 학습, 4월~5월 데이터를 테스트하였다. 하드웨어는 Google Colab의 Tesla K80 GPU, 소프트웨어는 TensorFlow 1.14이며, 학습률 1e‑4, 배치 크기 256, 출력 활성화 함수는 시그모이드로 설정하였다. 성능 평가는 MAPE, MAE, MSE, RMSE 네 가지 지표를 사용했으며, VLSTM‑E는 LSTM 단독 모델에 비해 모든 지표에서 개선된 결과를 보였다. 구체적으로, 관측소 716076에서 MAPE가 10.27%에서 9.60%로 0.67%p 감소했으며, RMSE는 0.0490에서 0.0422로 약 14% 개선되었다. 관측소 717060에서도 유사한 수준의 향상이 관찰되었다. 또한, 기존 연구에서 사용된 MCNN‑M(다중채널 CNN)과 SAE(스택드 오토인코더)와 비교했을 때도 VLSTM‑E가 전반적으로 동등하거나 약간 우수한 성능을 기록하였다. 하지만 연구에는 몇 가지 한계가 존재한다. 첫째, 결측값 보정이 단순 스플라인 보간에 의존해 복잡한 결측 패턴을 충분히 반영하지 못한다는 점이다. 둘째, 변분 인코더가 가우시안 분포를 가정함으로써 교통량의 비정규적 급변을 완전히 모델링하지 못할 가능성이 있다. 셋째, 실험이 두 개의 관측소에만 국한돼 일반화 가능성에 대한 검증이 부족하며, 모델의 연산 복잡도와 실시간 적용 가능성에 대한 논의가 부족하다. 향후 연구 방향으로는 (1) 그래프 신경망(GNN)이나 공간‑시간 컨볼루션 네트워크를 결합해 다중 센서 간 공간적 상관관계를 모델링하고, (2) 베이지안 딥러닝 기법을 도입해 불확실성 추정 정확도를 높이며, (3) 결측값 보정을 딥러닝 기반의 데이터 복원 모델로 대체해 보다 정교한 전처리를 수행하는 것이 제안된다. 이러한 확장을 통해 VLSTM‑E의 예측 정확도와 실용성을 한층 강화할 수 있을 것으로 기대된다.

변분 LSTM 기반 단기 교통 흐름 예측 모델

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기