베이지안 조합 시계열로 보는 인바운드 관광 수요 구성 예측

본 논문은 Airbnb 예약 데이터를 활용해 2017‑2024년 기간 동안 네 개 지역(EMEA, 북미, 아시아‑태평양, 라틴아메리카)의 방문객 원천 시장 점유율 변화를 베이지안 디리클레 ARMA(BDARMA) 모델로 예측한다. 코로나19로 인한 구조적 변화를 포착하고, 계절적 정밀도 변동을 포함한 모델이 기존 변환 기반 벤치마크보다 평균 절대오차와 Aitchison 거리에서 유의하게 우수함을 입증한다.

저자: Harrison Katz

베이지안 조합 시계열로 보는 인바운드 관광 수요 구성 예측
본 논문은 관광 목적지의 방문객 원천 시장 구성이 시간에 따라 어떻게 변하는지를 정량적으로 예측하고자 하는 실용적·학문적 필요에서 출발한다. 기존 관광 수요 예측 연구는 주로 총 방문객 수나 전체 매출과 같은 집계량에 초점을 맞추었으며, 원천 시장별 점유율이라는 ‘구성’ 특성을 다루는 경우는 드물었다. 구성 데이터는 각 원소가 0과 1 사이에 존재하고 전체 합이 1이 되는 단순합 제약을 갖기 때문에, 전통적인 시계열 모델을 그대로 적용하면 비합리적인 음수값이나 100% 초과 예측이 발생한다. 이를 해결하기 위해 저자들은 베이지안 디리클레 ARMA(BDARMA) 모델을 제안하고, 실제 Airbnb 예약 데이터를 활용해 네 개의 주요 지역(EMEA, 북미, 아시아‑태평양, 라틴아메리카)에서의 원천 시장 점유율을 2017‑2024년 기간 동안 분석·예측한다. **데이터** Airbnb의 전 세계 예약 데이터베이스에서 2017년 1월부터 2024년 12월까지 확정된 예약 건을 추출하였다. 각 예약에는 예약일, 게스트 거주 국가, 숙소 위치가 포함되어 있으며, 이를 목적지 지역별로 집계해 월별 원천 시장 비율을 산출했다. 총 96개월, 4개 지역, 각 지역별 20여 개 이상의 주요 원천 국가가 포함된 고차원 구성 시계열을 구성하였다. **모델링** BDARMA 모델은 다음과 같은 구조를 가진다. 1. **디리클레 관측모델**: yₜ | μₜ, ϕₜ ∼ Dirichlet(ϕₜ μₜ) 로, 평균 구성 μₜ와 정밀도 ϕₜ를 동시에 추정한다. 2. **ILR 변환**: μₜ를 isometric log‑ratio(ILR) 변환 ηₜ = Vᵀ log(μₜ) 로 실수 공간 ℝ^{C‑1}에 매핑한다. 3. **VARMA 동역학**: ηₜ = Xₜβ + Σ_{p=1}^{P} A_p(η_{t‑p}‑X_{t‑p}β) + Σ_{q=1}^{Q} B_q ε̃_{t‑q} 로, 외생변수 Xₜ(계절성 Fourier 항 포함)와 AR·MA 행렬을 통해 시계열 의존성을 모델링한다. 4. **계절 정밀도**: log ϕₜ = zₜᵀγ 로, zₜ에 계절성 코사인·사인 항을 포함해 정밀도가 계절에 따라 변하도록 설정한다. 베이지안 사전분포는 회귀계수 β에 대해 N(0,1), AR 대각선에 대해 N(0.5,0.3), 비대각선에 대해 N(0,0.2), MA에 대해 N(0,0.3), 정밀도 절편에 대해 N(3,1) 등 약한 정보만을 제공한다. 모델 추정은 Stan 기반 MCMC를 사용해 4개의 체인, 각 2,000번 반복(1,000번 warm‑up)으로 수행했으며, ˆR ≈ 1.00과 충분한 ESS를 확인하였다. **예측 및 평가** 사후 샘플을 이용해 h‑step‑ahead 예측을 수행하고, Dirichlet 예측분포에서 샘플링해 점예측(사후 평균)과 구간예측(사후 분위수)을 도출했다. 평가 지표는 구성 데이터에 적합한 MAE(구성별 평균 절대오차), Aitchison 거리, 로그예측밀도(LPD) 등을 사용했으며, 베이스라인으로는 (i) 순방향, (ii) 계절 순방향, (iii) 12개월 이동평균, (iv) ILR 변환 후 ETS, (v) ILR 변환 후 SARIMA을 포함했다. 변환 기반 모델의 경우 ILR 역변환을 통해 단순합을 강제로 맞추는 후처리를 적용하였다. 모델 비교는 LOO‑CV와 Pareto‑smoothed importance sampling을 통해 ELPD와 p_loo를 산출했으며, Diebold‑Mariano 검정으로 통계적 유의성을 검증했다. **주요 결과** - **예측 정확도**: EMEA 지역에서 BDARMA는 naïve 대비 MAE가 27% 감소했으며, Aitchison 거리에서도 유의한 개선을 보였다(p < 0.001). 다른 지역(NAMER, APAC, LATAM)에서도 평균 15‑20% 수준의 오류 감소가 관찰되었다. - **계절 정밀도 효과**: 정밀도를 계절적으로 변동시키는 모델이 정밀도 고정 모델보다 MAE가 약 12% 낮았으며, 특히 여름 성수기와 겨울 비수기 사이의 변동성을 정확히 포착했다. - **구조적 변동**: 코로나19 팬데믹 기간(2020‑2021)에는 장거리 원천 시장(예: 미국‑유럽) 비중이 급감하고, 지역 내(예: 유럽‑내) 예약 비중이 상승하는 구조적 전환이 감지되었다. 회복 단계에서는 지역별 회복 속도가 다르게 나타났으며, BDARMA는 이러한 이질적 회복 패턴을 시계열 동역학과 정밀도 변동을 통해 효과적으로 모델링했다. - **베이지안 장점**: 전체 예측이 Dirichlet 분포 형태로 제공돼 단순합 위배 위험이 없으며, 정밀도 파라미터를 통해 예측 불확실성을 직관적으로 해석할 수 있다. 정책 입안자는 95% 신뢰구간을 활용해 마케팅 예산 배분이나 인프라 투자 결정을 리스크를 고려해 수행할 수 있다. **시사점 및 한계** 본 연구는 플랫폼 기반 대규모 예약 데이터를 활용해 관광 원천 시장 구성을 정밀하게 예측할 수 있음을 보여준다. 이는 전통적인 관광 통계(국경 통과, 숙박 설문)보다 실시간에 가까운 ‘실제 수요’를 반영한다는 점에서 실무적 가치가 크다. 또한 베이지안 디리클레 시계열 모델이 구성 데이터의 특성을 자연스럽게 만족시키면서도 복잡한 계절·구조 변동을 포착한다는 방법론적 기여가 있다. 한편, 데이터는 Airbnb 이용자에 국한되므로 전체 관광 흐름을 완전히 대변하지 못한다는 제한이 있다. 또한 정밀도 모델링에 사용된 Fourier 항의 차수 선택이 결과에 민감할 수 있어, 향후 연구에서는 비선형 혹은 외생 충격(정책, 환율 등) 변수를 추가하는 방안을 검토할 필요가 있다. **결론** 베이지안 Dirichlet ARMA 모델은 관광 수요 구성 예측에 있어 현재 가장 효과적인 접근법 중 하나이며, 특히 코로나19와 같은 외부 충격으로 인한 구조적 변동을 실시간으로 감지하고 예측할 수 있다. 향후 연구는 다른 플랫폼 데이터와 결합하거나, 다변량 베이지안 구조(state‑space) 모델을 확장해 보다 정교한 정책 시뮬레이션을 수행하는 방향으로 나아갈 수 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기