딥러닝으로 동물 이동 분석

본 논문은 전통적인 단계 선택 함수(SSF)를 확장하여, 깊은 신경망(DNN) 기반 SSF 모델을 제안한다. DNN‑SSF는 설명가능 인공지능(xAI) 기법을 이용해 선택 계수를 추출함으로써, 선형 효과에 대해서는 기존 GLM‑SSF와 동일한 추정치를 제공하고, 비선형·상호작용·개체 간 변이와 같은 복잡한 패턴을 자동으로 탐지한다. 모델 구현은 R 패키지 ‘citoMove’를 통해 제공되며, 시뮬레이션 및 실제 야생 멧돼지 데이터에 적용해 성능…

저자: Thibault Fronville, Maximilian Pichler, Johannes Signer

딥러닝으로 동물 이동 분석
본 논문은 동물 이동 분석에 있어 단계 선택 함수(SSF)의 전통적인 통계적 한계를 극복하고자, 딥러닝, 특히 완전 연결 신경망(MLP)을 활용한 새로운 모델링 프레임워크인 DNN‑SSF를 제안한다. 기존 GLM‑SSF는 관측된 이동 단계와 무작위로 생성된 대조 단계 사이의 선택 확률을 조건부 로짓 모델로 추정한다. 그러나 이 접근법은 사전에 정의된 선형·이차 형태만을 허용해, 실제 환경에서 나타나는 비선형 반응, 고차원 상호작용, 개체 간 이질성 등을 포착하지 못한다. GAM‑SSF가 스플라인 기반 비선형성을 도입했지만, 변수 간 복잡한 상호작용과 개체별 랜덤 효과를 동시에 모델링하기엔 제한적이다. 저자들은 이러한 제약을 해결하기 위해, SSF의 확률 구조를 그대로 유지하면서 선택 함수 w와 이동 커널 φ를 신경망으로 대체한다. 핵심 아이디어는 (1) 관측 단계와 무작위 단계 각각에 대한 환경 변수와 이동 변수(예: 단계 길이, 회전 각도)를 입력으로 사용하고, (2) 신경망이 출력하는 로그오즈를 조건부 로짓 손실 함수에 적용해 파라미터를 학습한다는 것이다. 이를 위해 기존 ‘cito’ 패키지의 포뮬러 기반 인터페이스와 ‘torch’ 백엔드를 활용했으며, 조건부 로짓 링크를 지원하도록 ‘citoMove’ 래퍼를 개발하였다. 통계적 해석 가능성을 확보하기 위해 설명가능 인공지능(xAI) 기법을 도입한다. SHAP(Shapley Additive exPlanations) 값, 부분 의존 플롯(PDP), 누적 효과 플롯 등을 이용해 각 변수의 선택 계수를 추정하고, 부트스트랩을 통해 p‑값과 신뢰구간을 계산한다. 이렇게 하면 DNN‑SSF가 “블랙 박스”가 아니라, 기존 GLM‑SSF와 동일한 수준의 추론 결과를 제공한다는 점을 입증한다. 성능 검증은 두 단계로 진행된다. 첫째, 시뮬레이션 데이터를 이용해 네 가지 상황을 설정했다. (i) 순수 선형 효과, (ii) 비선형(예: 포물선형) 효과, (iii) 두 변수 간 복합 상호작용, (iv) 개체별 랜덤 슬로프(비선형 랜덤 효과). 각 상황마다 GLM‑SSF, GAM‑SSF, DNN‑SSF를 적용하고, 추정된 β값, p‑값, 모델 적합도(AIC, 로그우도) 및 예측 정확도(ROC AUC)를 비교했다. 결과는 DNN‑SSF가 선형 상황에서는 GLM‑SSF와 거의 동일한 추정치를 제공하면서도, 비선형·상호작용·개체 변이 상황에서는 GAM‑SSF보다 높은 정확도와 낮은 편향을 보였다. 특히, xAI를 통해 추출한 SHAP 값은 시뮬레이션에서 사전에 설정한 비선형 함수 형태와 높은 상관관계를 나타냈으며, 부트스트랩 기반 신뢰구간도 실제 파라미터를 95% 이상 포함했다. 둘째, 실제 사례로 독일 베를린·레겐스부르크 지역에서 수집된 야생 멧돼지(GPS) 데이터를 분석했다. 데이터는 도시와 농경지 환경을 포함하며, 12마리 개체에 대해 6개월 간의 이동 궤적을 포함한다. DNN‑SSF는 개체별 임베딩 레이어를 도입해 개체 이질성을 비선형 랜덤 효과로 모델링했으며, 결과는 개체마다 이동 거리와 서식지 선호도가 현저히 다름을 보여준다. 예를 들어, 도시 근처 개체는 건물 밀집 지역을 회피하고, 농경지 개체는 작물 경계 근처에서 높은 선택 확률을 보였다. 이러한 결과는 기존 GLM‑SSF로는 포착하기 어려웠으며, GAM‑SSF 역시 개체별 차이를 완전히 설명하지 못했다. 기술적 구현 측면에서 ‘citoMove’ 패키지는 다음과 같은 기능을 제공한다. (1) R 포뮬러를 이용한 변수 지정, (2) 조건부 로짓 손실 함수와 다양한 최적화 옵션(Adam, SGD 등), (3) 교차 검증 및 하이퍼파라미터 튜닝 자동화, (4) xAI 기반 변수 중요도 시각화, (5) 부트스트랩을 통한 통계적 검정. 또한, 패키지는 GPU 가속을 지원해 대규모 데이터셋에도 효율적으로 적용 가능하도록 설계되었다. 논문의 결론은 세 가지 주요 메시지를 담는다. 첫째, DNN‑SSF는 기존 통계 모델의 해석 가능성을 유지하면서도 복잡한 비선형·상호작용·개체 변이를 자동으로 탐지한다. 둘째, 설명가능 인공지능 기법을 결합함으로써, 딥러닝 모델에서도 신뢰할 수 있는 p‑값과 신뢰구간을 제공한다는 점을 실증했다. 셋째, ‘citoMove’라는 사용자 친화적인 R 패키지를 공개함으로써, 동물 이동 연구자들이 딥러닝을 손쉽게 도입할 수 있는 기반을 마련했다. 향후 연구 방향으로는 시계열 의존성을 반영한 RNN/Transformer 기반 확장, 다중 종 동시 모델링, 실시간 추적 데이터 스트리밍에 대한 적용 가능성 등을 제시한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기